اپیزود نهم - مدلهای زبانی بزرگ چطوری ساخته شدند؟
Description
سلام. من امیر پورمند هستم و این قسمت نهم از ایستگاه هوش مصنوعیه. تو قسمتهای قبل راجع به مدلهای زبانی بزرگ حرفهایی زدیم ولی هرگز نگفتم که مدل زبانی چیه و چطوری درست شده.
تو این قسمت میخوام راجع به این صحبت کنم. واقعاً هم نمیخوام بحث تئوری کنم. میخوام راجع به اینها صحبت کنم که وقتی قسمتهای بعد راجع به نقاط ضعف و محدویتهای مدلهای زبانی صحبت کردم، یه ایدهای داشته باشید که چرا این نقاط ضعف بوجود اومدند یا حتی اینطوری خودتون میتونید راجع به کاربردهای این مدلها تو صنعت خودتون بهتر فکر کنید.
در واقع این قسمت معرفی مدلهای زبانی بزرگ بر مبنای یک داستانه. داستان دانشآموزی که میره دبستان، خوندن و نوشتن یاد میگیره. بعد تو دبیرستان، یک سری مفاهیم رو از بر میکنه و تو دانشگاه نحوه تعامل با آدمها رو یاد میگیره.
همچنین قبلاً هم این پست راجع به مدلهای زبانی نوشتم و بعضی چیزهایی که میگم رو اونجا با شکل توضیح دادم. در واقع یک چیز رو با دو بیان مختلف گفتم:
https://aprd.ir/large-language-models-training/
متن این قسمت رو هم میتونید در اینجا بصورت کامل ببینید:
https://aprd.ir/ai-station-e09-llm-training/
واقعا دمتون گرم خیلی خیلی لذت میبرم از اینکه اینقدر شیرین و ساده مطالب رو بیان میکنید. یه دنیا ممنون