خب. آخر ماه شد و طبق روال ماههای قبل، گزارش این ماه رو منتشر میکنم.
متمم
تو متمم اکثراً درسهای تصمیمگیری و مهارت حل مسئله رو خوندم.
میخوام زودتر پروژههاشون رو انجام بدم که بتونم تفکر استراتژیک رو ببینم چیه. به نظر خیلی چیز جالبی میاد.
فریبخورده تصادف
نسیم طالب آدم جالبی هست. کتابش رو دوست دارم چون متفاوت فکر میکنه و دید جالبی نسبت به احتمالات و شانس داره.
به این فکر افتادم که نکنه کل مدلسازیهایی که داریم از دنیای واقعی با ابزارهای یادگیری ماشین انجام میدیم، یک سری overfitting باشند؛ یعنی صرفا الگوهای قدیمی رو مدل کنیم و تو توضیح وقایع جدید نتوانیم خوب عمل کنیم.
بالاخره ته تهش تقریباً همه مدلهای یادگیری ماشین MLE هستند (Maximum likelihood estimator) و سعی میکنند بهترین مدلی رو پیدا کنند که گذشته رو توضیح بده.
نسیم طالب راجع به این حرف میزنه که چی میشه اگر مدلهای ذهنی ما راجع به دنیا اشتباه باشند و چطوری خودش رو تو بعضی جاها (مثلاً بازار بورس) نشون میده.
مدلهای زبانی
با توجه به این که تو شرکت با مدلهای زبانی بزرگ (LLMها) سر و کار داریم، بخش مهمی از وقتم رو حول این موضوع میگذرونم.
تقریباً هر روز چک میکنم ببینم کسی مدل پایه Open-Source فارسی گذاشته یا نه. این ماه بالاخره دیدم NVIDIA یه مدل پایه فارسی گذاشته. با کلی داستان بابت تحریم و اینها، تونستم اجراش کنم. بد نیست ولی چندان به درد محیط عملیاتی نمیخوره.
البته میدونم بعضی شرکتها الان دارند تلاش میکنند که خودشون انجام بدن ولی به نظرم کار اونا نیست (حداقل اونایی که من شنیدم اصلاً در اون حد و اندازه نیستند). به نظرم آدم باید به تجربه بقیه نگاه کنه. وقتی تو مقالهها میبینیم که برای Trainکردن همچین مدلهایی صدها بلکه هزاران GPU استفاده شده و آخرش هم کاملاً به دقت ChatGPT نرسیدند، من نوعی نباید با ۴ تا GPU حتی به Trainکردن این مدلها فکر کنم.
فکر میکنم بعید نیست انتظار داشته باشیم تا چند ماه آینده یه مدل درست حسابی تر فارسی که بشه ازش تو کاربردهای مختلف استفاده کرد، داشته باشیم. اینه که فعلاً فکر میکنم صبر کردن بهترین راهه تا یک مدل پایهای مناسب ارائه بشه.
کمی هم دعوای پدران هوش مصنوعی (یان لکون و جفری هینتون) حول هوش مصنوعی رو تو توئیتر دنبال کردم. نکته اختلافشون هم اینه که یان لکون میگه که هوشمندی ربطی به «تمایل به قدرت» نداره و هر طوری هم بشه، ته تهش ما کنترل رو خواهیم داشت و خب جفری هم مخالفه و فکر میکنه هوش مصنوعی خطرناکتر از این حرفاس.
یوتیوب
این ماه خیلی زیاد یوتیوب دیدم. میخواستم ببینم تو این یه ماهی که نبودم، چه خبر بوده که خب خبر خاصی نبود :)
به هر حال با Yannic Klicher و Coffee Break with Letitia وقت گذروندم و در محضر اساتید یاد گرفتم.
برای بحث MLOps هم چند تا ویدئو و پلیلیست دیدم و لذت بردم. این که بشینم تو Jupyter Notebook و هی مدل تست کنم، برام جالب نیست. فعلاً بحثهای مهندسی نرمافزار حول ML و اتوماسیون این بحثها برام جذابتره.
پادکست
قسمت چهارم از ایستگاه هوش مصنوعی رو هم ضبط کردم. ولی دارم فکر میکنم که کمکم مسیر پادکست رو عوض کنم. به نظرم بیش از حد تئوری شد و اینطوری حوصله آدم سر میره.
مخصوصاً این که موضوعات خیلی جذابتری از نظر خودم وجود داره که میشه راجع بهش صحبت کرد. من فقط ایدهام این بود که مخاطبم رو تقریباً با فیلد آشنا کنم و بعدش دیگه کمکم راجع به همه چیز صحبت کنیم. احتمالاً یکی دو قسمت دیگه مقدمات رو بگم و بعد دیگه مثلاً تو فصل بعدی راجع به مباحث جذابتر صحبت کنم.
سادگی و ساده زیستی
یه درس گفتاری از مصطفی ملکیان به نام سادگی و ساده زیستی رو گوش دادم. خیلی از بحثش خوشم اومد. بحثش با تعریف سادگی شروع میشه که به معنای اینه که ظاهر و باطن یکی باشه (در واقع حضور یا عدم حضور بقیه تاثیری روی ما نداشته باشه).
تا همین جای بحثش هم باهاش کلی کیف کردم. کلا ملکیان صدای خیلی آرومی داره و لذت میبرم وقتی به حرفهاش گوش میدم. اولین بار مجموعه فایلهای «اخلاق کاربردی» رو گوش دادم. الان تقریباً هیچی ازش یادم نیست جز یک خاطره خوب.
ناموفقها
هنوز تاثیرات دوره سربازی رو زندگیم هست. تا قبل سربازی من راحت ساعت ۶ و ۷ صبح بیدار میشدم و حتی یک بار هم خواب نمیخوندم.
ولی بعد این دوران عبث، یه سری روزها دیر میرسم شرکت و بقیه روزها هم به سختی بیدار میشم و عجله عجله میرم سرکار.
گزارش روزانه و هفتگی و اینها هم ننوشتم.
اوضاع سلامتیام هم ناجالب شده و به قول قدیمیها «زیر پوستم آب افتاده» (یعنی چاق شدم). ببینم میتونم از ماه بعد یه کاری براش بکنم یا نه.