خب. آخر ماه شد و طبق روال ماه‌های قبل، گزارش این ماه رو منتشر می‌کنم.

متمم

تو متمم اکثراً درس‌های تصمیم‌گیری و مهارت حل مسئله رو خوندم.

می‌خوام زودتر پروژه‌هاشون رو انجام بدم که بتونم تفکر استراتژیک رو ببینم چیه. به نظر خیلی چیز جالبی میاد.

فریب‌خورده تصادف

نسیم طالب آدم جالبی هست. کتابش رو دوست دارم چون متفاوت فکر می‌کنه و دید جالبی نسبت به احتمالات و شانس داره.

به این فکر افتادم که نکنه کل مدلسازی‌هایی که داریم از دنیای واقعی با ابزارهای یادگیری ماشین انجام میدیم، یک سری overfitting باشند؛ یعنی صرفا الگوهای قدیمی رو مدل کنیم و تو توضیح وقایع جدید نتوانیم خوب عمل کنیم.

بالاخره ته تهش تقریباً همه مدل‌های یادگیری ماشین MLE هستند (Maximum likelihood estimator) و سعی می‌کنند بهترین مدلی رو پیدا کنند که گذشته رو توضیح بده.

نسیم طالب راجع به این حرف می‌زنه که چی میشه اگر مدل‌های ذهنی ما راجع به دنیا اشتباه باشند و چطوری خودش رو تو بعضی جاها (مثلاً بازار بورس) نشون میده.

مدل‌های زبانی

با توجه به این که تو شرکت با مدل‌های زبانی بزرگ (LLMها) سر و کار داریم، بخش مهمی از وقتم رو حول این موضوع می‌گذرونم.

تقریباً هر روز چک می‌کنم ببینم کسی مدل پایه Open-Source فارسی گذاشته یا نه. این ماه بالاخره دیدم NVIDIA یه مدل پایه فارسی گذاشته. با کلی داستان بابت تحریم و اینها، تونستم اجراش کنم. بد نیست ولی چندان به درد محیط عملیاتی نمی‌خوره.

البته می‌دونم بعضی شرکت‌ها الان دارند تلاش می‌کنند که خودشون انجام بدن ولی به نظرم کار اونا نیست (حداقل اونایی که من شنیدم اصلاً در اون حد و اندازه نیستند). به نظرم آدم باید به تجربه بقیه نگاه کنه. وقتی تو مقاله‌ها می‌بینیم که برای Trainکردن همچین مدل‌هایی صدها بلکه هزاران GPU استفاده شده و آخرش هم کاملاً به دقت ChatGPT نرسیدند، من نوعی نباید با ۴ تا GPU حتی به Trainکردن این مدل‌ها فکر کنم.

فکر می‌کنم بعید نیست انتظار داشته باشیم تا چند ماه آینده یه مدل درست حسابی تر فارسی که بشه ازش تو کاربردهای مختلف استفاده کرد، داشته باشیم. اینه که فعلاً فکر می‌کنم صبر کردن بهترین راهه تا یک مدل پایه‌ای مناسب ارائه بشه.

کمی هم دعوای پدران هوش مصنوعی (یان لکون و جفری هینتون) حول هوش مصنوعی رو تو توئیتر دنبال کردم. نکته اختلاف‌شون هم اینه که یان لکون میگه که هوشمندی ربطی به «تمایل به قدرت» نداره و هر طوری هم بشه، ته تهش ما کنترل رو خواهیم داشت و خب جفری هم مخالفه و فکر می‌کنه هوش مصنوعی خطرناک‌تر از این حرفاس.

یوتیوب

این ماه خیلی زیاد یوتیوب دیدم. می‌خواستم ببینم تو این یه ماهی که نبودم، چه خبر بوده که خب خبر خاصی نبود :)

به هر حال با Yannic Klicher و Coffee Break with Letitia وقت گذروندم و در محضر اساتید یاد گرفتم.

برای بحث MLOps هم چند تا ویدئو و پلی‌لیست دیدم و لذت بردم. این که بشینم تو Jupyter Notebook و هی مدل تست کنم، برام جالب نیست. فعلاً بحث‌های مهندسی نرم‌افزار حول ML و اتوماسیون این بحث‌ها برام جذاب‌تره.

پادکست

قسمت چهارم از ایستگاه هوش مصنوعی رو هم ضبط کردم. ولی دارم فکر می‌کنم که کم‌کم مسیر پادکست رو عوض کنم. به نظرم بیش از حد تئوری شد و اینطوری حوصله آدم سر میره.

مخصوصاً این که موضوعات خیلی جذاب‌تری از نظر خودم وجود داره که میشه راجع بهش صحبت کرد. من فقط ایده‌ام این بود که مخاطبم رو تقریباً با فیلد آشنا کنم و بعدش دیگه کم‌کم راجع به همه چیز صحبت کنیم. احتمالاً یکی دو قسمت دیگه مقدمات رو بگم و بعد دیگه مثلاً تو فصل بعدی راجع به مباحث جذاب‌تر صحبت کنم.

سادگی و ساده زیستی

یه درس گفتاری از مصطفی ملکیان به نام سادگی و ساده زیستی رو گوش دادم. خیلی از بحثش خوشم اومد. بحثش با تعریف سادگی شروع میشه که به معنای اینه که ظاهر و باطن یکی باشه (در واقع حضور یا عدم حضور بقیه تاثیری روی ما نداشته باشه).

تا همین جای بحثش هم باهاش کلی کیف کردم. کلا ملکیان صدای خیلی آرومی داره و لذت می‌برم وقتی به حرف‌هاش گوش میدم. اولین بار مجموعه فایل‌های «اخلاق کاربردی» رو گوش دادم. الان تقریباً هیچی ازش یادم نیست جز یک خاطره خوب.

ناموفق‌ها

هنوز تاثیرات دوره سربازی رو زندگیم هست. تا قبل سربازی من راحت ساعت ۶ و ۷ صبح بیدار می‌شدم و حتی یک بار هم خواب نمی‌خوندم.

ولی بعد این دوران عبث، یه سری روزها دیر می‌رسم شرکت و بقیه روزها هم به سختی بیدار میشم و عجله عجله میرم سرکار.

گزارش روزانه و هفتگی و اینها هم ننوشتم.

اوضاع سلامتی‌ام هم ناجالب شده و به قول قدیمی‌ها «زیر پوستم آب افتاده» (یعنی چاق‌ شدم). ببینم می‌تونم از ماه بعد یه کاری براش بکنم یا نه.