این پست از جمله پستهایی هست که داخلش غر میزنم به وضع موجود :) این پست رو خیلی وقت پیش نوشته بودم ولی دل و دماغ منتشرکردنش رو نداشتم. الان که فارغالتحصیل شدم، همینطوری که قبلاً نوشته بودم منتشرش میکنم.
احتمالاً بیشتر به درد کسی میخوره که الان در حال نوشتن پایاننامه هست و داره به عبث بودن این کار فکر میکنه و میخواد ببینه کسی مثل اون بوده یا نه. پس با خیال راحت، از این پست بگذرید که چیز زیادی به شما اضافه نخواهد کرد.
شروع کنیم.
همونطور که میدونید پایاننامههای کارشناسی ارشد و دکترا باید به زبان «فارسی مریض» نوشته بشوند. در این نوشته کوتاه میخوام دلایلی که فکر میکنم اینکار اشتباه هست رو شرح بدم.
فکر میکنم دلایل من بیشتر در مورد رشتههای فنی درست باشند و احتمالا به رشتههای انسانی یا تجربی ربطی ندارند.
قبلا وقتی دوم دبیرستان بودم پدرم و داییام و عموم در حال گرفتن مدرک ارشد مدیریت (بازرگانی و بازاریابی) بودند و من بهشون تو نوشتن پایاننامه کمک کردم. نه به خاطر این که بلد بودم پایاننامه چیه و چطوریه. فقط چون اونها ورد رو خوب بلد نبودند و من بلد بودم. این بود که تقریبا همه پایاننامه پدرم و قسمت زیادی از پایاننامه عمو و داییام رو من نوشتم :) جایزهاش هم بابام یه لپتاب ASUS برام خرید که هنوز سالمه!
هدف این قانون
فکر میکنم میفهمم که هدفشون چی بوده. میخواستند که زبان فارسی تقویت بشه. محتوای درخور برای زبانفارسی تولید بشه ولی با قوانینی که گذاشتند به طور کامل در این زمینه شکست خوردند!
بیاید با موضوع پایاننامه ارشد من شروع کنیم. «تشخیص و دستهبندی خودکار و بیدرنگ پولیپ با استفاده از هوش مصنوعی تفسیرپذیر» موضوع منه. یعنی دارم چیکار میکنم؟ ببینید تو روده بزرگ یه سری پولیپ داریم که بعضا مستعد سرطانیشدن هستند یعنی ممکنه رشد بیش از حد در برخی نواحی روده (کولون) داشته باشیم. برای تشخیص این مورد، پزشک از کولونوسکوپی استفاده میکنه که یه دستگاهی هست که وارد روده میشه و فیلم میگیره. حالا کار من تو این پروژه اینه که از روی تصاویر دستگاه کولونوسکوپی، پولیپها رو تشخیص بدم و بر اساس سرطانی بودن و نبودن دستهبندی کنم.
به جملات بالایی نگاه کنید. چند کلمه انگلیسی میبینید که معادل فارسی ندارند؟ به من بگید کولونوسکوپی رو چی ترجمه کنم که مجبور نباشید دوباره انگلیسیاش رو بخونید.
جامعه مخاطب = صفر
آخرین باری که بررسی کردم تو ایران اینکار خیلی بصورت محدود انجام شده بود (در حد دو سه تا) که متعلق به چند سال پیش بود. حالا بر فرض این که من این پایاننامه رو بنویسم. چند نفر داخل ایران، پایاننامه من رو مطالعه خواهند کرد؟ تقریباً هیچکس جز استاد راهنمای بنده و البته داور. بعد به زبالهدان تاریخ خواهد پیوست.
در بهترین حالت ۴ ۵ سال دیگه یه نفر دوباره تو ایران به سرش میزنه که روی این موضوع کار کنه. فیلد هوش مصنوعی کلا تو چهار سال زیر و رو میشه و پایاننامه من نوعی دیگه ارزش مطالعه نخواهد داشت. فکر نکنید فقط پایاننامه من به این شکله. کلی پایاننامه تو کتابخونه آزمایشگاههای مختلف شریف هست که هیچکس مطالعه نمیکنه.
همین پایاننامهها اگر بصورت انگلیسی نوشته میشد به راحتی کلی جامعه مخاطب خارجی داشت. اصلاً زبان علم انگلیسی هست. من متوجه نمیشم که فارسی نوشتن پایاننامه چه پوینتی داره. فکرشو بکنید ۹۹ درصد مطالب یه حوزه داره به زبان انگلیسی چاپ میشه، حالا من نوعی میام خودشیرینی میکنم و فارسی مینویسم. کی کار من رو میخونه؟
تنها استفاده من از پایاننامه اونوقتی بود که یه پنجره هی باز میشد، پایاننامه دکترای یکی از بچهها و یه سری کتاب قطور دیگه رو گذاشتم پشتش که باز نشه؛ البته مشخص بود که طرف رو پایاننامه دکتراش خوب کار نکرده؛ چون بعد از اولین باد، پایاننامه افتاد. البته این فقط مربوط به من نبود، تو بقیه آزمایشگاهها هم پایاننامه معمولاً کاربردی جز زیرمانیتوری براش متصور نبود (که بعضیهاش به درد همون هم نمیخورد). این تست برای پایاننامههای ارشد دیگه کاربرد نداره چون پایاننامه به دلیل صرفهجویی در مصرف کاغذ دیگه حتی چاپ هم نمیشه.
شاید بگید که اغراق میکنی! اجازه بدید دو تا قانون دیگه پایان نامه رو مرور کنیم که بفهمیم اغراق نمیکنم.
عدم دسترسی ایرانیان به متن پایاننامه
اولاً پایاننامههای کارشناسی ارشد دیگه بصورت فیزیکی چاپ نمیشن. یعنی این چند ورق کاغذی که قریب یک ماه فقط صرف نوشتنش میشه حتی ارزش چاپ بصورت فیزیکی هم نداره. لابد میشه به صورت آنلاین مطالعه اش کرد. نه؟ بله میشه فقط به شرطی که برید داخل شریف. آیا همین کافیه؟ نه. باید یه نامه از طریق استاد راهنماتون بزنید که به مطالب فلان پایان نامه نیاز دارید. بعد برید داخل کتابخانه شریف بشینید مطالعه کنید و نوت برداری کنید و بیاید بیرون.
پس جامعه مخاطب که قرار بود کل ایران باشه به لطف قوانین کتابخانه مرکزی به دانشجویان شریفی که استاد راهنماشون امضا کرده باشه تقلیل یافت.
غیرقابل خوندن متن پایاننامه
قانون: متن پایاننامه باید به زبان فارسی (بخوانید عربی) نوشته شود.
پایاننامههای فارسی اصلا قابل خوندن نیست! من با خوندن متن جملات سمینار و پایاننامه خودم و دوستام کلی خندیدم. مثلاً به شبکه CNN باید بگیم شبکه پیچشی عصبی. به مدل Detection باید بگیم آشکارسازی. به Self-supervised باید بگیم خودنظارتی. به Ablation Study باید بگیم مطالعه فرسایشی.
مسئله اصلی اینه که این کلمات در زبان روزمره و عادی ما به کار نمیرن و فقط تو نوشتههای آکادمیک به کار میرن (که اونم عمراً اگر کسی متوجه بشه که چی نوشتید). من در مورد کلمه «مطالعه فرسایشی» از چند تا از اساتید هوشمصنوعی پرسیدم و اکثراً این کلمه به گوششون هم نخورده بود. حالا چه مرضی هست که من به جای کلمه روان و قابلفهم Ablation Study از مطالعه فرسایشی استفاده کنم.
این مورد به حدی جدی هست که تصمیم داشتم پایاننامه خودم رو به زبان فارسی سلیس در وبلاگم منتشر کنم. فارسی سلیس که میگم یعنی جوری صحبت کنم که شما بفهمید دارم چی میگم.
البته چون به لحاظ قانونی حق ندارم پایاننامهام رو منتشر کنم میخواستم یه کار دیگه بکنم (که نکردم). قسمتهایی که به نظرم برای بقیه میتونه مفید باشه (مثل ادبیات تحقیق) رو اول به زبان آدمیزاد در وبلاگم مینویسم. بعداً به شکل پیچیده و غیرقابلفهم (خواسته دانشگاه) در میارم و بهشون تحویل میدم.
این که میگم تو زبان عادی ما به کار میرن؛ مثلاً این یه مکالمه کاملاً عادی من و دوستم راجع به تز ارشدم بود:
- حسن، امروز یه روش Semi-Supervised رو YOLO زدم ۲ درصد رو MAP بهبود داشتم. به خود Backboneاش هم دست نزدم.
- امیر، بزن تموم شه بره. هر چی زودتر دفاع کنی، راحتتری.
- من یه GradCAM هم بزنم، Interpretable بشه تمومه. این کلمه interpretability تو تزم اومده باید یه contributionای داشته باشم بالاخره.
مسئله اصلی اینه که این کلمات به شکل انگلیسیشون در زبان ما هضم شدند ولی معادل فارسیشون نه تنها استفاده نمیشه، بلکه هر وقت کسی از ترجمهاش استفاده بکنه، باید سریعاً انگلیسیاش رو هم بگه که همه متوجه بشن منظورش چیه. این نشون میده اون ترجمه کردن کار عبثی بوده.
پیشنهاد بنده
نوشتن پایاننامه به زبان فارسی، جدا یک «کار عبث» هست. پیشنهاد من اینه که پایاننامههای فنی همگی به زبان انگلیسی نوشته بشن. احتمالا با خوندن این توصیه به این فکر میکنید که اینطوری به زبان فارسی لطمه زده میشه و دایره لغاتی زبان فارسی کم میشه. در این زمینه آقای شعبانعلی مطلب مفیدی دارند که خوندنش خالی از لطف نیست و اتفاقا کاملا به بحث من مربوطه.
واقعیت تلخ: زبان فارسی در بستر احتضار مرگ… | روزنوشتههای محمدرضا شعبانعلی