متن اپیزود چهارم ایستگاه هوش‌ مصنوعی

توجه کنید که این متن توسط مدل‌های هوش‌مصنوعی تولید شده است و احتمال خطا در آن وجود دارد.

[0.00s -> 30.00s] ما تو قسمت های قبل راجع به این صحبت کردیم که یادگیری ماشین چیه و گفتیم که یه بخش بزرگی از اون چیزی که ما الان به عنوان داریم

[30.00s -> 60.00s] بان یادگیری ماشین می شناسیم یادگیری نظارتیه یا سوپروایز لرنینگ بعد یادگیری نظارتی رو توضیح دادیم و گفتیم که یادگیری نظارتی وقتی اتفاق میافته که به ازای هر داده یه برچسب داشته باشیم یه سری مثال هم زدیم که دوباره نمیخوام وا ردش بشم بعد دیدیم که یک سوال پیش میاد و اون سوال اینه که اصولا چیزی که ما بهش میگیم یادگیری

[60.00s -> 90.00s] یعنی چی و اون دیدی که ما راجع به یادگیری انسان داریم چه ارتباطی داره به اون یادگیری که کامپیوتر داره انجام میده تو این قسمت میخوایم راجع به یادگیری صحبت کنیم

[90.00s -> 120.00s] ببینید داستان اینه از یک جایی به بعد یک سری افراد اومدن گفتن که خیلی از کارهایی که ما داریم الان انجام میدیم به عنوان آدمیزاد اینها صرفا یک سری تابهان تابه به چه معنا تابه به همون معنایی که تو ریاضیات دبیرستان خوندیم به این معنا که وقتی من یک مرودی میدم یک خروجی بگیرم دو تا خروجی نگیرم

[120.00s -> 150.00s] پنج تا خروجی هم نگیرم یک خروجی بگیرم مثلا اگر تابه خطی ایگرگ مساوی ده ایکس رو در نظر بگیریم یک تابه که وقتی ایکس رو به عنوان ورودی بهش صفر میدم ایگرگم میشه صفر وقتی ایکس رو یک میدم ایگرگم میشه ده

[150.00s -> 180.00s] که تو منطقه یک تهرانه قیمت خونه رو پیش بینی کنم بگم قیمت این خونه چنده یعنی تو این مسئله ورودی من میشه متراج خونه خروجی من میشه قیمت خونه و هیچ اطلاعات دیگه ای رم راجع به هیچ چیز دیگه ندارم یعنی من نمیدونم تعداد اتاقاش چقدره نه عکس خونه رو دارم هیچ اطلاعاتی از خونه ندارم صرفا میخوام با توجه به متراش قیمت رو تخمیم بزنم اینجا یک کاری که میشه ان

[180.00s -> 210.00s] خب ببینیم خونه تو منطقه یک متری چنده اون متر رو ضربدر متراج خونه کنیم مثلا اگر خونه تو منطقه یک متر دویست میلیون تومنه و خونه ما صد متره خب خونه میشه بیست میلیارد و قیمت خونه به دست میاد این الان یه نمونه تابه که دویست میلیونو ضربدر متراج خونه میکنه و قیمت خونه رو پیش بینی میکنه

[210.00s -> 240.00s] من اگر بتونم همچین تابعی رو پیدا کنم میگم مسئلم رو یاد گرفتم یعنی یادگیری ماشین که یه کانسپته یه ایده ای عجیب غریب بود و نمیدونستیم داریم راجع به چی صحبت می کنیم تقلیل پیدا کرد به یادگیری یه تابع ریاضی

[240.00s -> 270.00s] و خروجی رو بگیرم میگم اون مسئله رو یاد گرفتم تمامی یعنی ما کار نداریم وقتی یه پزشک به یه تصویر سی تی اسکن مغز نگاه میکنه چه اتفاقاتی تو سرش میافته به چی فکر میکنه که تشخیص میده این بیمار سرطان داره یا نه ولی فرض می کنیم که یه تابعی وجود داره تو دنیا که اون تابع رو ما اگه بتونیم پیدا کنیم وقتی بهش ورودی

[270.00s -> 300.00s] تصویر سی تی اسکن مغزو میدیم خروجیش به اون یه عدد میده اگر اون عدد صفر بود مثلا یعنی این بیمار سرطان ندارد اگر یک بود یعنی سرطان دارد

[300.00s -> 330.00s] ولی نه مسئله ما سخت تر شد چون ما الان تعداد توابعی که تو دنیا داریم بی نهایته بزای هر مسئله ای که در نظر بگیرید با هر تعداد ورودی و هر تعداد خروجی که میخواید بهش فکر کنید حتی با یه ورودی و یه خروجی تعداد توابعی که میتونیم داشته باشیم بی نهایته برای همون مسئله پیش بینی قیمت خونه بهش فکر کنید که این مسئله کاملا ساده است

[330.00s -> 360.00s] قیمت متراج خونه و قیمت خونه رابطه خطیه شاید تو دنیای واقعی بهترین تابعی که این رو تخمین میزنه تابعی خطی نباشه شاید تابعیش یه شکلی از سینوس هم داخلش داشته باشه شاید اصلا تابعیش رادیکالی باشه شاید تابعیش ایکس دو باشه اصلا شاید یه فرم عجیب غریبی داشته باشه تابعیش که تا یه جایی بالا بره و از یه جایی به بعد دیگه قیمتش چندان به اینها بستگی نداش

[360.00s -> 390.00s] که ما نمیدونیم تو دنیای واقعی چه تابعیه که داره این قیمت رو تولید میکنه

[390.00s -> 420.00s] بالاخره یه مقداری به تصادف بستگی داره یه مقداری نویزه یه مقداری هم اصلا برمی گرده به خطای اندازه گیری ما یه چیزایی هم هست که ما در نظر نگرفتیم و اینا همش میتونه باعث بشه که یه مقداری از خطا داشته باشیم مثلا تو مسئله همون پیش بینی قیمت خونه ما وقتی بخوایم فقط با یک متراش قیمت خونه رو پیش بینی کنیم خب مشخصه که اینجا خطا خواهیم داشت

[420.00s -> 450.00s] ولی حتی اگر بریم اون صدتا عامل دیگه را هم در بیاریم بازم ممکنه یه عامل دیگه ای باشه که بهش بستگی داشته باشه و ما در نظر نگرفته باشیم پس همیشه میتونیم در نظر بگیریم که یه مقداری از خطا خواهیم داشت و این خطا غیر قابل کاهشه

[450.00s -> 480.00s] اگر بخوایم مسئله مونو این جوری تعریف کنیم که بگیم یه تابعی وجود داره میخوایم یاد بگیریم از اول کار باید بنا رو بزاریم به اینکه خب هیچ وقت نمیشه صد درصد باشه این تابع مون صد درصد همیشه درست جواب بده میتونیم نود و نه نه دهم ازش انتظار داشته باشیم تو بعضی وقتا بعضی جاها ولی صد درصد نمیشه دیگه از قدیم هم میگفتن خیلی از معلم ها که بیست مال خداست و بیست

[480.00s -> 510.00s] حالا اینجا ممکنه برای یکی سوال پیش بیاد و اتفاقا سوال درستی هم هست و اون اینکه شما مسئله پیش بینی قیمت خونه یه مسئله ساده انتخاب کردی که ورودیش اتفاقا عدد بود متراج خونه و خروجیش هم عدد بود قیمت خونه

[510.00s -> 540.00s] ما ورودی مون تو ماشین لرنینگ تو یادگیری ماشین یا عدد هست به صورت پیش فرض که خب خوشحالیم یا عدد نیست که به زور تبدیل می کنیم به عدد و مسئله حل میشه

[540.00s -> 570.00s] که شما یه تصویر سی تی اس کن دارید این تصویر سی تی اس کن رو میخواید بدید به این مدل یادگیری ماشین وقتی میگم مدل تو ذهن خود تون ترجمه کنید به یه تابه که بیشتر ارتباط بگیرید با هاش که مدل یعنی چی میخوایم این تصویر رو بدیم به یه تابه خب چجوری میتونیم تصویر رو بدیم به یه تابه داستان اینه که اگر شما مثلا از این تصویر سی تی اس کن با گوشی تون عکس بگیرید

[570.00s -> 600.00s] گوشی شما مثلا دوربینش پنجاه مگاپیکسله. پنجاه مگاپیکسل یعنی به ازای هر تصویر پنجاه میلیون پیکسل وجود داره. بعد تک تک این پیکسلا یه مقدار آر دارن یه جی دارن یه بی دارن سه تا مقدار دارن که هر کدوم از اون سه تا مقدار بین صفره تا دویست و پنجاه و پنج پس بازم به عدد تبدیل شد یعنی من اینجا یه

[600.00s -> 630.00s] مسئله دارم که پنجاه میلیون پیکسل داره هر پیکسل هم سه تا مقدار ممکنه داشته باشه یعنی صد و پنجاه میلیون ورودی دارم یه خروجی صد و پنجاه میلیون ورودی دارم و یه خروجی اون خروجی ها چیه اون خروجی ها میگه که آیا مریض سرطان داره یا نه اگر یک بود یعنی سرطان داره اگر صفر بود یعنی سرطان نداره و حالا من اگر بتونم یه تابه پیدا کنم

[630.00s -> 660.00s] این ورودی ها رو بدیم خروجی ها رو بگیرم میگم یاد گرفتم خوشحال میشم میگم خب تصویر رو این جوری گفتی متن رو چی کار می کنی متن که دیگه عدد نیست با متن ها هم عدد می کنیم فرض کنید طرف میگه آیم استیودنت من میتونم به آی یه کد نسبت بدم بگم آی مثلا کدش باشه ده ام کدش باشه صد استیودنت کدش باشه هزار

[660.00s -> 690.00s] قطعا این روش نسبت بدن کد بهترین روشی نیست که من میتونم یه کلمه رو به یه کد نسبت بدم

[690.00s -> 720.00s] آیا حرف حرف بشکنم آیا کلمه رو بیام تکه تکه کنم مثلا می کنم و می و جدا در نظر بگیرم کن و جداعم و جدا یا اینکه می کنم و کلا یه کلمه در نظر بگیرم اینها مسائلیه که میشه راجبش بحث کرد ولی کلیت بحث جایی نمیره همه چیز در یادگیری ماشین عدده

[720.00s -> 750.00s] اینجا یکی ممکنه بگه که اوکی باشه من اصلا حرفایی که تو میه گیو پذیرفتم من اصلا دنیا رو هرچی که تو دنیا هست به صورت یه سری عدد می بینم خوبه دیگه تهش همینه دیگه بعد حالا هر مسئله ای که تو دنیا هستو اینجوری می بینم که یه تابه تخمیم بزنیم

[750.00s -> 780.00s] باشه حالا یه سوال تو چجوری میخوای از بین تمام توابعی که وجود دارن یه دونه تابه ور داری انتخاب کنی و خوب سوال قشنگیه و دانشمندان سوال ها به این سوال فکر کردن یه جوابی که برای این سوال فهمیدن این بوده که یکی از مهم ترین جواباش اینه که خوب شما نمیتونی بری همه ی

[780.00s -> 810.00s] توابع و بگردی پیدا کنی بیا یه زیرمجموعه از این توابع و انتخاب کن بعد یه روشی ارائه بده که تو این زیرمجموعه ای که انتخاب کردی بتونی بهترین تابه و در بکشی حالا بهترین تابه هم نتونستی در بکشی اشکال نداره بتونی یه تابه مناسب از اونجا بکشی بیرون استخراج کنی به من بدی مثلا فرض کنید که

[810.00s -> 840.00s] کل توابعی که ما تو دنیا داریم یه مستطیله اول روشش اینه که اول بیایم یه دایره کوچیک خیلی خیلی کوچیک از این مستطیله انتخاب کنیم بگیم خوب این فضای توابعیه که من در نظر گرفتم به این کار میگم انتخاب مدل یا مدل سلکشن که خوب میشه ساعت ها در موردش صحبت کرد که شما باید چه منطقی و چه

[840.00s -> 870.00s] رساسی اومدی یه دایره این فضا رو انتخاب کردی از اون فضای بزرگی که وجود داشت بعدش که اینو انتخاب کردن باید بگن خوب از این فضای کوچیکی که انتخاب شد حالا شما چه روشی داری چه روشی میتونی ارائه بدی که با توجه به داده هات بتونی یه تابه مناسب از این استخراج کنی

[870.00s -> 900.00s] یه دایره کوچیک انتخاب کنیم میگیم مدل سلکشن انتخاب مدل و از اینکه بر داریم حالا تو این دایره کوچیکی که انتخاب کردیم یه نقطه پیدا کنیم یه تابه پیدا کنیم استخراج کنیم میگیم ترین کردن یا آموزش دادن مدل

[900.00s -> 930.00s] روزها و هفته ها و چه بسا ماها میزاریم آموزش ببینم روی یه سرور نه دو سرور نه چند هزار تا سرور با چند هزار تا جی پی او تهش نتیجه اش چیه نتیجه اش اینه که یه تابه در میاد مشخصات دقیقه یه تابه در میاد که اون تابه رو ما معتقدیم که به درد میخوره و مفیده و اتفاقا هم هست

[930.00s -> 960.00s] ما تو این قسمت یه خوره بحث مون انتزاعی شد و راجع به این صحبت کردیم که یادگیری یعنی چی و خب با هم دیدیم که یادگیری یعنی اینکه یه دونه تابه و از فضای کل توابعی که داریم انتخاب کنیم ته شون تابه و تحویل بدیم ولی خب فکر می کنم برای اینکه بهتر بتونیم درک کنیم یه نمونه مثال ساده بزنیم

[960.00s -> 990.00s] حالا تو قسمت بعد ایده ام اینه که یه مثال ساده بزنیم راجع به یه مدل خیلی ساده به نام رگرسیون خطی ببینیم که اگر ما فضا مونو خط فرض کنیم چگونه میتونیم اون تابه رو یاد بگیریم چجوری ارزیابیش کنیم و چه و چه و چه امیدوارم که برا تون مفید باشه