توجه کنید که این متن توسط مدل‌های هوش‌مصنوعی تولید شده است و احتمال خطا در آن وجود دارد.

[0.00s -> 30.00s] ما تو قسمت های قبل راجع به این صحبت کردیم که هوش مصنوعی چیه و کجا به درد می خورد

[30.00s -> 60.00s] تو این قسمت میخوام یک دسته بندی کلی از روش های یادگیری ماشین ارائه بدم و بعد تو قسمت های بعد هر کدوم از این دسته ها رو به طور خاص تر راجع به شون صحبت کنیم ببینیم داستارشون چیه. اصولا روش های یادگیری ماشین رو سه دسته میکنن

[60.00s -> 90.00s] بعد می خواهیم راجع به این ها صحبت کنیم. خب با اولین دسته شروع می کنیم روش های یادگیری نظارتی یا سوپروایز لرنینگ احتمالا با کلمه سوپروایزر آشنایی دارید

[90.00s -> 120.00s] سوپروایزر یا ناظر قراره به اون کمک کنه که بتونیم کارمونو بهتر انجام بدیم و تو یادگیری ماشین هم یک سری روش ها داریم که این روش ها نیاز به یک سوپروایزر دارن نیاز به یک ناظر دارن تا بتونن کارشون که تشخیص کارشون که یادگیری رو بهتر انجام بدن به این روش ها میگیم سوپروایز لرنینگ

[120.00s -> 150.00s] و خب سوال پیش میاد که ناظرتون کیه میگیم ناظرمون برچسبخان یا لیبل ها فرض کنید که میخواید تشخیص احساس انجام بدید یعنی یک جمله رو بگیرید و بگید اوکی این جمله مثبت هست یا منفی هست یا حالا خنثی هست

[150.00s -> 180.00s] یک سری جمله استخراج می کنید حالا از هر جایی مثلا میرید از اسنپ و دیجی کالا یک سری جمله برمی دارید بعد این جملات رو برچسب می زنید میگید این جمله مثبته این جمله منفیه و این جمله خنثیه پس به ازای هر جمله یک برچسب داریم حالا وظیفه روش شما این میشه که این هزار تا جمله رو ببینه و یا

[180.00s -> 210.00s] بیاد بگیره بفهمه که هر کدوم لیبل برچسب هر کدوم از این هزار تا جمله چیه البته قراره که یک الگویی رو استخراج کنه که بفهمه نه که حفظ کنه و بگه که دقیقا این جمله برچسبشین میشه سعی میشه که یک الگویی رو از اینها در بیاره البته من تو اینجا یادگیری و همین جوری استفاده کردم و خیلی تعریف نکردم

[210.00s -> 240.00s] ولی خب شما در این حد در نظر بگیرید که هرچی مدیر من بهتر بتونه وقتی یک جمله بهش دادیم تشخیص بده که مثبت هست یا منفی ما میگیم بهتر یاد گرفته هرچی عملکرد بهتری داشته باشه میگیم بهتر یاد گرفته

[240.00s -> 270.00s] بگیره یعنی حتما هر داده یک برچسبم داره کنارش

[270.00s -> 300.00s] که مثلا قیمت خونه انقدره مشخصاتش چیه مشخصاتش میتونه متراجش باشه تعداد اتاقش باشه متراج هر کدوم از اتاقاش باشه تعداد همون دستجویی نمیدونم محله ای که داره سال ساختش و تمام چیزهایی که راجع به خونه وجود داره رو میتونید به عنوان ورودی در نظر بگیرید و قیمت خونه رو به عنوان خروجی در نظر بگیرید اون چیزی که ما بهش میگیم برچسب

[300.00s -> 330.00s] حالا تو روش نظارتی این برچسب ها نظارت می کنند که مدل بهتر یاد بگیره

[330.00s -> 360.00s] یا مثل مثال تشخیص قیمت خونه یا پیش بینی قیمت خونه یک عدد باشه یک عددی که هر مقداری رو میتونه داشته باشه

[360.00s -> 390.00s] ما میتونیم رو تصویر یه برچسب بزنیم که آره یا خیر سرطان دارد یا ندارد میتونیم دقیق تر بشیم بگیم بله سرطان دارد و سرطان تقریبا تو این ناحیه است مثلا یه ناحیه ای رو مشخص کنیم یه مستطیل دولش بکشیم یا میتونیم خیلی دقیق تر بشیم میتونیم پیکسل به پیکسل مشخص کنیم که سرطان دقیقا اینجاست

[390.00s -> 420.00s] و خب ما از مدل ها انتظار داریم که وقتی ریزدانگی مون بیشتر میشه وقتی جزئیات بیشتری رو به شون میدیم باید بتونن با همون جزئیات بیشتر به اون خروجی بدن

[420.00s -> 450.00s] همون مثال سی تی اسکن که من گفتم برای اینکه تشخیص بدیم که یک تصویر تو امور داره یا نه نیازه که وقت متخصص گرفته بشه و متخصص بگه که این عکس تو امور داره یا نداره منو شما که نمیتونیم بگیم و قاعدتا وقت متخصص هم بسیار ارزشمنده حالا بستگی به کاری که میخوایم انجام بدیم و اون تسکی که انجام میدیم درجه تخصص اون

[450.00s -> 480.00s] وقت فرق میکنه مثلا میتونه یک پزشک باشه یا میتونه یک آدم ساده باشه مثل من و شما چون تشخیص احساس و من و شما هم میتونیم برچسب بزنیم شاید برا تون جالب باشه که این کار تبدیل به یک شغل شده و خیلی از افراد هستن که میرن یک سری داده رو دریافت میکنن حالا یک هزینه ای رو میگیرن و برچسب میزن و تحویل میدن

[480.00s -> 510.00s] از نظارتی خیلی کار داریم و به زودی به شون برمی گردیم و خیلی راجع به شون صحبت می کنیم ولی فکر می کنم فعلا کافی باشه یک دید کلی نسبت به شون پیدا کردید و فهمیدید که ویژگی اصلی شون اینه که برچسب دارن

[510.00s -> 540.00s] دسته دومین روش های یادگیری ماشین میشن یادگیری بدون نظارت یا آن سوپروایز لرنینگ

[540.00s -> 570.00s] ندارن برچسب نمیخوان یا اصلا آقا بالا سر نمیخوان خب پس چجوری کار میکنن روش کار شون اینه که شما یک مجموعه از داده به شون میدید همین جور یه سری داده هست به شون میدید میگید آقا شما زحمت بکش از این داده ها برای ما یک معنی استخراج کن و خب مدیر سعی میکنه ببینه چه معنی میتونه استخراج کن

[570.00s -> 600.00s] روش ها میشه کلاسترین یا خوشه بندی یا چیزی که بعضی هم بهش میگن بخش بندی فرض کنید شما اگه مدیر کسب و کارید و میخواید رفتار مشتریاتونو بهتر بفهمید یا اینکه نیازهاشونو بهتر بشناسید یکی از کارایی که میتونید انجام بدید اینه که بیاید مشتریاتونو چند تا دسته کنید مثلا بگید پنج تا دسته

[600.00s -> 630.00s] و هر دسته رو بیاد با توجه به نیازهایی که دارن یه سری پیشنهاد ها به شون بدید یه سری کارا برا شون انجام بدید که خب این اصلا تو تخصص من نیست و اصلا یه اسمی داره به اسم مارکت سگمنتیشن و بخش بندی بازار و خب کسایی که مدیریت میخونن قشنگ میدونن که وقتی این کار انجام شد مرحله بعدیش چیه من اصلا مرحله بعدی اون کار ندارم به این کار دارم که دسته بندی مشتری

[630.00s -> 660.00s] آن کاریه که نیاز به هوش داره و هوش مصنوعی میتونه تو این مورد کمک کنه چطوری میتونه این کارو انجام بده روش اینه که مشتری های شما یک سری ویژگی ها دارند ویژگی های مثل قد جنس سن تسهیلات درآمد حالا یه سری از این ویژگی ها اصلا ممکنه نداشته باشیدا ولی خب هرچیو دارید درآمد

[660.00s -> 690.00s] نمیدونم مقدار خریدی که از تون داشتن اصلا چه جنسهایی خریدن چه چیزهایی رو نخریدن و مقدار خریدی که تو ماههای گذشته داشتن و کلا اطلاعاتی که راجع به مشتری وجود داره این ها رو میشه به یه الگوریتم کلاسترینگ داد به یه الگوریتم خوشه بندی داد و بهش گفت که سعی کن پنج تا دسته از این داده ها در بیاری مثلا که این پنج تا دسته مشتریهایی که تو هر دسته

[690.00s -> 720.00s] قرار دارن به هم نزدیک باشن از نظر معیارهایی که هست این میشه یه نمونه از خوشه بندی یا یک کار دیگه که میشه انجام داد با این روشهای بدون نظارت اینه که بیایم تشخیص آنومالی انجام بدیم یا تشخیص ناهنجاری ناهنجاری کلم فارسی شه آنومالی کلم انگلیسی شه همون طور که میدونید

[720.00s -> 750.00s] ناهنجار به نرم برمی گرده یعنی یه چیزی که نرماله ناهنجار یعنی یه چیزی که نرمال نیست فرض کنید که مثلا میخواید بازار بورس رو رصد کنید یه کاری که این روشهای تشخیص ناهنجاری میتونن انجام بدن اینه که وقتی یک سهمی از اون نرمالش خارج شد به شما اطلاع بدن یعنی فرض این روشهای اینه که مثلا مدل

[750.00s -> 780.00s] تو اکثر موارد تو نود و نه درصد موارد نرماله و یه جاهایی هست که رفتارای غیر نرمالی انجام میده اونو میشه تشخیص داد و مثلا اطلاع داد یا مثلا یه کاربرد دیگش میتونه این باشه که رفتارای سیستم کامپیوتری رو ورداره نظارت کنه ببینه که اگر مثلا یه چیز عجیب غریبی رخ داد مثلا نمیدونم سی پی و چسبوند یا مثلا مموری کم

[780.00s -> 810.00s] آورد یه چیز عجیب غریبی رخ داد که تا حالا رخ نداده بود یا خیلی نادر اتفاق میافته اینو مثلا مسئول زیرساخت اطلاع بده که آقا همچین اتفاقی افتاده و بیا ببین چی شده وضعیت پس اصل ایده این روش ها اینه که ما برای کارمون ما برای اون کاری که میخوایم انجام بدیم برچسب نداشته باشیم صرفا یک سری داده داشته باشیم و سعی کنیم یک محنایی از این داده ها

[810.00s -> 840.00s] استخراج کنیم

[840.00s -> 870.00s] این روش ها چه جوری ان این روش ها این جوری ان که خیلی شبیه ما هستن کاری که انجام میدن مبتنی بر پاداش و جذا یعنی این طوریه که ما اینارو میذاریم توی محیطی اینارو بعد به شون میگیم که خب جناب شما یه کاریو انجام بده بعد یه کاریو انجام میده

[870.00s -> 900.00s] میگیم شما حق داری دورتا دورتا نگاه کنی چپ بری راست بری بالا بری پایین بیای این چهار تا کارو میتونی انجام بدی بعد مبتنی بر اینکه چه کاری انجام بده یا تشویقش می کنی یا میزنی تو سرش یا تشویقش می کنی یا تمبیه اش می کنی که خب تو ادبیات یادگیری ماشین به این تشویقه میگن ریوارد مثبت یا پاداش مثبت به تمبیه میگن پاداش منفیه

[900.00s -> 930.00s] و خب این پاداش میتونه آنی باشه و میتونه تاخیر داشته باشه چطوری مثلا فرض کنیم با مدل میگیم جناب شما شطرنج بازی کن وقتی مدل داره شطرنج بازی میکنه شطرنج بازی کردن چیزی نیست که بتونه الان نتیجه کاری که انجام میده رو ببینه ممکنه الان یه حرکتی انجام بده که حتی وزیرش از دست بره ولی بتونه اونو مات کنه با این حرکتی

[930.00s -> 960.00s] پس نمیشه به سادگی تشخیص داد این کاری که انجام داد جزاش مثبته یا منفیه پس کاری که انجام میدیم اینه که صبر می کنیم تا آخر بازی اگر برد میگیم باریکلا اگر باخت می زنیم تو سرش یا پاداش منفی بهش میدیم و ما انتظار داریم تو این روش ها این مدل وقتی محیط شا دید که حالا محیط تو این جا میتونه بازی شطرنج باشه وقتی محیط شا

[960.00s -> 990.00s] دید و با محیطش یکسری کار انجام داد کم کم محیطشو بشناسه و بتونه بفهمه تو این محیط چه کاری خوبه و چه کاری بده چطوری باید تو این محیط رفتار کنه که بتونه بیشترین پاداش رو بگیره در واقع هدف مدل ما این میشه که بتونه بیشترین پاداش رو تو محیطی که وجود داره به دست بیاره

[990.00s -> 1020.00s] بزارید یه مثال دیگه هم بزنم فرض کنید یه ماشینی هست که میخواد توی محیطی یه محیط دوبودی از سه تا تپه عبور کنه بعد این ماشین کارایی که میتونه انجام بده یه گازه یه ترمزه و اطلاعاتی که از محیط داره اینه که خودش کجا و همین بعد تو هر زمان این ماشین یا گاز میده یا ترمز میگیره

[1020.00s -> 1050.00s] بعد خیلی سخته برای اینکه ما بیایم به ماشین یاد بدیم که شما دقیقا کجا مثلا ترمز بگیر کجا گاز بده

[1050.00s -> 1080.00s] یه نوعی گاز بدی و ترمز بگیری که بتونی این سه تا تپه رو رد کنی بدون اینکه از هیچ تاش نتونی بالا بری چون میدونی مثلا یه تپه اگر زیاد چیز داشته باشه باید بتونه زیاد گاز بده اگر تونستی همه این سه تا تپه رو رد کنی و چپه هم نکردی ما اینجا به دیگه وارد مثبت میدیم و مدل رو می زنیم تو محیط میگیم انقدر این محیط رو سعی کن انقدر این محیط رو برو

[1080.00s -> 1110.00s] تا بتونی یاد بگیری که چطوری باید با محیط تعامل کنی

[1110.00s -> 1140.00s] ولی این تنها کاربردش نیست و کاربردهای دیگه هم داره مثلا اگر بخوایم یه رباتی داشته باشیم که این رباته بتونه تو هر شرایطی تعادلش را حفظ کنه این از یادگیری تقویتی استفاده میکنه کاری هم که انجام میدیم اینه که حالا ربات رو درست می کنیم بعد دستشو پاشو همه چیشو بهش وصل می کنیم میذاریمش تو محیط بعد سعی می کنیم یه سری

[1140.00s -> 1170.00s] بینا اینا بهش بدیم که بتونه با محیط تعامل داشته باشه محیطو ببینه بعد او یه سری کار انجام میده تو این محیط بعد ما هی بهش پاداش و جذاب میدیم تا نهایتا یاد بگیره که تو محیط چطور راه بره و این خیلی چیز ارزشمندیه و به خاطر همینه که میگم این روش ها با روش های قبلی خیلی تفاوت دارن چون این روش ها یک المان دارن به نام تاخیر و خب تا کاری رو انجام ندن

[1170.00s -> 1174.00s] ما نمیتونیم بهشون پاداش بدیم یا جذاب بدیم.

[1200.00s -> 1230.00s] بعد از اون روش های بدون نظارتو گفتم و گفتم روش های بدون نظارت اوناین که نیاز به برچسب ندارن و نهایتا روش های یادگیری تقویتیو گفتم که روش هاین که نیاز دارن با محیط تعامل کننو توی حالت سعی و خطا مثل کاری که بچه انجام میده اینجوری یاد بگیرن

[1230.00s -> 1260.00s] به طور خاص میخوام بگم که اصلا یعنی چی که ما یاد می گیریم یعنی چی که میگیم مدل یاد میگیره مگه اصلا کامپیوتر میتونه چیزیو یاد بگیره و اینکه این چیزی که ما داریم بهش میگیم یادگیری و اون چیزی که آدمیزاد یاد میگیره تفاوت داره یا یکیه با ما همراه باشید