یادگیری تقویتی رو با دست به کد شدن درک کنین | به بهانه اهدای جایزه تورینگ امسال

یادگیری تقویتی رو با دست به کد شدن درک کنین | به بهانه اهدای جایزه تورینگ امسال

Jadi Mirmirani

55 лет назад

7,533 Просмотров

امروز اندرو بارتو و ریچارد ساتون به عنوان برندگان جایزه تورینگ معرفی شدن؛ جایزه‌ای که به عنوان نوبل کامپیوتر شناخته می‌شه. هر دوی اونها دهه‌ها است که روی یادگیری تقویتی کار کردن؛ حوزه‌ای که بسیاری از هوش مصنوعی‌هایی که اطرافمون می‌بینیم ازش بهره می‌برن. از ماشین‌های خودران گرفته تا ربات‌ها و برنامه‌های شطرنج و تحلیل بازار. توی این ویدئو به این بهانه سعی می‌کنم مفهوم کلی یادگیری تقویتی رو توضیح بدم، منابعی برای شروعش معرفی کنم و در نهایت کمی هم دست به کد بشیم تا فرصتی بشه برای شروع استفاده از کتابخونه‌هاش توی پایتون. کتاب‌خونه مورد استفاده Gymnasium از OpenAI است.

کدی که توی ویدئو می‌بینین رو می‌تونین از اینجا بردارین:
https://gist.github.com/jadijadi/012e1aa5f255f3c4477bd8bc1eebc76e

برای حمایت:
پتریان: https://www.patreon.com/jadijadi
یوتیوب: https://www.youtube.com/channel/UCgKePkWtPuF36bJy0n2cEMQ/join
بقیه لینک‌ها: https://linktr.ee/jadijadi
Ссылки и html тэги не поддерживаются


Комментарии: