یادگیری تقویتی (Reinforcement Learning)

دسته بندی: آموزش هوش مصنوعی (AI)

آموزش یادگیری تقویتی

آنچه در این صفحه می خوانید:

معرفی یادگیری تقویتی (Reinforcement Learning)

یادگیری تقویتی (RL) بخشی از یادگیری ماشین در رشته هوش مصنوعی است که مربوط به چگونگی عملکرد نرم افزارها در یک محیط می باشد تا بتواند مفهوم پاداش تجمعی را به حداکثر برساند. یادگیری تقویتی یکی از سه الگوی اصلی یادگیری ماشین، در کنار یادگیری نظارت شده و یادگیری بدون نظارت است.

یادگیری تقویتی با یادگیری نظارت شده در عدم نیاز به برچسب ورودی / خروجی دارای برچسب متفاوت است، و در عدم نیاز به اقدامات زیر بهینه برای صریح تصحیح، متفاوت است. درعوض، تمرکز بر یافتن تعادل بین اکتشاف (موضوعات غیرقابل بررسی) و بهره برداری (از دانش فعلی) است.

محیط به طور معمول در قالب یک فرآیند تصمیم گیری مارکوف (MDP) بیان می شود زیرا بسیاری از الگوریتم های یادگیری تقویتی کننده برای این زمینه از تکنیک های برنامه نویسی پویا استفاده می کنند. تفاوت اصلی بین روش های برنامه نویسی کلاسیک پویا و الگوریتم های یادگیری تقویتی این است که دومی دانش در مورد یک مدل دقیق ریاضی از MDP فرض نمی کند و آنها MDP های بزرگ را هدف قرار می دهند که در آن روش های دقیق غیرقابل استفاده می شوند.

Reinforcement Learning به اختصار RL، بیش از 100 سال پیش توسط ادوارد تورندیک، روانشناس، معرفی شده بود. این تکنولوژی، به جای اینکه برنامه نویس به آنها بگوید چه کاری باید انجام دهد، اجازه می دهد که عامل کامپیوتر / نرم افزار به خودش با بهترین راه کار task را انجام دهد. تعامل بین دو عنصر محیط و عامل یادگیری قرار دارد. در راه، عامل با محیطی که به عنوان سیگنال تقویتی شناخته می شود پاداش می گیرد. بر اساس پاداش، عامل از این دانش استفاده می کند و گزینه ها را برای اقدام بعدی می سازد. در حقیقت، رایانه ها مانند افرادی که نیاز به آموزش صریح ندارند یاد می گیرند. مجازات هایی که در طول راه برای عامل مصنوعی اتفاق می افتد، اما با روش های ثابت و محرمانه، عوامل متوجه می شوند و به بهترین روش را (بر اساس ورودی خام) بکار می گیرند.

به طور مداوم، انتخاب ها هنگام جداسازی خوب و بد انجام می شود. نمایش توسط Q-network انجام می شود که مجموع پاداش را حدس می زند. تکنولوژی در حال حاضر با ترکیبی از یادگیری عمیق قوی تر است که با استفاده از یک شبکه عصبی شبیه سازی شده برای شناسایی الگوهای / روند داده ها و انجام وظایف یادگیری کامپیوتر انجام می شود.

  • مراحل "علت و معلول" برای عامل RL

دوره یادگیری تقویتی

  • عامل مصنوعی وضعیت ورودی را تشخیص می دهد (RL ابتدا مسئله را شناسایی و فرموله می کند).
  • گام بعدی توسط استراتژی معین تعیین می شود.
  • سپس اقدام انجام می شود و پاداش / مجازات و مطابق با آن تقویتی می شود.
  • وضعیت اعلام شده ثبت می شود.
  • در نهایت، بهترین عملکرد را می توان برای افزایش نتایج تنظیم کرد.

مزایای یادگیری تقویتی

RL الگوریتم های یادگیری ماشینی است که عملکرد را به حداکثر می رساند. RL در موارد زیر به طور گسترده ای مورد استفاده قرار می گیرد:

  • ساخت و تولید: ربات ها از RL در هنگام برداشتن کالاها و قرار دادن آنها در موقعیت مناسب استفاده می کنند. پس از انجام درست، روش را با دقت ادامه می دهند.
  • مدیریت موجودی: استفاده از فضا امری ضروری برای تجارت الکترونیکی و خرده فروشان است - RL اجازه می دهد تا برای الگوریتم های که می تواند جهت انبارداری و بازیابی و بهبود عملیات انبار زمان را کاهش دهد.
  • حسابداری: RL در ارزیابی استراتژی های معاملاتی و بهینه سازی اهداف مالی کمک می کند.
  • مدیریت تحویل: RL مسائل را در Split Delivery Vehicle Routing حل می کند. Q-learning با ارائه یک وسیله نقلیه برای مشتریان متضاد مدیریت می کند.
  • قیمت گذاری داینامیک: RL استراتژی ها یا بهینه سازی قیمت گذاری های پویا را از طریق تقاضا، عرضه و تعامل با مشتریان ترویج می کند.
  • شخصی سازی تجارت الکترونیک: RL در تجزیه و تحلیل رفتار مصرف کننده و خرده فروشان محصولات و خدمات به عنوان منافع کمک می کند.
  • صنعت پزشکی: با الگوریتم های RL به حل مشکل DTR و پردازش داده های بالینی برای تصمیم گیری بر روی یک استراتژی درمان بر اساس ورودی های بیمار می پردازند.

انواع یادگیری تقویتی

دو نوع روش یادگیری تقویتی عبارتند از:

  • مثبت (Positive)

این به عنوان یک رویداد تعریف شده است، که به دلیل رفتار خاص رخ می دهد. این قدرت و فراوانی رفتار را افزایش می دهد و بر عملکردی که توسط عامل انجام می شود تأثیر مثبت می گذارد. این نوع تقویت کننده به شما کمک می کند تا حداکثر عملکرد و حفظ تغییرات را برای یک دوره طولانی تر انجام دهید. با این حال، تقویت بیش از حد ممکن است به بهینه سازی بیش از حد حالت منجر شود، که می تواند نتایج را تحت تأثیر قرار دهد.

  • منفی (Negative)

تقویت منفی به عنوان تقویت رفتارهایی تعریف می شود که به دلیل شرایط منفی که باید متوقف شده یا از آن جلوگیری می شود، رخ می دهد. این به شما کمک می کند حداقل موضع عملکرد را تعیین کنید.

آیا این نوشته را دوست داشتید؟
udacity-reinforcement-learning

دوره یادگیری تقویتی - Udacity Reinforcement Learning


متخصص یادگیری تقویتی شوید. اگر علاقه ای به یادگیری ماشین و تمایل به تعامل با آن از دیدگاه تئوری دارید، این دوره می تواند مفید واقع شود. با استفاده ترک...

1398/12/28 2145 بازدید زیرنویس دارد
udemy-machine-learning-advanced

آموزش یادگیری ماشینی (پیشرفته)


این دوره پیشرفته یادگیری ماشینی است. در این دوره با تمام نکات مربوط به یادگیری ماشینی مانند جنگل های تصادفی، درختان تصمیم گیری، شبکه های عصبی، یادگیری...

1398/12/16 4188 بازدید
packtpub-hands-on-artificial-intelligence-with-keras-and-python

آموزش کاربردی هوش مصنوعی با پایتون و Keras


در این دوره ، شما قادر خواهید بود تا با استفاده از Keras و Python برنامه های هوش مصنوعی در دنیای واقعی بسازید. شما می آموزید که چگونه با ایجاد برنامه ...

1398/10/07 5496 بازدید
packtpub-artificial-intelligence-in-3-hours

آموزش هوش مصنوعی در 3 ساعت


در این دوره با مفاهیم و تکنیک های پیشرفته هوش مصنوعی، کار با مجموعه داده های زندگی واقعی در مورد چگونگی کار آموزش ، ارزیابی مدل و نحوه پردازش اولین مج...

1398/09/29 4955 بازدید
packtpub-advanced-practical-reinforcement-learning-video

آموزش پیشرفته یادگیری تقویتی


یادگیری تقویتی (RL) به عنوان یک ابزار محبوب برای ساخت سیستم های خودکار شناخته شده است که خود را با تجربه بهبود می بخشد.  این دوره ویدیویی با نمونه های...

1397/07/29 2826 بازدید
packtpub-hands-on-reinforcement-learning-with-tensorflow-video

آموزش یادگیری تقویتی با تنسورفلو


برخی از بازی های ساخته شده با هوش مصنوعی مانند بازی AlphaGo، با کمک یک پارادایم یادگیری ماشینی به نام "یادگیری تقویتی" (RL) ساخته شده است. در این دوره...

1397/07/10 2630 بازدید
lynda-azure-machine-learning-development-1-basic-concepts

آموزش توسعه یادگیری ماشینی Azure - بخش 1 - مفاهیم پایه


علم داده  فرصت های جدید و هیجان انگیزی را به ویژه برای توسعه دهندگان مایکروسافت که می خواهند از قابلیت های هوش مصنوعی و  یادگیری ماشین Azure استفاده ک...

1397/06/14 1209 بازدید زیرنویس دارد
pluralsight-master-reinforcement-learning-algorithms

آموزش الگوریتم های یادگیری تقویتی


الگوریتم های یادگیری ماشین سنتی برای پیش بینی ها و طبقه بندی استفاده می شود. یادگیری تقویت کننده در مورد عوامل آموزشی برای تصمیم گیری برای به حداکثر ر...

1397/06/14 2941 بازدید زیرنویس دارد
packtpub-reinforcement-learning-techniques-with-r-video

آموزش تکنیک های یادگیری تقویتی با R


یادگیری تقویتی یک نوع یادگیری ماشینی است که به ماشین ها و عوامل نرم افزاری اجازه می دهد هوشمندانه و به طور خودکار رفتار مطلوب را در یک محیط خاص شناسای...

1397/06/03 1247 بازدید
packtpub-hands-on-reinforcement-learning-with-python-video

آموزش یادگیری تقویتی با پایتون


یادگیری تقویتی یکی از شاخه های هوش مصنوعی است که اجازه می دهد تا برنامه نویسان agents نرم افزاری ایجاد کنند که یاد بگیرند اقدامات بهینه را برای به حدا...

1397/02/30 3203 بازدید