عنوان مقاله: Exploiting Language Instructions for Interpretable and Compositional Reinforcement Learning

چکیده مقاله:

در این مقاله ، ما یک روش جایگزین برای ساخت یک عامل ترکیبی از طریق استفاده از یک طبقه بندی کننده تشخیصی ارائه می دهیم. به دلیل نیاز به عوامل قابل توضیح در فرآیندهای تصمیم گیری اتوماتیک ، ما سعی می کنیم فضای نهان را از یک عامل RL تفسیر کنیم تا هدف فعلی آن را در یک آموزش زبان پیچیده مشخص کنیم. نتایج نشان می دهد که فرایند طبقه بندی باعث ایجاد تغییراتی در حالت های پنهان می شود که باعث می شود آنها راحت تر تفسیر شوند ، اما باعث تغییر عملکرد zero-shot به دستورالعمل های جدید می شود. و در آخر اینکه ، ما سیگنال نظارتی را در طبقه بندی محدود می کنیم و تأثیر مشابه اما کمتری را مشاهده می کنیم.

 

 

دانلود مقاله از کانال تلگرام

اشتراک اجتماعی

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *