عنوان مقاله: The utility of tactile force to autonomous learning of in-hand manipulation is task-dependent

چکیده مقاله:

سنسورهای لمسی اطلاعاتی را ارائه می دهند که می تواند برای یادگیری و اجرای کارهای دستکاری استفاده شود. با این حال ، کارهای مختلف ممکن است به سطوح مختلفی از اطلاعات سنسوری نیاز داشته باشد، که به نوبه خود به احتمال زیاد بر میزان یادگیری و عملکرد تأثیر می گذارد. در این مقاله نقش اطلاعات لمسی در یادگیری مستقل دستکاری با یک دست شبیه سازی شده ۳ انگشتی بررسی می شود. ما توانایی همان الگوریتم یادگیری (Proximal Optimization Policy، PPO) را برای یادگیری دو کار دستکاری (چرخاندن یک توپ در مورد محور افقی با و بدون سختی چرخشی) با سه سطح سنجش لمسی مقایسه می کنیم. بدون سنجش ، نیروی عادی ۱D و بردار نیروی سه بعدی. با کمال تعجب ، و بر خلاف کار اخیر در مورد دستکاری ، اضافه کردن نیروی سنجش ۱ بعدی همیشه باعث افزایش نرخ یادگیری در مقایسه با بدون سنجش نمی شود – احتمالاً به دلیل عدم وجود نیروی عادی مربوط به کار باشد. با این وجود ، حتی اگر سنجش نیروی ۳ بعدی ، ابعادی از ورودی سنسوری را افزایش می دهد – که به طور کلی همگرایی الگوریتم را مختل می کند – منجر به سرعت یادگیری سریع تر و عملکرد بهتر می شود. علاوه بر این ، ابزار سنجش نیروی ۳D حتی می تواند هزینه محاسباتی اضافه شده با یادگیری با ورودی سنسوری با ابعاد بالا را جبران کند.

 

دانلود مقاله از کانال تلگرام

اشتراک اجتماعی

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *