عنوان مقاله: Geometric Dataset Distances via Optimal Transport

چکیده مقاله:

مفهوم تشابه وظیفه در هسته پارادایمهای مختلف یادگیری ماشینی مانند تطبیق دامنه و فرا یادگیری است. روشهای فعلی برای تعیین کمیت آن اغلب اکتشافی هستند ، فرضیه های قوی را در مورد برچسب ها در انجام وظایف می سازند ، و بسیاری از آنها با معماری وابسته هستند و به پارامترهای بهینه خاص وظیفه متکی هستند (برای مثال ، نیاز به آموزش یک مدل در هر مجموعه داده). در این کار ما یک مفهوم جایگزین از فاصله بین مجموعه داده ها پیشنهاد می کنیم که (i) مدل agnostic است ، (ii) شامل آموزش نیست ، (iii) می تواند مجموعه داده ها را حتی اگر مجموعه های برچسب آنها کاملاً جدا باشد و (IV) دارای نظریه قوی باشد. نتایج ما نشان می دهد که این فاصله جدید مقایسه معنی داری از مجموعه داده ها را ارائه می دهد ، و ارتباط خوبی با سختی یادگیری انتقال در تنظیمات و مجموعه های داده های آزمایشی مختلف دارد.

 

دانلود مقاله از کانال تلگرام

اشتراک اجتماعی

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *