کنفرانس مهندسی برق ایران

صفحه اصلی / سی و یکمین کنفرانس بین المللی مهندسی برق

بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیط‌های چندعامله

نویسندگان :

محمد روغنی¹ سمانه حسینی سمنانی²

1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶ 2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶

کلمات کلیدی :

مسیریابی،یادگیری تقلیدی،الگوریتم‌های نامتمرکز

چکیده :

در سال‌های اخیر مدل‌های یادگیری ماشین ‌در انواع و اقسام مسائل و کاربرد‌ها استفاده شده‌اند. یکی از این مسائل مسیریابی ربات‌ها در محیط‌های چند عامله بوده است. علی رغم پیشرفت این مدل‌ها در حل این مسئله، به جهت این که هرگونه خطا در کنترل ربات‌ها می‌تواند هزینه‌های سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدل‌ها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی ربات‌ها در محیط‌های چند عامله انجام شده است. اکثر این تحقیقات از روش‌های یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدل‌های خود استفاده کرده‌اند. زمانی که ما دسترسی به مدل‌هایی داشته باشیم که بتوانیم از آن‌ها تقلید کنیم، یادگیری تقویتی لزوما بهینه‌ترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کرده‌ایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار می‌رود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.