0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیطهای چندعامله
نویسندگان :
محمد روغنی
1
سمانه حسینی سمنانی
2
1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
کلمات کلیدی :
مسیریابی،یادگیری تقلیدی،الگوریتمهای نامتمرکز
چکیده :
در سالهای اخیر مدلهای یادگیری ماشین در انواع و اقسام مسائل و کاربردها استفاده شدهاند. یکی از این مسائل مسیریابی رباتها در محیطهای چند عامله بوده است. علی رغم پیشرفت این مدلها در حل این مسئله، به جهت این که هرگونه خطا در کنترل رباتها میتواند هزینههای سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدلها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی رباتها در محیطهای چند عامله انجام شده است. اکثر این تحقیقات از روشهای یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدلهای خود استفاده کردهاند. زمانی که ما دسترسی به مدلهایی داشته باشیم که بتوانیم از آنها تقلید کنیم، یادگیری تقویتی لزوما بهینهترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کردهایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار میرود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.
لیست مقالات
لیست مقالات بایگانی شده
Collocation of GEO-Satellites using Differential Game Theory
Fatemeh Amozegary - Amirreza Kosari - Mahdi Fakoor
Forecasting Tehran Stock Exchange Trend with Time Series Analysis, Fundamental Data, and Sentiment Analysis in News
Mahdi Shamisavi - Amir Jahanshahi
Microgrid Damping Improvement Using High-Pass Filter-Based Virtual Synchronous Generator
Shayan Zaimi - Ashkan Moradi Naserkhani - Sharara Rehimi - Amin Karimi - Rahmatollah Mirzaei - Hassan Bevrani
Single-Item Fashion Recommender: Towards Cross-Domain Recommendations
Seyed Omid Mohammadi - Hossein Bodaghi - Ahmad Kalhor
A Design Methodology for Submicron Low-Voltage Bandgap Voltage Reference
Mehdi Samavati - Samad Sheikhaei - Mohsen Jalali
بررسی ارتباط الگوی خریدوفروش کاربران ارز دیجیتال و حرکات قیمت بازار رمزارز
مهسا علیزاده نیلی - عبدالحسین وهابی - محمدرضا ابوالقاسمی
تعیین محل خطا با استفاده از اطلاعات حاصل شده از خطا در حضور جبرانساز سری خازنی کنترل تریستوری (TCSC) به روش آفلاین.
حامد حیدری - سعید غنیمتی
Wide-band Cloaking of Finite Length PEC Cylindrical Objects under Oblique Incidence using Multi-Layer Mantle Cloak
Alireza Moosaei - Mohammad Hasan Neshati
بهینه سازی تزویج فیبر نوری باریک شده و موجبر نوری بر بستر پلیمر
مهتاب حسینعلی زاده - مونا ثریا - غلام محمد پارسا نسب - شکراله کریمیان
Unsupervised Change Detection in SAR Images Using a Six-Branch CNN and Adaptive Window Approach
Abbas Kakoolvand - Maryam Imani - Hassan Ghassemian
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 40.4.2