0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیطهای چندعامله
نویسندگان :
محمد روغنی
1
سمانه حسینی سمنانی
2
1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
کلمات کلیدی :
مسیریابی،یادگیری تقلیدی،الگوریتمهای نامتمرکز
چکیده :
در سالهای اخیر مدلهای یادگیری ماشین در انواع و اقسام مسائل و کاربردها استفاده شدهاند. یکی از این مسائل مسیریابی رباتها در محیطهای چند عامله بوده است. علی رغم پیشرفت این مدلها در حل این مسئله، به جهت این که هرگونه خطا در کنترل رباتها میتواند هزینههای سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدلها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی رباتها در محیطهای چند عامله انجام شده است. اکثر این تحقیقات از روشهای یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدلهای خود استفاده کردهاند. زمانی که ما دسترسی به مدلهایی داشته باشیم که بتوانیم از آنها تقلید کنیم، یادگیری تقویتی لزوما بهینهترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کردهایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار میرود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.
لیست مقالات
لیست مقالات بایگانی شده
A Novel Estimation Law for Impedance-Controlled Bilateral Teleoperation to Enhance Human-Environment Interaction
Mobina Kameli - Mohammad Motaharifar - Negin Sayyaf
Analyzing, simulating and measuring the effects of stirrers and walls on the performance of the RTS60 reverberation chamber
Mojtaba Basravi - Zakerhossein Firouzeh - Hadi Aliakbarian
Selecting the Economical Energy Storage System for Photovoltaic Power Plants
Zahra Moradi-Shahrbabak
A New Unsupervised Feature Learning Method for Object Recognition using Prior-Knowledge Data
Ashkan Farrokhi - Hadi Seyedarabi
Improving the Accuracy of the Annotation Algorithm in Pattern-Based Tennis Game Video
Azam Bastanfard - Dariush Amirkhani
Multiswarm Binary Butterfly Optimization Algorithm for Solving the Multidimensional Knapsack Problem
Shakiba Shahbandegan - Madjid Naderi
Towards Blockchain-based Remote Management Systems for Patients with Movement Disorders
Behnaz Behara - Mehdi Delrobaei
Establishment of a Virtual Power Plant in Grid for Maximizing Producers' Profits and Minimizing Pollutant Emissions and Investment Costs
Amir Hossein Gholami - Amir Abulfazl Suratgar - Mohammad Bagher Menhaj - Mohammad Reza Hesamzadeh
Contrastive Learning Framework for fMRI Time-Series Classification in Left and Right Epilepsy Using Continues Wavelet Transform
Marzieh Soheili-nejad - Saeed Masoudnia - Hamid Soltanian-zadeh
تجزیه وابستگی با استفاده از Q-Learning محافظه کار
امیر زارعی - علیرضا خیاطیان - پیمان ستوده
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 40.4.2