0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیطهای چندعامله
نویسندگان :
محمد روغنی
1
سمانه حسینی سمنانی
2
1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
کلمات کلیدی :
مسیریابی،یادگیری تقلیدی،الگوریتمهای نامتمرکز
چکیده :
در سالهای اخیر مدلهای یادگیری ماشین در انواع و اقسام مسائل و کاربردها استفاده شدهاند. یکی از این مسائل مسیریابی رباتها در محیطهای چند عامله بوده است. علی رغم پیشرفت این مدلها در حل این مسئله، به جهت این که هرگونه خطا در کنترل رباتها میتواند هزینههای سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدلها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی رباتها در محیطهای چند عامله انجام شده است. اکثر این تحقیقات از روشهای یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدلهای خود استفاده کردهاند. زمانی که ما دسترسی به مدلهایی داشته باشیم که بتوانیم از آنها تقلید کنیم، یادگیری تقویتی لزوما بهینهترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کردهایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار میرود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.
لیست مقالات
لیست مقالات بایگانی شده
Application of Max Flow- Min Cut Theory to find the best placement Of Electronic-based DC-PFCs for enhancing static security in MT-HVDC Meshed Grids
Mir Hamed Pour Mir Asghariyan - Jafar Milimonfared - Seyed Saeid Heidari Yazdi - Ali Haji Ali Biglo - Kumars Rouzbehi
Multiphysics Simulation of the Modified Flux Coupling Type SFCL in VSC-HVDC Network
Mohammad Khakroei - Ashkan Mirzaei Rajeooni - Mahdi Rahimi Pirbasti - Hossein Heydari
Multi-Agents Gaussian Estimation and Coverage Control Client-Server Architecture
Mohammad َAzizian Shishavan - Mahdi Zeinali - Azam Salari
A Closed RF Wave-Applicator to Study the Biological Effects of Mobile Communication Systems
SeyedMilad Miri - Karim Mohammadpour-Aghdam
Bit Error Rate Analysis for a Mixed Underwater OWC-FSO Relaying System in the Presence of Pointing Error
Mahdis Saghaee Jahed - Meysam Ghanbari - Seyed Mohammad Sajad Sadough
The Use of NSGA-2 for Optimal Placement and Management of Renewable Energy Sources When Considering Network Uncertainty and Fault Current Limiters
Ali Akbar Farahani - Seyed Hossein Hesamedin Sadeghi
{High performance detector for massive MIMO systems using an adaptive filering approach
Masoud Tahmasbi Fard - Mojtaba Amiri - Ali Olfat
Joint Space Control of a Deployable Cable Driven Parallel Robot with Redundant Actuators
S. Ahmad Khalilpour - Ali Hassani - Rohollah Khorambakht - A.R. Zahedi - Abbas Bataleblu - Hamid D. Taghirad
Scattering by an array of PEC cylinders in ferrite media using spectral technique
Zahra Bahrami - Asghar Keshtkar - Ayaz Ghorbani
Optimal D2D Resource Allocation in Heterogeneous Cellular Networks by Decentralized Multi-Agent Deep Q-Learning
Pouya Akhoundzadeh - Ghasem Mirjalily - Mohammad taghi Sadeghi
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.3.2