0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیطهای چندعامله
نویسندگان :
محمد روغنی
1
سمانه حسینی سمنانی
2
1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
کلمات کلیدی :
مسیریابی،یادگیری تقلیدی،الگوریتمهای نامتمرکز
چکیده :
در سالهای اخیر مدلهای یادگیری ماشین در انواع و اقسام مسائل و کاربردها استفاده شدهاند. یکی از این مسائل مسیریابی رباتها در محیطهای چند عامله بوده است. علی رغم پیشرفت این مدلها در حل این مسئله، به جهت این که هرگونه خطا در کنترل رباتها میتواند هزینههای سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدلها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی رباتها در محیطهای چند عامله انجام شده است. اکثر این تحقیقات از روشهای یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدلهای خود استفاده کردهاند. زمانی که ما دسترسی به مدلهایی داشته باشیم که بتوانیم از آنها تقلید کنیم، یادگیری تقویتی لزوما بهینهترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کردهایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار میرود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.
لیست مقالات
لیست مقالات بایگانی شده
کنترل سطح آب درام بویلر های نیروگاهی با استفاده از الگوریتم کنترل تطبیقی جدید با در نظر گرفتن کارایی و افزایش عمر شیر کنترلی (مطالعه موردی کنترل سطح آب درام IP نیروگاه سیکل ترکیبی قم)
کیوان زاهدی - محمدحسین هاشمی - محسن منتظری
Sparsity Domain Smoothing Based Thresholding Recovery Method for OFDM Sparse Channel Estimation
Mohammad Hossein Bahonar - Reza Ghaderi Zefreh - Rouhollah Amiri
Outage and Sum-Rate Analysis for mCAP-NOMA in Visible Light Communication Under Users' Mobility
Amir Oshtoudan - Seyed Mohammad Sajad Sadough
Dynamic State Estimation of Power System Using Gauss-Seidel Cubature Kalman Filter
Atiyeh Keshavarz-Mohammadiyan
مدل سازی فشرده و شبیه سازی گذار عایق به هادی در افزاره مات مبتنی بر VO2
پرناز عباسی - مجید شالچیان
High-Precision Simple-Expandable Loser Take All (LTA) Circuit
Hossein Yaghoobzade Shadmehri - Ehsan Rahiminejad - Mohaddeseh Ghaeni
A New Gradient Driver with only a Single DC Voltage Source For Using In MRI Systems
Amirabbas Naghipour Shahrbabaki - Reza Beiranvand
Design and Simulation of Axial Flux Permanent Magnet Electrical Machine for Electric Vehicles Application
Hamid Radmanesh - Reza Sharifi
A Design Technique For Linear Desensitized LNAs
Masoumeh Sabzi - Mahmoud Kamarei - Yann Mahe - Tchanguiz Razban-Haghighi
Development of a Compact Linearly Polarized Wideband Hybrid Antenna Using Semi-Elliptical SIW Resonator and Patch Radiator
Behzad Hosseinitalab - Mohammad Hassan Neshati
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.3.2