0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیطهای چندعامله
نویسندگان :
محمد روغنی
1
سمانه حسینی سمنانی
2
1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
کلمات کلیدی :
مسیریابی،یادگیری تقلیدی،الگوریتمهای نامتمرکز
چکیده :
در سالهای اخیر مدلهای یادگیری ماشین در انواع و اقسام مسائل و کاربردها استفاده شدهاند. یکی از این مسائل مسیریابی رباتها در محیطهای چند عامله بوده است. علی رغم پیشرفت این مدلها در حل این مسئله، به جهت این که هرگونه خطا در کنترل رباتها میتواند هزینههای سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدلها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی رباتها در محیطهای چند عامله انجام شده است. اکثر این تحقیقات از روشهای یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدلهای خود استفاده کردهاند. زمانی که ما دسترسی به مدلهایی داشته باشیم که بتوانیم از آنها تقلید کنیم، یادگیری تقویتی لزوما بهینهترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کردهایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار میرود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.
لیست مقالات
لیست مقالات بایگانی شده
ساخت حسگر مقاومتی بخار اتانول مبتنی بر هتروساختار باریم تیتانات / اکسید روی آلاییده با نانوذرات نقره
محسن طاهری پور - نوید یثربی - شیرین نصراصفهانی - محمد حسین شیخی
A Siamese Neural Network for Predicting snoRNA-Disease Association
Milad Besharatifard - Fatemeh Zare-Mirakabad
Fast and Low Power Modified Carry Look-Ahead Adder
Sanaz Salem - Amir hossein Owji
Improving the Performance of Unified Power Quality Conditioner Using Interval Type 2 Fuzzy Control
Farzad Rastegar - Zohreh Paydar
Tumor-treating fields orientation effects on breast cancer cells in vitro
Fatemeh Khanmohammadi - Mohammad Sadegh Bank - Majid Badieirostami
بهبود تخمین واریانس نویز با بهره گیری از واریانس تغییرات سیگنال
مجید دهقانیزاده - مسعودرضا آقابزرگی
Outage Analysis of Distributed Relaying NOMA in Cognitive Radio Networks
Zahra Doorbash - Ali Jamshidi
Transmission and Energy Storage Co-Planning Expansion Considering Short-Term Uncertainties under Renewable Penetration
Mojtaba Moradi-Sepahvand - Turaj Amraee
پیش بینی قیمت انرژی الکتریکی در بازار روز بعد با استفاده از شبکه عصبی مصنوعی تعمیم یافته و با در نظر گرفتن محدودیت سوخت رسانی
حسین صابر - سعید محسنی - رضا پورآقابابا - مصطفی یحیی آبادی
IRS-aided NOMA in a Cell Free Massive MIMO System
Anahid Rafieifar - Hosein Ahmadinejad - Abolfazl Falahati
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 43.6.0