0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیطهای چندعامله
نویسندگان :
محمد روغنی
1
سمانه حسینی سمنانی
2
1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
کلمات کلیدی :
مسیریابی،یادگیری تقلیدی،الگوریتمهای نامتمرکز
چکیده :
در سالهای اخیر مدلهای یادگیری ماشین در انواع و اقسام مسائل و کاربردها استفاده شدهاند. یکی از این مسائل مسیریابی رباتها در محیطهای چند عامله بوده است. علی رغم پیشرفت این مدلها در حل این مسئله، به جهت این که هرگونه خطا در کنترل رباتها میتواند هزینههای سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدلها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی رباتها در محیطهای چند عامله انجام شده است. اکثر این تحقیقات از روشهای یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدلهای خود استفاده کردهاند. زمانی که ما دسترسی به مدلهایی داشته باشیم که بتوانیم از آنها تقلید کنیم، یادگیری تقویتی لزوما بهینهترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کردهایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار میرود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.
لیست مقالات
لیست مقالات بایگانی شده
الگوریتم تشخیصی برای طبقه بندی سرطان خون لوسمی لنفوسیتی حاد با استفاده از شبکه های عصبی عمیق در یادگیری آنلاین
رضا گودرزی - علی جلالی - امید هاشمی پورتفرشی
بهینهسازی مبدلDC-DC منبع امپدانسی مبتنی بر ترانسفورماتور ایزوله گالوانیکی با کاهش تعداد سوئیچها
علی سلیمانی - رضا قاضی
Low power SRAM using an optimal number of split bit lines and single-ended sensing
Mahdie Nazemian - Sayed Masoud Sayedi
Wake-Sleep Learning in R-STDP-Based Spiking Neural Networks to Avoid Catastrophic Forgetting
Mehrdad Baradaran - Katayoon Kobraei - Saeed Reza Kheradpisheh
Bi-level Bidding Strategy of a Wind Power Producer Considering Local Intraday Demand Response Exchange Market
Ehsan Nokandi - Mostafa Vahedipour-Dahraie - Saeed Reza Goldani
کاربرد داده کاوی در بخش مشترکین صنعت توزیع برق
سارا علی پور - محمودرضا حقی فام
Design Comparison of BLDC and SR Motor Drives for Range Hood Applications
Aghil Ghaheri - Reza Naghash - Akbar Mohammadi Ajamloo - Ebrahim Afjei
MAD-TI: Meta-path Aggregated-Graph Attention Network for Drug Target Interaction Prediction
Reza Shami Tanha - Maryam Sadighian - Arash Zabihian - Mohsen Hooshmand - Mohsen Afsharchi
Design of a plasmonic MIM filter based on ring resonator incorporating circular air holes
Sara Gholinezhad Shafagh - Hassan Kaatuzian - Mohammad Danaie
Design and Modelling of a Modified Controller for D-STATCOM Considering Parametric Uncertainties and Unmodeled Dynamics
Majid Arabahmadi - Hossein Khaligh - Amirhossein Moghani - Ali Mosallanejad
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.0.4