0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیطهای چندعامله
نویسندگان :
محمد روغنی
1
سمانه حسینی سمنانی
2
1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
کلمات کلیدی :
مسیریابی،یادگیری تقلیدی،الگوریتمهای نامتمرکز
چکیده :
در سالهای اخیر مدلهای یادگیری ماشین در انواع و اقسام مسائل و کاربردها استفاده شدهاند. یکی از این مسائل مسیریابی رباتها در محیطهای چند عامله بوده است. علی رغم پیشرفت این مدلها در حل این مسئله، به جهت این که هرگونه خطا در کنترل رباتها میتواند هزینههای سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدلها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی رباتها در محیطهای چند عامله انجام شده است. اکثر این تحقیقات از روشهای یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدلهای خود استفاده کردهاند. زمانی که ما دسترسی به مدلهایی داشته باشیم که بتوانیم از آنها تقلید کنیم، یادگیری تقویتی لزوما بهینهترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کردهایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار میرود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.
لیست مقالات
لیست مقالات بایگانی شده
Joint User Association and UAV Location Optimization for Two-Tired Visible Light Communication Networks
Alireza Qazavi - Foroogh Sadat Tabataba - Mehdi Naderi Soorki
بررسی کنترل مغناطیسی پاسخ کایرواپتیکی ساختارهای مگنتوکایرال
کی سیاوش کیکاوسی - حمیده دشتی خویدکی - جواد احمدی شکوه - مجید رشیدی هویه
Diagnosis of Covid 19 disease, flu, allergies, colds
Mahyar Mohammady - Marzieh Kamali
ارائه روش بهینه سازی نوین جهت جایابی بهینه تولیدات پراکنده (DG) در شبکه توزیع بمنظور کمینه کردن اثر فروافتادگی ولتاژ
پژمان هاشمیان - عبدالرضا علیرضاپوری
True Random Number Generator Relying on Multiple Entropy Source and Triple Oscillator for Cryptography Purposes
Somayeh Gholam Mehraban - Mohsen Jalali - Mostafa Azadbakht
Improved Equivalent Input Disturbance Control of Nonlinear Aeropendulum System Using Data-Driven Approach
Mohammad Hossein Bayati - Arman Marzban - Mahsan Tavakoli-Kakhki - Ali Naseh
Optimization of Novel L-shaped Gate All Around Junctionless Field Effect Transistor
Mohammad Tabarsi Sochelmaei - Arash Yazdanpanah Goharrizi
Low power SRAM using an optimal number of split bit lines and single-ended sensing
Mahdie Nazemian - Sayed Masoud Sayedi
Design, Simulation, and fabrication of a compact dual-band GNSS antenna
Farnoosh Abbasi - Amir Saman Nooramin
A Non-Isolated Extendable Common Grounded DC-DC Boost Converter for DC-microgrid Applications
Saed Mahmoud alilou - Ali Nadermohammadi - Mohammad Maalandish - Seyed hossein Hosseini - Kazem Zare - Mehdi Abapour
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.0.4