0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیطهای چندعامله
نویسندگان :
محمد روغنی
1
سمانه حسینی سمنانی
2
1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
کلمات کلیدی :
مسیریابی،یادگیری تقلیدی،الگوریتمهای نامتمرکز
چکیده :
در سالهای اخیر مدلهای یادگیری ماشین در انواع و اقسام مسائل و کاربردها استفاده شدهاند. یکی از این مسائل مسیریابی رباتها در محیطهای چند عامله بوده است. علی رغم پیشرفت این مدلها در حل این مسئله، به جهت این که هرگونه خطا در کنترل رباتها میتواند هزینههای سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدلها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی رباتها در محیطهای چند عامله انجام شده است. اکثر این تحقیقات از روشهای یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدلهای خود استفاده کردهاند. زمانی که ما دسترسی به مدلهایی داشته باشیم که بتوانیم از آنها تقلید کنیم، یادگیری تقویتی لزوما بهینهترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کردهایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار میرود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.
لیست مقالات
لیست مقالات بایگانی شده
Employing Integrated Quantum Photonic Computers for Gaussian Boson Sampling
Mehrdad Ghasemi - Hassan Kaatuzian - Houshyar Noshad - Mahmood Hassani - Mobin Motaharifar - Mahdi NoroozOliaei
A Novel Tunable LC Filter For Ultra High Frequency Applications
Davoud Razaghpour - Mir Majid Ghasemi - Amir Fathi
طراحی و پیادهسازی آرایه انعکاسی چند پرتویی پهن باند با قطبش های خطی و دایروی همزمان با تنظیم فاز ثابت مرجع در سطح آرایه
مجید کریمی پور
جابجایی ایمبرت-فدروف نور عبوری از ساختار چندلایه ای حاوی گرافن و دیاکسید وانادیوم
رباب زادجمال سیفی - رضا عبدی قلعه - کاظم جمشیدی قلعه
Holographic Technique Inspired Multi-Beam Cylindrical Leaky-Wave Antenna
Mohammad Amin Chaychi Zadeh - Nader Komjani - Sajjad Zohrevand
Experimental Study on Automatically Assembling Custom Catering Packages With a 3-DOF Delta Robot Using Deep Learning Methods
Reihaneh Yourdkhani - Arash Tavoosian - Navid Asadi Khomami - Mehdi Tale Masouleh
Model Reference Adaptive Control for Nonlinear Systems in the Presence of Unknown External Disturbances
Ehsan Nazemorroaya - Mohsen Shafieirad - Majid Hajatipour
تخمین کانال V2X با استفاده از CDP وفقی
الهام نادری مقدم - محمدعلی سبقتی - حسن زارعیان
The Use of NSGA-2 for Optimal Placement and Management of Renewable Energy Sources When Considering Network Uncertainty and Fault Current Limiters
Ali Akbar Farahani - Seyed Hossein Hesamedin Sadeghi
Classifier Fusion Based on Extracted Features Using a Spiking Neural Network from Handwritten Digits
Ali Gholamzade Fard Kazzazi - Malihe Nazari - Fariba Bahrami
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 40.4.2