0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیطهای چندعامله
نویسندگان :
محمد روغنی
1
سمانه حسینی سمنانی
2
1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
کلمات کلیدی :
مسیریابی،یادگیری تقلیدی،الگوریتمهای نامتمرکز
چکیده :
در سالهای اخیر مدلهای یادگیری ماشین در انواع و اقسام مسائل و کاربردها استفاده شدهاند. یکی از این مسائل مسیریابی رباتها در محیطهای چند عامله بوده است. علی رغم پیشرفت این مدلها در حل این مسئله، به جهت این که هرگونه خطا در کنترل رباتها میتواند هزینههای سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدلها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی رباتها در محیطهای چند عامله انجام شده است. اکثر این تحقیقات از روشهای یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدلهای خود استفاده کردهاند. زمانی که ما دسترسی به مدلهایی داشته باشیم که بتوانیم از آنها تقلید کنیم، یادگیری تقویتی لزوما بهینهترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کردهایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار میرود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.
لیست مقالات
لیست مقالات بایگانی شده
Low-cost Broadband Reflectarray Antenna Using Cross Bow-Tie elements
Mahdieh Bozorgi - Mahmood Rafaei-Booket
تعیین محل خطا با استفاده از اطلاعات حاصل شده از خطا در حضور جبرانساز سری خازنی کنترل تریستوری (TCSC) به روش آفلاین.
حامد حیدری - سعید غنیمتی
طراحی کنترلکنندهی جدولبندی بهرهی پسخورد خروجی کلیدزن مقاوم برای سیستمهای پارامتر متغیر خطی نامعین چندوجهی پیوسته-زمان
رضا یاوری - سعید شمقدری - آرش صادقزاده
Gearbox Fault Detection Using Continuous Wavelet Transform and Vision Transformer (ViT)
Ali Asadian - Yassin Riyazi - Moosa Ayati
تشخیص و تفکیک برخط خطای مدار باز کلید در اینورترهای تک فاز PWM
مهدی اره پناهی - علی اکبر سلیمی
بهبود پردازش وفقی فضا-زمان (STAP) در سیستمهای رادار هوابرد با استفاده از الگوریتمهای آگاه به تنک بودن (Sparsity) سیستم
علی شیخیان - سارا میهن دوست - نعمت الله عزتی - احسان مصطفی پور
Giant Optical Nonreciprocity with Magnetized Epsilon-Near-Zero Materials
Zahra Chamani - Abolghasem Zeidaabadi Nezhad - Mahyar Dehdast - Zaker Hossein Firouzeh
Posture Stabilization of Tractor-Trailer Wheeled Mobile Robot Using Nonlinear MPC
Kevin Babakhanloo - Khalil Alipour - Bahram Tarvirdizadeh - Majid Sorouri - Mohammad Ghamari
تولید ریزداپلر راداری بدن انسان با استفاده از آموزش شبکه مولد متقابل کانولوشنال عمیق
مهدی استوان - صادق صمدی - علیرضا کاظمی
Simulation of planar organic-inorganic perovskite light-emitting diode
Morteza Yarahmadi - Elnaz Yazdani - Mohammad Kazem Moravvej-Farshi
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.5.3