0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیطهای چندعامله
نویسندگان :
محمد روغنی
1
سمانه حسینی سمنانی
2
1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
کلمات کلیدی :
مسیریابی،یادگیری تقلیدی،الگوریتمهای نامتمرکز
چکیده :
در سالهای اخیر مدلهای یادگیری ماشین در انواع و اقسام مسائل و کاربردها استفاده شدهاند. یکی از این مسائل مسیریابی رباتها در محیطهای چند عامله بوده است. علی رغم پیشرفت این مدلها در حل این مسئله، به جهت این که هرگونه خطا در کنترل رباتها میتواند هزینههای سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدلها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی رباتها در محیطهای چند عامله انجام شده است. اکثر این تحقیقات از روشهای یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدلهای خود استفاده کردهاند. زمانی که ما دسترسی به مدلهایی داشته باشیم که بتوانیم از آنها تقلید کنیم، یادگیری تقویتی لزوما بهینهترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کردهایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار میرود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.
لیست مقالات
لیست مقالات بایگانی شده
اینورتر چندسطحی منبع ولتاژ جدید با هدف کاهش سوئیچ برای سطوح بالا
علی سیفی - سید حسین حسینی - مهرداد طرقدار حق - مهران صباحی - مجید حسین پور
طراحی و ساخت تقویت کننده توان اصلاح شده مقاومتی-راکتیوی باند گسترده کلاس B/J با گین بالا در توان خروجی پشتی و شرایط بایاس کلاس AB
سارا آقاجانی - محمود کمره ای - مرضیه چگینی
Unsupervised Change Detection in SAR Images Using a Six-Branch CNN and Adaptive Window Approach
Abbas Kakoolvand - Maryam Imani - Hassan Ghassemian
Non-homogeneous interference suppression in OFDM array radars using direct data domain approach
Sima Shariatmadari
مرتب سازی اسپایک های عصبی با استخراج ویژگی مبتنی بر شبکه عمیق خود رمزگذار
شیدا معجونی - حسین حسینی نژاد محبتی - امین نیک انجام
نحوه کنترل سطوح هوشمند با قابلیت تنظیم مجدد در راستای مقابله با استراق سمع کننده ها
محمد کاظم ناطقی - زلفا زینل پور یزدی
Optimization of Novel L-shaped Gate All Around Junctionless Field Effect Transistor
Mohammad Tabarsi Sochelmaei - Arash Yazdanpanah Goharrizi
Integration of Deep Learning Techniques in Stock Market Forecasting: xLSTM-CNN with RevIN and Adaptive Wavelet Denoising
Alireza Mohammadi - Ali Doustmohammadi - Masoud Shafiee
Contrastive Learning Framework for fMRI Time-Series Classification in Left and Right Epilepsy Using Continues Wavelet Transform
Marzieh Soheili-nejad - Saeed Masoudnia - Hamid Soltanian-zadeh
Flexible Generation Expansion Planning Considering Representative Days of Load and Renewable Variations
Peyman Amirian - Zeinab Maleki - Mohammad-Amin Pourmoosavi - Turaj Amraee
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.8.0