0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیطهای چندعامله
نویسندگان :
محمد روغنی
1
سمانه حسینی سمنانی
2
1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
کلمات کلیدی :
مسیریابی،یادگیری تقلیدی،الگوریتمهای نامتمرکز
چکیده :
در سالهای اخیر مدلهای یادگیری ماشین در انواع و اقسام مسائل و کاربردها استفاده شدهاند. یکی از این مسائل مسیریابی رباتها در محیطهای چند عامله بوده است. علی رغم پیشرفت این مدلها در حل این مسئله، به جهت این که هرگونه خطا در کنترل رباتها میتواند هزینههای سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدلها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی رباتها در محیطهای چند عامله انجام شده است. اکثر این تحقیقات از روشهای یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدلهای خود استفاده کردهاند. زمانی که ما دسترسی به مدلهایی داشته باشیم که بتوانیم از آنها تقلید کنیم، یادگیری تقویتی لزوما بهینهترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کردهایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار میرود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.
لیست مقالات
لیست مقالات بایگانی شده
طبقه بندی سکته مغزی در یک سیستم دو بعدی چند فرکانسی با استفاده از امواج مایکروویو و یادگیری عمیق
محسن مهرانیان - محمدسعید ماجدی - امیررضا عطاری
Optimal Sizing and Placing of Capacitors in Distribution Networks in the Presence of Three-Phase Induction Motors Using Genetic Algorithm
Seyed Amir Hossein Mohamadi - Seyed Amir Mohammad Lahaghi - Shayan Nazari - Behrooz Zaker
کاربرد امواج فراصوت در ترومبولسیس لخته خون به عنوان درمان غیرتهاجمی
مریم بیات - شکراله کریمیان - اسفندیار مهرشاهی
A Closed RF Wave-Applicator to Study the Biological Effects of Mobile Communication Systems
SeyedMilad Miri - Karim Mohammadpour-Aghdam
Wake-Sleep Learning in R-STDP-Based Spiking Neural Networks to Avoid Catastrophic Forgetting
Mehrdad Baradaran - Katayoon Kobraei - Saeed Reza Kheradpisheh
Optimal Bidding Strategy of a Cascade Hydroelectric Unit in a Day-ahead Energy Market Using Particle Swarm Optimization
Shabnam Ahmadian Titkanloo - Sahar Ahmadian Titkanloo - Asghar Akbari Foroud - Sadaf Ahmadian - Soheil Ahmadian Titkanloo
حسگر زیستی نانومتری حساس با زیرلایه غیرهمگن برای تشخیص سلول های سرطانی
پریسا مرادی هارونی - محمود رفائی بوکت
True Random Number Generator Relying on Multiple Entropy Source and Triple Oscillator for Cryptography Purposes
Somayeh Gholam Mehraban - Mohsen Jalali - Mostafa Azadbakht
تحلیل ارتباطات موثر و عملکردی سیگنالهای فیزیولوژیکی راننده جهت بهبود تشخیص حواس پرتی
نیلوفر وثوق - زهرا بهمنی دهکردی - امین محمدیان
MODELING AGE-RELATED CHANGES IN VISUAL EVOKED RESPONSES USING CORRELATION METRICS AND INTER-ELECTRODE CONNECTIVITY
Seyyed Saleh Fazaeli Hashemi - Farveh Daneshvarfard - Nasrin Maarefi
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.5.3