0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیطهای چندعامله
نویسندگان :
محمد روغنی
1
سمانه حسینی سمنانی
2
1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
کلمات کلیدی :
مسیریابی،یادگیری تقلیدی،الگوریتمهای نامتمرکز
چکیده :
در سالهای اخیر مدلهای یادگیری ماشین در انواع و اقسام مسائل و کاربردها استفاده شدهاند. یکی از این مسائل مسیریابی رباتها در محیطهای چند عامله بوده است. علی رغم پیشرفت این مدلها در حل این مسئله، به جهت این که هرگونه خطا در کنترل رباتها میتواند هزینههای سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدلها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی رباتها در محیطهای چند عامله انجام شده است. اکثر این تحقیقات از روشهای یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدلهای خود استفاده کردهاند. زمانی که ما دسترسی به مدلهایی داشته باشیم که بتوانیم از آنها تقلید کنیم، یادگیری تقویتی لزوما بهینهترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کردهایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار میرود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.
لیست مقالات
لیست مقالات بایگانی شده
Modeling and optimal control of the vibration model of constrained buildings based on fractional order singular theory using orthogonal polynomials
Vahid Safari Dehnavi - Masoud Shafiee
مقایسه پارامترهای عملکردی کمپرسورهای 4:2 در تکنولوژی FinFET و GAA-NWFET
پگاه زکیان - راهبه نیارکی اصلی
ساخت حسگر رطوبت مقاومتی با استفاده از نانوذره اکسید گرافن بر پایه الکترودهای شانه ای
ندا قربانی - سمانه حامدی
A Linear Position Sensor Proposal by Development of a Variable Reluctance Linear Resolver
Arman Ramezannezhad - Peyman Naderi - Lieven Vandevelde
Estimation of the Arc Model Parameters Using Heuristic Optimization Methods
Sadegh Ghavami - Ali A Razi-kazemi
Innovative MOEMS Biosensor for Hepatitis DNA Detection Utilizing an Optical Ring Resonator
Hossein Bahramian - Arash Yazdanpanah Goharrizi
A Combined Channel Approach for Decoding Intracranial EEG Signals: Enhancing Accuracy through Spatial Information Integration
Maryam Ostadsharif Memar - Navid Ziaei - Behzad Nazari
طراحی کنترلکنندهی جدولبندی بهرهی پسخورد خروجی کلیدزن مقاوم برای سیستمهای پارامتر متغیر خطی نامعین چندوجهی پیوسته-زمان
رضا یاوری - سعید شمقدری - آرش صادقزاده
Millimeter-Wave Imaging System: A Brief Study on System Performance
Behnam Ghandi - Sobhan Dabidian - Sina Zeraatkar - Zahra Kavehvash
A Boost and Luo Based Non-isolated DC-DC Converter Suitable for DC Link of High Voltage Applications
Ali Meftahpour - Hesam Ehsan - Hossein Gholizadeh - Mohammad Hamed Samimi
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 40.3.1