0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
بررسی عملکرد الگوریتم یادگیری تقلیدی در آموزش شبکه عصبی کاملا متصل برای حل مسئله مسیریابی در محیطهای چندعامله
نویسندگان :
محمد روغنی
1
سمانه حسینی سمنانی
2
1- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
2- دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی اصفهان، اصفهان، ایران ۸۳۱۱۱-۸۴۱۵۶
کلمات کلیدی :
مسیریابی،یادگیری تقلیدی،الگوریتمهای نامتمرکز
چکیده :
در سالهای اخیر مدلهای یادگیری ماشین در انواع و اقسام مسائل و کاربردها استفاده شدهاند. یکی از این مسائل مسیریابی رباتها در محیطهای چند عامله بوده است. علی رغم پیشرفت این مدلها در حل این مسئله، به جهت این که هرگونه خطا در کنترل رباتها میتواند هزینههای سنگین مالی و جانی داشته باشد هنوز راه بسیاری تا استفاده تجاری از این مدلها باقی مانده است. تحقیقات بسیاری برای حل مسئله مسیریابی رباتها در محیطهای چند عامله انجام شده است. اکثر این تحقیقات از روشهای یادگیری تقویتی مانند Actor Critic، Proximal Policy Optimization و ... برای آموزش مدلهای خود استفاده کردهاند. زمانی که ما دسترسی به مدلهایی داشته باشیم که بتوانیم از آنها تقلید کنیم، یادگیری تقویتی لزوما بهینهترین راه برای یادگیری نیست. در این مقاله ما روشی را برای آموزش یک شبکه عصبی کاملا متصل با استفاده از یادگیری تقلیدی ارائه کردهایم و عملکرد مدل تعلیم دیده شده بررسی شده است. الگوریتم یادگیری تقلیدی توانست با افت قابل قبولی نسبت به عامل خبره خود شبکه عصبی را آموزش دهد و انتظار میرود اگر از یک الگوریتم بهینه یا نزدیک به بهینه به عنوان عامل خبره استفاده شود در نهایت نتیجه بسیار قابل قبولی حاصل شود.
لیست مقالات
لیست مقالات بایگانی شده
بهینه سازی استفاده از منابع شبکه های نوری با گرومینگ ترافیک در لایهی MPLS
محمدعلی سالک قادری - آرش رضایی - لطف اله بیگی
Ultra-broadband and compact beamsplitters using subwavelength-grating-assisted zero gap directional couplers
Kamalodin Arik - Mahmood Akbari - Amin Khavasi
External Force Control with Disturbance Rejection for 6 DoF Manipulator
Zahra Bonakdar - Arefe Hamidipour - Hamed Ghafarirad
Medial Residual Encoder Layers for Classification of Brain Tumors in Magnetic Resonance Images
Zahra Sobhaninia - Nader Karimi - Pejman Khadivi - Shadrokh Samavi
ارتقای تاب آوری بارهای شبکه های توزیع تحت رویدادهای HILP از طریق امکان سنجی تشکیل ریزشبکه
محمدحسین تاجمیری - محسن حمزه
Defense Against Spectrum Sensing Data Falsification Attack in Cognitive Radio Networks Using Machine Learning
Nazanin Parhizgar - Ali Jamshidi - Peyman Setoodeh
Blind angle and angular range detection in planar and limited-view geometries for photoacoustic tomography
Soheil Hakakzadeh - Zahra Kavehvash
Design of Dual-Band Triangular Microstrip Antenna Using Fractal Structure for Wi-Max and Wi-Fi Applications
Arian Mianji - Mohammad Bemani - Saeid Nikmehr - Ahmad Atashpaz Gargari
Low-Power Fano Resonance-Based MIM Plasmonic Switch Using Kerr-Type Nonlinear Material
Yousef Karimi - Hassan Kaatuzian
Modeling of seawater desalination by reverse osmosis method powered by wind turbine
Bahareh Iranmanesh - Gholam Hossein Riahy Dehkordi
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 41.7.4