0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
Semi-supervised Deep Reinforcement Learning in Decentralized Multi-Agent Collision Avoidance and Path Planning in a Complex Environment
نویسندگان :
Marzie Parooei
1
Mehdi Tale Masouleh
2
Ahmad Kalhor
3
1- دانشگاه تهران
2- دانشگاه تهران
3- دانشگاه تهران
کلمات کلیدی :
Decentralized،Multi Agent،Collision Avoidance،Deep Reinforcement Learning
چکیده :
The problem of path planning and collision avoidance in complex and natural environments is one of the basic requirements of the robotic world, enabling robots to enter social environments. This paper aims to provide a decentralized path planning and collision avoidance method in multi-agent environments. In this method, each agent is a decision-making unit that decides independently from other agents and based on what is in its field of view. In the present paper, classical methods have been used to generate data for training purposes. Models were trained offline by imitating classical methods then semi-supervised methods were used for feature extraction. The results obtained from this method were compared with the Optimal Reciprocal Collision Avoidance (ORCA) method in three environments with different densities and three different indices. The proposed method performed relatively optimally and successfully increased the interaction index while decreasing the computation time. On the other hand, due to the scalable potential of this method, the number of agents could be increased without affecting the computation time.
لیست مقالات
لیست مقالات بایگانی شده
پیشبینی توان تولیدی توربینهای بادی با روشهای حافظه کوتاهمدت طولانی و ماشین تقویتکنندهی گرادیان سبک
سید متین ملکوتی - مهدی منصوری - امیر ریخته گرغیاثی
بررسی تاثیر دینامیکی سیستمهای انرژی خورشیدی متصل به شبکه بر بارگذاری ترانسفورماتور و بهبود عملکرد شبکه فشار ضعیف توزیع نیروی برق
مهدی محمدی - رضا خدادی - علی معصومی
Improving Spiking Neural Network Performance Using Astrocyte Feedback for Farsi Digit Recognition
Malihe Nazari - Fariba Bahrami - Mohammad Javad Yazdanpanah
Designing a delay line independent of PVT (Process, Voltage, Temperature) and applying it to a TDC (Time to Digital Converter)
Sepehr Zare Teimoori - Mehdi Ehsanian
The Conduction Mechanism in Micron-Thick ZnO Layers Grown on Si Substrates by Spray Pyrolysis
Mohsen Gharesi - Alireza Karimpour - Reza Razmand - Faramarz Hossein-Babaei
Adaptive dynamic programming for kinematic control of 3 interconnected wheeled mobile robots
Aliakbar Ghasemzadeh - Roya Amjadifard - Ali Keymasi Khalaji
Second-Order Sliding Mode Design Based on the Integration of Proportional-Integral and Nonlinear $\mathcal{H}_\infty$ Controllers for Load Frequency Control
Behrad Samari - Mohammad Javad Yazdanpanah
کنترل تطبیقی بازوی رباتی دو درجه آزادی با استفاده از یادگیری گروهی مبتنیبر الگوریتم اکثریت وزندار شده تصادفی
علی چراغی - امیرحسین جراره - سعید شمقدری
Perfect Tracking of a Non-minimum Phase MIMO System
Saeedreza Tofighi - Farshad Merrikh-Bayat
ارائه ساختار پیشنهادی ترانسفورماتور حالت جامد یک سویه در بهره برداری از شبکه های توزیع
بهنام بهارلوئی - رضا قندهاری - مهدی بابایی - یوسف عطائی
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 43.6.0