0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
طراحی کنترل کننده امن سیستمهای غیرخطی با استفاده از یادگیری تقویتی و بهینه سازی مجموع مربعات
نویسندگان :
حسین قلی زاده
1
احسان رضوی
2
سجاد پاک خصال
3
سعید شمقدری
4
1- دانشگاه علم و صنعت ایران
2- دانشگاه صنعتی امیرکبیر
3- دانشگاه علم و صنعت ایران
4- دانشگاه علم و صنعت ایران
کلمات کلیدی :
تکرار سیاست امن،بهینه سازی مجموع مربعات،ناحیه امن،یادگیری تقویتی امن،سیستم غیرخطی
چکیده :
حل مساله مقید یکی از بزرگترین چالشهای الگوریتمهای یادگیری تقویتی میباشد. در مساله مقید چنانچه قید بر روی حالتهای سیستم باشد به آن مسئله ایمنی نیز میگویند. اکثر روشهایی که بهینگی قانون کنترل را تضمین میکنند در مورد ایمنی آن ادعایی ندارند و بالعکس. در این مقاله الگوریتمی برای طراحی کنترلکننده امن و بهینه برای یک سیستم غیرخطی پیوسته ارائه میشود. در این روش، الگوریتم تکرار سیاست با استفاده از مفهوم تابع مانع (barrier function) به الگوریتم تکرار سیاست امن تبدیل میشود. برای حل این مسئله نیازمند داشتن ناحیه امن و ناحیه دارای تضمین پایداری، در حضور قیدهای مسئله هستیم. علاوه بر این یک الگوریتم تکراری دیگر ارائه میشود که بزرگترین ناحیه امن و با تضمین پایداری را ارائه میکند. این تضمین داده میشود که مسیر حالتهای سیستم از این ناحیه خارج نخواهند شد. در الگوریتم تکرار سیاست از برنامهریزی مجموع مربعات استفاده شده است که روشی موثر برای حل مسائل بهینهسازی با قیود چند جملهای میباشد. نهایتا کارایی کنترلکننده پیشنهاد شده با استفاده از شبیهسازی نشان داده شده است.
لیست مقالات
لیست مقالات بایگانی شده
Explorable Grasp Pose Detection for Two-Finger Robot Handover
AliReza Beigy - Mehdi Tale Masouleh - Ahmad Kalhor
ردیابی اهداف کوچک مادون قرمز مبتنی بر فیلتر کالمن بهینهشده با الگوریتم نهنگ و ازدحام ذرات
نازنین بهمن جو - سعید خانکلانتری
New dental implants with micro-movement capability - biomechanical evaluation and evolution
Zahra Nouri - Nima Norouzi
پیشبینی بازار سرمایه به کمک دادهکاوی با الگوریتمهای رگرسیونی
شیوا نمایان - محمدشهرام معین
An Event-Triggered Robust Data-Driven Predictive Control with Transient Response Improvement
Amir Mehrnoosh - Mohammad Haeri
Multi-physics electromagnetic-mechanical analysis of a high-speed switched reluctance motor for vacuum cleaner application
Nasrin Majlesi - Morteza Saghaian-Nejad - Amir Rashidi
Vehicle stability control and trajectory tracking utilizing a type-2 fuzzy controller
Mohammad Mahdavi Mazdeh - Mehdi Pourgholi - Vahid Fakhari
A New Physical Philosophy to Model and Interpret Partial Discharge Phenomenon
Arman Vasigh Zadeh Ansari - Mahdi Vakilian
Efficiency Estimation Methods of In-Service Induction Motors-A Review
Moslem Geravandi - Hassan Moradi CheshmehBeigi
Nonlinear Observer Design via Emulation Method for Sampled-data Teleoperation Systems
Ali Firouzi Abriz - Amir Aminzadeh Ghavifekr - Ashkan Safari
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 43.6.0