0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
طراحی کنترل کننده امن سیستمهای غیرخطی با استفاده از یادگیری تقویتی و بهینه سازی مجموع مربعات
نویسندگان :
حسین قلی زاده
1
احسان رضوی
2
سجاد پاک خصال
3
سعید شمقدری
4
1- دانشگاه علم و صنعت ایران
2- دانشگاه صنعتی امیرکبیر
3- دانشگاه علم و صنعت ایران
4- دانشگاه علم و صنعت ایران
کلمات کلیدی :
تکرار سیاست امن،بهینه سازی مجموع مربعات،ناحیه امن،یادگیری تقویتی امن،سیستم غیرخطی
چکیده :
حل مساله مقید یکی از بزرگترین چالشهای الگوریتمهای یادگیری تقویتی میباشد. در مساله مقید چنانچه قید بر روی حالتهای سیستم باشد به آن مسئله ایمنی نیز میگویند. اکثر روشهایی که بهینگی قانون کنترل را تضمین میکنند در مورد ایمنی آن ادعایی ندارند و بالعکس. در این مقاله الگوریتمی برای طراحی کنترلکننده امن و بهینه برای یک سیستم غیرخطی پیوسته ارائه میشود. در این روش، الگوریتم تکرار سیاست با استفاده از مفهوم تابع مانع (barrier function) به الگوریتم تکرار سیاست امن تبدیل میشود. برای حل این مسئله نیازمند داشتن ناحیه امن و ناحیه دارای تضمین پایداری، در حضور قیدهای مسئله هستیم. علاوه بر این یک الگوریتم تکراری دیگر ارائه میشود که بزرگترین ناحیه امن و با تضمین پایداری را ارائه میکند. این تضمین داده میشود که مسیر حالتهای سیستم از این ناحیه خارج نخواهند شد. در الگوریتم تکرار سیاست از برنامهریزی مجموع مربعات استفاده شده است که روشی موثر برای حل مسائل بهینهسازی با قیود چند جملهای میباشد. نهایتا کارایی کنترلکننده پیشنهاد شده با استفاده از شبیهسازی نشان داده شده است.
لیست مقالات
لیست مقالات بایگانی شده
Stabilizing Control System for Synchronizing a Biological Neuron Network Considering Electrical Autapse Effect
Fatemeh Jahangiri - AliAkbar Afzalian - Mashkour Mansouri
A High Gain, High IIP3, Perfect Input Matching, Programmable Gain LNA in CMOS Technology
Amirhossein Tajik - Seyedali Samareh Taherinasab - Samad Sheikhaei
A Design Methodology for Submicron Low-Voltage Bandgap Voltage Reference
Mehdi Samavati - Samad Sheikhaei - Mohsen Jalali
شبیه سازی رفتار و عملکرد مقره پلیمری 20 کیلوولت با اعمال آلودگی سطحی از نقطه نظر ارزیابی و سنجش جریان خزشی و ارائه الگوی معادل سازی آن
سیدمحمدعلی طباطبائی - حمید جوادی - مسعود عبدالحسین پور - فرامرز قلیچی
تجزیه وابستگی با استفاده از Q-Learning محافظه کار
امیر زارعی - علیرضا خیاطیان - پیمان ستوده
A new approach to design fuzzy interval observer for parameter-varying systems
Mostafa Faramin - Behrooz Rezaie - Zahra Rahmani
A New 10 Watt 1.6 GHz Linear Power Amplifier with More than 11 dB Gain
Marzieh Chegini - HojjatAllah Nemati - Mahmoud Kamarei
Distributed Data Processing for Multi-Agent Systems Via Wave Model
Saeedreza Tofighi - Masoud Shafiee
A novel wideband low profile Fabry-Perot cavity antenna using single-layer partially reflective surface
Mahtab Ghanbari - Bijan Abbasi arand - Maryam Hesari shermeh
Fault tolerant control design for linear systems based on cubic observers
Mahsa Hasanshahi - Malihe Maghfoori Farsangi - Elham Amini Boroujeni
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 40.4.2