0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
طراحی کنترل کننده امن سیستمهای غیرخطی با استفاده از یادگیری تقویتی و بهینه سازی مجموع مربعات
نویسندگان :
حسین قلی زاده
1
احسان رضوی
2
سجاد پاک خصال
3
سعید شمقدری
4
1- دانشگاه علم و صنعت ایران
2- دانشگاه صنعتی امیرکبیر
3- دانشگاه علم و صنعت ایران
4- دانشگاه علم و صنعت ایران
کلمات کلیدی :
تکرار سیاست امن،بهینه سازی مجموع مربعات،ناحیه امن،یادگیری تقویتی امن،سیستم غیرخطی
چکیده :
حل مساله مقید یکی از بزرگترین چالشهای الگوریتمهای یادگیری تقویتی میباشد. در مساله مقید چنانچه قید بر روی حالتهای سیستم باشد به آن مسئله ایمنی نیز میگویند. اکثر روشهایی که بهینگی قانون کنترل را تضمین میکنند در مورد ایمنی آن ادعایی ندارند و بالعکس. در این مقاله الگوریتمی برای طراحی کنترلکننده امن و بهینه برای یک سیستم غیرخطی پیوسته ارائه میشود. در این روش، الگوریتم تکرار سیاست با استفاده از مفهوم تابع مانع (barrier function) به الگوریتم تکرار سیاست امن تبدیل میشود. برای حل این مسئله نیازمند داشتن ناحیه امن و ناحیه دارای تضمین پایداری، در حضور قیدهای مسئله هستیم. علاوه بر این یک الگوریتم تکراری دیگر ارائه میشود که بزرگترین ناحیه امن و با تضمین پایداری را ارائه میکند. این تضمین داده میشود که مسیر حالتهای سیستم از این ناحیه خارج نخواهند شد. در الگوریتم تکرار سیاست از برنامهریزی مجموع مربعات استفاده شده است که روشی موثر برای حل مسائل بهینهسازی با قیود چند جملهای میباشد. نهایتا کارایی کنترلکننده پیشنهاد شده با استفاده از شبیهسازی نشان داده شده است.
لیست مقالات
لیست مقالات بایگانی شده
Improving Adaptive Algorithm to Reduce Grounding System Impedance Computing Time
Soheil Rahnamayian Jelodar - Seyed Hossein Hesamedin Sadeghi - Reza Rahmani - Mohammad Ali Narooie Dehchil - Hossein Askarian Abyaneh
Reinforcement Learning based Joint Resource Allocation and User Fairness Optimization in mmWave-NOMA HetNets
Sima Sobhi-Givi - Mahdi Nouri - Mahrokh G. Shayesteh - Hashem Kalbkhani - Zhiguo Ding
Achieving a Wide Range of Voltage Gain in Three-Phase LLC Resonant Converter Using Hybrid Control of Variable Frequency and Variable Magnetizing Inductor
Saeed Ramezani darvish - Salar Sadeghian - Adib Abrishamifar
A High Gain Transformerless DC-DC Boost Converter Using LCD Network: Design and Experimental Verification
Hamed Hokmali - Ebrahim Afjei
کنترل توربین بادی با استفاده از کنترلکننده پیشبین تابعی توسعهیافته
آرمین باقری - محمد حائری
A 30dB and 250μW High Linear Variable Gain Amplifier with Employing Gm-boosting and Common Mode Feedforward Techniques
Mehdi Shahabi
Non-homogeneous interference suppression in OFDM array radars using direct data domain approach
Sima Shariatmadari
A Single-Switch High Voltage Gain DC-DC Converter Using Coupled Inductor and Switched Capacitor-Inductor Techniques
Mohammad Salehizadeh - Hasan Rastegar - Farid Mohammadi
An Accurate Subthreshold Analytical Model for Black Phosphorus Heterojunction Dopingless Tunneling Field-Effect Transistors
Saeid Marjani - Mohamad Tolue Khayami
تعیین آرایش بهینه خطوط جهت کاهش فرسایش یقه پایه های بتنی ناشی از تنشهای باد
میثم پوراحمدی نخلی - حمیدرضا فیروزآبادی
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.0.4