0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
طراحی کنترل کننده امن سیستمهای غیرخطی با استفاده از یادگیری تقویتی و بهینه سازی مجموع مربعات
نویسندگان :
حسین قلی زاده
1
احسان رضوی
2
سجاد پاک خصال
3
سعید شمقدری
4
1- دانشگاه علم و صنعت ایران
2- دانشگاه صنعتی امیرکبیر
3- دانشگاه علم و صنعت ایران
4- دانشگاه علم و صنعت ایران
کلمات کلیدی :
تکرار سیاست امن،بهینه سازی مجموع مربعات،ناحیه امن،یادگیری تقویتی امن،سیستم غیرخطی
چکیده :
حل مساله مقید یکی از بزرگترین چالشهای الگوریتمهای یادگیری تقویتی میباشد. در مساله مقید چنانچه قید بر روی حالتهای سیستم باشد به آن مسئله ایمنی نیز میگویند. اکثر روشهایی که بهینگی قانون کنترل را تضمین میکنند در مورد ایمنی آن ادعایی ندارند و بالعکس. در این مقاله الگوریتمی برای طراحی کنترلکننده امن و بهینه برای یک سیستم غیرخطی پیوسته ارائه میشود. در این روش، الگوریتم تکرار سیاست با استفاده از مفهوم تابع مانع (barrier function) به الگوریتم تکرار سیاست امن تبدیل میشود. برای حل این مسئله نیازمند داشتن ناحیه امن و ناحیه دارای تضمین پایداری، در حضور قیدهای مسئله هستیم. علاوه بر این یک الگوریتم تکراری دیگر ارائه میشود که بزرگترین ناحیه امن و با تضمین پایداری را ارائه میکند. این تضمین داده میشود که مسیر حالتهای سیستم از این ناحیه خارج نخواهند شد. در الگوریتم تکرار سیاست از برنامهریزی مجموع مربعات استفاده شده است که روشی موثر برای حل مسائل بهینهسازی با قیود چند جملهای میباشد. نهایتا کارایی کنترلکننده پیشنهاد شده با استفاده از شبیهسازی نشان داده شده است.
لیست مقالات
لیست مقالات بایگانی شده
A New Method on Failure Detection of Fixed and Moving Contacts of Circuit Breakers
Hassan Hamidi - Ali Asghar Razi Kazemi
Single- and Multi-Hop BERT Question Classifier for Open-Domain Question Answering (SiMQC)
Faeze Zakaryapour Sayyad - Mahdi Bohlouli
ارائه ساختار پیشنهادی ترانسفورماتور حالت جامد یک سویه در بهره برداری از شبکه های توزیع
بهنام بهارلوئی - رضا قندهاری - مهدی بابایی - یوسف عطائی
Revealing Shadows: Low-Light Image Enhancement Using Self-Calibrated Illumination
Farzaneh Koohestani - Nader Karimi - Shadrokh Samavi
High efficiency Continuous class J/B power amplifier design with 130% Fractional Bandwidth
Sara Aghajani - Mahmoud Kamarei - Marzieh Chegini
A Novel Step-up Converter Based on Active Network and Coupled-Inductor Technique with Soft Switching Operation
Mohammadreza Zeynalhosseyni - Reza Beiranvand
Counterintuitive Benefits of Time Window Constraints: Enhancing Cost Efficiency in Vehicle Routing Problems
Mehdi Alimohammadi - Saeedeh Rezaee - Nasser Motahari Farimani - Mohammad Reza Akbarzadeh Totonchi
Automated Optic Disc Segmentation in Low-Quality Retinopathy of Prematurity Retinal Images
Abolfazl Karimiyan Abdar - Reza AghaeiZadeh Zoroofi - Naser Shoeibi - Sare Safi - Alireza Ramezani - Homayoun Nikkhah - Hamid Safi - Mohammad Reza Ansari Astaneh
Emotion Recognition from EEG Signals During REM Sleep
Asghar Zarei - Ali Mahmoudi
بهبود بازه پویای حسگر گاز اکسید فلزی برای کاربرد در پایش ایمنی محیطهای صنعتی
سمانه محمدباغبان - وحید غفاری نیا
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 43.6.0