0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
طراحی کنترل کننده امن سیستمهای غیرخطی با استفاده از یادگیری تقویتی و بهینه سازی مجموع مربعات
نویسندگان :
حسین قلی زاده
1
احسان رضوی
2
سجاد پاک خصال
3
سعید شمقدری
4
1- دانشگاه علم و صنعت ایران
2- دانشگاه صنعتی امیرکبیر
3- دانشگاه علم و صنعت ایران
4- دانشگاه علم و صنعت ایران
کلمات کلیدی :
تکرار سیاست امن،بهینه سازی مجموع مربعات،ناحیه امن،یادگیری تقویتی امن،سیستم غیرخطی
چکیده :
حل مساله مقید یکی از بزرگترین چالشهای الگوریتمهای یادگیری تقویتی میباشد. در مساله مقید چنانچه قید بر روی حالتهای سیستم باشد به آن مسئله ایمنی نیز میگویند. اکثر روشهایی که بهینگی قانون کنترل را تضمین میکنند در مورد ایمنی آن ادعایی ندارند و بالعکس. در این مقاله الگوریتمی برای طراحی کنترلکننده امن و بهینه برای یک سیستم غیرخطی پیوسته ارائه میشود. در این روش، الگوریتم تکرار سیاست با استفاده از مفهوم تابع مانع (barrier function) به الگوریتم تکرار سیاست امن تبدیل میشود. برای حل این مسئله نیازمند داشتن ناحیه امن و ناحیه دارای تضمین پایداری، در حضور قیدهای مسئله هستیم. علاوه بر این یک الگوریتم تکراری دیگر ارائه میشود که بزرگترین ناحیه امن و با تضمین پایداری را ارائه میکند. این تضمین داده میشود که مسیر حالتهای سیستم از این ناحیه خارج نخواهند شد. در الگوریتم تکرار سیاست از برنامهریزی مجموع مربعات استفاده شده است که روشی موثر برای حل مسائل بهینهسازی با قیود چند جملهای میباشد. نهایتا کارایی کنترلکننده پیشنهاد شده با استفاده از شبیهسازی نشان داده شده است.
لیست مقالات
لیست مقالات بایگانی شده
Kernel-Based Embedded Feature Selection for Motor Imagery Based BCI
Mehdi Kamandar
ساخت یک تراشه میکروسیالی برای شمارش سلول های معلق در مایع با الکترود های مایع
نرگس حسین زاده - پادینا فرخیان - سیدعلی حسینی
Automatic Classification of Parkinson’s Disease Using Best Parameters of Forward and Backward Walking
Atiye Riasi - Mehdi Delrobaei
Fast Adapted Delay and Sum Reconstruction Algorithm in Circular Photoacoustic Tomography
Soheil Hakakzadeh - Seyed masood Mostafavi - Zahra Kavehvash
Human Action Recognition in Still Images Using ConViT
Seyed Rohollah Hosseyni - Sanaz Seyedin - Hassan Taheri
Deep Learning Meets Explainable AI: A Robust Framework for X-Ray Fracture Detection
Ali Tamizifar - Shakiba Berenjkoub - Mina Amiri
Stabilizing Control System for Synchronizing a Biological Neuron Network Considering Electrical Autapse Effect
Fatemeh Jahangiri - AliAkbar Afzalian - Mashkour Mansouri
An Improved Hybrid Recommender System: Integrating Document Context-Based and Behavior-Based Methods
Meysam Varasteh - Mehdi Soleiman Nejad - Hadi Moradi - Mohammad Amin Sadeghi - Ahmad Kalhor
Sampled-data-based Descriptor Observer Design with Aperiodic Measurements for Lithium-ion Batteries in Hybrid Electric Vehicles
Hamid Reza Ahmadzadeh - Masoud Shafiee
Power exchanging of a VPP with its neighboring VPPs and participating in Day-ahead and spinning reserve markets
Mohammad Fazel Dehghanniri - Masoud Ali Akbar Golkar - Farzin Ghasemi
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 40.4.2