0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
طراحی کنترل کننده امن سیستمهای غیرخطی با استفاده از یادگیری تقویتی و بهینه سازی مجموع مربعات
نویسندگان :
حسین قلی زاده
1
احسان رضوی
2
سجاد پاک خصال
3
سعید شمقدری
4
1- دانشگاه علم و صنعت ایران
2- دانشگاه صنعتی امیرکبیر
3- دانشگاه علم و صنعت ایران
4- دانشگاه علم و صنعت ایران
کلمات کلیدی :
تکرار سیاست امن،بهینه سازی مجموع مربعات،ناحیه امن،یادگیری تقویتی امن،سیستم غیرخطی
چکیده :
حل مساله مقید یکی از بزرگترین چالشهای الگوریتمهای یادگیری تقویتی میباشد. در مساله مقید چنانچه قید بر روی حالتهای سیستم باشد به آن مسئله ایمنی نیز میگویند. اکثر روشهایی که بهینگی قانون کنترل را تضمین میکنند در مورد ایمنی آن ادعایی ندارند و بالعکس. در این مقاله الگوریتمی برای طراحی کنترلکننده امن و بهینه برای یک سیستم غیرخطی پیوسته ارائه میشود. در این روش، الگوریتم تکرار سیاست با استفاده از مفهوم تابع مانع (barrier function) به الگوریتم تکرار سیاست امن تبدیل میشود. برای حل این مسئله نیازمند داشتن ناحیه امن و ناحیه دارای تضمین پایداری، در حضور قیدهای مسئله هستیم. علاوه بر این یک الگوریتم تکراری دیگر ارائه میشود که بزرگترین ناحیه امن و با تضمین پایداری را ارائه میکند. این تضمین داده میشود که مسیر حالتهای سیستم از این ناحیه خارج نخواهند شد. در الگوریتم تکرار سیاست از برنامهریزی مجموع مربعات استفاده شده است که روشی موثر برای حل مسائل بهینهسازی با قیود چند جملهای میباشد. نهایتا کارایی کنترلکننده پیشنهاد شده با استفاده از شبیهسازی نشان داده شده است.
لیست مقالات
لیست مقالات بایگانی شده
Remote Sensing Image Registration Using Fast Visual Saliency and Improved SIFT
Fatemeh Khalili - Farbod Razzazi - Abolfazl Hosseini
Effective Service Restoration in Electrical Distribution Networks Using a Bi-Stage Algorithm
Qasem Asadi - Amir Amini - Hamid Falaghi - Maryam Ramezani
Message Overhead Control Using P-Epidemic Routing Method in Resource-Constrained Heterogeneous DTN
Mohammad Yousef Darmani - Shiva Karimi
Simulation and Measurement of a Large Reverberation Chamber (LRC) Loaded by Metal Elements
Mojtaba Basravi - ZakerHossein Firouzeh - Hadi Aliakbarian
Sparsity Domain Smoothing Based Thresholding Recovery Method for OFDM Sparse Channel Estimation
Mohammad Hossein Bahonar - Reza Ghaderi Zefreh - Rouhollah Amiri
نحوه کنترل سطوح هوشمند با قابلیت تنظیم مجدد در راستای مقابله با استراق سمع کننده ها
محمد کاظم ناطقی - زلفا زینل پور یزدی
Introduce a novel approach to orbital maintenance in CRTBP
Amirreza Kosari - Ehsan Abbasali - Jamileh Hamzei - Majid Bakhtiari
Adaptive fault tolerant neural control of heterogeneous second-order multi-agent systems
Mohammad Hadi Rezaei - Ali Abooee
Performance Analysis of the Modified Flux-Coupling-Type SFCL in VSC-HVDC System
Mohammad Khakroei - Ashkan Mirzaei Rajeooni - Mahdi Rahimi Pirbasti - Hossein Heydari
A New Atrial Fibrillation Detection System with Noise Cancellation and Signal Annotation
Amirali Banaei Kashani - Bardia Baraeinejad - Mohammad Fakharzadeh
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 40.3.1