0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
طراحی کنترل کننده امن سیستمهای غیرخطی با استفاده از یادگیری تقویتی و بهینه سازی مجموع مربعات
نویسندگان :
حسین قلی زاده
1
احسان رضوی
2
سجاد پاک خصال
3
سعید شمقدری
4
1- دانشگاه علم و صنعت ایران
2- دانشگاه صنعتی امیرکبیر
3- دانشگاه علم و صنعت ایران
4- دانشگاه علم و صنعت ایران
کلمات کلیدی :
تکرار سیاست امن،بهینه سازی مجموع مربعات،ناحیه امن،یادگیری تقویتی امن،سیستم غیرخطی
چکیده :
حل مساله مقید یکی از بزرگترین چالشهای الگوریتمهای یادگیری تقویتی میباشد. در مساله مقید چنانچه قید بر روی حالتهای سیستم باشد به آن مسئله ایمنی نیز میگویند. اکثر روشهایی که بهینگی قانون کنترل را تضمین میکنند در مورد ایمنی آن ادعایی ندارند و بالعکس. در این مقاله الگوریتمی برای طراحی کنترلکننده امن و بهینه برای یک سیستم غیرخطی پیوسته ارائه میشود. در این روش، الگوریتم تکرار سیاست با استفاده از مفهوم تابع مانع (barrier function) به الگوریتم تکرار سیاست امن تبدیل میشود. برای حل این مسئله نیازمند داشتن ناحیه امن و ناحیه دارای تضمین پایداری، در حضور قیدهای مسئله هستیم. علاوه بر این یک الگوریتم تکراری دیگر ارائه میشود که بزرگترین ناحیه امن و با تضمین پایداری را ارائه میکند. این تضمین داده میشود که مسیر حالتهای سیستم از این ناحیه خارج نخواهند شد. در الگوریتم تکرار سیاست از برنامهریزی مجموع مربعات استفاده شده است که روشی موثر برای حل مسائل بهینهسازی با قیود چند جملهای میباشد. نهایتا کارایی کنترلکننده پیشنهاد شده با استفاده از شبیهسازی نشان داده شده است.
لیست مقالات
لیست مقالات بایگانی شده
تخمین پارامتر سریهای زمانی دو بعدی چند متغیره گسسته
مرضیه بهمنی - محسن شفیعیراد - مهدی زینالی - احسان ناظمالرعایا
Simultaneous Sensor and Actuator Faults Diagnosis in Fornasini-Marchesini Second Model Using Design Unknown Input Observer
Masoud Shafiee - Mehdi Mirshahi
بررسی و تحلیل تقابل تلفات و پروفیل ولتاژ به کمک الگوریتم ژنتیک چند هدفه در سیستم های قدرت در حضور سیستم های انتقال قدرت انعطاف پذیر
سجاد احمدنیا - حبیب رجبی مشهدی
Constructing a security network for improving the information vulnerability of transmission systems observability
Vahid Sohrabi Tabar - Saeid Ghassemzadeh - Sajjad Tohidi - Pierluigi Siano
Formation of Singular Multi-Agent Systems via a New Iterative Learning Control Approach
Ali Raddanipour - Masoud Shafiee
Holographic Principle Inspired Metal-Only Spoof Surface Plasmon Polariton Leaky-wave Antenna with Circular Polarization
Sajjad Zohrevand - Mohammad Amin Chaychi zadeh - Nader Komjani
Design Of Observer-Based Nonlinear Controller For Tracking Maximum Power Point In The Solar Cell
Kobra Siahi - Mohammad Reza Arvan - Vahid Behnamgol - Mahdi Mosayebi
A Novel Model for Backcasting the Environmental Sustainability in Iran’s Electricity Supply Mix
Mohammad Saeid Atabaki - Mohammad Mohammadi
A Fast Approach for Deep Neural Network Implementation on FPGA
Maedeh Nobari - Hadi Jahanirad
ℒ1 Adaptive Control Design Using CMPC: Applied to Single-Link Flexible Joint Manipulator
Hossein Ahmadian - Heidar Ali Talebi - Iman Sharifi
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.3.2