0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
طراحی کنترل کننده امن سیستمهای غیرخطی با استفاده از یادگیری تقویتی و بهینه سازی مجموع مربعات
نویسندگان :
حسین قلی زاده
1
احسان رضوی
2
سجاد پاک خصال
3
سعید شمقدری
4
1- دانشگاه علم و صنعت ایران
2- دانشگاه صنعتی امیرکبیر
3- دانشگاه علم و صنعت ایران
4- دانشگاه علم و صنعت ایران
کلمات کلیدی :
تکرار سیاست امن،بهینه سازی مجموع مربعات،ناحیه امن،یادگیری تقویتی امن،سیستم غیرخطی
چکیده :
حل مساله مقید یکی از بزرگترین چالشهای الگوریتمهای یادگیری تقویتی میباشد. در مساله مقید چنانچه قید بر روی حالتهای سیستم باشد به آن مسئله ایمنی نیز میگویند. اکثر روشهایی که بهینگی قانون کنترل را تضمین میکنند در مورد ایمنی آن ادعایی ندارند و بالعکس. در این مقاله الگوریتمی برای طراحی کنترلکننده امن و بهینه برای یک سیستم غیرخطی پیوسته ارائه میشود. در این روش، الگوریتم تکرار سیاست با استفاده از مفهوم تابع مانع (barrier function) به الگوریتم تکرار سیاست امن تبدیل میشود. برای حل این مسئله نیازمند داشتن ناحیه امن و ناحیه دارای تضمین پایداری، در حضور قیدهای مسئله هستیم. علاوه بر این یک الگوریتم تکراری دیگر ارائه میشود که بزرگترین ناحیه امن و با تضمین پایداری را ارائه میکند. این تضمین داده میشود که مسیر حالتهای سیستم از این ناحیه خارج نخواهند شد. در الگوریتم تکرار سیاست از برنامهریزی مجموع مربعات استفاده شده است که روشی موثر برای حل مسائل بهینهسازی با قیود چند جملهای میباشد. نهایتا کارایی کنترلکننده پیشنهاد شده با استفاده از شبیهسازی نشان داده شده است.
لیست مقالات
لیست مقالات بایگانی شده
Design and Implementation of a fast flexible and efficient multichannel digital filter for hearing aids
Mohammadsadegh Poushnegar - Mahmoud Tabandeh - Meysam Nesary Moghadam - Farzam Gilani - Ali Aghakasiri
A high speed method for features extraction in face recognition systems
Hosein Khorami - Hadishahriar Shahhoseini
Wideband Rat-race Hybrid Coupler Using Ridge Gap Waveguide Technology
Zahra Akhoondmahdi - Ahmad Bakhtafrouz
Risk-based Expansion planning of Active Distribution Networks in the Presence of Electric Vehicles to improve the Reliability
Ali Razzaghi
High Step up DC/DC Converter with Low Input Current Ripple and Low Voltage Stress on Semiconductors
Saed Mahmoud Alilou - Mohammad Maalandish - Soheil Nouri - Seyed Hossein Hosseini
بکارگیری یادگیری عمیق در ارزیابی به هنگام پایداری ولتاژ کوتاه مدت با استفاده از داده های اندازه گیری فازوری
امیرحسین باباعلی - محمدتقی عاملی
Diagnosis of Covid 19 disease, flu, allergies, colds
Mahyar Mohammady - Marzieh Kamali
Image quality equations for focused transducer in circular photoacoustic computed tomography
Soheil Hakakzadeh - Zahra Kavehvash
A Novel Approach to Cheating Prevention in Demand Side Management Algorithms
Farahnaz Haftbaradaran - Ali Akhtari - Massoud Reza Hashemi - Zahra Baharlouei
تخمین بهینه پارامترهای مدل یک ماژول فتوولتائیک توسط الگوریتم بهینه سازی Mayfly
پریسا اکبری - نجمه اقبال
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.8.0