0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
طراحی کنترل کننده امن سیستمهای غیرخطی با استفاده از یادگیری تقویتی و بهینه سازی مجموع مربعات
نویسندگان :
حسین قلی زاده
1
احسان رضوی
2
سجاد پاک خصال
3
سعید شمقدری
4
1- دانشگاه علم و صنعت ایران
2- دانشگاه صنعتی امیرکبیر
3- دانشگاه علم و صنعت ایران
4- دانشگاه علم و صنعت ایران
کلمات کلیدی :
تکرار سیاست امن،بهینه سازی مجموع مربعات،ناحیه امن،یادگیری تقویتی امن،سیستم غیرخطی
چکیده :
حل مساله مقید یکی از بزرگترین چالشهای الگوریتمهای یادگیری تقویتی میباشد. در مساله مقید چنانچه قید بر روی حالتهای سیستم باشد به آن مسئله ایمنی نیز میگویند. اکثر روشهایی که بهینگی قانون کنترل را تضمین میکنند در مورد ایمنی آن ادعایی ندارند و بالعکس. در این مقاله الگوریتمی برای طراحی کنترلکننده امن و بهینه برای یک سیستم غیرخطی پیوسته ارائه میشود. در این روش، الگوریتم تکرار سیاست با استفاده از مفهوم تابع مانع (barrier function) به الگوریتم تکرار سیاست امن تبدیل میشود. برای حل این مسئله نیازمند داشتن ناحیه امن و ناحیه دارای تضمین پایداری، در حضور قیدهای مسئله هستیم. علاوه بر این یک الگوریتم تکراری دیگر ارائه میشود که بزرگترین ناحیه امن و با تضمین پایداری را ارائه میکند. این تضمین داده میشود که مسیر حالتهای سیستم از این ناحیه خارج نخواهند شد. در الگوریتم تکرار سیاست از برنامهریزی مجموع مربعات استفاده شده است که روشی موثر برای حل مسائل بهینهسازی با قیود چند جملهای میباشد. نهایتا کارایی کنترلکننده پیشنهاد شده با استفاده از شبیهسازی نشان داده شده است.
لیست مقالات
لیست مقالات بایگانی شده
The most descriptive surprise definition for brain’s EEG response to visual and auditory oddball tasks
Mohammad Mahdi Kiani - Zahra Mousavi - Hamid Aghajan
Low-power and Low-Phase Noise Gm-Boosted Differential CMOS LC Voltage Controlled Oscillator using Genetic Algorithm
Mohammad Jafar Hemmati - Sepehr Ebrahimi Mood
Multi-Attribute Decision-Making Methods to a Cloud Service Providing Selection
Amirhossein Shahbakhsh razavi - Kiumars Javan - Mehdi Zaferanieh - Somayeh Sobati-Moghadam
ارتقای تاب آوری بارهای شبکه های توزیع تحت رویدادهای HILP از طریق امکان سنجی تشکیل ریزشبکه
محمدحسین تاجمیری - محسن حمزه
A Mathematical 3D Solution to Efficiently Locate Drones in 5G Wireless Networks
Mina Taghavi - Jamshid Abouei
An event-triggered distributed consensus information filter for target tracking in sensor networks
Sara Giyani - Behrouz Safarinejadian - Sajad Shamsi
High PSRR, 0.7nW MOSFET-Only Subthreshold Voltage Reference
Mohammad Rashtian - Mahdi Shahpasandi
A Thin-Film SIS Solar Cell Based on Distributed Silicon Nanoparticles
Mohammad Ali Shameli - Sayyed Reza Mirnaziry - Leila Yousefi
Investigating the Effects of Adding Distributed Generation Resources to the Distribution Networks on their Protection System Performance
Morteza Abbasghorbani - Elham Vahed
بیشینه سازی ظرفیت در رله های تمام دوطرفه تک مسیره با در نظر گرفتن اختلالات سخت افزاری
حسین حصاربنی - زهرا کشاورز گندمانی
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.3.2