0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
طراحی تنظیمکنندهی خروجی بهینهی مبتنی بر یادگیری تقویتی ایمن با استفاده از تابع مانع کنترلی نمایی
نویسندگان :
سیدرضا اصغری
1
سعید شمقدری
2
1- دانشگاه علم و صنعت ایران
2- دانشگاه علم و صنعت ایران
کلمات کلیدی :
ایمنی،تابع مانع کنترلی نمایی،تنظیمکنندهی خروجی بهینه،سیستم چهار-تانک،سیستم دو-تانک،یادگیری تقویتی
چکیده :
یکی از روشهای حل مسئله تنظیمکنندهی خروجی بهینه برای یک سیستم زمان-گسسته، استفاده از کنترلکننده مبتنی بر یادگیری تقویتی میباشد و این در حالی است که در حضور محدودیتهای ایمنی، این امکان وجود دارد که استفاده از آن کنترلکننده، سبب بروز رفتارهای پرخطر در کاربردهای دنیای واقعی گردد. از این رو، در این مقاله، ضمن تبیین الگوریتم off-policy مستقل از مدل، فیلتر مبتنی بر تابع مانع کنترلی نمایی به منظور تحقق محدودیتهای ایمنی، معرفی میگردد. این فیلتر، در قالب یک مسئله بهینهسازی مرتبه-دوم، با توسعه مفهوم تابع مانع کنترلی نمایی و ترکیب آن با رگرسیون فرآیند گوسی، این امکان را ایجاد میکند که محدودیتهای مدنظر برای ورودیهای کنترلی و حالتهای سیستم، تحقق یابد. نتایج حاصل از اعتبارسنجی رویکرد پیشنهادی در کنترل سیستمهای چهار-تانک و دو-تانک نشان میدهند که رویکرد مدنظر با طراحی ورودی کنترلی مناسب توانایی لازم برای دفع اغتشاش و ردیابی مسیر مرجع را دارد و تحقق محدودیتهای مدنظر را نیز تضمین مینماید.
لیست مقالات
لیست مقالات بایگانی شده
Vibration Analysis of a High-Speed Switched Reluctance Motor Considering Fast Demagnetization Voltage
Nasrin Majlesi - Amir Rashidi - Morteza Saghaian Nejad
مدل سازی و شبیه سازی جداکننده پرتو کوانتومی و تداخل گر ماخ زندر کوانتومی
محمد جواد شریفی
Real-Time Prediction of Lower Limb AngularTrajectories Using an Optimized LSTM Model withMarkerless Motion Capture
Amirhossein Jafari - Hamed Jalaly Bidgoly
Significant Methods to Improve Control of Quadrotors, Hexarotors and Octorotors
Peyman Amiri - Nima Sina - Mohammad Danesh
Optimal Bidding Strategy with Smooth Budget Delivery in Online Advertising
Mohammad Afzali - Keykhosro Khosravani - Maryam Babazadeh
Partitioning-based Graph Signal Denoising via Heat Kernel Smoothing
Mohammadreza Fattahi - Hamid Saeedi-Sourck - Vahid Abootalebi
Human Identification based on micro-Doppler images using Residual Networks
Ali Pouresmaeil - Pegah Kakvand - Mohammad Ali Sebt
Robot-Assisted Rehabilitation with Optimal Impedance: Using an $\mathcal{EKF}$-Based $\mathcal{L}asso-\mathcal{MPC}$
Hossein Ahmadian - Iman Sharifi - Heidar Ali Talebi
Improving CCA-based methods for SSVEP classification using a common source graph
Nastaran Noori - Sepideh Hajipour Sardouie
Investigation of Li3P as Electrolyte and Lithium-ion conductor: An Ab-Initio Study
Keyvan Khosh Abady - ََamin Niksirat - Negar Karpourazar - Mahdi Pourfath
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.5.3