0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
طراحی تنظیمکنندهی خروجی بهینهی مبتنی بر یادگیری تقویتی ایمن با استفاده از تابع مانع کنترلی نمایی
نویسندگان :
سیدرضا اصغری
1
سعید شمقدری
2
1- دانشگاه علم و صنعت ایران
2- دانشگاه علم و صنعت ایران
کلمات کلیدی :
ایمنی،تابع مانع کنترلی نمایی،تنظیمکنندهی خروجی بهینه،سیستم چهار-تانک،سیستم دو-تانک،یادگیری تقویتی
چکیده :
یکی از روشهای حل مسئله تنظیمکنندهی خروجی بهینه برای یک سیستم زمان-گسسته، استفاده از کنترلکننده مبتنی بر یادگیری تقویتی میباشد و این در حالی است که در حضور محدودیتهای ایمنی، این امکان وجود دارد که استفاده از آن کنترلکننده، سبب بروز رفتارهای پرخطر در کاربردهای دنیای واقعی گردد. از این رو، در این مقاله، ضمن تبیین الگوریتم off-policy مستقل از مدل، فیلتر مبتنی بر تابع مانع کنترلی نمایی به منظور تحقق محدودیتهای ایمنی، معرفی میگردد. این فیلتر، در قالب یک مسئله بهینهسازی مرتبه-دوم، با توسعه مفهوم تابع مانع کنترلی نمایی و ترکیب آن با رگرسیون فرآیند گوسی، این امکان را ایجاد میکند که محدودیتهای مدنظر برای ورودیهای کنترلی و حالتهای سیستم، تحقق یابد. نتایج حاصل از اعتبارسنجی رویکرد پیشنهادی در کنترل سیستمهای چهار-تانک و دو-تانک نشان میدهند که رویکرد مدنظر با طراحی ورودی کنترلی مناسب توانایی لازم برای دفع اغتشاش و ردیابی مسیر مرجع را دارد و تحقق محدودیتهای مدنظر را نیز تضمین مینماید.
لیست مقالات
لیست مقالات بایگانی شده
An Autonomous Multi Agent Q-Learning Approach for Resource Allocation in D2D-Enabled Heterogeneous Networks
Pouya Akhoundzadeh - Ghasem Mirjalily - Mohammad taghi Saadeghi
A Modified Low Rank Learning Based on Iterative Nuclear Weighting in Ripplet Transform for Denoising MR Images
Nooshin Farhangian - Mansour Nejati Jahromi - Mahdi Nouri
Gesture recognition of hand movements using mechanomyography
Ashkan Elyasinia - Raheleh Davoodi - Sedighe Dehghani
On the Design of Highly Efficient Harmonic Tuned Wideband Class F-1/F Power Amplifier
Mohammad Reza Zeinali - Amir Hossein Aalipour - Hossein Shamsi
Global Finite-Time Nonlinear Observers for a Class of Nonlinear Systems Subjected to Mismatched Uncertainties
َAli Abooee - Saeed Amiri - Mohammad Hadi Rezaei
Detecting Variance Changes in Alarm Systems Using Generalized Delay-timers
Zahra Sharifi - Iman Izadi - Jafar Ghaisari
A Novel UAV-enabled V2V Mobile Network: A Reinforcement Learning Approach
Hossein Mohammadi Firouzjaei - Javad Zeraatkar - Mehrdad Ardebilipour
طراحی یک چارچوب غیر متمرکز تبادل انرژی برای مصرفکنندههای فعال در بازارهای همتا به همتا (P2P)
امیر زارع بخت پیما چمثقالی - مهدی مهدینژاد - مهرداد عابدی
Devloping a clustering routing algorithm based on the efficient hybrid methodology for WSN performance optimization
Neda Mazloomi - Sajad Haghzad Klidbary
A modified Dempster Shafer approach to classification in surgical skill assessment
Arash Iranfar - Mohammad Soleymannejad - Behzad Moshiri - Hamid D. Taghirad
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.8.0