0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
طراحی کنترل کننده امن سیستمهای غیرخطی با استفاده از یادگیری تقویتی و بهینه سازی مجموع مربعات
نویسندگان :
حسین قلی زاده
1
احسان رضوی
2
سجاد پاک خصال
3
سعید شمقدری
4
1- دانشگاه علم و صنعت ایران
2- دانشگاه صنعتی امیرکبیر
3- دانشگاه علم و صنعت ایران
4- دانشگاه علم و صنعت ایران
کلمات کلیدی :
تکرار سیاست امن،بهینه سازی مجموع مربعات،ناحیه امن،یادگیری تقویتی امن،سیستم غیرخطی
چکیده :
حل مساله مقید یکی از بزرگترین چالشهای الگوریتمهای یادگیری تقویتی میباشد. در مساله مقید چنانچه قید بر روی حالتهای سیستم باشد به آن مسئله ایمنی نیز میگویند. اکثر روشهایی که بهینگی قانون کنترل را تضمین میکنند در مورد ایمنی آن ادعایی ندارند و بالعکس. در این مقاله الگوریتمی برای طراحی کنترلکننده امن و بهینه برای یک سیستم غیرخطی پیوسته ارائه میشود. در این روش، الگوریتم تکرار سیاست با استفاده از مفهوم تابع مانع (barrier function) به الگوریتم تکرار سیاست امن تبدیل میشود. برای حل این مسئله نیازمند داشتن ناحیه امن و ناحیه دارای تضمین پایداری، در حضور قیدهای مسئله هستیم. علاوه بر این یک الگوریتم تکراری دیگر ارائه میشود که بزرگترین ناحیه امن و با تضمین پایداری را ارائه میکند. این تضمین داده میشود که مسیر حالتهای سیستم از این ناحیه خارج نخواهند شد. در الگوریتم تکرار سیاست از برنامهریزی مجموع مربعات استفاده شده است که روشی موثر برای حل مسائل بهینهسازی با قیود چند جملهای میباشد. نهایتا کارایی کنترلکننده پیشنهاد شده با استفاده از شبیهسازی نشان داده شده است.
لیست مقالات
لیست مقالات بایگانی شده
Identifying Influential Nodes in Complex Networks by Multiple Attributes Model
Shima Esfandiari - Mostafa Fakhrahmad
A Novel UAV-enabled V2V Mobile Network: A Reinforcement Learning Approach
Hossein Mohammadi Firouzjaei - Javad Zeraatkar - Mehrdad Ardebilipour
مدیریت بهینه توان در یک ساختمان هوشمند حاوی واحدهای ترکیبی برق و حرارت و منابع تولیدپراکنده در حضور ذخیره ساز انرژی
اسماعیل زحمت کشان
بهبود بازدهی انرژی در سیستم های بدون سلول با آنتن های انبوه مبتنی بر مخابرات پهپادها به کمک انتقال همزمان توان و اطلاعات به صورت بی سیم
امیرحسین زحمتی - محسن اسلامی
تخمین بهینه پارامترهای مدل یک ماژول فتوولتائیک توسط الگوریتم بهینه سازی Mayfly
پریسا اکبری - نجمه اقبال
Lightweight SRAM-PUF Identity Authentication for Edge Devices
Alireza Shafiei - Mehrnaz Monajati
Performance analysis under the Independent Fluctuating Two-Ray (IFTR) Fading in RIS-Assisted Millimeter Wave Communications
Maryam Olyaee - Hadi Hashemi - Juan Manuel Romero Jerez
Adaptive Attitude Synchronization and Tracking Control of Spacecraft Formation Flying using Reaction Wheel without Angular Velocity Measurement
Amin Mihankhah - Ali Doustmohammadi
Evaluation of Different Connectivity Methods for Obsessive Compulsive Disorder Diagnosis
Samandokht Rashidi - Amin Abdipourasl - Fatemeh Jamaloo - Reza Rostami
A Novel HVDC Transmission System Based on Z-Source Converter
Mehdi Zareian Jahromi - Mohammadreza Mousavikhademi - Ebrahim Kazemi
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.5.3