0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
طراحی تنظیمکنندهی خروجی بهینهی مبتنی بر یادگیری تقویتی ایمن با استفاده از تابع مانع کنترلی نمایی
نویسندگان :
سیدرضا اصغری
1
سعید شمقدری
2
1- دانشگاه علم و صنعت ایران
2- دانشگاه علم و صنعت ایران
کلمات کلیدی :
ایمنی،تابع مانع کنترلی نمایی،تنظیمکنندهی خروجی بهینه،سیستم چهار-تانک،سیستم دو-تانک،یادگیری تقویتی
چکیده :
یکی از روشهای حل مسئله تنظیمکنندهی خروجی بهینه برای یک سیستم زمان-گسسته، استفاده از کنترلکننده مبتنی بر یادگیری تقویتی میباشد و این در حالی است که در حضور محدودیتهای ایمنی، این امکان وجود دارد که استفاده از آن کنترلکننده، سبب بروز رفتارهای پرخطر در کاربردهای دنیای واقعی گردد. از این رو، در این مقاله، ضمن تبیین الگوریتم off-policy مستقل از مدل، فیلتر مبتنی بر تابع مانع کنترلی نمایی به منظور تحقق محدودیتهای ایمنی، معرفی میگردد. این فیلتر، در قالب یک مسئله بهینهسازی مرتبه-دوم، با توسعه مفهوم تابع مانع کنترلی نمایی و ترکیب آن با رگرسیون فرآیند گوسی، این امکان را ایجاد میکند که محدودیتهای مدنظر برای ورودیهای کنترلی و حالتهای سیستم، تحقق یابد. نتایج حاصل از اعتبارسنجی رویکرد پیشنهادی در کنترل سیستمهای چهار-تانک و دو-تانک نشان میدهند که رویکرد مدنظر با طراحی ورودی کنترلی مناسب توانایی لازم برای دفع اغتشاش و ردیابی مسیر مرجع را دارد و تحقق محدودیتهای مدنظر را نیز تضمین مینماید.
لیست مقالات
لیست مقالات بایگانی شده
Study of the interaction between different parameters in the fabrication of paper-based microfluidic devices using the wax printing method
MOHAMMAD DERAKHSHANI - SEYED HOSSEIN TAYEBI - MEHRDAD LOTFI CHOOBBARI - AMIR JAHANSHAHI
Rank-Based Adaptive Brooding in a Mimetic Coral Reefs Search for Feature Selection
Seyed Amirhossein Farjadi - Mohammad Reza Akbarzadeh Totonchi
مدلسازی نویز فاز در ساختار کاهنده نویز نوسانساز مبتنی بر تداخلسنجی
سیدمحمدعلی صدرقاینی - علی بنائی
A Novel Model for Backcasting the Environmental Sustainability in Iran’s Electricity Supply Mix
Mohammad Saeid Atabaki - Mohammad Mohammadi
Analytical Model for Estimating the Range of Troposcatter Active Radar
Mahdi Shiri - Mohammadreza Edalatzadeh
LSTM and Markov-Based Mobility Prediction for Multi-access Edge Computing
Hadi Ghavaminejad - Nasser Yazdani - Golboo Rashidi
قرارگیری بهینه سطوح هوشمند قابل تنظیم مجدد برای مکان یابی فرستنده
مهدی گودرزی - فریدون بهنیا - امین آقاتبار رودباری
Tuning of SMC Parameters for 3-DOF Spatial Parallel Robot Based on Whale Optimization Algorithm
Saeed Firuz Bahr Afzal - Amir Hossein Hassanabadi
بررسی تأثیر اجرای سازوکارهای بهره وری انرژی بر ظرفیت سنجی اقتصادی سیستم تأمین برق تجدیدپذیر برای ایستگاه های پایه مخابرات موبایل
بهروز عظیمی امینی - وحید محتشمی - حسین ابوترابی زارچی
Improving the Reliability of Multicore Embedded Systems through an Evolutionary-based Task Scheduling Approach
Athena Abdi - Hamid R Zarandi
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 40.4.2