0% Complete
صفحه اصلی
/
سی امین کنفرانس بین المللی مهندسی برق
تجزیه وابستگی با استفاده از Q-Learning محافظه کار
نویسندگان :
امیر زارعی
1
علیرضا خیاطیان
2
پیمان ستوده
3
1- دانشگاه شیراز،دانشکده مهندسی برق و کامپیوتر
2- دانشگاه شیراز،دانشکده مهندسی برق و کامپیوتر
3- دانشگاه شیراز،دانشکده مهندسی برق و کامپیوتر
کلمات کلیدی :
الگوریتم انتقال محور،تجزیه وابستگی،یادگیری تقویتی،Q-Learning
چکیده :
تجزیه وابستگی یکی از شاخه های اصلی پردازش زبان طبیعی است که هدف آن ارائه تحلیلی نحوی از جملات است. یکی از روش های اصلی تجزیه وابستگی الگوریتم های انتقال محور میباشند که از قابلیت بالایی به منظور مدل شدن به صورت یک فرآیند تصمیم گیری مارکوف نیز برخوردار هستند. این ویژگی امکان بهبود حل مسئله تجزیه وابستگی را با استفاده از یادگیری تقویتی افزایش میدهد اما پیچیدگی های طراحی محیط و سیگنال پاداش در یادگیری تقویتی ارجحیت استفاده از روش های برون خط را بیش از پیش در حل مسئله تجزیه وابستگی نمایان میکند. در نمونه برون خط یادگیری تقویتی نیازی به طراحی محیط نمیباشد و توابع عامل یادگیر صرفا با استفاده از داده های از قبل تهیه شده آموزش خواهند دید. این ویژگی منحصر به فرد امکان استفاده از یادگیری تقویتی در فعالیت هایی که سعی و خطا و تعامل با محیط در آنها مخاطره آمیز و هزینه بر هستند را فراهم میکند. در این مقاله نشان داده میشود که استفاده از یادگیری تقویتی برون خط در تجزیه وابستگی نتایجی مشابه و حتی بهتر از روش های بر خط در پی خواهد داشت.
لیست مقالات
لیست مقالات بایگانی شده
Optimal Receiver Placement in Distributed Passive Sensor Networks: A DRL Approach
Hossein Nikaein - Mohammad Reza Jabbari - Maedeh Kadkhodaie Elyaderani - Saeed Gazor
A New 10 Watt 1.6 GHz Linear Power Amplifier with More than 11 dB Gain
Marzieh Chegini - HojjatAllah Nemati - Mahmoud Kamarei
Tuning of SMC Parameters for 3-DOF Spatial Parallel Robot Based on Whale Optimization Algorithm
Saeed Firuz Bahr Afzal - Amir Hossein Hassanabadi
Automatic Classification of Parkinson’s Disease Using Best Parameters of Forward and Backward Walking
Atiye Riasi - Mehdi Delrobaei
Mountain Gazelle Optimized PID Controller for a MIMO System with External Disturbance
Siavash Shirali - Hamoun Maleki - Hadi Delavari
Backstepping-based Adaptive Constrained Control of Passive Torque Simulator Using Function Approximation Technique
Seyyed Amirhossein Saadat - Mohammad Mehdi Fateh - Javad Keighobadi
طراحی روش مبتنی بر آنالیز پوش داده برای ارزیابی عملکرد ایستگاه های فوق توزیع و تعیین سطح مطلوب قابلیت اطمینان سیستم توزیع انرژی الکتریکی
محمد رستگار - زهرا یزدانپناه - محمد جوشکی
Study of Performance Characteristics of a Line-Start Synchronous Reluctance Motor Over its Synchronization Region
Ali Jamali-Fard - Mojtaba Mirsalim
Unscented Kalman Filter adaptive noise covariance selection for satellite formation flying with Q_learning
Mohammad Hossein Nemati - MohammadRasoul Kankashvar - Hossein Bolandi
Vehicle stability control and trajectory tracking utilizing a type-2 fuzzy controller
Mohammad Mahdavi Mazdeh - Mehdi Pourgholi - Vahid Fakhari
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.5.3