0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
Vision Transformer and Parallel Convolutional Neural Network for Speech Emotion Recognition
نویسندگان :
Saber Hashemi
1
Mohammad Asgari
2
1- دانشگاه صداوسیما
2- دانشگاه صدا و سیما
کلمات کلیدی :
speech emotion recognition،vision transformer،convolutional neural network،attention mechanism
چکیده :
Vision transformer (ViT) is a new approach for image processing tasks. The vision transformer splits the image into patches and converts it into a sequence of vectors. This sequence is suitable for the transformer structure. This paper uses the ViT method for speech emotion recognition. Unlike ViT, which splits the image into square patches, we use time frames as patches. Alongside using the frame-based ViT to benefit from its ability to learn global features, we are using a convolutional neural network. The convolutional neural network extracts local features and focuses on the two-dimensional structure of the input. Mel-Frequency Cepstral Coefficients extracted from audio files are used as input for the proposed neural network. Using this model in the RAVDESS dataset, we achieved an unweighted accuracy of 79.2%.
لیست مقالات
لیست مقالات بایگانی شده
Design and Modelling of a Modified Controller for D-STATCOM Considering Parametric Uncertainties and Unmodeled Dynamics
Majid Arabahmadi - Hossein Khaligh - Amirhossein Moghani - Ali Mosallanejad
طراحی و ساخت چرخاننده سهدرگاهی صفحه E در موجبر باند X
زهرا عابدان - محمد حسین حسینی
Improved Attention U-Net combined with Conditional Random Field for Ischemic Lesion Segmentation from Magnetic Resonance Images
Ali Rezaei - Asieh Khosravanian - Habibollah Danyali - Kamran Kazemi - Ardalan Aarabi
طراحی لایه Max-Pooling نوری مجتمع مبتنی بر Ge2Sb2Te5 برای شبکه های عصبی پیچشی نوری
سمانه امیری - دکتر مهدی میری
طراحی ایستگاه شارژ سریع با در نظر گرفتن عدم قطعیت منابع تجدیدپذیر و مدیریت ریسک
محمد بزرگپور رودباری - میثم جعفری نوکندی - محمد هاشمی مصیر
Integrated expansion planning of the distribution network and distributed generations considering energy storage systems, electric vehicles charging stations, and daily load modeling
Ahmad Mohammadi Pour - Mehrdad Setayesh Nazar
Smartly, reduce the latency of high-priority vehicles using IoT technology
Mahdi Talebi - Masoud Sabaei
طراحی و پیادهسازی آرایه انعکاسی چند پرتویی پهن باند با قطبش های خطی و دایروی همزمان با تنظیم فاز ثابت مرجع در سطح آرایه
مجید کریمی پور
طراحی یک چارچوب غیر متمرکز تبادل انرژی برای مصرفکنندههای فعال در بازارهای همتا به همتا (P2P)
امیر زارع بخت پیما چمثقالی - مهدی مهدینژاد - مهرداد عابدی
Wind-Robust Sea-Ice Discrimination from Sentinel-1 Texture Features
Parsa Shamsaddini - Ahmad Keshavarz - Stefano Zecchetto
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 43.6.0