0% Complete
صفحه اصلی
/
سی و سومین کنفرانس بین المللی مهندسی برق
Dual-Branch Cross-Parallel Transformer Model for Single-Channel Speech Enhancement
نویسندگان :
Mohammad Hakimkhah
1
Rahil Mahdian Toroghi
2
Hassan Zareian
3
1- Iran Broadcasting University
2- Iran Broadcasting University
3- Iran Broadcasting University
کلمات کلیدی :
Speech enhancement،Single microphone،Crossparallel Transformer،Dual branch
چکیده :
In this paper, a dual-branch parallel structure is proposed for single-channel speech enhancement, consisting of a Magnitude Mask Branch (MMB) and a Complex Mapping Branch (CMB) utilizing a Cross-Parallel Transformer (CPT) in the time-frequency domain. The CPT effectively captures longterm dependencies along time and frequency axes, extracting time-frequency-related features by integrating their information. The MMB estimates the spectral magnitude, while the CMB compensates for lost spectral details and implicitly extracts phase information. The approach is evaluated on the public VoiceBank+DEMAND dataset. The proposed Dual-Branch Cross- Parallel Transformer Neural Network (DB-CPTNN) achieves superior results compared to SOTA models. Specifically, the model attains PESQ, STOI, SSNR, CSIG, CBAK, and COVL scores of 3.37, 95.9%, 10.58, 4.71, 3.89, and 4.15, respectively, outperforming state-of-the-art (SOTA) benchmarks.
لیست مقالات
لیست مقالات بایگانی شده
نقش پوشش گیاهی عمودی به همراه اینترنت اشیا در کاهش آلودگی شهری
فرانک صید جانی - سبا کرمی میرعزیزی - هادی اشعریون
A High Dynamic Range Differential Rectifier for RF Energy Harvesting
Ataollah Mahsafar - Mohammad Yavari
طراحی یک کنترلکننده غیرخطی تطبیقی غیرمتمرکز برای تنظیم ولتاژ ریزشبکههای DC در حالت جزیرهای
سمیه بهرامی - فاطمه صفایی
Significant Methods to Improve Control of Quadrotors, Hexarotors and Octorotors
Peyman Amiri - Nima Sina - Mohammad Danesh
Impacts of Various Wind Turbine Generators on Transient Recovery Voltage in a Medium Voltage Power Network
Mostafa Heydari - Ali Asghar Razi-Kazemi
Angular Misalignment Effect on the Performance of Underwater MIMO OCC Systems
Ehsan Hamidnejad - Asghar Gholami
On spatiotemporal-aware deep neural networks for real-time video fire detection: empowering image-based models with temporal and spatial features of video
Mahdi Shamisavi - Sahar Eslami - Amir Jahanshahi - Morteza Rajabzadeh
Design and Implementation of CAN Bus Monitoring Module for Lithium Battery Management System
Shakila Kazempourdizaji - Amir Mohammad Moazami Goudarzi - Majid Shalchian
مدل سازی ریزالور دو درجه آزادی خطی با استفاده از تابع سیمپیچی اصلاح شده
فرید توتونچیان - رضا فریادرس
ارائه مبدل DC-DC غیر ایزوله هیبریدی بهره ولتاژ بالا با سوئیچ فعال سلفی
حسن زارعین - مجتبی حیدری - سیدمحمد دهقان دهنوی
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.5.3