0% Complete
صفحه اصلی
/
سی و سومین کنفرانس بین المللی مهندسی برق
Dual-Branch Cross-Parallel Transformer Model for Single-Channel Speech Enhancement
نویسندگان :
Mohammad Hakimkhah
1
Rahil Mahdian Toroghi
2
Hassan Zareian
3
1- Iran Broadcasting University
2- Iran Broadcasting University
3- Iran Broadcasting University
کلمات کلیدی :
Speech enhancement،Single microphone،Crossparallel Transformer،Dual branch
چکیده :
In this paper, a dual-branch parallel structure is proposed for single-channel speech enhancement, consisting of a Magnitude Mask Branch (MMB) and a Complex Mapping Branch (CMB) utilizing a Cross-Parallel Transformer (CPT) in the time-frequency domain. The CPT effectively captures longterm dependencies along time and frequency axes, extracting time-frequency-related features by integrating their information. The MMB estimates the spectral magnitude, while the CMB compensates for lost spectral details and implicitly extracts phase information. The approach is evaluated on the public VoiceBank+DEMAND dataset. The proposed Dual-Branch Cross- Parallel Transformer Neural Network (DB-CPTNN) achieves superior results compared to SOTA models. Specifically, the model attains PESQ, STOI, SSNR, CSIG, CBAK, and COVL scores of 3.37, 95.9%, 10.58, 4.71, 3.89, and 4.15, respectively, outperforming state-of-the-art (SOTA) benchmarks.
لیست مقالات
لیست مقالات بایگانی شده
New dental implants with micro-movement capability - biomechanical evaluation and evolution
Zahra Nouri - Nima Norouzi
Sensitive RSNs to Schizophrenia; A graph parameter approach
Shirin Karimian - Farzaneh Keyvanfard - Abbas Nasiraei Moghaddam
Design Investigation of a Broadband Polarization Rotator Using SIW Technology with T-Shaped Slots
Amin Azimi - Mohammad.H Neshati
Diagnosis of Covid 19 disease, flu, allergies, colds
Mahyar Mohammady - Marzieh Kamali
Contrastive Learning Framework for fMRI Time-Series Classification in Left and Right Epilepsy Using Continues Wavelet Transform
Marzieh Soheili-nejad - Saeed Masoudnia - Hamid Soltanian-zadeh
حسگر ضریب شکست مبتنی بر فانو رزونانس در موجبرهای فلز- عایق- فلز، با رزوناتور صفحهای تزویج شده از جانب
تورج هاشمی - نسرین عبدالهی برازجان - عباس علی قنبری
بهینهسازی نرخ امن با استفاده از انتخاب آنتن فرستنده در سیستمهای دوکارهی راداری- ارتباطی با چند ورودی - چند خروجی
نیلوفر حسینی - هنگامه کشاورز
Multi wasserstien distance
Atefeh Ziaei Moghadam - Hamed Azarnoush - Seyyed Ali Seyyedsalehi
Global Finite-Time Nonlinear Observers for a Class of Nonlinear Systems Subjected to Mismatched Uncertainties
َAli Abooee - Saeed Amiri - Mohammad Hadi Rezaei
نقش پوشش گیاهی عمودی به همراه اینترنت اشیا در کاهش آلودگی شهری
فرانک صید جانی - سبا کرمی میرعزیزی - هادی اشعریون
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.8.0