0% Complete
صفحه اصلی
/
سی و سومین کنفرانس بین المللی مهندسی برق
Single-Channel Recursive Speech Separation with Unknown Speaker Count by Mask Estimation
نویسندگان :
Hadi Alizadeh
1
Rahil Mahdian Toroghi
2
Hassan Zareian
3
1- Iran Broadcasting University
2- Iran Broadcasting University
3- Iran Broadcasting University
کلمات کلیدی :
Instantaneous Speech separation،single microphone،unknown speaker count،recursive operation،Mask estimation
چکیده :
This paper presents a novel speech separation method capable of handling an unknown number of speakers using a single, compact model, eliminating the need for prior knowledge of speaker count. The proposed approach employs a unique objective function to train a speaker-independent, single-channel model, enabling effective separation across diverse conditions, even when training and testing datasets differ. Additionally, a robust technique for detecting the number of speakers in a mixture is introduced, ensuring high performance with minimal computational complexity. By employing a recursive separation strategy, the method addresses the limitations of traditional approaches reliant on predefined speaker counts, making it more adaptable to real-world scenarios. Evaluations on the WSJ0 dataset demonstrate the proposed model's superiority in SI-SNR and SDR metrics while achieving a significantly lower parameter count compared to existing methods.
لیست مقالات
لیست مقالات بایگانی شده
HIV Virus States Estimation by Extended Kalman Particle Filter
Meysam Hooshmand - Mahtab Sharifian - Hamid Sharifian - Javad Mahmoudi
Deep SqueezeNet Based Technique for Detection of High Impedance Arcing Faults in Electric Power Distribution Networks
Amin Mohammadi - Mohsen Jannati - Mohammadreza Shams
طراحی و ساخت یک سیستم مخابرات نور مرئی مبتنی بر دوربین
شادی خسروی - فروغ السادات طباطباء - شهاب الدین رحمانیان
Large Scale Indoor VLC Positioning Using Image Sensor with Limited Field of View
Arezoo Kabiri - Foroogh Sadat Tabataba
Intelligent Filter of $\mathcal{L}_{1}$ Adaptive Controller Using ANFIS System Optimized with Genetic Algorithm
Hossein Ahmadian - HeidarAli Talebi - Iman Sharifi
راهبرد بهینه خرده فروش در شبکه توزیع برق با در نظر گرفتن اثر پاسخ گویی بار
امیرحسین مدبری فر - حبیب رجبی مشهدی
Soft Decision Adaptive Deep Learning Detection for Enhanced Massive MIMO Performance
Farnaz Sedaghati - Mojtaba Amiri - Ali Olfat
Atrial Fibrillation (AF) Detection Using Deep Learning with GAN-based Data Augmentation
Amirhossein Akhoondkazemi - Arash Vashagh - Sayed Jalal Zahabi - Davood Shafie
طراحی مدولاتور الکتروجذبی پلاسمونیک مبتنی بر Vo2 باساختار اسلت برای بهبود عملکرد در طول موج 1550 نانومتر مخابراتی
حبیبه صمدی - حمید واحد - هادی صوفی
بررسی یک روش معکوس برای استخراج ثابت دی الکتریک محلی با استفاده از میکروسکوپ نوری روبشی میدان نزدیک
علی اقراری - محمد نشاط
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.8.0