0% Complete
صفحه اصلی
/
سی و یکمین کنفرانس بین المللی مهندسی برق
تشخیص انتها به انتها حملات جعل بازپخش صدا به کمک شبکه CNN-ViT جهت بهبود تعمیم پذیری
نویسندگان :
حسین حجازی
1
محمد عسگری
2
1- دانشکده صدا و سیما
2- دانشکده صدا و سیما
کلمات کلیدی :
تایید خودکار گوینده،ترنسفرمر بینایی،حملات بازپخش،شبکه عصبی کانولوشنی
چکیده :
با وجود پیشرفت سیستم های تایید خودکار گوینده (ASV)، این سیستم ها در مواجهه با حملات جعل بازپخش که نیازی به مهارت خاص یا سخت افزار تخصصی جهت اعمال به سیستم های ASV ندارند، آسیب پذیر هستند. در این مقاله سعی داریم با استفاده از ساختار شبکه ی عصبی کانولوشنی (CNN) و به دنبال آن ترنسفرمر بینایی (ViT)، یک رویکرد جدید یادگیری عمیق برای تشخیص حملات بازپخش صدا ارائه دهیم. با استفاده از این سیستم واحد، نتایج نرخ خطای برابر (EER) نشان از بهبود 23/84 درصدی در دادگان توسعه، 30/02 درصدی در دادگان ارزیابی و 35/5 درصدی در تعمیم پذیری نسبت به روش های پایه موجود در چالش ASVSpoof2017 دارد.
لیست مقالات
لیست مقالات بایگانی شده
Smart EV Charging in Residential Power Grids Considering Users’ Preferences
Mahya Shahshahani - Ali Moradi Amani - Mahdi Jalili
Speech Emotion Recognition Using Transfer Learning and Self-Supervised Speech Representation Learning
Marziye Azad - Babak Nasersharif
ارائه چارچوب مدیریت بهینه انرژی و انعطافپذیری برای تجمیعکننده منابع انرژی پراکنده
نیلوفر پورقادری - محمود فتوحی فیروز آباد - معین معینی اقطاعی - میلاد کبیری فر
Study of Performance Characteristics of a Line-Start Synchronous Reluctance Motor Over its Synchronization Region
Ali Jamali-Fard - Mojtaba Mirsalim
Defense Against Spectrum Sensing Data Falsification Attack in Cognitive Radio Networks Using Machine Learning
Nazanin Parhizgar - Ali Jamshidi - Peyman Setoodeh
ارزیابی کیفیت و موفقیت های پیوند کلیه
علی رفیعی پور - بهزاد خلجی امامزاده عباسی - زینب زالی - مسعودرضا هاشمی
تخمین کانال V2X با استفاده از CDP وفقی
الهام نادری مقدم - محمدعلی سبقتی - حسن زارعیان
A Coronavirus Herd Immunity Optimizer For Intrusion Detection System
Amir Soltany Mahboob - Hadi Shahriar Shahhoseini - Mohammad Reza Ostadi Moghaddam - Shima Yousefi
Binomial Distribution based K-means for Graph Partitioning Approach in Partially Reconfigurable Computing system
Zahra Asgari - Maryam Sadat Mastoori
طراحی لایه Max-Pooling نوری مجتمع مبتنی بر Ge2Sb2Te5 برای شبکه های عصبی پیچشی نوری
سمانه امیری - دکتر مهدی میری
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.8.0