0% Complete
صفحه اصلی
/
سی و سومین کنفرانس بین المللی مهندسی برق
Design and Implementation of a Flexible CNN Accelerator for Fast Real-Time Object Detection on FPGA
نویسندگان :
Emadodin Sakhaee
1
Mahdi Kalbasi
2
1- دانشگاه اصفهان
2- دانشگاه اصفهان
کلمات کلیدی :
Energy efficiency،real-time image processing،convolutional neural networks،hardware accelerator
چکیده :
In edge computing systems with limited resources, such as mobile devices and the Internet of Things, the use of Convolutional Neural Network (CNN) accelerators on FPGA has increasingly expanded. Ultrascale ZYNQ FPGAs offer scalability and flexibility for implementing deep learning-based object detection applications. However, this technology has low performance and limitations in achieving real-time processing. This paper addresses the optimization of the accelerator at the Register Transfer Level (RTL) to increase processing speed using low-power techniques in FPGA implementation. Therefore, a configurable accelerator design for a CNN-based object detection system at the RTL level on FPGA is proposed. We also present RTL optimization techniques that include techniques for disabling unnecessary clock cycles to reduce energy consumption and the use of the Posit number system format to increase calculation accuracy. The proposed system was tested with ResNet-20 and trained with the CIFAR-10 dataset. The weight data used for this test was provided by Tensil. Experimental results show that the proposed design process improves energy consumption, hardware utilization, and computational accuracy by 11%, up to 25%, and 4%, respectively.
لیست مقالات
لیست مقالات بایگانی شده
بررسی یک روش معکوس برای استخراج ثابت دی الکتریک محلی با استفاده از میکروسکوپ نوری روبشی میدان نزدیک
علی اقراری - محمد نشاط
Posture Stabilization of Tractor-Trailer Wheeled Mobile Robot Using Nonlinear MPC
Kevin Babakhanloo - Khalil Alipour - Bahram Tarvirdizadeh - Majid Sorouri - Mohammad Ghamari
Medial Residual Encoder Layers for Classification of Brain Tumors in Magnetic Resonance Images
Zahra Sobhaninia - Nader Karimi - Pejman Khadivi - Shadrokh Samavi
Batch(offline) Reinforcement Learning for recommender system
Mohammad Amir Rezaei Gazik - Mehdy Roayaei
بررسی و مدلسازی اثرات نویز فاز پالس ساعت بر عملکرد تقویت کننده صوتی کلاس D سمعک ها
محمد مهدی احمدی - محدثه امیریان چایجان
مدلسازی ریاضی و شبیه سازی پاندمی کووید 19در ایران
شبنم کوهستانی - نیلوفر مظفری - سید محمدرضا موسوی
یک روش جدید در تشخیص اختلال طیف اوتیسم از تصاویر چهره کودکان با استفاده از معماری چندمقیاسی MS-ViT و پردازش لبهای
خسرو رضائی - طیبه شمولی جوانمردی - امیر محمد حیدری
تشخیص و مکان یابی خطاها در آرایه های فتوولتائیک متصل به شبکه
سعید انصاری - حیدر صامت - تیمور قنبری
کنترل درایو موتور DC بدون جاروبک سه فاز با اینورتر چهار سوییچه به روش کنترل پیش بین مدل مبتنی بر تعداد حالات کنترلی محدود (FCS-MPC)
ابوالفضل حلوایی نیاسر - سجاد محمدی کوجانی
A Bi-Level Attack-Defense Model for the Forecasting False Data Injection Attacks on the Integrated Energy Systems
Maryam Azimi - Hamed Delkhosh - Mahdi Ghaedi
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 40.3.1