0% Complete
صفحه اصلی
/
سی و دومین کنفرانس بین المللی مهندسی برق
A novel clustering-based over-sampling technique for imbalanced data sets
نویسندگان :
Behzad Mirzaei
1
Hossein Nezamabadi-pour
2
Javad Mahmoodi
3
1- دانشگاه شهید باهنر کرمان
2- دانشگاه شهید باهنر کرمان
3- دانشگاه شهید باهنر کرمان
کلمات کلیدی :
Imbalanced data،Clustering،K-means algorithm،Over-sampling،Preprocessing methods
چکیده :
One of the most challenging problems in machine learning is the classification of imbalanced data. This problem arises when the samples of data are distributed unevenly among the classes, such that compared to one class (the majority or negative class), the other class (the minority or positive class) has far fewer samples. The classical classifiers are inappropriate to classify data sets of this nature. To address these classifiers' shortcoming in class imbalance situations, we present a novel clustering-based over-sampling technique in this paper. First, the k-means clustering algorithm is used to cluster the minority class samples. Then, sparse clusters including fewer samples are chosen. Finally, we use the nearest neighbor of each cluster center to create synthetic samples for the minority class. Also, to select clusters based on probabilities, we apply the roulette wheel selection operator during over-sampling. The C4.5 decision tree classifier is utilized in our experiments, and the F-measure criterion is considered to evaluate methods. According to the results, our method outperforms six other methods over fifteen imbalanced data sets.
لیست مقالات
لیست مقالات بایگانی شده
Optimizing Dual IMU Sensor Placement for Gait Phase Detection with LSTM Models
Mahya Abedi - Zolfa Anvari - Hamed Ghafarirad - Mohammad Zareinejad
Swin Wavelet Super Resolution
Zahra Moammeri - Ahmad Mahmoudi-Aznaveh
GAN-Driven Image Generation for Metamaterial Absorbers Using Mean and Variance Encoding
Atefe Shahsavaripour - Mohammad Hossein Badiei - Leila Yousefi - Ahmad Kalhor
Entanglement Witness Derived By Using Kolmogorov-Arnold Networks
Fatemeh Lajevardi - Azam Mani - Ali Fahim
ارائه یک روش دو مرحلهای مبتنی بر حسگری فشرده برای تخمین زاویه ورود در آرایه
مهدی محمدی پرستو - محمود مدرس هاشمی
Effective Service Restoration in Electrical Distribution Networks Using a Bi-Stage Algorithm
Qasem Asadi - Amir Amini - Hamid Falaghi - Maryam Ramezani
An Investigation on Transfer Learning for Classification of COVID-19 Chest X-Ray Images with Pre-trained Convolutional-based Architecture
Mobina Abdoli Nemati - ََAmirreza Baba Ahmadi
بهبود عملکرد یک ( LOC ) Lab – On –Chipپیشرفته مبتنی بر فناوری MEMSبه کمک تقویت میدان الکتریکی ساختار
شیوا عظیمی نام - فهیمه مروی - کیان جعفری
کنترل سطح آب درام بویلر های نیروگاهی با استفاده از الگوریتم کنترل تطبیقی جدید با در نظر گرفتن کارایی و افزایش عمر شیر کنترلی (مطالعه موردی کنترل سطح آب درام IP نیروگاه سیکل ترکیبی قم)
کیوان زاهدی - محمدحسین هاشمی - محسن منتظری
Comparison of the MRT and ZF Precoding in Massive MIMO Systems from Energy Efficiency Viewpoint
Mahdi Nangir - Abdolrasoul Sakhaei Gharagezlou - Nima Imani
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 40.4.2