Perbandingan Metode Prediksi Laju Galat dalam Pemodelan Klasifikasi Algoritma C4.5 untuk Data Tidak Seimbang
DOI:
https://doi.org/10.24036/ujsds/vol1-iss4/89Kata Kunci:
Algoritma C4.5, Metode Prediksi Laju Galat, Data Tidak SeimbangAbstrak
Pemodelan klasifikasi dapat dibentuk menggunakan algoritma C4.5. Model yang dibentuk oleh algoritma C4.5 perlu dilihat akurasi prediksinya menggunakan metode prediksi laju galat. Metode prediksi laju galat yang membedakan data training dan data testing memiliki kinerja lebih baik. Tiga metode prediksi laju galat dengan pembagian data training dan testing yang sering digunakan yaitu Hold Out (HO), Leave One Out Cross Validation (LOOCV), dan K-Fold Cross Validation (K-Fold CV). Penelitian ini berfokus pada perbandingan metode prediksi laju galat HO,LOOCV, dan K-Fold CV pada algoritma C4.5 untuk kasus data tidak seimbang, sebab kasus ini sering dijumpai dalam kasus nyata klasifikasi. Data tidak seimbang menyebabkan peningkatan kesalahan klasifikasi algoritma C4.5 sebab hasil prediksi tidak merepresentasikan seluruh data dan memperburuk kinerja metode prediksi laju galat. Sementara itu, kasus data dengan korelasi berbeda dilakukan untuk mengetahui apakah beda korelasi mempengaruhi kinerja metode prediksi laju galat. Tujuan penelitian untuk mengetahui metode prediksi laju galat yang paling cocok diterapkan pada algoritma C4.5 kasus data tidak seimbang dan pengaruh beda korelasi. Hasil penelitian menunjukkan metode K-Fold CV adalah metode prediksi yang paling cocok diterapkan pada algoritma C4.5 kasus data tidakseimbang dibanding metode HO dan LOOCV. Selain itu, Korelasi tinggi dapat memperburuk kinerja metode prediksi laju galat.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2023 Yunistika Ilanda, Dodi Vionanda, Yenni Kurniawati, Dina Fitria
Artikel ini berlisensi Creative Commons Attribution 4.0 International License.