Perbandingan Metode Prediksi Laju Galat dalam Pemodelan Klasifikasi Algoritma C4.5 untuk Data Tidak Seimbang

Penulis

  • Yunistika Ilanda Universitas Negeri Padang
  • Dodi Vionanda
  • Yenni Kurniawati
  • Dina Fitria

DOI:

https://doi.org/10.24036/ujsds/vol1-iss4/89

Kata Kunci:

Algoritma C4.5, Metode Prediksi Laju Galat, Data Tidak Seimbang

Abstrak

Pemodelan klasifikasi dapat dibentuk menggunakan algoritma C4.5. Model yang dibentuk oleh algoritma C4.5 perlu dilihat akurasi prediksinya menggunakan metode prediksi laju galat. Metode prediksi laju galat yang membedakan data training dan data testing memiliki kinerja lebih baik. Tiga metode prediksi laju galat dengan pembagian data training dan testing yang sering digunakan yaitu Hold Out (HO), Leave One Out Cross Validation (LOOCV), dan K-Fold Cross Validation (K-Fold CV). Penelitian ini berfokus pada perbandingan metode prediksi laju galat HO,LOOCV, dan K-Fold CV pada algoritma C4.5 untuk kasus data tidak seimbang, sebab kasus ini sering dijumpai dalam kasus nyata klasifikasi. Data tidak seimbang menyebabkan peningkatan kesalahan klasifikasi algoritma C4.5 sebab hasil prediksi tidak merepresentasikan seluruh data dan memperburuk kinerja metode prediksi laju galat. Sementara itu, kasus data dengan korelasi berbeda dilakukan untuk mengetahui apakah beda korelasi mempengaruhi kinerja metode prediksi laju galat. Tujuan penelitian untuk mengetahui metode prediksi laju galat yang paling cocok diterapkan pada algoritma C4.5 kasus data tidak seimbang dan pengaruh beda korelasi. Hasil penelitian menunjukkan metode K-Fold CV adalah metode prediksi yang paling cocok diterapkan pada algoritma C4.5 kasus data tidakseimbang dibanding metode HO dan LOOCV. Selain itu, Korelasi tinggi dapat memperburuk kinerja metode prediksi laju galat.

Unduhan

Diterbitkan

2023-08-28

Cara Mengutip

Yunistika Ilanda, Dodi Vionanda, Yenni Kurniawati, & Dina Fitria. (2023). Perbandingan Metode Prediksi Laju Galat dalam Pemodelan Klasifikasi Algoritma C4.5 untuk Data Tidak Seimbang. UNP Journal of Statistics and Data Science, 1(4), 240–247. https://doi.org/10.24036/ujsds/vol1-iss4/89

Artikel paling banyak dibaca berdasarkan penulis yang sama

1 2 3 4 5 6 7 > >>