Classification of Dropout Rates in West Sumatra Using the Random Forest Algorithm with Synthetic Minority Oversampling Technique

Penulis

  • Anita Fadila Universitas Negeri Padang
  • Syafriandi Syafriandi Universitas Negeri Padang
  • Yenni Kurniawati Universitas Negeri Padang
  • Admi Salma Universitas Negeri Padang

DOI:

https://doi.org/10.24036/ujsds/vol2-iss3/183

Kata Kunci:

Dropout Rates, Random Forest, Synthetic Minority Oversampling Technique

Abstrak

Angka putus sekolah adalah persentase atau banyaknya siswa yang tidak melanjutkan pendidikan hingga menyelesaikan suatu jenjang pendidikan tertentu, misalnya sekolah dasar, sekolah menengah pertama, atau sekolah menengah atas. Angka putus sekolah yang tinggi dapat mengindikasikan adanya permasalahan dalam sistem pendidikan. Pada tahun 2021, rata-rata angka putus sekolah di Sumbar lebih tinggi dibandingkan rata-rata nasional. Banyak faktor yang menyebabkan siswa putus sekolah. Metode statistik dapat digunakan untuk memprediksi faktor-faktor penyebab seseorang putus sekolah, salah satunya melalui metode klasifikasi. Klasifikasi dapat membantu mengidentifikasi dan memprediksi kelompok rentan putus sekolah. Algoritma yang digunakan adalah random forest. Sebelum dilakukan klasifikasi, dilakukan penyeimbangan data dengan menggunakan metode SMOTE. Sumber data diperoleh dari data Susenas tahun 2021. Algoritma random forest berhasil menciptakan model optimal untuk mengidentifikasi angka putus sekolah di Sumatera Barat pada tahun 2021 dengan menerapkan kombinasi parameter tuning mtry = 3 dan ntree = 500. Berdasarkan nilai Mean Decrease Gini (MDG) dalam menentukan variabel-variabel penting, ditemukan bahwa atribut utama penyebab putus sekolah adalah status ibu masih hidup atau sudah meninggal. Model dengan SMOTE tidak meningkatkan akurasi dan spesifisitas, namun mampu meningkatkan presisi, recall, dan skor F1. Oleh karena itu, pada kasus putus sekolah, model dengan SMOTE lebih baik dibandingkan model tanpa SMOTE.

Unduhan

Diterbitkan

2024-08-24

Cara Mengutip

Anita Fadila, Syafriandi Syafriandi, Yenni Kurniawati, & Admi Salma. (2024). Classification of Dropout Rates in West Sumatra Using the Random Forest Algorithm with Synthetic Minority Oversampling Technique. UNP Journal of Statistics and Data Science, 2(3), 279–286. https://doi.org/10.24036/ujsds/vol2-iss3/183

Artikel paling banyak dibaca berdasarkan penulis yang sama

1 2 3 4 5 6 > >>