Classification of Dropout Rates in West Sumatra Using the Random Forest Algorithm with Synthetic Minority Oversampling Technique
DOI:
https://doi.org/10.24036/ujsds/vol2-iss3/183Kata Kunci:
Dropout Rates, Random Forest, Synthetic Minority Oversampling TechniqueAbstrak
Angka putus sekolah adalah persentase atau banyaknya siswa yang tidak melanjutkan pendidikan hingga menyelesaikan suatu jenjang pendidikan tertentu, misalnya sekolah dasar, sekolah menengah pertama, atau sekolah menengah atas. Angka putus sekolah yang tinggi dapat mengindikasikan adanya permasalahan dalam sistem pendidikan. Pada tahun 2021, rata-rata angka putus sekolah di Sumbar lebih tinggi dibandingkan rata-rata nasional. Banyak faktor yang menyebabkan siswa putus sekolah. Metode statistik dapat digunakan untuk memprediksi faktor-faktor penyebab seseorang putus sekolah, salah satunya melalui metode klasifikasi. Klasifikasi dapat membantu mengidentifikasi dan memprediksi kelompok rentan putus sekolah. Algoritma yang digunakan adalah random forest. Sebelum dilakukan klasifikasi, dilakukan penyeimbangan data dengan menggunakan metode SMOTE. Sumber data diperoleh dari data Susenas tahun 2021. Algoritma random forest berhasil menciptakan model optimal untuk mengidentifikasi angka putus sekolah di Sumatera Barat pada tahun 2021 dengan menerapkan kombinasi parameter tuning mtry = 3 dan ntree = 500. Berdasarkan nilai Mean Decrease Gini (MDG) dalam menentukan variabel-variabel penting, ditemukan bahwa atribut utama penyebab putus sekolah adalah status ibu masih hidup atau sudah meninggal. Model dengan SMOTE tidak meningkatkan akurasi dan spesifisitas, namun mampu meningkatkan presisi, recall, dan skor F1. Oleh karena itu, pada kasus putus sekolah, model dengan SMOTE lebih baik dibandingkan model tanpa SMOTE.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2024 Anita Fadila, Syafriandi Syafriandi, Yenni Kurniawati, Admi Salma
Artikel ini berlisensi Creative Commons Attribution 4.0 International License.