Penanganan Ketidakseimbangan Multikelas pada Dataset Survei Kerangka Sampel Area menggunakan Metode SCUT
DOI:
https://doi.org/10.24036/ujsds/vol2-iss2/163Kata Kunci:
Ketidakseimbangan, Multikelas, SMOTE and Cluster-based Undersampling Technique (SCUT)Abstrak
Kerangka Sampel Area (KSA) merupakan survei yang digunakan oleh pemerintah Indonesia untuk mengukur produktivitas padi di Indonesia. KSA merupakan data penting karena data hasil produktivitas padi yang akurat dan berkualitas sangat dibutuhkan. Terdapat ketidakseimbangan ekstrim pada data KSA tersebut sehingga perlu dilakukan penanganan ketidakseimbangan tersebut. SMOTE and Cluster-based Undersampling Technique (SCUT) merupakan metode yang dapat digunakan untuk mengatasi ketidakseimbangan dataset. SCUT merupakan gabungan dari oversampling menggunakan SMOTE dan undersampling menggunakan CUT. Hasil dari SCUT diperoleh bahwa jumlah data pada setiap kelas menjadi seimbang. Kemudian dilakukan pengujian rataan dua sampel untuk melihat perbedaan rataan antara dataset asli dan dataset setelah penanganan. Hasil yang diperoleh adalah pada fase vegetatif awal, vegetatif akhir, dan panen memiliki rataan yang signifikan sama antara dataset asli dan dataset setelah penanganan, namun pada fase generatif memiliki rataan tidak signifikan sama. Oleh karena itu, secara garis besar data sintetik yang dibangkitkan dengan menggunakan metode SCUT memiliki karakteristik rataan yang sama.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2024 Wilia Sondriva, Yenni Kurniawati, Nonong Amalita, Admi Salma
Artikel ini berlisensi Creative Commons Attribution 4.0 International License.