Penanganan Ketidakseimbangan Multikelas pada Dataset Survei Kerangka Sampel Area menggunakan Metode SCUT

Penulis

  • Wilia Sondriva Universitas Negeri Padang
  • Yenni Kurniawati Universitas Negeri Padang
  • Nonong Amalita
  • Admi Salma

DOI:

https://doi.org/10.24036/ujsds/vol2-iss2/163

Kata Kunci:

Ketidakseimbangan, Multikelas, SMOTE and Cluster-based Undersampling Technique (SCUT)

Abstrak

Kerangka Sampel Area (KSA) merupakan survei yang digunakan oleh pemerintah Indonesia untuk mengukur produktivitas padi di Indonesia. KSA merupakan data penting karena data hasil produktivitas padi yang akurat dan berkualitas sangat dibutuhkan. Terdapat ketidakseimbangan ekstrim pada data KSA tersebut sehingga perlu dilakukan penanganan ketidakseimbangan tersebut. SMOTE and Cluster-based Undersampling Technique (SCUT) merupakan metode yang dapat digunakan untuk mengatasi ketidakseimbangan dataset. SCUT merupakan gabungan dari oversampling menggunakan SMOTE dan undersampling menggunakan CUT. Hasil dari SCUT diperoleh bahwa jumlah data pada setiap kelas menjadi seimbang. Kemudian dilakukan pengujian rataan dua sampel untuk melihat perbedaan rataan antara dataset asli dan dataset setelah penanganan. Hasil yang diperoleh adalah pada fase vegetatif awal, vegetatif akhir, dan panen memiliki rataan yang signifikan sama antara dataset asli dan dataset setelah penanganan, namun pada fase generatif memiliki rataan tidak signifikan sama. Oleh karena itu, secara garis besar data sintetik yang dibangkitkan dengan menggunakan metode SCUT memiliki karakteristik rataan yang sama.

Unduhan

Diterbitkan

2024-05-31

Cara Mengutip

Sondriva, W., Kurniawati, Y., Amalita, N., & Salma, A. (2024). Penanganan Ketidakseimbangan Multikelas pada Dataset Survei Kerangka Sampel Area menggunakan Metode SCUT. UNP Journal of Statistics and Data Science, 2(2), 159–164. https://doi.org/10.24036/ujsds/vol2-iss2/163

Artikel paling banyak dibaca berdasarkan penulis yang sama

1 2 > >>