Perbandingan Metode Decision Tree dan Naïve Bayes dalam Data Mining untuk Klasifikasi Data Penyakit Tuberculosis di Indonesia

Penulis

  • Putri Dewi Febrianti UNIVERSITAS HAMZANWADI
  • Alissa Chintyana UNIVERSITAS HAMZANWADI
  • Ristu Haiban Hirzi

DOI:

https://doi.org/10.57059/formasi.v5i2.133

Kata Kunci:

Data Mining, Decision Tree, Klasifikasi, Naïve Bayes, Tuberkulosis

Abstrak

Tuberkulosis (TB) tetap menjadi masalah kesehatan serius di Indonesia, dengan angka kasus dan kematian yang tinggi. Indonesia memiliki jumlah kasus TB tertinggi kedua di dunia setelah India, menyumbang sekitar 10% dari kasus global. Data dari Kementerian Kesehatan Indonesia menunjukkan bahwa jumlah kasus TB diperkirakan melebihi satu juta per tahun, dengan ratusan ribu kematian. Oleh karena itu, analisis data yang lebih baik diperlukan untuk mendukung strategi pengendalian dan pencegahan TB. Studi ini bertujuan untuk mengklasifikasikan penyebaran TB di berbagai kabupaten/kota di lima provinsi dengan kasus TB tertinggi di Indonesia menggunakan perbandingan metode Decision Tree dan Naïve Bayes dengan menggunakan data TB dari tahun 2021 hingga 2024. Dataset mencakup variabel seperti usia, kepadatan penduduk, dan layanan kesehatan. Tahapan penelitian meliputi pra-pemrosesan data, konversi data numerik ke data kategorikal, dan validasi menggunakan K-Fold Cross Validation. Kinerja model dievaluasi menggunakan Matriks Konfusi. Hasil penelitian menunjukkan bahwa metode Decision Tree memiliki tingkat akurasi yang lebih tinggi (76,63%) dibandingkan metode Naïve Bayes (63,27%), Keunggulan Decision Tree dalam mengidentifikasi usia sebagai prediktor utama menunjukkan kemampuannya dalam memodelkan pola data TB yang kompleks.

##submission.downloads##

Diterbitkan

2026-02-27