PENERAPAN PRUNING PADA ALGORITMA C5.0 UNTUK MENDIAGNOSIS PENYAKIT DIABETES MELITUS
Abstract
Diabetes melitus atau kencing manis adalah suatu gangguan kesehatan dengan kondisi dimana jumlah atau konsentrasi glukosa atau gula di dalam darah melebihi atau tidak sesuai dengan keadaan normal. Diabetes melitus merupakan salah satu penyakit yang tidak dapat disembuhkan tetapi dapat dikendalikan. Banyak penderita diabetes melitus yang menganggap remeh kadar gula darah karena kurangnya pengetahuan dan gaya hidup. Pendeteksian dini sebuah penyakit dapat dilakukan oleh sistem yang menggunakan algoritma C5.0. Dimana pada algoritma ini pohon klasifikasi yang terbentuk akan dirampingkan sehingga memudahkan interpretasinya. Dengan tahapan pruning pada algoritma C5.0 membuat tidak ada data yang tidak dapat diklasifikasi. Tahapan pruning menerima masukan berupa atribut yang menjadi node dan masing-masing nilainya yang menjadi cabang node. Untuk menentukan nilai tingkat galat pada setiap node menggunakan sebuah rumus yang didalamnya terdapat nilai z yang merupakan invers dari distribusi kumulatif normal baku dengan parameter α. Besar nilai α mempengaruhi besar nilai z. Dengan menggunakan jumlah data yang sama, uji coba pembentukan pohon klasifikasi dengan variasi nilai α = {0.1, 0.2, 0.3, 0.4, 0.5}. Dari hasil percobaan nilai α = 0.2 dipilih sebagai yang paling optimal karena memiliki nilai rata-rata persentase jumlah data salah klasifikasi yang paling kecil diantara empat variasi nilai α lainnya dengan 14.39%. Selain itu, dengan adanya tahapan pruning ini membuat tidak ada data yang tidak dapat diklasifikasikan.