Perbandingan Kinerja Model Klasifikasi Decission Tree , Bayesian Classifier, Instance Base, Linear Function Base, Rule Base pada 4 Dataset Berbeda
Abstract
Ada banyak metode klasifikasi yang telah dikembangkan namun kinerjanya selalu berbeda dari satu masalah ke masalah lain. Perlu dilakukan suatu upaya untuk memilih model klasifikasi yang relatif optimal, salah satunya dengan membandingkan kinerja beberapa algoritma dari beberapa kelas model berbeda menggunakan beberapa dataset dengan karakteristik yang berbeda pula sehingga dapat memberikan gambaran tentang kelas model mana yang relatif optimal untuk dipilih sebagai tahap awal dalam memilih algoritma yang akan diterapkan. Pada makalah ini dibandingkan kinerja metode klasifikasi dari model Decission Tree, Bayesian Classifier, Instance Base, Linear Function Base dan Rule Base menggunakan 4 dataset yang berbeda karakteristiknya. Dari hasil pengujian diperoleh kesimpulan bahwa model Instance Base dan Decission Tree lebih robust dibanding kelas model lainnya bila diberi dataset yang mengandung noise dan missing value. Accuracy model Bayesian lebih stabil dibanding kelas model lainnya apabila diberi dataset dengan jumlah atribut yang lebih banyak. Semua kelas model mempunyai scalability yang baik dan mampu meningkatkan accuracy bila diberi jumlah record yang lebih besar. Kelas model Linear Function dan Decission Tree membutuhkan waktu training yang relatif lebih lama dibanding model lainnya, namun membutuhkan waktu testing yang relatif lebih cepat dibanding model lainnya. Secara umum kelas model Decission Tree lebih unggul dibanding kelas model lainnyaReferences
Fatmawati. (2016). Perbandingan Algoritma Klasifikasi Data Mining Model C4 . 5 Dan Naive Bayes Untuk Prediksi Penyakit Diabetes. Jurnal Techno Nusa Mandiri, XIII(1), 50–59.
Fiska, R. R. (2017). Penerapan Teknik Data Mining dengan Metode Support Vector Machine (SVM) untuk Memprediksi Siswa yang Berpeluang Drop Out (Studi Kasus di SMKN 1 Sutera). SATIN - Sains Dan Teknologi Informasi, 3(1), 15. https://doi.org/10.33372/stn.v3i1.200
Fitri, S. (2014). Perbandingan Kinerja Algoritma Klasifikasi Naïve Bayesian , Lazy-Ibk , Zero-R , Dan Decision Tree- J48. Dasi, 15(1), 33–37. Retrieved from https://ojs.amikom.ac.id/index.php/dasi/article/view/180
Ghorbani, R., & Ghousi, R. (2019). Predictive data mining approaches in medical diagnosis: A review of some diseases prediction. International Journal of Data and Network Science, 3, 47–70. https://doi.org/10.5267/j.ijdns.2019.1.003
Gorunescu, F. (2011). Data Mining:Concepts,Models and Techniques (Vol. 12). Berlin, Heidelberg: Springer Berlin Heidelberg. https://doi.org/10.1007/978-3-642-19721-5
Han, J., Kamber, M., & Pei, J. (2011). Data Mining:Concepts and Techniques (3rd ed.). Elsevier. https://doi.org/10.1016/B978-0-12-381479-1.00001-0
Hastuti, K. (2012). ANALISIS KOMPARASI ALGORITMA KLASIFIKASI DATA MINING UNTUK PREDIKSI MAHASISWA NON AKTIF. In Seminar Nasional Teknologi Informasi & Komunikasi Terapan 2012 (Vol. 14, pp. 241–249).
Mahmud, S. S., & Ilyas. (2017). Penerapan Algoritma Nearest Neighbor Retrieval Untuk Mendiagnosa Penyakit Hepatitis. Sains Dan Teknologi Informasi (SATIN), 3(1), 24. https://doi.org/10.33372/stn.v3i1.202
Marcos, H., & Utomo, H. S. (2015). Perbandingan kinerja algoritme c4.5 dan naïve bayes mengklasifikasi penyakit diabetes. Jurnal Informatika, 15(2), 141–148. https://doi.org/http://dx.doi.org/10.30873/ji.v15i2
Menarianti, I. (2015). Klasifikasi data mining dalam menentukan pemberian kredit bagi nasabah koperasi. Jurnal Ilmiah Teknosains, 1(1), 36–45. Retrieved from http://journal.upgris.ac.id/index.php/JITEK/article/view/836
Stéphane, T. (2011). Data Mining and Statistics for Decision Making (1st ed.). West Sussex: John Wiley & Sons Ltd.,Publication. https://doi.org/10.4018/978-1-5225-2031-3.ch002
Witten, I. H., Frank, E., & Hall, M. a. (2011). Data Mining:Practical Machine Learning Tools and Techniques (2nd ed.). San Francisco: Morgan Kaufmann Publishers.
Yusa, M., Utami, E., & Luthfi, E. T. (2016). Analisis Komparatif Evaluasi Performa Algoritma Klasifikasi pada Readmisi Pasien Diabetes. Jurnal Buana Informatika, 7(4), 293–302. https://doi.org/10.24002/jbi.v7i4.770
Zhang, Y., Xin, Y., Li, Q., Ma, J., Li, S., Lv, X., & Lv, W. (2017). Empirical study of seven data mining algorithms on different characteristics of datasets for biomedical classification applications. BioMedical Engineering OnLine, 16(1), 125. https://doi.org/10.1186/s12938-017-0416-x