Perbandingan Penggunaan Jarak Manhattan, Jarak Euclid, dan Jarak Minkowski dalam Klasifikasi Menggunakan Metode KNN pada Data Iris

Authors

  • Adi Setiawan Universitas Kristen Satya Wacana

DOI:

https://doi.org/10.24246/juses.v5i1p28-37

Keywords:

data Iris, jarak Euclid, jarak Manhattan, jarak Minkowski, metode klasifikasi KNN

Abstract

Dalam klasifikasi, ukuran kebaikan suatu metode ditentukan oleh akurasi dan skor F1. Penelitian ini bertujuan untuk menentukan rata-rata akurasi dan skor F1 pada klasifikasi menggunakan metode KNN pada data Iris dengan bantuan program Python. Rata-rata akurasi maupun skor F1 ditentukan dengan membuat variasi parameter yang digunakan yaitu random state dari 1 sampai dengan 10000, k yang digunakan dalam metode KNN dari 1 sampai dengan 31 (tergantung prosentase data uji yang digunakan), q (definisi jarak yang digunakan yaitu jarak Manhattan, jarak Euclid, dan jarak Minkowski) serta persentase data uji yang digunakan. Dalam penelitian ini, digunakan persentase data uji 10%, 20 %, 30 %, dan 40 %. Jika digunakan k = 5 dalam metode KNN, variasi random state 1 sampai dengan 10000 dan digunakan data uji 20 % maka diperoleh akurasi rata-rata 96,6667 %. Demikian juga dapat diperoleh histogram dari akurasi tersebut. Histogram tersebut cenderung menceng ke kiri. Dalam penelitian ini, juga diperoleh hasil bahwa dengan melakukan variasi k dalam metode KNN juga dapat diperoleh akurasi maupun skor F1 yaitu bahwa makin besar data uji yang digunakan maka makin kecil nilai k untuk mencapai akurasi ataupun skor F1 maksimum. Lebih lanjut, dalam perubahan nilai p pada jarak Minkowski, apabila p membesar maka nilai maksimum rata-rata akurasi akan cenderung membesar namun nilai k cenderung mengecil.

Downloads

Download data is not yet available.

References

Ali, A., Alrubei, M., Hassan, L. F. M., Al-Ja’afari, M., & Abdulwahed, S. (2020). Diabetes Classification based on KNN. IIUM Engineering Journal, 21(1), 175–181.

AlZoman, R. M., & Alenazi, M. J. F. (2021). A Comparative Study of Traffic Classification Techniques for Smart City Networks. Sensors, 21(14).

Bah, I., & Yu, X. (2021). KNN Algorithm Used for Heart Attack Detection. FES Journal of Engineering Sciences, 7–19.

Baharuddin, M. M., Azis, H., & Hasanuddin, T. (2019). Analisis Performa Metode K-Nearest Neighbor untuk Identifikasi Jenis Kaca. ILKOM Jurnal Ilmiah, 11(3), 269–274.

Dewi, A. M. S. I., & Dwidasmara, I. B. G. (2020). Implementation of the K-Nearest Neighbor (KNN) Algorithm for Classification of Obesity Levels. JELIKU (Jurnal Elektronik Ilmu Komputer Udayana), 9(2), 277–284.

Djakaria, I., Guritno, S., & Kartiko, S. H. (2010). Visualisasi Data Iris menggunakan Analisis Komponen Utama dan Analisis Komponen Utama Kernel. Jurnal ILMU DASAR, 11(1), 31–38.

Febrianti, F., Hafiyusholeh, M., & Asyhar, A. H. (2016). Perbandingan Pengklusteran Data Iris menggunakan Metode K-Means Dan Fuzzy C-Means. Jurnal Matematika “MANTIK,” 2(1), 7–13.

Handayani, P. K. (2020). Penerapan Principal Component Analysis untuk Peningkatan Kinerja Algoritma Decision Tree pada Iris Dataset. Indonesian Journal of Technology, Informatics and Science (IJTIS), 1(2), 55–58.

Haviluddin, Iqbal, M., Putra, G. M., Puspitasari, N., Setyadi, H. J., Dwiyanto, F. A., Wibawa, A. P., & Alfred, R. (2020). A Performance Comparison of Euclidean, Manhattan and Minkowski Distances in K-Means Clustering. 2020 6th International Conference on Science in Information Technology (ICSITech), 184–188.

Hermanto, D. M. C. (2017). Analisis Algoritma Clustering dalam Kasus Penentuan Jenis Bunga Iris. Jurnal Media Aplikom, 9(2), 72–84.

Hidayati, N., & Hermawan, A. (2021). K-Nearest Neighbor (K-NN) Algorithm with Euclidean and Manhattan in Classification of Student Graduation. Journal of Engineering and Applied Technology, 2(2), 86–91.

Khamdani, M. K., Hidayat, N., & Dewi, R. K. (2021). Implementasi Metode K-Nearest Neighbor untuk Mendiagnosis Penyakit Tanaman Bawang Merah. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 5(1), 11–16.

Mara, A. A. P. T., Sediyono, E., & Purnomo, H. (2021). Penerapan Algoritma K-Nearest Neighbors pada Analisis Sentimen Metode Pembelajaran Dalam Jaringan (DARING) di Universitas Kristen Wira Wacana Sumba. JOINTER - Journal of Informatics Engineering, 1(2), 24–31.

Nugroho, W. (2020). Optimasi Metode K-Nearest Neighbours dengan Backward Elimination Menggunakan Dataset Software Effort Estimation. Bianglala Informatika, 8(2), 129–133.

Pamuji, A. (2021). Performance of the K-Nearest Neighbors Method on Analysis of Social Media Sentiment. JUISI, 7(1), 32–37.

Pamungkas, F. S., & Kharisudin, I. (2021). Analisis Sentimen dengan SVM, NAIVE BAYES dan KNN untuk Studi Tanggapan Masyarakat Indonesia Terhadap Pandemi Covid-19 pada Media Sosial Twitter. PRISMA, Prosiding Seminar Nasional Matematika, 4, 628–634.

Prakisya, N. P. T., Liantoni, F., Hatta, P., Aristyagama, Y. H., & Setiawan, A. (2021). Utilization of K-Nearest Neighbor Algorithm for Classification of White Blood Cells in AML M4, M5, and M7. Open Engineering, 11, 662–668.

Pratama, N. S. H., Afandi, D. T., Mulyawan, Iin, & Nuris, N. D. (2021). Menurunkan Presentase Kredit Macet Nasabah dengan menggunakan Algoritma K-Nearest Neighbor. Information System for Educators and Professionals, 5(2), 131–140.

Purwaningsih, E., & Nurelasari, E. (2021). Penerapan K-Nearest Neighbor Untuk Klasifikasi Tingkat Kelulusan Pada Siswa. Syntax: Jurnal Informatika, 10(1), 46–55.

Retnoningsih, E., & Pramudita, R. (2020). Mengenal Machine Learning dengan Teknik Supervised dan Unsupervised Learning Menggunakan Python. Bina Insani Ict Journal, 7(2), 156–165.

Rudiyan, A., Dzulkifli, A. E., & Munazar, K. (2022). Klasifikasi Kebakaran Hutan Menggunakan Metode K-Nearest Neighbor: Studi Kasus Hutan Provinsi Kalimantan Barat. JTIM: Jurnal Teknologi Informasi Dan Multimedia, 3(4), 195–202.

Wahyono, Trisna, I. N. P., Sariwening, S. L., Fajar, M., & Wijayanto, D. (2020). Perbandingan Penghitungan Jarak pada K-Nearest Neighbour dalam Klasifikasi Data Tekstual. Jurnal Teknologi Dan Sistem Komputer, 8(1), 54–58.

Yunus, R., Ulfa, U., & Safitri, M. D. (2021). Application of the K-Nearest Neighbors (K-NN) Algorithm for Classification of Heart Failure. Journal of Applied Intelligent System, 6(1), 1–9.

Published

2022-05-22

How to Cite

Setiawan, A. (2022). Perbandingan Penggunaan Jarak Manhattan, Jarak Euclid, dan Jarak Minkowski dalam Klasifikasi Menggunakan Metode KNN pada Data Iris. Jurnal Sains Dan Edukasi Sains, 5(1), 28–37. https://doi.org/10.24246/juses.v5i1p28-37