Analisis Klasifikasi Kanker Payudara Menggunakan Algoritma Naive Bayes

  • Hardian Oktavianto Universitas Muhammadiyah Jember
  • Rahman Puji Handri Universitas Muhammadiyah Jember
Keywords: klasifikasi, kanker payudara, naive bayes

Abstract

Breast cancer is one of the highest causes of death among women, this disease ranks second cause of death after lung cancer. According to the world health organization, 1 million women get a diagnosis of breast cancer every year and half of them die, in general this is due to early treatment and slow treatment resulting in new cancers being detected after entering the final stage. In the field of health and medicine, machine learning-based classification has been carried out to help doctors and health professionals in classifying the types of cancer, to determine which treatment measures should be performed. In this study breast cancer classification will be carried out using the Naive Bayes algorithm to group the types of cancer. The dataset used is from the Wisconsin breast cancer database. The results of this study are the ability of the Naive Bayes algorithm for the classification of breast cancer produces a good value, where the average percentage of correctly classified data reaches 96.9% and the average percentage of data is classified as incorrect only 3.1%. While the level of effectiveness of classification with naive bayes is high, where the average value of precision and recall is around 0.96. The highest precision and recall values ​​are when the test data uses a percentage split of 40% with the respective values ​​reaching 0.974 and 0.973.

Kanker payudara merupakan salah satu faktor penyebab kematian tertinggi di kalangan wanita, penyakit ini menempati urutan kedua penyebab kematian setelah kanker paru – paru. Menurut organisasi kesehatan dunia, 1 juta wanita mendapat diagnosis menderita kanker payudara setiap tahun dan separuh dari mereka akhirnya meninggal, pada umumnya hal ini disebabkan penanganan dini serta pengobatan yang lambat mengakibatkan kanker baru terdeteksi setelah memasuki stadium akhir. Pada bidang kesehatan dan pengobatan, klasifikasi yang berbasis machine learning telah banyak dilakukan untuk membantu dokter dan ahli kesehatan dalam mengelompokkan jenis kanker, hingga menentukan tindakan pengobatan yang sebaiknya dilakukan. Pada penelitian ini akan dilakukan klasifikasi kanker payudara dengan menggunakan algoritma Naive Bayes untuk melakukan pengelompokan jenis kanker. Dataset yang digunakan adalah berasal dari basis data kanker payudara Wisconsin. Hasil dari penelitian ini adalah kemampuan algoritma naive bayes untuk klasifikasi kanker payudara menghasilkan nilai yang baik, dimana rata – rata persentase data yang terklasifikasi dengan benar mencapai 96.9% dan rata – rata persentase data terklasifikasi salah hanya 3.1%. Sedangkan tingkat efektivitas klasifikasi dengan naive bayes ini termasuk tinggi, dimana rata – rata nilai precision dan recall berada di sekitar 0.96. Nilai precision dan recall paling tinggi yaitu ketika data uji menggunakan percentage split 40% dengan nilai masing – masing secara berurutan mencapai 0.974 dan 0.973.

 

 

Published
2020-02-17