Optimalisasi Feature Selection Untuk Mendeteksi Penyakit Diabetes Mellitus Menggunakan Metode Decision Tree

Abstract

Diabetes mellitus type 2 is a health problem with a high prevalence rate throughout the world. The International Diabetes Federation (IDF) in the West Asia Pacific region consists of 20 countries, of which Indonesia is a member. In the world, 536.6 million people have diabetes and 206 million in the West Asia Pacific region. Until 2045, this number will continue to increase to 260 million in the West Asia Pacific Region and as many as 783.7 million diabetes sufferers worldwide. An unhealthy lifestyle causes diabetes, so it is found that people with diabetes no longer come from older people. Machine learning has been widely used to recognize several disease patterns as an initial detection effort. The machine learning accuracy matrix can be improved using a decision tree algorithm by adding improvements to the feature selection process using information gain. This research uses several attributes that are thought to have information on detecting diabetes mellitus. Five features with the highest scores were obtained using the Information Gain method in the feature subset selection process. Next, the Decision Tree classification algorithm is applied to a subset of selected features, and applying the Decision Tree algorithm using information gain increases accuracy by 96.25%. It is hoped that the results of this research can reduce the number of people with diabetes.   Keywords— Detection, Diabetes Mellitus, Feature Selection, Information Gain, Decision TreeDiabetes mellitus adalah penyakit kronis yang ditandai oleh tingginya kadar gula (glukosa) dalam darah. Penyebabnya berkaitan dengan masalah dalam produksi atau penggunaan insulin, hormon yang mengatur kadar gula darah. Penyakit diabetes mellitus tipe 2 merupakan permasalahan kesehatan dengan tingkat prevalensi tinggi di seluruh dunia. Indonesia adalah salah satu dari 20 negara dan teritori IDF (International Diabetes Federation) Kawasan Asia Fasifik Barat. Di dunia terdapat 536,6 juta orang menderita penyakit diabetes dan 206 juta orang di kawasan Asia Pasifik Barat. Hingga tahun 2045 jumlah ini akan terus meningkat menjadi 260 juta di Kawasan Asia Pasifik Barat dan sebanyak 783,7 juta penderita diabetes di dunia. Pada Penelitian ini menggunakan beberapa atribut yang diduga memiliki informasi dalam mendeteksi penyakit diabetes mellitus. Pada proses perhitungan atribut akan digunakan proses pemilihan fitur untuk mencari fitur yang lebih memiliki banyak informasi dalam proses deteksi, dengan melakukan proses pemilihan fitur diduga dapat mendapatkan hasil yang lebih akurat. Oleh karena itu pada penelitian ini menggunakan Feature selection dengan metode Information Gain dalam proses pemilihan subset fitur yang relevan dan didapatkan 5 fitur dengan nilai tertinggi. Selanjutnya, algoritma klasifikasi Decision Tree diterapkan pada subset fitur terpilih dan mendapatkan tingkat akurasi sebesar 96% dimana hasil ini konsisten dengan hasil tingkat akurasi yang hanya menggunakan algoritma decision tree tanpa melibatkan feature selection yaitu sebesar 96%.   Kata kunci— Diabetes Mellitus, Feature Selection, Information Gain, Decision Tree &nbsp

Similar works

This paper was published in JURNAL POLITEKNIK NEGERI SRIWIJAYA.

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.