research

Analisis Perbandingan Algoritma Klasifikasi Data Mining untuk Dataset Blogger dengan Rapid Miner

Abstract

Data mining merupakan sebuah proses untuk menganalisa sebuah kasus untuk menemukan performaterbaik dari algoritma yang diuji. Salah satu cara untuk mendapatkan informasi atau pola dari kumpulandata yang besar adalah dengan menggunakan teknik-teknik dalam data mining. Ada banyak metodeklasifikasi yang di gunakan untuk menghasilkan nilai akurasi yang akurat. Terdapat 5 algoritma klasifikasiyang digunakan dalam mengklasifikasi dataset blogger yaitu decision tree, Naïve bayes, k-nearestneighbour, ID3, dan CHAID. Dataset menggunakan data blogger dari UCI Machine Learning Repository.Blogadalah media yang bergantung pada teknologi informasi dan kemajuan teknologi. Penelitian ini diujiDengan menggunakan validasi 10-fold cross validation dan uji t-test. Sehingga hasil tertinggi dari nilai akurasiyang didapat adalah sebesar 85.00% untuk algoritma KNN. Sedangkan untuk nilai AUC algoritma CHAIDyang memiliki hasil tertinggi yaitu sebesar 0.758. dan dari asil uji t-test yang dilakukan bahwa algoritmaID3,CHAID dan Naive Bayes merupakan algoritma dengan performa terbaik yang diterapkan pada datasetblogger. Sedangkan untuk algoritma KNN dan C45 merupakan algoritma dengan performa yang kurangbaik dengan nilai AUC 0,500%

    Similar works

    Full text

    thumbnail-image

    Available Versions

    Last time updated on 09/07/2019