Klasifikasi Multi-label pada Topik Berita Berbahasa Indonesia Menggunakan K-Nearest Neighbor

Abstract

Berita telah menjadi kebutuhan pokok manusia seiring dengan berkembangnya teknologi dan internet. Perkembangan teknologi dan internet ini menyebabkan proses pendistribusian informasi pada berita beralih dari cara penyampaian era media cetak menuju era digital. Masalah lain yang muncul ketika mengklasifikasikan berita adalah multi-label. Klasifikasi multi-label berbeda dengan klasifikasi single label. Klasifikasi single label akan mengklasifikasikan suatu dokumen ke dalam satu label saja. Sedangkan klasifikasi multi-label dapat mengelompokkan suatu dokumen ke lebih dari satu label. Sebagai contoh, sebuah artikel berita yang di dalamnya membahas secara rinci mengenai deteksi dini kanker ovarium dengan pendekatan bioinformatika, dapat memiliki lebih dari satu label yaitu kesehatan, bioinformatika, dan wanita. Pada tugas akhir ini, dibangun sebuah model klasifikasi yang mampu mengidentifikasi kelas pada masing-masing artikel berita secara multi-label dengan menggunakan metode K-Nearest Neighbor. Kelebihan K-Nearest Neighbor adalah algoritma yang sangat cocok untuk kasus multi-label, bahkan KNN bisa lebih unggul dibanding classifier yang lain. Dari sistem yang dibuat, didapatkan hasil nilai performa sistem yang diukur dengan proximity measure yaitu perbandingan antara Manhattan Distance, Euclidean Distance, dan Supremum Distance dengan menggunakan parameter K=11, menghasilkan nilai Hamming Loss sebesar 11,16%

Similar works

Full text

thumbnail-image
oai:openlibrary.telkomuniversity.ac.id:19.04.107Last time updated on 4/16/2020

This paper was published in Open Library.

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.