Klasifikasi Topik Berita Berbahasa Indonesia Menggunakan k-Nearest Neighbor

Abstract

Masyarakat Indonesia kini mulai beralih dari konsumsi berita dalam bentuk surat kabar ke berita online. Persentase konsumsi berita melalui online mencapai 96 persen berdasarkan riset lembaga Global GFK. Angka tertinggi dibandingkan dengan konsumsi berita melalui televisi sebesar 91 persen, surat kabar 31 persen dan radio sebesar 15 persen. Akan tetapi begitu banyak berita bisa menyulitkan kerja editor dalam mengategorikan setiap berita yang ada, oleh karena itu dibutuhkan suatu sistem yang bisa mengategorikan berita sesuai dengan kategori masing-masing. Pada penelitian ini bertujuan untuk membuat suatu sistem yang mampu mengategorikan setiap berita berdasar dari topik berita tersebut. Metode yang digunakan dalam mengklasifikasi berita adalah k-Nearest Neighbor (K-NN) yang merupakan algoritma klasifikasi sederhana namu memiliki performa yang tinggi. Pada penelitian ini perancangan sistem dilakukan proses pengumpulan dataset, preprocessing data, klafikasifikasi dengan k-nn, dan terakhir dilakukan pengujian system. Dalam penelitian ini system yang dibangun mampu menghasilkan performa micro average f1-measure sebesar 69,9% dengan nilai k=1

Similar works

This paper was published in Open Library.

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.