Twitter text mining untuk informasi gempa bumi menggunakan TF-IDF di Indonesia

Abstract

INDONESIA: Text Mining atau Penambangan Teks adalah proses yang dilakukan oleh komputer untuk mendapatkan sesuatu yang baru, atau menemukan kembali informasi yang tersirat secara implisit. Penelitian ini membahas mengenai penambangan teks kemudian difilter untuk mendapatkan informasi mengenai gempa bumi di Indonesia. Tujuan yang ingin didapatkan adalah memperoleh informasi tentang terjadinya gempa bumi dari media sosial secara akurat. Aplikasi ini dibangun menggunakan bahasa Python sebagai bahasa pemrogramannya. Untuk uji cobanya dilakukan dengan men-stream web Twitter menggunakan kata kunci “gempa” kemudian di-crawl. Dokumen yang dihasilkan dari proses stream twitter API dilakukan penghitungan bobot tf-idf. Dari hasil uji coba pada proses uji coba, didapatkan bahwa proses stream menghasilkan 520 dokumen tweet dengan kata kunci gempa. Kemudian oleh aplikasi dokumen tersebut dihitung kemunculan term gempa pada setiap dokumen. Dari 520 dokumen tweet yang dihasilkan, freakuensi rata-rata tweet yang dihasilkan dalam satu menit adalah 1 tweet dengan bobot tf-idf 0.036. Frekuensi kemunculan term divisualkan dalam bentuk chart time series yang menunjukkan kemunculan term gempa pada tiap menit. ENGLISH: Text Mining is the process that performed by a computer to get something new, or find back information that implied implicitly. This research discussed about text mining then filtered it to get information of the earth quake in Indonesia. The goal is to get obtain information about the earthquake of social media accurately . This application is build on Python as the programming language. The test process is by doing some twitter stream using keyword “gempa” then crawl it. Documents produced from the twitter API stream process count of tf-idf weight. From the trial at process trial, got that process stream produce 520 documents tweets keyword earthquake. Then by the application of the documents calculated the term earthquake in each document. From the 520 documents of the tweet that produced, the average frecuency of tweets generated in one minute is one tweet with tf-idf weight of 0.036. Frequency of occurrence visualized term in the chart time series showing the term earthquake in every minutes

Similar works

Full text

thumbnail-image

Etheses of Maulana Malik Ibrahim State Islamic University

redirect
Last time updated on 10/08/2016

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.