3 research outputs found

    Perbandingan Seleksi Fitur Term Frequency & Tri-Gram Character Menggunakan Algoritma Naïve Bayes Classifier (Nbc) Pada Tweet Hashtag #2019gantipresiden

    Get PDF
    Towards an election year (elections) in 2019 to come, many mass campaign conducted through social media networks one of them on twitter. One online campaign is very popular among the people of the current campaign with the hashtag #2019GantiPresiden. In studies sentiment analysis required hashtag 2019GantiPresiden classifier and the selection of robust functionality that mendaptkan high accuracy values. One of the classifier and feature selection algorithms are Naive Bayes classifier (NBC) with Tri-Gram feature selection Character & Term-Frequency which previous research has resulted in a fairly high accuracy. The purpose of this study was to determine the implementation of Algorithm Naive Bayes classifier (NBC) with each selection and compare features and get accurate results from Algorithm Naive Bayes classifier (NBC) with both the selection of the feature. The author uses the method of observation to collect data and do the simulation. By using the data of 1,000 tweets originating from hashtag # 2019GantiPresiden taken on 15 September 2018, the author divides into two categories: 950 tweets as training data and 50 tweets as test data where the labeling process using methods Lexicon Based sentiment. From this study showed Naïve Bayes classifier algorithm accuracy (NBC) with feature selection Character Tri-Gram by 76% and Term-Frequency by 74%,the result show that the feature selection Character Tri-Gram better than Term-Frequency

    Perbandingan seleksi fitur term frequency & tri-gram character menggunakan algoritma naïve bayes classifier nbc pada tweet hashtag #2019gantiPresiden

    No full text
    Menuju tahun pemilu (pemilihan umum) pada 2019 mendatang, banyak kampanye yang dilakukan secara massal melalui jejaring media sosial salah satunya di twitter. Salah satu kampanye online yang sangat populer dikalangan masyarakat saat ini adalah kampanye dengan hashtag #2019GantiPresiden. Dalam penelitian sentimen analisis hashtag #2019GantiPresiden diperlukan classifier & seleksi fitur yang tangguh agar mendaptkan nilai akurasi yang tinggi. Salah satu classifier & seleksi fitur tersebut adalah Algoritma Naïve Bayes Classifier (NBC) dengan seleksi fitur Tri-Gram Character & Term-Frequency dimana pada penelitian sebelumnya menghasilkan akurasi yang cukup tinggi. Tujuan dari penelitian ini adalah mengetahui implementasi dari Algoritma Naïve Bayes Classifier (NBC) dengan masing-masing seleksi fitur serta mendapatkan dan membandingkan hasil akurasi dari Algoritma Naïve Bayes Classifier (NBC) dengan kedua seleksi fitur tersebut. Penulis menggunakan metode observasi untuk mengumpulkan data dan melakukan simulasi. Dengan menggunakan 1.000 data tweet yang bersumber dari hashtag #2019GantiPresiden yang diambil pada 15 September 2018, penulis membagi menjadi dua kategori yaitu 950 tweet sebagai data latih dan 50 tweet sebagai data uji dimana proses labelling sentimen menggunakan metode Lexicon Based. Dari penelitian ini diperoleh hasil akurasi Algoritma Naïve Bayes Classifier (NBC) dengan seleksi fitur Trigram Character sebesar 76% & Term-Frequency sebesar 74% serta, sehingga untuk melakukan analisis sentimen pada Twitter menggunakan Algoritma Naïve Bayes Classifier (NBC) lebih baik menggunakan seleksi fitur Trigram Characte