    Komparasi Algoritma Klasifikasi Machine Learning dan Feature Selection pada Analisis Sentimen Review Film

    Analisis sentimen adalah proses yang bertujuan untuk menentukan isi dari dataset yang berbentuk teks bersifat positif, negatif atau netral. Saat ini, pendapat khalayak umum menjadi sumber yang penting dalam pengambilan keputusan seseorang akan suatu produk. Algoritma klasifikasi seperti Naïve Bayes (NB), Support Vector Machine (SVM), dan Artificial Neural Network (ANN) diusulkan oleh banyak peneliti untuk digunakan pada analisis sentimen review film. Namun, klasifikasi sentimen teks mempunyai masalah pada banyaknya atribut yang digunakan pada sebuah dataset. Feature selection dapat digunakan untuk mengurangi atribut yang kurang relevan pada dataset. Beberapa algoritma feature selection yang digunakan adalah information gain, chi square, forward selection dan backward elimination. Hasil komparasi algoritma, SVM mendapatkan hasil yang terbaik dengan accuracy 81.10% dan AUC 0.904. Hasil dari komparasi feature selection, information gain mendapatkan hasil yang paling baik dengan average accuracy 84.57% dan average AUC 0.899. Hasil integrasi algoritma klasifikasi terbaik dan algoritma feature selection terbaik menghasilkan accuracy 81.50% dan AUC 0.929. Hasil ini mengalami kenaikan jika dibandingkan hasil eksperimen yang menggunakan SVM tanpa feature selection. Hasil dari pengujian algoritma feature selection terbaik untuk setiap algoritma klasifikasi adalah information gain mendapatkan hasil terbaik untuk digunakan pada algoritma NB, SVM dan ANN

    Opinion Mining of Movie Review using Hybrid Method of Support Vector Machine and Particle Swarm Optimization

    Nowadays, online social media is online discourse where people contribute to create content, share it, bookmark it, and network at an impressive rate. The faster message and ease of use in social media today is Twitter. The messages on Twitter include reviews and opinions on certain topics such as movie, book, product, politic, and so on. Based on this condition, this research attempts to use the messages of twitter to review a movie by using opinion mining or sentiment analysis. Opinion mining refers to the application of natural language processing, computational linguistics, and text mining to identify or classify whether the movie is good or not based on message opinion. Support Vector Machine (SVM) is supervised learning methods that analyze data and recognize the patterns that are used for classification. This research concerns on binary classification which is classified into two classes. Those classes are positive and negative. The positive class shows good message opinion; otherwise the negative class shows the bad message opinion of certain movies. This justification is based on the accuracy level of SVM with the validation process uses 10-Fold cross validation and confusion matrix. The hybrid Partical Swarm Optimization (PSO) is used to improve the election of best parameter in order to solve the dual optimization problem. The result shows the improvement of accuracy level from 71.87% to 77%


    Analisis sentimen merupakan teknik yang bertujuan menentukan opini dari masyarakat bersifat positif atau negatif. Internet merupakan bagian terpenting dalam kehidupan sehari- hari. Banyak situs yang menyediakan berbagai macam review tentang suatu produk atau jasa yang menggambarkan pendapat pengguna. Salah satu contohnya adalah situs internet Yelp. Yelp adalah sebuah situs yang berisi berbagai macam review, seperti transportasi, media massa, restoran, hotel, makanan, elektronik dan lain sebagainya. Transportasi memiliki peran yang sangat penting dalam menunjang pertumbuhan ekonomi masyarakat dan merupakan urat nadi dalam pembangunan ekonomi suatu negara. Oleh karena itu keberhasilan pembangunan dibidang ekonomi harus ditunjang dengan pengembangan sistim transportasi yang baik, sesuai dengan kebutuhan dan perkembangan zaman. Pengguna transportasi bisa memberikan pendapat mereka mengenai kualitas dari transportasi yang sudah tersedia secara online. Jika membaca review tersebut secara keseluruhan bisa memakan waktu dan sebaliknya jika hanya sedikit review yang dibaca, hasil evaluasi akan bias. Algoritma klasifikasi sentimen review seperti support vector machine (SVM) adalah algoritma yang sering digunakan untuk klasifikasi analisis sentimen review. Namun klasifikasi sentimen review mempunyai kelemahan pada banyaknya fitur atau atribut dataset yang digunakan, metode seleksi fitur chi square dapat digunakan untuk mengurangi fitur atau atribut yang tidak relevan.Kata kunci : analisis sentimen, review transportasi, klasifikasi, chi Square

    A Deep Learning based Model using Review Associated Feature Extraction Approach for Sentiment Analysis

    With the advancement of internet technologies, in the present days, online forums, social media platforms and e-commerce sites have made the product reviews process very easy. There are a lot of mobile applications, websites and forums where consumers used to share and circulate their opinions, experiences, ideas and views regarding products, brands and services. In consequence, online user reviews have become a deciding factor for many consumers prior to purchasing their selected items. The sentiment analysis is a technique to extract sentiments, feelings and insights from customer reviews and public texts. Therefore, plenty of businesses perform sentiment analysis in order to more thoroughly comprehend of their customer opinions and suggestions regarding their products and services. Furthermore, a number of scientific researchers also have a keen interest in classifying customer reviews into a set of labels employing text classification techniques. The objective of the this research work is to develop an approach to extract review associated features using Part-of-Speech (POS) tagging and design a CNN model to classify the reviews' sentiment as positive or negative. In this paper, an approach to extract review associated feature has been presented. Natural Language Processing (NLP) techniques are utilized for data preprocessing to remove uninformative data from reviews. Deep learning model CNN is used for sentiment classification and Amazon mobile reviews dataset is used for the experiment. The proposed model is experimentally evaluated and provides enhanced performance than other models also provides improved accuracy of 97.23% on Amazon mobile review dataset

    Aspect term extraction for sentiment analysis in large movie reviews using Gini Index feature selection method and SVM classifier

    With the rapid development of the World Wide Web, electronic word-of-mouth interaction has made consumers active participants. Nowadays, a large number of reviews posted by the consumers on the Web provide valuable information to other consumers. Such information is highly essential for decision making and hence popular among the internet users. This information is very valuable not only for prospective consumers to make decisions but also for businesses in predicting the success and sustainability. In this paper, a Gini Index based feature selection method with Support Vector Machine (SVM) classifier is proposed for sentiment classification for large movie review data set. The results show that our Gini Index method has better classification performance in terms of reduced error rate and accuracy

    Klasifikasi Sentimen Review Film Menggunakan Algoritma Support Vector Machine

    Sentimen merupakan sebuah penilaian dari seseorang yang berupa pendapat dan komentar terhadap suatu topik atau produk tertentu. Analisis sentimen berfungsi untuk melihat pendapat dan komentar terhadap suatu masalah atau topik tertentu oleh seseorang, cenderung beropini positif atau beropini negatif. Penelitian Tugas Akhir ini menjelaskan klasifikasi sentimen pada dokumen review film guna mempermudah orang lain untuk mengetahui kualitas dari sebuah film. Salah satu cara mengetahui kualitas sebuah film adalah dengan membaca review atau ulasan berdasarkan pengalaman penonton lain. Dengan kemajuan di bidang teknologi, seluruh informasi tentang semua film sudah tersedia di Internet. Jika informasi tersebut diolah dengan baik maka akan diperoleh kualitas dari informasi tersebut. Satu hal yang penting dalam sebuah review atau ulasan yaitu opini yang terkandung di dalamnya. Metode yang digunakan pada penelitian ini adalah Support Vector Machine (SVM) karena SVM mampu mengklasifikasikan data berdimensi tinggi sesuai dengan data yang digunakan pada Tugas Akhir ini, data teks. Pengklasifikasi Support Vector Machine adalah teknik machine learning yang populer untuk klasifikasi teks karena dapat melakukan klasifikasi dengan cara belajar dari sekumpulan contoh dokumen yang telah diklasifikasi sebelumnya dan juga mampu memberikan hasil yang baik. Dari uji skenario yang dilakukan, dapat diketahui bahwa algoritma Support Vector Machine dapat digunakan untuk kasus review film dengan nilai F1-Score sebesar 84.9%. Kata Kunci: Analisis sentimen, Support Vector Machine, Review film, Klasifikas

    Semantics-Driven Aspect-Based Sentiment Analysis

    People using the Web are constantly invited to share their opinions and preferences with the rest of the world, which has led to an explosion of opinionated blogs, reviews of products and services, and comments on virtually everything. This type of web-based content is increasingly recognized as a source of data that has added value for multiple application domains. While the large number of available reviews almost ensures that all relevant parts of the entity under review are properly covered, manually reading each and every review is not feasible. Aspect-based sentiment analysis aims to solve this issue, as it is concerned with the development of algorithms that can automatically extract fine-grained sentiment information from a set of reviews, computing a separate sentiment value for the various aspects of the product or service being reviewed. This dissertation focuses on which discriminants are useful when performing aspect-based sentiment analysis. What signals for sentiment can be extracted from the text itself and what is the effect of using extra-textual discriminants? We find that using semantic lexicons or ontologies, can greatly improve the quality of aspect-based sentiment analysis, especially with limited training data. Additionally, due to semantics driving the analysis, the algorithm is less of a black box and results are easier to explain