3 research outputs found

    Extraction of aspects from Online Reviews Using a Convolution Neural Network

    Get PDF
    The quality of the product is measured based on the opinions gathered from product reviews expressed on a product. Opinion mining deals with extracting the features or aspects from the reviews expressed by the users. Specifically, this model uses a deep convolutional neural network with three channels of input: a semantic word embedding channel that encodes the semantic content of the word, a part of speech tagging channel for sequential labelling and domain embedding channel for domain specific embeddings which is pooled and processed with a Softmax function. This model uses three input channels for aspect extraction. Experiments are conducted on amazon review dataset. This model achieved better result

    ASPECT EXTRACTION PADA ULASAN MENGGUNAKAN PENGGABUNGAN LATENT DIRICHLET ALLOCATION DAN GLOBAL VECTOR FOR WORD REPRESENTATION

    Get PDF
    "Di era digital saat ini, semua informasi dapat ditemukan di berbagai jejaring sosial, seperti Facebook dan Twitter yang menjadi tempat beropini atau memberi ulasan. Biasanya masyarakat mengekspresikan ulasannya tidak secara keseluruhan tetapi hanya sebagian fitur saja pada setiap ulasan. Fitur dalam ulasan tersebut berisi aspek yang harus diekstraksi menggunakan aspek, dikumpulkan dalam beberapa kategori, dan dibagi menjadi polaritas yang berbeda. Sentiment Analysis berbasiskan aspek dapat membantu mengatasi hal tersebut. Aspect extraction merupakan task yang penting dalam pendekatan ini. Penelitian ini berfokus pada Aspect Extraction dan Latent Topic Identification menggunakan unsupervised learning. LDA (Latent Dirichlet Allocation) adalah pendekatan yang paling umum digunakan dalam unsupervised learning yang baik untuk menemukan topik dalam dokumen berukuran besar. Namun, LDA kurang efektif untuk melakukan aspect extraction terutama pada ulasan atau teks berukuran pendek karena mempengaruhi data sparsity, sehingga terjadi aspek dan topic yang tidak koheren dan tidak kompatibel. Untuk mengatasinya, kita mengusulkan LDA yang digabungkan dengan word embedding. GloVe (Global Vector for Word Representation) merupakan word embedding yang memiliki perpaduan kelebihan dari word embedding yang berdasarkan prediksi dan perhitungan. Pendekatan yang diajukan ini akan menguji pengaruh GloVe sebagai word embedding terhadap LDA sebagai topic modelling. Data penelitian menggunakan ulasan edukasi, e- Commerce, dan game. Data diolah menggunakan seleksi fitur dan dikelompokkan menggunakan LDA. Hasil pengujian menunjukkan bahwa penggabungan LDA- GloVe mempunyai nilai koheren yang tinggi daripada metode lain dengan peningkatan mencapai 79,6%. Hasil tersebut mengindikasikan bahwa word embedding mempunyai pengaruh yang signifikan terhadap LDA. Kata Kunci: Aspect Extraction, Review, Latent Dirichlet Allocation, GloVe
    corecore