25 research outputs found

    Combining Likes-Retweet Analysis and Naive Bayes Classifier within Twitter for Sentiment Analysis

    Get PDF
    Sentiment analysis is a research study that aims to extract subjectivity of opinions. Due to massive growth number of user generated content in social media, Twitter is one of the most popular microblogging application which user is freely to discuss and share opinions about specific topic or entity. Twitter have several features that potentially can be used to improve sentiment analysis such as like and retweet. Like and retweet are mechanism in Twitter to propagate or share and to show appreciation of other user posting. This paper proposes a combination of textual and non-textual features to improve performance of sentiment prediction. In this research we apply Naïve Bayes for textual classification and Fisher Score to determine non-textual (like and retweet) features. By combining two kinds of features, our experimental find the optimal value of α and β. The evaluation performance using F1-measure gives 0.838 of accuracy with α and β are 0.6 and 0.4 respectively

    Identifikasi Sel Darah Merah Bertumpuk Menggunakan Pohon Keputusan Fuzzy Berbasis Gini Index

    Get PDF
    Pendekatan teknik data mining diusulkan untuk identifikasi sel darahmerah bertumpuk pada citra makroskopik sel darah untuk meningkatkan akurasipenghitungan jumlah sel darah merah. Fitur yang digunakan adalah geometri danwarna. Fitur geometri terdiri dari luasan dan eksentrisitas sel. Pada prosesidentifikasi digunakan pendekatan fuzzy. Setiap fitur direpresentasikan denganfungsi keanggotaan fuzzy. Identifikasi dilakukan berdasarkan aturan yangdiperoleh dari pohon keputusan fuzzy yang dibangkitkan. Pencabangan multisplitdigunakan pada pohon keputusan fuzzy. Pengukuran split atribut menggunakannilai gini index. Hasil pengujian pada 10 citra makroskopik sel darah yangmengandung 532 sel darah merah menunjukkan bahwa metode yang diusulkanmemiliki rata-rata akurasi sebesar 96,14%. Dengan akurasi yang tinggidiharapkan dapat meningkatkan akurasi diagnosis penyakit berdasarkan jumlahsel darah merah

    Prediction of On-time Student Graduation with Deep Learning Method

    Get PDF
    Universities have an important role in providing quality education to their students so they can build a foundation for their future. However, a problem that often arises is that the process experienced will be different for each individual. Therefore, it is necessary to apply on-time graduation predictions for students with academic attributes in the hope that educational institutions can better understand student conditions and maximize on-time student graduation. In this study, a deep learning method was implemented to help predict on-time graduation for students at the Faculty of Computer Science, University of Brawijaya. Based on the test results and hyperparameter tuning using Optuna, the best hyperparameter configuration for the deep learning method consisted of number of layer combinations = 4; first-layer nodes = 118; first dropout = 0.3393; second-layer nodes = 83; second dropout = 0.0349; third-layer nodes = 88; third dropout = 0.0491; fourth-layer nodes = 65; fourth dropout = 0.4169; number of epochs = 244; learning rate = 0.0710; and optimizer = SGD. Thus, an accuracy rate of 86.61% was achieved for the two classes of the test data set, i.e., on-time graduation and not on-time graduation

    Framework Design for Map-Based Navigation in Google Android Platform

    Get PDF
    This research proposes a design of mobile application framework that allow mobile application developers to develop their own outdoor mobile navigation application with the possibilities of utilizing multiple different pathfinding methods by using Abstract Factory design pattern for an optimized mobile navigation application in Google Android platform. The proposed framework has main functionality of providing navigation path from source or user location to a particular or user-specified location and then represents it visually on a digital map. Dijkstra and A-Star algorithms are implemented to show the effectiveness of the proposed mobile application framework design. An Android application prototype is constructed using the application framework and it has been successfully developed and satisfies the specified requirements. Mobile application framework design, performance comparison of pathfinding methods implementation, and a recommendation in specifying pathfinding method to use during application runtime are also provided

    Framework Design for Modular Web-based Application Using Model-CollectionService-Controller-Presenter (MCCP) Pattern

    Get PDF
    Information system is one of the most important business supports in organizations. Web-based applications become an appropriate solution to overcome the dynamically changing environment among different units in an organization. Model-View-Controller (MVC) is a well-known design pattern in web-based application development due to the separation of an application into several parts, hence it is easy to reuse and maintain. However, such design pattern requires improvements since the information system handles business process choreography and integration between application. Therefore, modifying the interaction of object of class in a design pattern become a challenging problem. In this paper, an application framework based on Model-CollectionService-Controller-Presenter (MCCP) design pattern, which is a modification of an MVC, was proposed. The proposed framework allows multiple different applications to run and provides inter-application data exchange mechanisms to improve the data communication process between applications. Several performance comparisons with another popular web application framework are also presented

    Klasifikasi Teks Bahasa Indonesia Pada Dokumen Pengaduan Sambat Online Menggunakan Metode K-Nearest Neighbors Dan Chi-square

    Get PDF
    K-Nearest Neighbors (K-NN) merupakan metode klasifikasi yang mudah untuk dipahami. Akan tetapi metode tersebut memiliki beberapa kekurangan, salah satunya dalam aspek komputasi perhitungan yang besar. Oleh karena itu, seleksi fitur digunakan sebagai salah satu cara untuk mengurangi besarnya komputasi adalah dengan mengurangi jumlah fitur yang tidak relevan dalam klasifikasi teks. Metode seleksi fitur yang digunakan adalah menggunakan metode Chi-Square untuk menghitung tingkat dependensi fitur. Proses yang dilakukan adalah mengumpulkan dokumen latih dan dokumen uji, melakukan tahap preprocessing dan seleksi fitur, kemudian dilakukan klasifikasi, dan pada tahap akhir dilakukan pengujian dan analisis terhadap hasil klasifikasi oleh sistem terkait nilai precision, recall, dan F-Measure. Dari penelitian ini dihasilkan bahwa seleksi fitur dapat meningkatkan nilai F-Measure dalam klasifikasi teks berbahasa Indonesia pada dokumen pengaduan SAMBAT Online dengan menggunakan metode klasifikasi K-Nearest Neighbor

    Penjadwalan Perkuliahan dengan Pendekatan Evolutionary Algorithm (Studi Kasus : Sistem Informasi Akademik (SIAKAD) Program Teknologi Informasi dan Ilmu Komputer Universitas Brwijaya)

    Get PDF
    Abstrak Untuk menyusun jadwal kuliah bukanlah sesuatu yang mudah karena terkait aturan-aturan yang ada. Penjadwalan perkuliahan jika dilakukan dengan cara manual tentu saja akan memakan waktu cukup lama. Oleh karena itu pada penelitian ini mencoba untuk melakukan pendekatan menggunakan evolutionary algorithm untuk mempermudah dalam pembuatan jadwal kuliah dengan menerapkan aturan yang berlaku. Kromosom disusun dalam bentuk representasi string dengan susunan yang mewakili hari, jam perkuliahan, ruang dan gedung. Dari beberapa percobaan paremeter yang digunakan, diperoleh hasil optimal pada jumlah individu 100 dan peluang crossover sebesar 75%. Kata kunci: algoritma evolusi, algoritma genetik, penjadwalan mata kuliah. Abstract It is not an easy task to arange academic schedule because it is affected by many constraints. If this scheduling is done manually, it will consume many times. Therefore, this research tries to use the evolutionary algorithm approach to do schedulling by applying the applicable rules. Chromosomes are represented as string, which each of them consist of days, times, rooms, dan the buildings. From some experiments whisch are used in this research, optimal result obtained when use 100 individu in one population and 75% chance of crossover. Keywords: evolution algorithm, genetic algorithm, class schedulin

    Pemilihan Kata Kunci Untuk Deteksi Kejadian Trivial Menggunakan Autocorrelation Wavelet Coefficients Pada Peringkasan Dokumen Twitter

    No full text
    Sistem peringkasan multi-dokumen (Multi-document Summarization) pada microblog Twitter tengah menjadi perhatian para peneliti beberapa tahun terakhir. Proses peringkasan dilakukan pada kumpulan dokumen Twitter (tweet) yang merepresentasikan kejadian penting (non-trivial) bertujuan untuk mendapatkan inti kejadian dari kumpulan dokumen tersebut. Permasalahan yang mendasari dilakukannya peringkasan tweet adalah pengguna harus membaca sejumlah tweet secara manual untuk memahami suatu kejadian (event), sedangkan pengguna Twitter memiliki batasan waktu untuk membaca seluruh tweet terkait kejadian. Pemisahan kejadian biasa (trivial) dengan kejadian penting (non-trivial) dilakukan untuk mengeliminasi tweet trivial sehingga dapat meningkatkan kualitas hasil peringkasan kejadian. Salah satu cara untuk menentukan suatu kejadian dianggap sebagai kejadian trivial dapat dilakukan dengan melakukan pemilihan kata kunci yang dianggap merepresentasikan kejadian trivial. Kejadian yang berulang secara periodik dianggap sebagai suatu kejadian trivial. Pendeteksian kejadian dilakukan dengan memanfaatkan pola-pola temporal atau sinyal dari data Twitter dalam bentuk sinyal wavelet untuk mendeteksi kemunculan kejadian penting. Wavelet analysis merupakan metode yang sering digunakan untuk mendeteksi perubahan dan puncak pada sinyal sehingga dapat dimanfaatkan untuk mendeteksi kemunculan suatu kejadian pada Twitter. Namun pendekatan tersebut tidak menjamin apakah kejadian-kejadian yang dideteksi merupakan kejadian yang berulang secara periodik atau tidak. Pada penelitian ini diajukan sebuah cara pendeteksian terhadap kejadian berulang secara periodik dengan melakukan pemilihan kata kunci trivial berdasarkan perhitungan korelasi (autocorrelation) pada wavelet coefficient kata kunci. Setelah mendapatkan kata kunci trivial maka dilakukan eliminasi terhadap tweet yang mengandung kata kunci trivial. Peringkasan multi-dokumen Twitter berdasarkan metode clustering tweet dilakukan untuk mengelompokkan kejadian yang sama kedalam sebuah cluster. Pemilihan kata kunci trivial tersebut pada peringkasan tweet diharapkan mampu memilih kejadian penting sehingga dapat meningkatkan kualitas hasil ringkasan. Penelitian menunjukkan bahwa nilai confidence boundary yang digunakan adalah sebesar 0.20 dan nilai minimum korelasi 27 untuk mendapatkan kata kunci trivial. Hasil clustering yang didahului proses eliminasi kata kunci trivial menghasilkan akurasi lebih baik yaitu 12 cluster dengan nilai sihlouette sebesar 0.45. ========================================================================================================= Multi-document summarization system on Twitter is a new topic of researchers in recent years. One of summarization is applied in Twitter's document (tweets) to the results of the detection of a significant event (non-trivial) to obtain information that includes a collection of tweets that represents an event. Underlying issues does summarization is needed in tweet because Twitter's users should read manually to understand from an event, whereas Twitter users have limit time to read all related tweets. Separation of normal incidence (trivially) with important events (nontrivial) done to eliminate the trivial tweets in order to improve the quality of the results of summarization of events. One way to determine an important event or not can be done by choosing keywords that are considered to represent an important event. Periodically recurring events regarded as a trivial incident that required a special method to detect the occurrence of such events for the next eliminated. Event detection is done by exploiting temporal patterns or signals of Twitter data in the form of signal wavelet to detect the emergence of important events. Wavelet analysis is a method often used to detect changes and peaks in the signal so it can be used to detect the occurrence of an event on Twitter. However, such approaches do not guarantee whether the detected events are periodically recurring events or not. This study aimed at detecting the occurrence of a repeated periodically for important events keyword selection by calculating the correlation (autocorrelation) in the wavelet coefficients in multi-document peringkasan Twitter tweets based clustering methods. The selection of the keywords in a tweet peringkasan expected to choose important events so as to improve the quality of the summaries

    Contextualization of Multimodal Sequence Models on Image to Text in Story Generation

    Get PDF
    豊橋技術科学大

    Pengkategorian Pesan Singkat Berbahasa Indonesia Pada Jejaring Sosial Twitter Dengan Metode Klasifikasi Naïve Bayes

    Get PDF
    Sistem pengkategorian pesan singkat pada jejaring sosial Twitter (tweet) merupakan penerapan dari text mining yang berusaha mengelompokkan secara otomatis sebuah tweet kedalam suatu kategori tertentu. Tujuan pengkategorian pesan singkat pada Twitter (tweet) membantu pengguna agar tidak kewalahan dengan membaca informasi tweet dalam kondisi yang masih acak. Metode yang digunakan dalam pembuatan aplikasi pengkategorian tweet adalah metode klasifikasi Naïve Bayes.Metode ini melakukan pendekatan probabilistik dalam melakukan inferensi yakni berbasis teorema Bayes secara umum.Data latih yang digunakan pada proses pengkategorian didapat dari dokumen RSS (Really Simple Syndication) yang disediakan oleh website tertentu dan sudah memiliki kategori sebelumnya. Kategori-kategori yang terdapat pada sistem adalah berita, olahraga, keuangan, teknologi, hiburan, dan otomotif.Aplikasi akan fokus pada tweet berbahasa Indonesia, dimana bahasa Indonesia mempunyai morfologi tertentu dalam pemrosesan pengkategorian. Aplikasi melakukan beberapa tahapan dalam melakukan pemrosesan diantaranya adalah preprocessing berupa case folding, dan parsing, transformation berupa penghapusan stopwords dan stemming, penghitungan frekuensi dan probabilitas dan perhitungan Naïve Bayes. Metode stemming yang digunakan khusus menangani morfologi bahasa Indonesia yang hasilnya digunakan dalam mendapatkan frekuensi dalam perhitungan klasifikasi Naïve Bayes. Pengkategorian yang dihasilkan oleh aplikasi dibandingkan dengan pengkategorian manual mempunyai rata-rata precision sebesar 80%, recall 79% dan F1 measure sebesar 78%. Proses stemming juga mempengaruhi hasil pengkategorian baik dari segi efektifitas maupun efisiensi
    corecore