5 research outputs found

    SocialLink: exploiting graph embeddings to link DBpedia entities to Twitter profiles

    Get PDF
    SocialLink is a project designed to match social media profiles on Twitter to corresponding entities in DBpedia. Built to bridge the vibrant Twitter social media world and the Linked Open Data cloud, SocialLink enables knowledge transfer between the two, both assisting Semantic Web practitioners in better harvesting the vast amounts of information available on Twitter and allowing leveraging of DBpedia data for social media analysis tasks. In this paper, we further extend the original SocialLink approach by exploiting graph-based features based on both DBpedia and Twitter, represented as graph embeddings learned from vast amounts of unlabeled data. The introduction of such new features required to redesign our deep neural network-based candidate selection algorithm and, as a result, we experimentally demonstrate a significant improvement of the performances of SocialLink

    Seleksi Fitur Untuk Mendeteksi Social Bot Pada Media Sosial Twitter (Studi Kasus: Kampanye Pemilu Presiden Indonesia 2019)

    Get PDF
    Saat ini media sosial dianggap sebagai sebuah alat bantu yang penting bagi sebuah organisasi untuk berkomunikasi dengan antar pengguna mulai dari meningkatkan popularitas, menampung opini, komentar dan ide, hingga dapat mempengaruhi pengguna lainnya. Salah satu isu terkait pengaruh media sosial adalah pengguaan bot atau social bot yaitu sebuah program terotomatisasi pada social media. Untuk mengatasi masalah mengenai social bot, terdapat beberapa pendekatan untuk mengindetifikasi sebuah bot dari sebuah akun seperti mengecek waktu pembuatan akun dengan menggunakan machine learning.Dengan banyaknya fitur yang ada maka dilakukan pengujian untuk mendapatkan kombinasi fitur yang minimal namun tetap memberikan hasil yang optimal. Pada penelitian ini data yang digunakan berasal dari media sosial Twitter dengan menggunakan studi kasus data pendukung calon presiden Republik Indonesia 2019 yaitu Joko Widodo dan Prabowo Subianto selama masa kampanye, dengan menggunakan dua pendekatan yaitu melalui melalui data dari akun seperti jumlah tweet, jumlah follower dan following dan berasal dari tweet yaitu jumlah retweet, reply dan jumlah hashtag. Pada Penelitian ini digunakan beberapa model algoritma yaitu Support Vector Machine, Random Forest, dan Naïve Bayes. Penelitian ini menggunakan 49 fitur yang terdiri dari 23 fitur yang berasal dari profil dan 26 fitur yang berasal dari tweet. Dari fitur yang sudah dikumpulkan, kemudian dilakukan pengujian terhadap seluruh fitur, lalu diambil sepuluh fitur tertinggi untuk dilakukan uji kombinasi. Uji kombinasi fitur meliputi tiga fokus area yaitu pada profile, tweet dan keduanya. Hasil penelitian ini menghasilkan informasi bahwa umur akun merupakan fitur utama yang paling berkontribusi untuk mendeteksi sebuah social bot dengan keterangan 8620 akun atau 68% dari keseluruhan sampel yang terdeteksi sebagai social bot mempunyai umur akun kurang dari 10 bulan, kemudian fitur yang berasal dari profil memberikan hasil yang baik dengan ROC 0.78 dengan waktu eksekusi enam detik. Terakhir, dari penelitian ini menghasilkan informasi yaitu kombinasi fitur paling optimal antara lain umur akun, friendship (Rasio following dan follower) , followership (Rasio follower dan following), jumlah favourite, dan interestingness (Rasio jumlah tweet dengan jumlah favourite) dengan rata – rata ROC yaitu 0.77 dari model algoritma yang digunakan. =================================================================================================================================== Nowadays, social media is considered an essential tool for a company to communicate with users or another customer from gaining popularity, getting an opinion, comments, or ideas to affecting other users. One of the issues in social media is the use of bot or social bot, which is an automated program on social media. To solve this problem, there are several approaches to identified one using machine learning by checking features such as account creation date. With the numerous numbers of features, there will be testing to get minimal numbers or features but with the optimal result. In this research, the data that will be used are from social media Twitter using case study from Indonesia 2019 presidential candidates supporter’s Twitter account during campaign period using two approaches which are account level such as tweet counts, following counts and follower counts and from tweet level such as retweet counts, reply counts and number of hashtag used. In this research, some algorithm models will be used, such as Support Vector Machine, Random Forest, and Naïve Bayes. In this research, 49 features will be tested, which consist of 23 features from profile and 26 features from tweet. After feature testing, ten highest contributing features will be chosen and continued with feature combination testing based on three focus area, which are profile, tweet, and both profile and tweet. The results from this research are the features from profile gives a good results with 0.78 ROC and six seconds execution time, then the account age determined as the essential factor of detecting social bot with 8620 accounts or 68% of total accounts that have been labelled as bot have less than 10 months in term of account age. Lastly, the optimum feature combination in this research are account age, friendship (ratio between following and follower), followership (ratio between follower and following), favourite count and interestingness (ratio between tweet count and favourite count) with average ROC score 0.77 from the algorithm model used in this research
    corecore