32 research outputs found

    Market Basket Analysis untuk Swalayan KSU Sumber Makmur dengan Algoritma FP Growth

    Get PDF
    Salah satu teknik data mining yang populer digunakan adalah association data mining atau yang biasa disebut dengan istilah market basket analysis. Market basket didefinisikan sebagai suatu itemset yang dibeli secara bersamaan oleh pelanggan dalam suatu transaksi. Market basket analysis adalah suatu sarana untuk meningkatkan penjualan. Metode ini dimulai dengan mencari sejumlah frequent itemset dan dilanjutkan dengan pembentukan aturan-aturan asosiasi. Algoritma Apriori dan frequent pattern growth adalah dua algoritma yang sangat populer untuk menemukan sejumlah frequent itemset dari data-data transaksi yang tersimpan dalam basis data. Dalam penelitian ini algoritma frequent pattern growth (FP Growth) digunakan untuk menemukan sejumlah aturan asosiasi dari basis data transaksi penjualan di Swalayan KSU Sumber Makmur (Trenggalek). Dari hasil pengolahan data didapatkan pola pembelian paling kuat berupa jika membeli pasta gigi maka dimungkinkan juga akan membeli sabun dan jika membeli shampo juga akan membeli sabun dengan tingkat keyakinan (confidence) 63% dan 62%

    Stance Classification Pada Berita Berbahasa Indonesia Berbasis Bidirectional LSTM

    Get PDF
    Berita palsu masih menjadi masalah yang harus mendapat perhatian khusus. Media sosial, termasuk Facebook menjadi salah satu sarana yang mudah dan murah untuk menyebarkan suatu informasi yang bahkan belum tentu kebenarannya. Informasi tentang kesehatan menjadi salah satu topik berita palsu yang banyak tersebar ke masyarakat. Cara yang berbeda untuk mendeteksi berita palsu yaitu dengan menggunakan deteksi sikap (stance detection). Tujuan utama dari penelitian ini adalah merancang model yang memiliki kemampuan terbaik untuk melakukan tugas stance classification pada konteks bahasa Indonesia. Model ini diharapkan dapat digunakan untuk berkontribusi dalam menanggulangi masalah penyebaran berita palsu, khususnya di Indonesia. Metode BiLSTM dan GRU diusulkan untuk digunakan dalam melakukan stance classification terhadap headline berita dengan kelas for (mendukung), against (menentang), dan observing (netral). Stance classification pada penelitian ini menggunakan data sebanyak 3.941 headline berita yang terdiri dari 563 klaim dengan 7 tanggapan. Dataset dikumpulkan dari artikel-artikel berita kesehatan berbahasa Indonesia yang diposting pada laman Facebook. Model pada penelitian ini mampu menghasilkan akurasi F1-score paling tinggi sebesar 64% dengan FastText embedding. Metode GRU dapat menjadi salah satu pilihan tepat untuk melakukan stance classification dengan komputasinya yang lebih sederhana. Kinerja FastText jauh lebih unggul dibandingkan dengan Word2Vec dalam melakukan pembentukan vektor kata karena mampu mengatasi masalah out-of-vocabulary (OOV)

    Stance Classification Pada Berita Berbahasa Indonesia Berbasis Bidirectional LSTM

    Get PDF
    Berita palsu masih menjadi masalah yang harus mendapat perhatian khusus. Media sosial, termasuk Facebook menjadi salah satu sarana yang mudah dan murah untuk menyebarkan suatu informasi yang bahkan belum tentu kebenarannya. Informasi tentang kesehatan menjadi salah satu topik berita palsu yang banyak tersebar ke masyarakat. Cara yang berbeda untuk mendeteksi berita palsu yaitu dengan menggunakan deteksi sikap (stance detection). Tujuan utama dari penelitian ini adalah merancang model yang memiliki kemampuan terbaik untuk melakukan tugas stance classification pada konteks bahasa Indonesia. Model ini diharapkan dapat digunakan untuk berkontribusi dalam menanggulangi masalah penyebaran berita palsu, khususnya di Indonesia. Metode BiLSTM dan GRU diusulkan untuk digunakan dalam melakukan stance classification terhadap headline berita dengan kelas for (mendukung), against (menentang), dan observing (netral). Stance classification pada penelitian ini menggunakan data sebanyak 3.941 headline berita yang terdiri dari 563 klaim dengan 7 tanggapan. Dataset dikumpulkan dari artikel-artikel berita kesehatan berbahasa Indonesia yang diposting pada laman Facebook. Model pada penelitian ini mampu menghasilkan akurasi F1-score paling tinggi sebesar 64% dengan FastText embedding. Metode GRU dapat menjadi salah satu pilihan tepat untuk melakukan stance classification dengan komputasinya yang lebih sederhana. Kinerja FastText jauh lebih unggul dibandingkan dengan Word2Vec dalam melakukan pembentukan vektor kata karena mampu mengatasi masalah out-of-vocabulary (OOV)

    Stance Classification Post Kesehatan di Media Sosial Dengan FastText Embedding dan Deep Learning

    Get PDF
    Misinformasi merupakan fenomena yang semakin sering terjadi di media sosial, tidak terkecuali Facebook, salah satu media sosial terbesar di Indonesia. Beberapa penelitian telah dilakukan mengenai teknik identifikasi dan klasifikasi stance di media sosial Indonesia. Akan tetapi, penggunaan Word2Vec sebagai word embedding dalam penelitian tersebut memiliki keterbatasan pada pengenalan kata baru. Hal ini menjadi dasar penggunaan fastText embedding dalam penelitian ini. Dengan menggunakan pendekatan deep learning, penelitian berfokus pada performa model dalam klasifikasi stance suatu judul post kesehatan di Facebook terhadap judul post lainnya. Stance berupa for (setuju), observing (netral), dan against (berlawanan). Dataset terdiri dari 3500 judul post yang terdiri dari 500 kalimat klaim dengan enam kalimat stance terhadap setiap klaim. Model dengan fastText pada penelitian ini mampu menghasilkan F1 macro score sebesar 64%

    Deteksi Aspek Review E-Commerce Menggunakan IndoBERT Embedding dan CNN

    Get PDF
    Dengan semakin berkembangnya teknologi informasi, maka muncul istilah e-commerce dalam dunia bisnis. Pada e-commerce ada fitur review, pelanggan dapat memberikan review berupa teks, gambar, dan bintang. Review tersebut merupakan opini dari pelanggan terkait barang yang dibeli. Tetapi pada kebanyakan e-commerce tidak ada fitur kategori terkait review hal ini membuat calon pembeli kesusahan dalam menganalisa secara manual. Aspect-based sentiment analysis (ABSA) merupakan solusi dari permasalahan tersebut. ABSA memiliki tiga tugas salah satunya Aspect Category Detection yang memiliki fungsi untuk menggabungkan review pelanggan menjadi beberapa aspek dimana aspek-aspek tersebut sudah didefinisikan terlebih dahulu. Cukup banyak penelitian terkait Aspect Category Detection dengan mengunakan machine learning. Dari beberapa metode yang diuji, Convolutional Neural Network (CNN) merupakan metode terbaik. Selain itu penggunaan BERT sebagai word embedding menghasilkan output yang bagus baik dari pada word embedding konvensional. Penelitian ini menggunakan dataset dari e-commerce Bukalapak dengan 3114 review dan 6 aspek (Akurasi, Pengiriman, Kualitas, Harga, Pengemasan, dan Pelayanan). Berdasarkan ujicoba dengan menggunakan IndoBERT sebagai word embedding dan CNN untuk deteksi aspek, maka didapatkan akurasi sebesar 94,86%. Dengan demikian model tersebut dapat digunakan untuk deteksi aspek. Selain itu, metode CNN mendapatkan hasil yang lebih baik dari pada metode LSTM

    Detection of Banana and Its Ripeness Using Residual Neural Network

    Get PDF
    Automatic fruit detection utilizing computer vision techniques has been carried out to help the agriculture and plantation industries. This study researches smart systems to detect bananas and ripeness classification utilizing residual neural networks. The method used to detect bananas is transfer learning from pretraned Model VGG-19. Whereas, in the bananas ripeness classification process, residual neural networks, which are trained from the start, are used. Sliding Windows is used to detect the position of bananas followed by Non-Max Suppression to summarize the results of several detected bananas. Previous studies were limited to the level of ripeness, but in this study, bananas are detected and followed by the level of bananas ripeness (raw, ripe, and overripe). This study’s data uses bananas which were mixed with other kinds of fruit. There two kinds of bananas detection architecture used in this study, VGG-19 and Restnet. After they were used to detect bananas, it was found that VGG-19 was more suitable. The results of this study are very satisfying as it is seen from the bananas detection testing percentage using VGG-19 architecture which shows 100% ripe bananas, 99 % raw bananas, and 100% overripe bananas.Keywords: Detection of banana, banana ripeness, Non-Max suppression, residual block

    Deteksi Aspek Review E-Commerce Menggunakan IndoBERT Embedding dan CNN

    Get PDF
    Dengan semakin berkembangnya teknologi informasi, maka muncul istilah e-commerce dalam dunia bisnis. Pada e-commerce ada fitur review, pelanggan dapat memberikan review berupa teks, gambar, dan bintang. Review tersebut merupakan opini dari pelanggan terkait barang yang dibeli. Tetapi pada kebanyakan e-commerce tidak ada fitur kategori terkait review hal ini membuat calon pembeli kesusahan dalam menganalisa secara manual. Aspect-based sentiment analysis (ABSA) merupakan solusi dari permasalahan tersebut. ABSA memiliki tiga tugas salah satunya Aspect Category Detection yang memiliki fungsi untuk menggabungkan review pelanggan menjadi beberapa aspek dimana aspek-aspek tersebut sudah didefinisikan terlebih dahulu. Cukup banyak penelitian terkait Aspect Category Detection dengan mengunakan machine learning. Dari beberapa metode yang diuji, Convolutional Neural Network (CNN) merupakan metode terbaik. Selain itu penggunaan BERT sebagai word embedding menghasilkan output yang bagus baik dari pada word embedding konvensional. Penelitian ini menggunakan dataset dari e-commerce Bukalapak dengan 3114 review dan 6 aspek (Akurasi, Pengiriman, Kualitas, Harga, Pengemasan, dan Pelayanan). Berdasarkan ujicoba dengan menggunakan IndoBERT sebagai word embedding dan CNN untuk deteksi aspek, maka didapatkan akurasi sebesar 94,86%. Dengan demikian model tersebut dapat digunakan untuk deteksi aspek. Selain itu, metode CNN mendapatkan hasil yang lebih baik dari pada metode LSTM

    Deteksi Komentar Cyberbullying Pada YouTube Dengan Metode Convolutional Neural Network – Long Short-Term Memory Network (CNN-LSTM)

    Get PDF
    Pada era digital seperti sekarang cyberbullying kerapkali terjadi di berbagai belahan dunia termasuk di Indonesia, hal ini dapat terjadi pada siapa saja dan dimana saja terutama media sosial seperti YouTube melalui fitur komentar semua pengguna yang memiliki akun dapat dengan mudah terlibat cyberbullying hanya melalui berbalas komentar. Penelitian ini bertujuan untuk melakukan deteksi adanya cyberbullying melalui pengumpulan serta pengklasifikasian komentar negatif video pada kanal YouTube dengan konten tertentu berbasis bahasa Indonesia (serta bahasa-bahasa daerah tertentu, seperti Jawa dan Surabaya) melalui metode deep-learning Convolutional Neural Network – Long Short-Term Memory Network (CNN-LSTM). Dataset komentar yang dipakai dalam penelitian dikumpulkan dengan menggunakan Application Program Interface (API) yang telah disediakan oleh Youtube secara gratis dan berbatas kuota secara kumulatif. Terkumpul data komentar total sebanyak 26.918 komentar dengan perincian 9.834 komentar terklasifikasi cyberbullying dan 17.084 komentar terklasifikasi sebagai bukan cyberbullying. Setelah dataset dipakai dalam proses training pada model CNN-LSTM dan menghasilkan sebuah model dengan nilai F1-score sebesar 0,84, model tersebut dipakai dalam sebuah API sederhana yang menerima input beberapa kalimat yang akan dideteksi konten cyberbullying dan menghasilkan output berupa JSON yang berisi hasil klasifikasi dari setiap kalimat yang akan dideteksi

    KLASIFIKASI MICRO-EXPRESSION MENGGUNAKAN K-NEAREST NEIGHBORS MENGGUNAKAN FITUR CAS DAN HOG

    Get PDF
    Micro-Expression adalah ekspresi yang muncul dalam waktu singkat, hanya berlangsung sepersekian detik. Hal ini mungkin merupakan akibat dari aktivitas komunikasi antar manusia selama interaksi sosial. Reaksi ekspresi mikro wajah terjadi secara alami dan segera, sehingga hanya menyisakan sedikit ruang untuk manipulasi. Namun, karena Micro-Expression bersifat sementara dan memiliki intensitas rendah, pengenalan dan pengenalannya sulit dan sangat bergantung pada pengalaman para ahli. Karena kekhususan dan kompleksitas intrinsiknya, klasifikasi Micro-Expression menggunakan 2 ekstraksi yaitu CAS dan HOG menarik tetapi menantang, dan baru-baru ini menjadi area penelitian yang aktif. context-aware saliency (CAS) yang bertujuan untuk mendeteksi wilayah gambar yang mewakili pemandangan. Tutujuannya adalah untuk mendeteksi objek dominan. Histogram Oriented Gradient (HOG) Bertujuan sebagai deskriptor yang efektif untuk pengenalan dan deteksi objek. Metode K-Nearest Neighbors (K-NN) digunakan untuk klasifikasi Micro-Expression berdasarkan fitur HOG dari citra saliency. Dataset yang digunakan pada penelitian ini dari data sampel siswa SMK Ma’arif NU Prambon jurusan Multimedia sebanyak 45 siswa dan ditambahkan dataset dari affecnet. Hasil yang didapatkan dari total dataset sebanyak 4116 citra yang dibagi menjadi 6 Micro-Expression yaitu anger, disgust, fear, happy, sad dan surprise, mendapatkan hasil akurasi diatas 80% dari perbandingan dataset sejumlah 4116 terbagi menjadi 2 dengan persentase 70% training dan 30% data testing

    Klasifikasi Micro-Expression Menggunakan K-Nearest Neighbors Menggunakan Fitur CAS dan HOG

    Get PDF
    Micro-Expression adalah ekspresi yang muncul dalam waktu singkat, hanya berlangsung sepersekian detik. Hal ini mungkin merupakan akibat dari aktivitas komunikasi antar manusia selama interaksi sosial. Reaksi ekspresi mikro wajah terjadi secara alami dan segera, sehingga hanya menyisakan sedikit ruang untuk manipulasi. Namun, karena Micro-Expression bersifat sementara dan memiliki intensitas rendah, pengenalan dan pengenalannya sulit dan sangat bergantung pada pengalaman para ahli. Karena kekhususan dan kompleksitas intrinsiknya, klasifikasi Micro-Expression menggunakan 2 ekstraksi yaitu CAS dan HOG menarik tetapi menantang, dan baru-baru ini menjadi area penelitian yang aktif. context-aware saliency (CAS) yang bertujuan untuk mendeteksi wilayah gambar yang mewakili pemandangan. Tutujuannya adalah untuk mendeteksi objek dominan. Histogram Oriented Gradient (HOG) Bertujuan sebagai deskriptor yang efektif untuk pengenalan dan deteksi objek. Metode K-Nearest Neighbors (K-NN) digunakan untuk klasifikasi Micro-Expression berdasarkan fitur HOG dari citra saliency. Dataset yang digunakan pada penelitian ini dari data sampel siswa SMK Ma’arif NU Prambon jurusan Multimedia sebanyak 45 siswa dan ditambahkan dataset dari affecnet. Hasil yang didapatkan dari total dataset sebanyak 4116 citra yang dibagi menjadi 6 Micro-Expression yaitu anger, disgust, fear, happy, sad dan surprise, mendapatkan hasil akurasi diatas 80% dari perbandingan dataset sejumlah 4116 terbagi menjadi 2 dengan persentase 70% training dan 30% data testing
    corecore