65,145 research outputs found

    A Support Vector Machine (SVM) and Speeded Up Robust Features (SURF) for Indonesian Car Licence Plate Identification System

    Full text link
    Volume 7 Issue 10 (October 201

    KATEGORISASI TEKS DENGAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) (Text Categorization with Support Vector Machine (SVM) Classification Method)

    Get PDF
    ABSTRAKSI: Adanya pertumbuhan yang pesat dari informasi pada masa kini, menjadikan kategorisasi teks (text categorization) yang merupakan suatu proses pengklasifikasian dokumen ke dalam satu atau lebih kategori yang telah didefinisikan sebelumnya atau ke dalam kelas-kelas dari dokumen-dokumen yang sama, sebagai suatu teknik kunci dalam penanganan dan pengorganisasian data yang berupa teks. Salah satu metode klasifikasi yang digunakan adalah Support Vector Machine (SVM). Konsep SVM dapat dijelaskan secara sederhana sebagai usaha mencari hyperplane terbaik yang berfungsi sebagai pemisah dua buah class pada input space. SVM secara konsep merupakan linear classifier, tetapi SVM dapat dimodifikasi dengan menggunakan kernel trick, sehingga bisa digunakan untuk menyelesaikan permasalahan non-linear. Walaupun masih terbilang metode baru, SVM memberikan performansi yang lebih baik dibandingkan metode-metode learning lainnya, seperti Naïve Bayesian, Bayesian Network, Decision Trees[4], atau Artificial Neural Network[1]. Melalui serangkaian pengujian terhadap sejumlah dokumen yang telah diolah menjadi suatu representasi data berupa matriks vektor, SVM berhasil mengklasifikasikan dokumen dalam jumlah besar (>3000 dokumen) ke dalam kategorinya dengan tingkat akurasi yang memuaskan, yaitu di atas 80%.Kata Kunci : kategorisasi teks, dokumen, Support Vector MachineABSTRACT: not availableKeyword

    A complexity analysis of statistical learning algorithms

    Full text link
    We apply information-based complexity analysis to support vector machine (SVM) algorithms, with the goal of a comprehensive continuous algorithmic analysis of such algorithms. This involves complexity measures in which some higher order operations (e.g., certain optimizations) are considered primitive for the purposes of measuring complexity. We consider classes of information operators and algorithms made up of scaled families, and investigate the utility of scaling the complexities to minimize error. We look at the division of statistical learning into information and algorithmic components, at the complexities of each, and at applications to support vector machine (SVM) and more general machine learning algorithms. We give applications to SVM algorithms graded into linear and higher order components, and give an example in biomedical informatics

    Sentiment Analysis Menggunakan Support Vector Machine(Svm)

    Get PDF
    Pemerintah sebagai peJayan masyarakat memiliki peran yang sangat besar dalam meningkatkan kesejahteraan masyarakat. Maka perJu diadakan suatu perbaikan secara bertahap guna meningkatkan peJayanan masyarakat (public services) sebagai tugas utama pemerintah, untuk itu perJu adanya sikap keterbukaan dari pemerintah untuk dapat menerima setiap keJuhan masyarakat mengenai kebijakan I program yang langsung menyentuh kepentingan masyarakat. Media Center merupakan sistem peJayanan informasi yang terintegrasi kepada masyarakat untuk ikut berpartisipasi dalam pembangunan dengan berbagai cara sepe1ti ide, pengaduan, kcluhan, kritik, saran dan pcrtanyaao. Untuk itu pcrlu adanya klasifikasi untuk sentiment analysis keluhan masyarakat informasi yang masuk ke media center sehingga pengelola dapat memberikan informasi yang cfisicn dan tcpat kcpada masyarakat dan pcmclintah dapat mcngctahui bidang mana yang perJu dibenahi dalam pembangunan. SemimenL analysis merupak:m proses klasifikasi dokumen LeksLual ke dalam heberapa keJas seperti sentimen positif dan negatif serta besarnya pengaruh dan manfaat dari sentiment analysis tersehuL Pada penelitian ini dihahas klasifikasi keluhan masy:mlkaLLerhadap pemerintah pada media sosial.facebookdan twitter sapawarga data berbahasa Indonesia menggunakan metode Support Vector Machine (SVM) yang dijalankan dalam komputasi terdistribusi dengan menggunakan Hadoop. Pengujian dilakukan dengan perhitungan precision, recall,F-Measure se1ta akurasi dengan mengasilkan akurasi rata-rata diatas 80% dengan akurasi tertinggi 84.4086% precision 81% recall84% serta F-Measure 80%. =============================================================================================== Government as a public servant has a very big role in improving the welfare of society. So there should be a gradual improvement in order to improve public services as the main task of government, to the need for openness of government to be able to receive any complaints about the policies I programs that directly touch the interests of the community. Media Center is a system of integrated information services to the public to participate in the development of a variety of ways such as ideas, complaints, complaint~, criticisms, suggeslions and queslions. Por thal we need a classificalion ror semiment analysis complaints that information into the media center so that managers can provide an efficient and precise information to the public and the government can determine what areas need to be addressed in d evel o pme nt. Sentiment analysis is the process of classification of textual documents into several classes such as positive ;md negative sentiment as well as the magnitude of the effect and the benefits of semiment analysis. In this study discussed the classification of public complaints against the government on facebook and twitter social media sapawarga Indonesian language of data using Support Vector Machine (SVM) which is executed in a distributed computing using Hadoop. Testing is done with the calculation precision, recalL F-Measure and accuracy with average accuracy above 80 % with the highest accuracy 84.4086 % precision 81 % recall of 84 % and F-Measure 80 %

    PREDIKSI TINGKAT PEMAHAMAN MATERI PESERTA DIDIK DALAM PEMBELAJARAN ONLINE MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE (SVM)

    Get PDF
    Penelitian ini bertujuan untuk memprediksi tingkat pemahaman materi peserta didik dalam pembelajaran online menggunakan algoritma Support Vector Machine (SVM). Algoritma ini digunakan agar mendapatkan penilaian terhadap pemahaman materi peserta didik yang lebih akurat dan objektif berdasarkan aktivitas peserta didik selama proses pembelajaran online. Penelitian ini menggunakan pendekatan eksperimen untuk mengimplementasikan algoritma Support Vector Machine (SVM), sehingga memiliki kinerja yang optimal dalam melakukan prediksi, menggunakan data dari Kaggle. Tahapan implementasi ini diantaranya data preprocessing yang terdiri dari Encoding Categorical dan normalisasi, kemudian proses pemodelan yaitu proses pelatihan dan pengujian model. Hasil implementasi algoritma Support Vector Machine (SVM) didapatkan akurasi sebesar 88.5% menggunakan parameter C = 24 dan gamma = 0.21, selain itu F1-Score yang didapatkan juga menunjukan hasil yang baik diantaranya kelas Low sebesar 88%, kelas Mid sebesar 87% dan kelas High sebesar 91%. Kemudian, fitur yang memiliki pengaruh sangat besar terhadap hasil prediksi tingkat pemahaman materi pembelajaran dalam pembelajaran online adalah fitur ketidakhadiran. This study aims to predict understanding level of students in online learning using the Support Vector Machine (SVM) algorithm. This algorithm is used in order to get an assessment understanding level of students that is more accurate and objective based on students activities during the online learning process. This study uses an experimental approach to implement the Support Vector Machine (SVM) algorithm, so that it has optimal performance in making predictions, using data from Kaggle. These stages of implementation include preprocessing data which consists of Encoding Categorical and Normalization, then the modeling process is the process of training and testing the model. The results of the implementation of the Support Vector Machine (SVM) algorithm obtained an accuracy of 88.5% using the parameters C = 24 and gamma = 0.21, besides that the F1-Score obtained also showed good results including the Low class 88%, the Mid class 87% and the High class 91%. Then, the feature that has a very big influence on the results of the prediction understanding level of students in online learning is the absence feature

    Simple SVM based whole-genome segmentation

    Get PDF
    We present a support vector machine (SVM) based framework for DNA segmentation into binary classes. Two applications are explored: transcription start site prediction and transcription factor binding prediction. Experiments demonstrate our approach has significantly better performance than other methods on both tasks

    Indonesian Stock Prediction using Support Vector Machine (SVM)

    Get PDF
    This project is part of developing software to provide predictive information technology-based services artificial intelligence (Machine Intelligence) or Machine Learning that will be utilized in the money market community. The prediction method used in this early stages uses the combination of Gaussian Mixture Model and Support Vector Machine with Python programming. The system predicts the price of Astra International (stock code: ASII.JK) stock data. The data used was taken during 17 yr period of January 2000 until September 2017. Some data was used for training/modeling (80 % of data) and the remainder (20 %) was used for testing. An integrated model comprising Gaussian Mixture Model and Support Vector Machine system has been tested to predict stock market of ASII.JK for l d in advance. This model has been compared with the Market Cummulative Return. From the results, it is depicts that the Gaussian Mixture Model-Support Vector Machine based stock predicted model, offers significant improvement over the compared models resulting sharpe ratio of 3.22

    Penerapan Support Vector Machine (SVM) untuk Pengkategorian Penelitian

    Get PDF
    Penelitian setiap perguruan tinggi akan terus bertambah. Penelitian akan disimpan dalam bentuk softcopy dan hardcopy. Penyusunan penelitian hendaknya harus perkategori agar mempermudah pencarian orang yang membutuhkan refrensi. Untuk mengkategorikan penelitian maka dibutuhkan sebuah metode untuk penambangan teks, salah satunya dengan implementasi Support Vector Machines (SVM). Data yang digunakan untuk mengenali ciri dari tiap kategori maka dibutuhkan data sekunder yang merupakan kumpulan dari abstrak penelitian. Data tersebut akan dilakukan praprosesing dengan beberapa tahapan yaitu case folding mengubah semua huruf menjadi huruf kecil, stopwords removing penghapusan kata-kata yang sangat umum, tokenizing membuang tanda baca, dan stemming mencari akar kata dengan membuang awalan dan akhiran. Selanjutnya data yang sudah mengalami preprocessing akan diubah menjadi bentuk numerik dengan untuk tahap term weighting yaitu pemberian bobot kontribusi setiap kata. Dari hasil term weighting maka diperoleh data yang bisa digunakan untuk data traning dan data uji. Proses training dilakukan dengan memberikan masukan berupa data teks yang diketahui kelas atau kategorinya. Kemudian dengan menggunakan algoritma Support Vector Machines, data-data hasil masukan tersebut ditransformasikan ke dalam suatu aturan, fungsi, ataupun model pengetahuan yang nantinya dapat digunakan dalam proses prediksi. Dari hasil penelitian ini diperoleh bahwa pengkategorian penelitian yang dihasilkan oleh SVM sudah sangat baik. Hal ini dibuktikan leh hasil pengujian yang menghasilkan tingkat akurasi 90%

    Implementasi Support Vector Machine (SVM) untuk Pemodelan Pendeteksi Fraud Studi Kasus Pajak

    Get PDF
    Pajak adalah kontribusi wajib kepada negara yang terutang oleh orang pribadi atau badan yang bersifat memaksa berdasarkan Undang-Undang dengan tidak mendapatkan imbalan secara langsung dan digunakan untuk keperluan negara sebesar-besarnya bagi kemakmuran rakyat. Pajak yang dibayarkan tersebut dapat saja terjadi fraud yaitu keanehan data yang disebabkan pada proses pengumpulan terdapat kesalahan input yang tidak disengaja maupun disengaja. Keanehan data tersebut dapat dicegah dengan langkah pendeteksian fraud. Pendeteksian tersebut dilakukan dengan cara memilah dan mengelompokkan fraud berdasarkan jenis-jenis kesalahan yang ada. pada pajak restoran dan rumah makan penulis mendapatkan 4 jenis fraud yaitu 3 jenis didapatkan dari pengertian fraud pada hukum pajak dan 1 jenis fraud tambahan yaitu wajib pajak melakukan pembayaran pajak kurang dari batas minimal kewajaran pembayaran pajak. Proses pembangunan sistem fraud detection pada pajak restoran dan rumah makan dilakukan dengan 2 tahapan yaitu tahapan preprocesing data dan tahapan klasifikasi. Tahapan preprocesing data tersebut adalah data integration, penanganan mising value, pelabelan dan feature creation. Tahapan klasifikasi dengan menggunakan metode Support Vector Machine (SVM). Setelah melakukan tahapan-tahapan tersebut, didapatkan hasil dari pengujian sistem dengan data pembayaran pajak yang menangani 3 jenis fraud mendapatkan akurasi 99%, sedangkan prngujian sistem yang menggunakan dataset yang ditambahkan data restoran dan rumah makan yang menangani 4 jenis fraud terdapat penurunan akurasi menjadi 60%
    corecore