27 research outputs found

    Mobile Blog untuk Citizen Journalism dengan Pengkategorian Berita Menggunakan Metode Inner Product

    Get PDF
    Dalam makalah ini dibahas tentang sebuah aplikasi yang mendukung kegiatan citizen journalism berupa telepon genggam yang bisa mengirimkan berita berupa gambar dan teks yang akan ditampilkan pada sebuah blog menurut kronologi waktu dan diklasifikasikan berdasarkan kategori berita politik, ekonomi, olahraga, kriminal, hiburan. Informasi berita bisa disampaikan oleh siapa saja, berupa peristiwa yang terjadi bisa kapan saja dan di mana saja, inilah yang disebut citizen journalism. Untuk memudahkan pembacaan maka berita akan dikategorikan secara otomatis. Input berita akan melalui proses text mining, yaitu tokenizing, filtering dan stemming, kemudian hasilnya akan diproses dengan kumpulan kata kunci tiap kategori berita menggunakan metode inner product. Metode inner product ini memerlukan kata kunci untuk setiap kategori berita. Kata kunci adalah kata yang sering muncul dalam suatu kategori berita. Hasil uji coba menunjukkan bahwa rata-rata tingkat keakuratan hasil klasifikasi berita dengan metode inner product sekitar 92%. Metode ini tergantung pada banyaknya kata kunci tiap kategori berita, semakin banyak kata kunci tiap kategori berita, semakin baik hasil pengkategoriannya

    PENENTUAN LOKASI PEMBUKAAN CABANG BARU LBB DENGAN METODE AHP - GIS

    Get PDF
    There many LBB emerge to help elementary, junior high and senior high student study now. Due to the fact that many LBB branch will emerge, it will increase competition between LBB in attracting students. LBB branch location is the key to increase the value of new LBB branch. Since many LBB branch didn't consider consumer's distribution, their patron rate is not as high as the main branch. Geographic Information System is an information system that able to visualize consumer's distribution pattern wich will be analyzed. AHP is a method used to make a multi-criteria and multi- alternate decisions. The criteria used in system are distance with main road, distance with housing, amount of nearby school and presence of other LBB. Using GIS imbued with AHP, LBB will be able to create a visualization of consumer's distribution that will recommend the best location to establish next branch. Hierarchical decision, criterias and priorities rank will affect the system recommendation to establish new LBB branch location

    Scientific reference style using rule-based machine learning

    Get PDF
    Regular Expressions (RegEx) can be employed as a technique for supervised learning to define and search for specific patterns inside text. This work devised a method that utilizes regular expressions to convert the reference style of academic papers into several styles, dependent on the specific needs of the target publication or conference. Our research aimed to detect distinctive patterns of reference styles using RegEx and compare them with a dataset including various reference styles. We gathered a diverse range of reference format categories, encompassing seven distinct classes, from various sources such as academic papers, journals, conference proceedings, and books. Our approach involves employing RegEx to convert one referencing format to another based on the user's specific preferences. The proposed model demonstrated an accuracy of 57.26% for book references and 57.56% for journal references. We used the similarity ratio and Levenshtein distance to evaluate the dataset's performance. The model achieved a 97.8% similarity ratio with a Levenshtein distance of 2. Notably, the APA style for journal references yielded the best results. However, the effectiveness of the extraction function varies depending on the reference style. For APA style, the model showed a 99.97% similarity ratio with a Levenshtein distance of 1. Overall, our proposed model outperforms baseline machine learning models in this task. This study introduces an automated program that utilizes regular expressions to modify academic reference formats. This will enhance the efficiency, precision, and adaptability of academic publishing

    Klasifikasi Topik terhadap Judul Berita Kasus Covid-19 dengan Multilayer Perceptron

    Get PDF
    Peran media massa berpengaruh dalam meningkatkan kesadaran masyarakat terhadap penyebaran Covid-19. Berdasarkan laporan Reuters Institute Digital News Report 2022, media daring cenderung dikonsumsi oleh masyarakat Indonesia sebagai sumber berita dengan persentase 88%. Hal tersebut menunjukkan media daring merupakan tempat penyebaran informasi yang penting. Penelitian ini bertujuan untuk mengklasifikasikan topik yang ada dalam berita terkait kasus Covid-19 dalam media massa Kompas dengan menggunakan multilayer perceptron. Berdasarkan hasil penelitian, berita kasus Covid-19 dapat dikategorikan menjadi empat label, yaitu kebijakan pemerintah, pemberitahuan informasi, internasional, dan masyarakat umum. Tingkat akurasi yang didapat dari pemodelan dengan multilayer perceptron adalah 75%. Kemiripan pada kata-kata dalam data menyebabkan adanya kesalahan dalam membedakan antara satu topik dengan topik lainnya

    Temu Kembali Informasi Berdasarkan Lokasi pada Dokumen yang Dikelompokkan Menggunakan Metode Centroid Linkage Hierarchical

    Get PDF
    Pencarian informasi berdasar kata kunci dapat membantu pengguna ketika ingin mengetahui informasi yang berhubungan dengan kata kunci yang dicari. Begitupun dengan pencarian informasi ketika pengguna ingin mengetahui kelompok dokumen yang memuat lokasi tertentu yang sama. Karenanya dibutuhkan suatu sistem yang memberikan informasi kepada pengguna yang ingin melakukan pengelompokkan dokumen berdasar lokasi tertentu yang sama. Dengan menerapkan temu kembali informasi dalam mencari kata kunci lokasi pada dokumen dan metode Centroid Linkage Hierarchical sebagai metode pengelompokkan data dapat memberikan hasil yang optimal dalam mengelompokkan dokumen dan hanya akan mengambil informasi yang mempunyai tingkat kepentingan tinggi. Pada percobaan yang telah dilakukan dengan kata kunci lokasi inputan Jakarta didapatkan prosentase error 20%, Bogor 25%, Tangerang Jakarta 30%, dan Bandung Dago 40%

    RANCANG BANGUN SISTEM PENGELOLAAN DOKUMEN-DOKUMEN PENTING MENGGUNAKAN TEXT MINING

    Get PDF
    the need to use of data in digital formats is increasing. we needs system to manage document in digital for

    Rhetorical Sentences Classification Based on Section Class and Title of Paper for Experimental Technical Papers

    Get PDF
    Rhetorical sentence classification is an interesting approach for making extractive summaries but this technique still needs to be developed because the performance of automatic rhetorical sentence classification is still poor. Rhetorical sentences are sentences that contain rhetorical words or phrases. Rhetorical sentences not only appear in the contents of a paper but also in the title. In this study, features related to section class and title class that have been proposed in a previous research were further developed. Our method uses different techniques to reach automatic section class extraction for which we introduce new, format-based features. Furthermore, we propose automatic rhetoric phrase extraction from the title. The corpus we used was a collection of technical-experimental scientific papers. Our method uses the Support Vector Machine (SVM) algorithm and the Naïve Bayesian algorithm for classification. The four categories used were: Problem, Method, Data, and Result. It was hypothesized that these features would be able to improve classification accuracy compared to previous methods. The F-measure for these categories reached up to 14%.

    Rule-based Sentiment Degree Measurement of Opinion Mining of Community Participatory in the Government of Surabaya

    Get PDF
    Diskominfo Surabaya, as a government agency, received much community participatory for improvement of governmental services, with increasing number of 698, 2717, 4176 and 4298 participatory data respectively in 2011, 2012, 2013 and 2014. It is challenging for Diskominfo Surabaya to set a target by giving the response back within 24 hours. Due to task complexity to address the degree of participatory and to categorize the group of participatory, they faced difficulty to fulfill the target. In this research, we present a new system for measuring the sentiment degree of community participatory. We provide 5 functions in our system, which are: (1) Data Collection, (2) Data Preprocessing, (3) Text Mining, (4) Sentiment Analysis and (5) Validation. We propose our rule-based technique for the sentiment analysis of opinion mining with detection of 8 important parts, which are (1) Verb, (2) Adjective, (3) Preposition, (4) Noun, (5) Adverb, (6) Symbol, (7) Phrase, and (8) Complimentary. For applicability of our proposed system, we made a series of experiment with 410 data of community participatory in Twitter for Diskominfo Surabaya and compared with other sentiment classification algorithms which are SVM and Naive Bayes Classifier. Our system performed 77.32% rate of accuracy and outperformed to other comparing algorithms

    PENCARIAN JALUR ALTERNATIF PADA DAERAH BENCANA LUMPUR SIDOARJO DENGAN METODE ANALYTIC HIERARCHY PROCESS BERBASIS WAP

    Get PDF
    In line with the increasing interest on Lapindo mud disaster which causes several roadway covered by mud, there is a need to give an alternative solution for traffic transportation problem in surrounding area. The possible criteria for the solution of this road way are length, surface, traffic, and width of the road. Types of vehicle across the road also give a contribution to the criteria. By using Geography Information System (GIS), it is easy to all drivers to take decision which way has to be chosen based on the real condition. GIS is used to visualize the alternative road, which is possible to take. Analytic Hierarchy Processing (AHP) is a decision method which is based on many criteria and alternatives. The input of AHP can be a preference or real value. Applied AHP to decide value of each alternative is based on application of Wireless Application Protocol (WAP) assessment

    Semantic Information Retrival for Scientific Experimental Papers with Knowlege based Feature Extraction

    Get PDF
    Seiring dengan perkembangan zaman, jumlah karya ilmiah semakin meningkat. Permintaan pencarian informasi dalam makalah ilmiah juga meningkat. Pada  makalah ilmiah eksperimental, peneliti mengalami kesulitan dalam mencari informasi pada karya ilmiah eksperimental karena mesin pencari informasi memiliki keterbatasan dalam proses pencarian berdasarkan ekstraksi fitur berbasis text-mining dari seluruh teks, sedangkan jenis makalah ilmiah eksperimental memiliki konten spesifik, yang memiliki perlakuan berbeda dalam ekstraksi fitur. Dalam makalah ini, kami mengusulkan sistem baru untuk pengambilan informasi pada makalah ilmiah eksperimental. Sistem ini terdiri dari 4 fungsi utama: (1) Ekstraksi fitur berbasis konten spesifik, (2) Model klasifikasi, (3) Pemilihan subruang berbasis konteks, dan (4) Pengukuran kesamaan yang bergantung pada konteks. Dalam ekstraksi fitur, sistem kami mengekstraksi kategori fitur dalam makalah ilmiah eksperimental dengan fitur berbasis konten tertentu, yaitu data, masalah, metode, dan hasil. Untuk model klasifikasi, kami menggunakan beberapa algoritma klasifikasi untuk mengklasifikasikan fitur konten tertentu dari paper queri ke agregasi dokumen pembelajaran. Dalam Pemilihan Subruang Berbasis Konteks, sistem melakukan pengurangan dimensi dengan pemilihan subruang berbasis konteks yang dipilih oleh pengguna. Untuk mendapatkan hasil pencarian akhir, kami mengukur kesamaan konteks dengan membangun metrik dataset berdasar konteks ke paper. Untuk melakukan penerapan sistem yang kami usulkan, kami menguji 77 makalah dalam dataset dengan model validasi Leave-One-Out dengan beberapa algoritma klasifikasi (Nearest Neighbor, Naive Bayes, Support Vector Machine, dan Decision Tree) dan rata-rata melakukan presisi 66,65% tingkat dan akurasi tingkat presisi 76,18%. Kami juga melakukan percobaan pada pengukuran kesamaan dengan memberikan queri paper dan konten yang diinginkan (data, hasil, metode, dan masalah) sebagai konteks yang diberikan oleh pengguna. Dalam percobaan pengukuran kesamaan, sistem yang kami usulkan memiliki tingkat akurasi 79,17%
    corecore