20 research outputs found

    Perbandingan Metode Web Scraping Menggunakan CSS Selector dan Xpath Selector

    Get PDF
    Pemanfaatan data atau berita yang tersebar di internet untuk meningkatkan peluang keberhasilan dalam sebuah usaha melalui analisa trend pasar adalah hal yang sangat umum pada saat ini. Penjelajahan Web (Crawl) dan ekstraksi data dari web (Scraping) menjadi salah satu hal yang penting, agar tidak terjadi data yang kurang sempurna, dan data yang diterima adalah data yang paling baru. CSS Selector dan Xpath merupakan salah satu metode yang umum digunakan dalam melakukan proses crawling. Terdapat perbedaan dari jumlah data yang terambil, besar file output dan waktu pemrosesan dari kedua metode tersebut, dimana Xpath memiliki keunggulan pada jumlah data yang terambil dan waktu pemrosesnya yang berakibat pada ukuran file output yang lebih besar. Sedangkan untuk penggunaan memori pada kedua metode pada proses crawling tidak memiliki perbedaan yang signifikan

    DESIGNING A PYTHON BASED TEXT PRE-PROCESSING APPLICATION FOR TEXT CLASSIFICATION

    Get PDF
    The first step that is always passed by documents in natural language processing is pre-processing text. These steps are needed for transferring text from human language to machine-readable format for further processing. However, not many special applications have been found that function as text pre-processing. This has led to any research on natural language processing having to create its own program code for the pre-processing text phase. The main focus of this research is to create an integrated text pre-processing application that can be accessed by any researcher who needs it. Several issues discussed in this study include the design, implementation, testing and integration of each text pre-processing feature. Text preprocessing which is integrated in this research includes case folding, tokenizing, and feature selection. The tools used in this research are the NLTK library of python and Django framework. The design of the text pre-processing application can be made using the waterfall method. For the application stage, the utilization of the NLTK Library can be applied precisely and systematically. This library also facilitates the implementation phase because of the large number of NLP classes that can be directly applied

    Pemanfaatan E-Commerce sebagai Strategi Peningkatan Pemasaran UMKM

    Get PDF
    The development of information technology that is bringing a considerable impact on every aspect of life, internet is on of that thingst that has a very big impact on everyday life both indiviual and social. It is also affected in the business world. One of the information technology that is aaffected ini bussines world is E-Commerce. E-Commerce Benefits as one of the strategies to improve marketing that can increase sales are widely applied today. This matter then the team devotion to the community with the activity: "Strategy of Marketing Improvement Through Creation E-Commerce Website At SMEs in District Sumbersari". Through activities to the public that HR is expected to dapart information technology to improve marketing that later can increase sales and in addition to improve competitiveness with other businesses

    Pemanfaatan E-Learning Untuk Menunjang Proses Pembelajaran Di SMPN 2 Jember

    Get PDF
    Penggunaan media computer dan internet pada dunia pendidikan di Indonesia khususnya di kota jember sudah banyak digunakan akan tetapi penggunaannya belum maksimal. Hal ini disebabkan karena keterbatasan sarana dan prasarananya serta sumber daya manusianya yang masih kurang, di sinilah peran Guru sebagai pendidik sangat diperlukan, karena guru merupakan figur yang paling bertanggung jawab dan berperan besar dalam memberikan pendidikan yang berkualitas kepada anak didiknya. Penerapan e-learning yang memiliki fasilitas seperti chat, forum, quiz assignment dan lain-lain sangat efektik untuk membantu proses belajar mengajar pada institusi pendidikan

    Estimasi Kecepatan Multi Objek Kendaraan Menggunakan Metode HOG dan Vanishing Point

    Get PDF
    Peningkatan jumlah kendaraan terjadi pada semua jenis kendaraan setiap tahunnya. Hal ini akan menimbulkan kemacetan yang memiliki dampak negatif. Kemacetan tersebut dapat dikurangi dengan melakukan rekayasa lalu-lintas. Sistem yang dibangun dapat  mengambil data kondisi lalu-lintas seperti jumlah dan kecepatan kendaraan menggunakan kamera dan pengolahan citra. Dengan memanfaatkan vanishing point, sebuah gambar yang memiliki distorsi perspektif dapat direktifikasi, Dengan menghitung jarak perpindahan kendaraan setiap frame nya pada gambar rektifikasi, maka kecepatan kendaraan dapat terdeteksi. Hasil estimasi kecepatan kendaraan oleh sistem dibandingkan dengan hasil pengamatan langsung memiliki selisih sebesar 8.22 km/jam. Kata Kunci - Estimasi Kecepatan Kendaraan; Pengolahan Citra; Rektifikasi Gambar; Vanishing Point

    Pemanfaatan News Crawling Untuk Pembangunan Corpus Berita Menggunakan Scrapy dan Xpath

    Get PDF
    Linguistically, language corpus is a collection of written (textual) or test hypotheses about language structure. However, the existence of the language corpus, especially the Indonesian corpus today is still very less. It's caused by the use of language corpus for Natural Language Processing is rare and most of them still using the same corpus which is used by previous research. In addition, the construction of the corpus itself takes a long time and big costs. To overcome this problem, this research proposed a development of language corpus, especially Indonesian corpus, using web crawling engine Scrapy and guided X-path. So with the use of guided web crawling technology is expected to build a corpus language data in accordance with the needs of research and net of unexpected codes and links without much time and energy consuming. The result shows that the development of news corpus using Scrapy and Xpath is successfully meet the expected target. This is characterized by the resulting corpus news that has been divided into three categories of news namely, entertainment, community and culinary news. In addition, from the parameters tested it can be concluded that the use of resources on the server computer is directly proportional to the number of items obtained and the file size. This means that the more items obtained and successfully stored the greater the size of the file and resource memory used. Thus, to limit memory usage on server computers, we can limit what items will be taken at the time of the scraping process by limiting the number of links crawled by the spider or limiting the number of items to be searched.  Keywords— Language Corpus, Natural Language Processing, Scrapy, Web Crawling, XPathÂ

    Predicted Missing Imputation on Dengue Fever Spread Data with K-Nearest Neighbor (K-NN)

    Get PDF
    Dengue Hemorrhagic Fever (DHF) is a disease caused by dengue virus with Aedes Aegypti intermediate.  Based on  a  survey  from  the  Health  Office  of  Jember  recorded  during January 2015 out of 300 cases of DHF patients, 7 of them are died, that why the prediction of DHF distribution is needed for prevention of spreading. Parameters that used to determine the potential  for  the  spread  of  DHF  diseases  are  rainfall  ,  rainy  day,  larva  free  and  house  index. However, the survey data is often incomplete, the missing imputation data resulted the process to  predict  the  potential  for  the  spread  of  DHF  is  still  constrained.  By used  of  K-Nearest Neighbor  (K-NN)  methods  that  can  be  used  to  predict  the  missing  imputation  data  and complete  it.  Using  the  correlations  between  attributes  attained  on Euclidean  Distance  that shows  better  performance  in  terms  of  imputation  accuracy. The method  show  MSE  below  1 and MAPE around 10 – 16%

    Penerapan Digital Marketing sebagai Strategi Marketing dan Branding pada UMKM

    Get PDF
    One of the effects of information technology development in the business world is the use of digital marketing to support marketing and branding in a business. The advantages of using digital marketing can be outside the marketing area of a product or business, besides that it can increase the selling value of the product or business through branding. Based on this, the service team held an activity: "Implementation of Digital Marketing as a Marketing and Branding Strategy in MSMEs in the Sumbersari sub-district". Through the service activities carried out, it is expected that partners can increase the marketing and branding of their products

    Perbandingan Metode TOPSIS dan SAW dalam Penempatan Karyawan

    Get PDF
    Multiple Criteria Decision Making (MCDM) merupakan salah satu metode yang umum dan banyak digunakan sebagai pemilih alternatif terbaik dari beberapa alternatif untuk proses pengambilan keputusan. Multiple Attribute Decision Making (MADM) merupakan salah satu pendekatan dasar dari MCDM dimana dalam proses pengambilan keputusannya memperhatikan beberapa atribut yang kadang saling bertentangan. Proses penempatan karyawan merupakan salah satu unsur penting yang nantinya akan menjadi indikator baik buruknya sebuah manajemen sebuah perusahaan. Pengujian dari beberapa metode MCDM atau MADM diperlukan untuk mendapatkan referensi metode yang tepat untuk kasus ini. Dalam penelitian ini dilakukan pengujian terhadap dua metode yaitu metode Technique for Order of Preference by Similarity to Ideal Solution (TOPSIS) dan metode Simple Additive Weighting (SAW) untuk melakukan proses penempatan karyawan pada posisi tertentu. Hasilnya metode TOPSIS memiliki tingkat akurasi yang sedikit lebih tinggi daripada metode SAW dalam proses perangkingan, akan tetapi metode SAW memiliki keunggulan dalam waktu yang dibutuhkan untuk proses komputasi dibandingkan dengan waktu koputasi metode TOPSIS

    PENCARIAN LOKASI RUMAH SAKIT DI KABUPATEN PROBOLINGGO DENGAN METODA DJIKSTRA BERBASIS SPASIAL

    Get PDF
    Perkembangan ilmu dibidang teknologi komputer telah membawa manfaat yang sangat besar bagi penyebaran informasi. Selain sebagai sumber informasi, komputer juga dimanfaatkan sebagai sarana penentu letak geografis pada suatu wilayah. Banyak  sekali  aplikasi–aplikasi yang  dapat  ditangani  oleh  sistem informasi geografis, Di antaranya adalah pada  bidang  rumah sakit yang dapat  dilakukan  dengan  bantuan SIG  adalah informasi letak dan jalur untuk menuju lokasi rumah sakit. Pencarian jalur sangat diperlukan bagi pengguna jalan yang tidak tahu jalan mana yang akan dilalui agar sampai ke tempat tujuannya dalam suatu kota. Penghematan waktu dan biaya menjadi faktor lain yang mengharuskan pengguna jalan mencari suatu jalur yang terpendek agar lebih cepat sampai ke tempat tujuan. Oleh karena hal itulah maka pencarian jalur terpendek menjadi suatu permasalahan yang patut untuk diselesaikan secara komputerisasi dengan kecerdasan buatan. Dari permasalahan tersebut, Dirancang suatu sistem yang dapat memetakan tempat rumah sakit di kabupaten Probolinggo. Sehingga dapat membantu masyarakat dalam mencari letak dan kecamatan terdekat menuju lokasi rumah sakit. Pemetaan dan informasi rumah sakit ini akan diangkat pada penlitian yang berjudul " PENCARIAN LOKASI RUMAH SAKIT DI KABUPATEN PROBOLINGGO DENGAN METODA DJIKSTRA BERBASIS SPASIAL"
    corecore