7 research outputs found

    Comparison Data Mining Techniques To Prediction Diabetes Mellitus

    Get PDF
    Diabetes is one of the chronic diseases caused by excess sugar in the blood. Various methods of automated algorithms in various to anticipate and diagnose diabetes. One approach to data mining method can help diagnose the patient's disease. In the presence of predictions can save human life and begin prevention before the disease attacks the patient. Choosing a legitimate classification clearly expands the truth and accuracy of the system as levels continue to increase. Most diabetics know little about the risk factors they face before the diagnosis. This method uses developing five predictive models using 9 input variables and one output variable from the dataset information. The purpose of this study was to compare performance analysis of Naive Bayes, Decision Tree, SVM, K-NN and ANN models to predict diabetes millitu

    PERANCANGAN KLASIFIKASI ALGORITMA NAIVE BAYES PADA DATA PEMILIHAN JURUSAN SISWA

    Get PDF
    Penelitian yang berjudul "Perancangan Algoritma Naive Bayes Dalam Klasifikasi Pemilihan Jurusan Siswa". Penelitian ini bertujuan untuk pembuatan suatu prediski dan impelemtasi metode dalam kalsifikasi Naive Bayes, serta untuk mengevaluasi dampak ketidak seimbangan kelas terhadap kinerja model klasifikasi. Penelitian ini juga menemukan adanya kelebihan sampel data secara tidak sengaja, dan eksperimen dengan menggunakan teknik SMOTE dilakukan untuk mengatasi ketidak seimbangan kelas tersebut. Data pemilihan jurusan siswa dari SMA Negeri 2 Cikarang Selatan digunakan untuk mengidentifikasi ketidak seimbangan kelas. Eksperimen ini membandingkan hasil klasifikasi sebelum dan setelah penerapan teknik SMOTE. Hasil analisis menunjukkan bahwa sebelum menggunakan teknik SMOTE, terdapat ketidak seimbangan kelas yang signifikan dalam data pemilihan jurusan siswa. Ketidak seimbangan ini memiliki dampak negatif terhadap kinerja model klasifikasi, terutama dalam mengenali kelas minoritas. Namun, setelah penerapan teknik SMOTE, ketidak seimbangan kelas berhasil dikurangi dan kinerja model klasifikasi mengalami peningkatan yang signifikan. Recall untuk kelas IPS meningkat menjadi 0,76, sementara recall untuk kelas MIPA tetap tinggi dengan nilai 0,92. Precision untuk kelas IPS meningkat menjadi 0,87, sedangkan precision untuk kelas MIPA tetap stabil di 0,85. Dengan menggunakan precision dan recall, skor F1 mencapai 0,8846. Berdasarkan temuan penelitian ini, dapat disimpulkan bahwa kinerja model klasifikasi dalam memilih jurusan siswa dapat dipengaruhi oleh kelebihan sampel data. Metode SMOTE efektif dalam mengurangi ketidak seimbangan kelas dan meningkatkan kinerja model klasifikasi. Metode Naive Bayes dapat digunakan sebagai alternatif yang efektif dalam memprediksi penjurusan siswa di SMA Negeri 2 Cikarang Selatan setelah menerapkan teknik SMOTE

    Analisis Sentimen Masyarakat Dengan Metode Naïve Bayes dan Particle Swarm Optimization

    Get PDF
    Pemberlakuan Pembatasan Kegiatan Masyarakat (PPKM) merupakan kebijakan yang di terapkan pada 15 Kota diluar pulau Jawa dan pulau Bali yang memiliki status zona merah atau daerah yang memiliki resiko tinggi terhadap paparan kasus COVID-19. Pada tanggal 3 Agustus 2021 kebijakan PPKM darurat di beberapa daearah di kepulauan Jawa dan kepualauan Bali di perpanjang sampai 9 Agustus 2021, perpanjangan kebijakan PPKM darurat menuai banyak komentar dari masyarakat sehingga menimbulkan pro dan kontra pada social media twitter. Penelitian ini bertujuan untuk mengetahui hasil klasifikasi sentimen masyarakat mengenai perpanjangan kebijakan PPKM darurat pada social media twitter dan untuk mengetahui hasil accuracy, precision, recall yang dihasilkan dari metode yang digunakan. Penelitian ini menggunakan metode Naïve Bayes dan Particle Swarm Optimization sebagai feature selection, selain itu terdapat tahap preprocessing yang didalamnya meliputi cleansing, remove duplicate, seleksi data, normalisasi, case folding, tokenizing, filtering, stopwords, stemming, dan labeling. Hasil klasifikasi yang didapat 53,31% pengguna twitter setuju dan 46,69% pengguna twitter tidak setuju dengan perpanjangan kebijakan PPKM darurat. Nilai accuracy yang didapatkan meningkat sebanyak 15,21% dari 77,16% menjadi 92,37%, nilai precision yang didapatkan meningkat sebanyak 3,07% dari 87,33% menjadi 90,40%, dan nilai recall yang didapatkan meningkat sebanyak 30,96% dari 64,42% menjadi 95,38%

    PREDIKSI PERTUMBUHAN PENDUDUK DENGAN MODELL CLUSTERING METODE REGRESI LINEAR

    Get PDF
    Berdasarkan data kependudukan dari Badan Pusat Statistik Kota Cirebon dari tahun 2019 hingga 2022 tercatat jumlah angka kelahiran meningkat dari 2.867 jiwa menjadi 3.713 jiwa. Penelitian ini bertujuan untuk memprediksi pertumbuhan penduduk untuk mengetahui laju pertumbuhan penduduk di masa yang akan datang.  Penelitian ini menggunakan teknik prediksi dan tahapan-tahapan pada data mining untuk memprediksi pertumbuhan penduduk dengan data yang diambil kelahiran dan kematian dengan menggunakan algoritma regresi linear menggunakan tools rapidminer, pengolahan data yang di jadikan dataset dalam penelitian ini, dataset dibagi menjadi dua yaitu 90% data training dan 10% data testing. hasil pengujian yang telah dilakukan bahwa variabel atau atribut yang digunakan dalam penelitian ini (kelahiran dan kematian) berpengaruh signifikan terhadap penelitian ini terbukti dengan menggunakan algoritma regresi linear mampu memberikan hasil yang baik dengan nilai Root Mean Squared Error: 0.998 +/- 0.000 dan Squared Error: 0.996 +/- 0.707. Kesimpulan dari penelitian yang dilakukan dengan menerapkan algoritma regresi linear dapat dilakukan suatu prediksi berdasarkan hubungan fungsional pada variabel atau atribut didalam data tersebut

    ANALISIS PREDIKSI PENJUALAN DENGAN METODE REGRESI LINEAR DI PT. EAGLE INDUSTRY INDONESIA

    No full text
    When making the crucial decision to determine the outcome of a case. The goal of this study is to evaluate the potential for product sales. With the help of data mining, this study evaluates the potential for litigation by using data from several sources, including product, plan, and current data. The current study makes use of the linear regressive algorithm and the rapidminer data processing tool. The dataset that was used for this study was divided into two parts: one half of the data for teaching and one half of the data for research. Using a linear regression algorithm, the results show that the variables or attributes used in the current analysis (produk, actual and plan) did not significantly affect the results. Squared Error is 1313427569.481 +/- 5882150128.134, and Root Mean Squared Error is 36241.241 +/- 0.000. This indicates that the squared Error generates a higher number than the Root Mean Squared Error.Ketika membuat keputusan, kemampuan untuk memprediksi penjualan sangat penting. Tujuan dari penelitian ini adalah untuk memprediksi perencanaan penjualan produk. Dengan data mining yang diambil, penelitian ini memprediksi perencanaan penjualan dengan menggunakan data berupa produk,plan,dan aktual. Penelitian ini menggunakan algoritma regresi linear dan  alat pemrosesan data berupa rapidminer. Dataset yang digunakan untuk penelitian ini dibagi menjadi dua, sembilan puluh persen data pelatihan dan sepuluh persen data pengujian. Dengan menggunakan algoritma regresi linear, hasilnya menunjukkan bahwa variabel atau atribut yang digunakan dalam penelitian ini (produk, aktual, dan plan) tidak berdampak pada hasilnya. Root Mean Squared Error adalah 36241.241 +/- 0.000, dan Squared Error adalah 1313427569.481 +/- 5882150128.134. Hal Ini menunjukkan bahwa squared Error menghasilkan nilai yang tinggi dari Root Mean Squared Error

    PERBANDINGAN ALGORITMA LINEAR REGRESSION, LSTM, DAN GRU DALAM MEMPREDIKSI HARGA SAHAM DENGAN MODEL TIME SERIES

    Get PDF
    Penelitian ini bertujuan untuk memprediksi harga saham dengan membandingkan algoritma Linear Regression, Long Short-Term Memory (LSTM), dan Gated Recurrent Unit (GRU) dengan dataset publik kemudian menentukan performa terbaik dari ketiga algoritma tersebut. Dataset yang diuji bersumber dari Indonesia Stock Exchange (IDX), yaitu dataset harga saham KEJU berbentuk time series dari tanggal 15 November 2019 sampai dengan 08 Juni 2021. Parameter yang digunakan untuk pengukuran perbandingan adalah RMSE (Root Mean Square Error), MSE (Mean Square Error), dan MAE (Mean Absolute Error). Setelah dilakukan proses training dan testing, dihasilkan sebuah analisis bahwa dari hasil perbandingan algoritma yang digunakan, algoritma Gated Recurrent Unit (GRU) memiliki performance paling baik dibandingkan Linear Regression dan Long-Short Term Memory (LSTM) dalam hal memprediksi harga saham, dibuktikan dengan nilai RMSE, MSE, dan MAE dari uji coba GRU paling rendah, yaitu nilai RMSE 0.034, MSE 0.001, dan nilai MAE 0.024
    corecore