12 research outputs found
Klasifikasi Hasil Cardiotocography (CTG) Ibu Hamil untuk Memprediksi Kesehatan Janin
A future mother must want the fetus in her womb to be in a healthy condition. A healthy fetus is one that has optimal growth and has sufficient nutrients at the time it is in the womb. The risk of miscarriage and maternal and fetal deaths can be reduced by monitoring fetal health and staying alert when necessary. CTG is carried out in cases where there is a risk of pregnancy and a relatively worrying birth. It will be easier to make further decisions to reduce health risks at birth if the CTG examination shows a good fetal condition. The study aims to study the comparison of different classification algorithms used in determining the exact values of the fetal health datasets used through Knowledge Discovery in Databases (KDD). The researchers used a data collection of 2126 data points from Kaggle’s website that had 22 variables divided into three categories Normal, Suspect, and Pathological. Prolonged decelerations, abnormal short-term variability, and the percentage of time with abnormally long-term variability are the most significant variables. The results of the study were obtained by dividing the data set into training and trial data, which were then divided into three trials. The results showed that the KNN algorithm had the best accuracy value of 91% in the second trial, the SVM algorithm had the most accurate value of 87% in the first and second trials, the Logistic Regression algorithm had the Best Accuracy Value of 84% in the Second Trial, the Naive Bayes algorithm had the Best Accuracy value of 84%, and the Decision Tree Algorithm had 89% in the First and Second Trials.Seorang calon ibu pasti menginginkan janin dalam kandungannya dalam kondisi sehat. Janin yang sehat adalah janin yang memiliki pertumbuhan yang optimal dan memiliki nutrisi yang cukup pada saat di dalam kandungan. Resiko keguguran dan kematian ibu dan janin dapat dikurangi dengan memantau kesehatan janin dan tetap waspada saat diperlukan. CTG dilakukan dalam kasus di mana ada risiko kehamilan dan kelahiran bayi yang cukup mengkhawatirkan. Akan lebih mudah untuk membuat keputusan lanjut untuk mengurangi risiko kesehatan pada saat melahirkan jika pemeriksaan CTG menunjukkan kondisi janin baik. Penelitian ini bertujuan untuk mempelajari perbandingan algoritma klasifikasi yang berbeda yang digunakan dalam menentukan nilai yang tepat dari dataset kesehatan janin yang digunakan melalui pendekatan Knowledge Discovery in Database (KDD). Peneliti menggunakan kumpulan data 2126 data dari website Kaggle yang memiliki 22 variabel yang dibagi menjadi tiga kategori Normal, Suspect, dan Pathological. Prolonged decelerations, abnormal short term variability, dan percentage of time with abnormal long term variability adalah variabel yang paling signifikan. Hasil penelitian ini didapatkan dengan membagi dataset menjadi data pelatihan dan data uji coba, kemudian dibagi menjadi tiga kali uji coba. Hasil menunjukkan bahwa algoritma KNN memiliki nilai akurasi terbaik sebesar 91% pada uji coba kedua, Algoritma SVM memiliki nilai akurasi terbaik sebesar 87% pada uji coba pertama dan kedua, Algoritma Logistic Regression memiliki nilai akurasi terbaik sebesar 84% pada uji coba kedua, Algoritma Naive Bayes memiliki nilai akurasi terbaik sebesar 84% pada uji coba pertama, Algoritma Decision Tree memiliki nilai akurasi terbaik sebesar 89% pada uji coba pertama dan kedua
APPLICATION OF VGG16 ARCHITECTURE IN WOOD TYPE CLASSIFICATION USING CONVOLUTIONAL NEURAL NETWORK
Wood is an important natural resource in construction and the furniture industry, with various types possessing unique characteristics. The selection of wood types is often done manually, which is prone to errors that can negatively impact the working process, product quality, and the sustainability of the forests that source the wood. Therefore, this research aims to improve classification accuracy through the application of technology. This study utilizes Convolutional Neural Network (CNN) with the VGG16 architecture to process images in analyzing the visual characteristics of wood, with the goal of building a model capable of classifying wood types based on images. The dataset used consists of 1,584 samples of wood images sourced from Kaggle. Four models were tested with variations in the training and validation data splits, as well as the use of Adam and Adamax optimizers, over 100 epochs. Model 1 achieved a training accuracy of 96.68% and a testing accuracy of 98.10%. Model 2, with a training accuracy of 99.47% and a testing accuracy of 98.41%, showed the best performance. Models 3 and 4 also yielded testing accuracies of 97.46% and 97.78%, respectively. The results of this study indicate that the application of CNN with the VGG16 architecture can enhance the effectiveness of wood type classification and contribute to more accurate and efficient wood selection practices
Evaluasi Performa Algoritma C4.5 dan C4.5 Berbasis PSO untuk Memprediksi Penyakit Diabetes
Tubuh manusia terdiri dari berbagai organ yang setiap saat diperlukan oleh manusia untuk beraktivitas. Aktivitas manusia dapat dilakukan jika kesehatan tubuh dalam keadaan baik. Salah satu penyakit yang berakibat komplikasi bahkan berujung kematian adalah diabetes. Penderita penyakit diabetes dari tahun ke tahun meningkat. Hal ini disampaikan oleh artikel Atlas Diabetes yang diterbitkan pada edisi ke-7 tahun 2015 dari IDF menyebutkan ditahun 2015 penderita penyakit diabetes akan mencapai 415 juta pasien dari 220 negara kemudian penderita diabetes akan meningkat menjadi 642 juta pasien di tahun 2040. Bidang keilmuan data mining ikut melakukan riset. Data mining salah satu bidang ilmu yang melakukan pengolahan terhadap data untuk mengetahui pengetahuan baru terhadap suatu kasus. Paper ini dilakukan suatu pemodelan algoritma klasifikasi data mining. Penerapan pemodelan dilakukan dengan menggunakan algoritma C4.5 dan C4.5 berbasis PSO. Penerapan pemodelan akan dilakukan peninjauan berdasarkan nilai performa akurasi dan AUC. Setelah dilakukan peninjauan terhadap kedua pemodelan tersebut, diperoleh hasil bahwa C4.5 berbasis PSO memiliki performa terbaik sehingga masuk pada kategori good classificationKesehatan merupakan suatu hal yang sangat penting bagi setiap manusia. Setiap manusia tentunya selalu berharap agar tetap sehat dan terhindar dari segala penyakit terutama penyakit yang tergolong menakutkan. Penyakit yang tergolong menakutkan diantaranya penyakit Jantung, paru-paru, ginjal, stroke dan diabetes. Penyakit-penyakit tersebut membuat setiap manusia takut dikarenakan selalu berakibat komplikasi bahkan berujung kematian. Seperti penyakit diabetes yang saat ini penderitanya terlihat meningkat. Hal ini disampaikan di atlas diabetes edisi ke-7 tahun 2015 dari IDF menyebutkan bahwa dari 220 negara jumlah penderita diabetes diperkirakan mencapai 415 juta ditahun 2015 dan pada tahun 2040 akan mencapai 642 juta orang. Dengan kasus tersebut mendorong para ilmuan untuk selalu melakukan riset di berbagai bidang pengatahuan. Seperti halnya pengetahuan Data mining yang saat ini semakin marak untuk dilakukan riset. Data mining melakukan pengolahan terhadap data untuk mengetahui pengetahuan baru terhadap suatu kasus. Kemudian pengetahuan tersebut dapat di gunakan sebagai rekomendasi atau mendukung suatu keputusan. Pada paper ini melakukan pemodelan terhadap algoritma data mining. Penerapan pemodelan dilakukan dengan menggunakan algoritma C4.5 dan C4.5 berbasis PSO. Setelah dilakukan perbandingan terhadap kedua pemodelan tersebut diketahui bahwa algoritma C4.5 berbasis PSO memiliki performa terbaik dengan nilai akurasi 82,29% dan nilai AUC sebesar 0,877 sehingga masuk pada kategori good classification
APLIKASI REKOMENDASI REVIEWER TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN METODE KLASIFIKASI K-NEAREST NEIGHBOR
APLIKASI REKOMENDASI REVIEWER TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN METODE KLASIFIKASI K-NEAREST NEIGHBOR
FITRIANI
11451201840
Tanggal Sidang : Januari 2021
Periode Wisuda : November 2021
Jurusan Teknik Informatika
Fakultas Sains dan Teknologi
Universitas Islam Negeri Sultan Syarif Kasim Riau
ABSTRAK
Tugas Akhir adalah suatu karangan ilmiah yang wajib ditulis dan diselesaikan oleh mahasiswa sebagai persyaratan akhir pendidikan akademisnya yang dilakukan mahasiswa secara individu di bawah bimbingan dosen pembimbing. Berdasarkan hasil wawancara dengan Koordinator TA, salah satu kekurangan fitur pada Sistem Informasi Tugas Akhir yaitu masalah penentuan reviewer yang masih secara manual karena Koordinator TA harus mengetahui topik Tugas Akhir yang diajukan dan disesuaikan dengan bidang keahlian reviewer yang akan dipilih sehingga membutuhkan waktu yang lama dan tidak efektif dan terkadang kuota reviewer sudah penuh, maka Koordinator TA memilih reviewer lain yang memungkinkan terjadinya ketidaksesuaian topik Tugas Akhir dengan Bidang keahlian reviewer. Untuk mengatasi hal tersebut, perlu dilakukan pengembangan Sistem Informasi Tugas Akhir pada proses rekomendasi reviewer agar membantu Koordinator TA dalam menentukan Reviewer. Penelitian ini menggunakan konsep text mining dengan metode K-Nearest Neighbor. Data yang digunakan yaitu data Tugas Akhir Mahasiswa dari tahun 2016-2019 yang berjumlah 412 data proposal dikelompokkan berdasarkan bidang keahlian dosen menghasilkan tingkat akurasi sebesar 100% pada nilai k=7, k=9, dan k=11 masing-masing berada pada fold ke-7 dan 10. Penelitian ini membuktikan bahwa metode K-Nearest Neighbor dapat diterapkan untuk rekomendasi reviewer Tugas Akhir berbasis text mining
SISTEM KLASIFIKASI RISIKO PENYAKIT JANTUNG MENGGUNAKAN ALGORITMA C4.5 DENGAN PENDEKATAN SMOTE
Penyakit jantung merupakan penyebab utama kematian di dunia. Organisasi Kesehatan Dunia (WHO), menyatakan setiap tahun lebih dari 17,9 juta orang di dunia meninggal akibat penyakit jantung dan pembuluh darah. Data Riset Kesehatan Dasar (Riskesdas) tahun 2018, prevalensi penyakit jantung di Indonesia sebesar 1,5% artinya 15 dari 1.000 orang Indonesia menderita penyakit jantung. Algoritma C4.5 merupakan salah satu metode data mining yang dapat diterapkan untuk melakukan klasifikasi risiko penyakit jantung. Dataset dalam penelitian ini diperoleh dari situs repositori UCI Machine Learning, dimana dataset tersebut memiliki 918 record dan 12 artibut. Atribut tersebut mencakup Age, Sex, Cp, Trestbps, Chol, Fbs, Restecg, Thalach, Exang, Oldpeak, Slope, kelas. Klasifikasi penyakit jantung menggunakan pendekatan Synthetic Minority Over-sampling Technique. SMOTE berkerja dengan mensintesis sampel baru dari kelas minoritas untuk menyeimbangkan dataset dengan cara sampling ulang sampel kelas minoritas. Klasifikasi risiko penyakit jantung berbasis web dengan implementasi bahasa pemograman PHP diharapkan mampu membantu masyarakat dalam melakukan pengecekan dini mereka yang berisiko tinggi mengidap penyakit jantung sehingga mereka dapat megetahui risiko penyakit yang diderita dan mengantisipasi penyakit tersebut dengan melakukan tidakan preventif. Output sistem ini adalah klasifikasi risiko penyakit jantung dari serta rekomendasi penanganan. Sistem diuji dengan blackbox test, dan tes akurasi menggunakan confusion matrix diperoleh akurasi terbesar dengan rasio 90:10 sebesar 81,37%. Peningkatan menggunakan pendekatan SMOTE adalah sebesar 3,92% menjadi 85,29%
KLASIFIKASI KOMENTAR BULLYING PADA INSTAGRAM MENGGUNAKAN METODE K-NEAREST NEIGHBOR
Bullying merupakan tindakan negatif yang dilakukan oleh orang lain secara terus menerus atau berulang. Tindakan ini kerap kali menyebabkan korban tidak berdaya, terluka secara fisik maupun mental. Tindakan bullying kini telah memasuki dunia sosial media. Instagram menjadi salah satu media sosial yang menjadi tempat terjadinya bullying melalui komentar pada foto/video yang diunggah oleh artis/selebgram. Salah satu cara mewaspadai tindakan bullying adalah dengan cara melihat komentar yang bersangkutan di media sosial (dalam hal ini Instagram) menggunakan metode klasifikasi K-Nearest Neighbor (KNN). Jumlah data yang digunakan sebanyak 1000 data, dimana 500 merupakan bullying dan 500 tidak bully. Dengan adanya penelitian ini diharapkan dapat membantu seseorang untuk mengetahui perbedaan komentar bullying dan yang bukan bullying. Metode KNN telah diuji menggunakan 5 nilai k yang berbeda (7, 9, 11, 13, 15) dengan pembagian data 70:30, 80:20 dan 90:10 menggunakan confusion matrix, dengan masing-masing fold yang dibentuk 4, 5 dan 10 sehingga menghasilkan total 95 fold pengujian, pengujian ini menghasilkan akurasi rata-rata sebesar 58,83%. Akurasi tertinggi terdapat pada k 13 dengan perbandingan 90:10 data pada fold ke 6 yaitu sebesar 77%
Implementasi Metode K-Nearest Neighbor Untuk Mengklasifikasi Jenis Penyakit Katarak
The eyes is one of the five senses that are very important for humans that are used to see the beauty of nature and interact with the environment properly. If the eyes has a problems or diseases, it will be very severe. One of the disorders in the eye is cataract. Cataract if allowed, it will get worse for the sufferer. Therefore, the accuracy of determining the type and layout of early cataract is very important to prevent the more severe effects of cataract. One way to find out early on the type of cataract is by using the mathematical approach to data mining, namely the K-Nearest Neighbor (KNN) method. The concept of the KNN method is to find the nearest neighbor and choose the majority of the classes in the cluster. In this study, the system classified cataract types based on the symptoms experienced by cataract patients at Anutapura Palu Hospital whose research data was obtained from January 2018-March 2018 which amounted to 170 data. The results of this study indicate the accuracy of the KNN method for 170 data at 91.76% Keywords : Cataract, Classification, K-Nearest Neighbor (KNN)</jats:p