75 research outputs found

    PREDIKSI KELULUSAN TEPAT WAKTU MENGGUNAKAN ALGORITMA SVM DAN K-NEAREST NEIGHBOUR BERBASIS PARTICLE SWARM OPTIMIZATION DI STMIK ERESHA

    Get PDF
    ABSTRAK PREDIKSI KELULUSAN TEPAT WAKTU MENGGUNAKAN  ALGORITMA SVM DAN K-NEAREST NEIGHBOUR BERBASIS PARTICLE SWARM OPTIMIZATION  DI STMIK ERESHA. Kelulusan mahasiswa bagi suatu perguruan tinggi menjadi elemen penting untuk penilaian akreditasi. Kelulusan tepat waktu untuk pencapaian gelar magister membutuhkan waktu normal selama 2 tahun atau 4 semester, namun pada kenyataannya banyak mahasiswa yang lulus tidak tepat waktu. Banyak faktor yang menyebabkan ketidaktepatan waktu kelulusan antara lain bersumber dari faktor internal dan faktor external. Pada penelitian ini telah diterapkan  metode klasifikasi dengan algortima Support Vector Machine dan K-Nearest Neighbour berbasis Particle Swarm Optimization untuk mencari metode yang terbaik dalam mengkalisifikasi data mahasiswa di STMIK Eresha. Terkait atribut yang digunakan adalah IPS (Indek Prestasi Sementara), SKS (Satuan Kredit Semester) lulus, usia, asal perguruan tinggi, status mahasiswa, status pernikahan dan status pekerjaan mahasiswa. Hasil penelitian ini menunjukan bahwa algoritma terbaik  antara algoritma  SVM dan K-NN  yaitu algoritma  K-NN dengan  nilai k-7 dengan  nilai akurasi 78,73%, sedangkan algortima SVM sebesar 73,41% dan setelah penambahan algortima PSO akurasi terbaik terdapat pada nilai K-9 dengan akurasi 80,21% dengan penambahan nilai akurasi sebesar 1,48 %. Hasil penelitian ini menunjukan bahwa algortima K-NN menjadi algoritma yang tepat dibandingkan dengan algortima SVM untuk memprediksi kelulusan tepat waktu di STMIK Eresha. Kata Kunci: Kelulusan tepat waktu, Prediksi, SVM, K-NN, PSO  ABSTRACTStudent graduation for university becomes an important element for accreditation assessment. Timely graduation to achieve a master's degree requires normal time for 2 years or 4 semesters, but in reality many students do not graduate on time. Many factors that cause the inaccuracy of graduation time include internal and external factors. In this study a classification method with the Support Vector Machine and K-Nearest Neighbour s based on Particle Swarm Optimization has been applied to find the best method for classifying student data at Eresha STMIK. Related to the attributes used are GPA (Great Point Average), credit passed, age, university origin, student status, marital status and student employment status. The results of this study indicate that the best algorithm between the SVM and K-NN algorithm is the K-NN algorithm with k-7 value with an accuracy value of 78.73%, while the SVM algorithm is 73.41% and after the addition of the PSO algorithm the best accuracy is found in the value K-9 with an accuracy of 80.21% with the addition of an accuracy value of 1.48%. The results of this study indicate that the K-NN algorithm is the right algorithm compared to the SVM algorithm to predict timely graduation at STMIK Eresha.Keywords: Timely graduation prediction, SVM, -NN, PSO 

    PREDIKSI KELULUSAN TEPAT WAKTU MENGGUNAKAN ALGORITMA SVM DAN K-NEAREST NEIGHBOUR BERBASIS PARTICLE SWARM OPTIMIZATION DI STMIK ERESHA

    Get PDF
    ABSTRAK PREDIKSI KELULUSAN TEPAT WAKTU MENGGUNAKAN  ALGORITMA SVM DAN K-NEAREST NEIGHBOUR BERBASIS PARTICLE SWARM OPTIMIZATION  DI STMIK ERESHA. Kelulusan mahasiswa bagi suatu perguruan tinggi menjadi elemen penting untuk penilaian akreditasi. Kelulusan tepat waktu untuk pencapaian gelar magister membutuhkan waktu normal selama 2 tahun atau 4 semester, namun pada kenyataannya banyak mahasiswa yang lulus tidak tepat waktu. Banyak faktor yang menyebabkan ketidaktepatan waktu kelulusan antara lain bersumber dari faktor internal dan faktor external. Pada penelitian ini telah diterapkan  metode klasifikasi dengan algortima Support Vector Machine dan K-Nearest Neighbour berbasis Particle Swarm Optimization untuk mencari metode yang terbaik dalam mengkalisifikasi data mahasiswa di STMIK Eresha. Terkait atribut yang digunakan adalah IPS (Indek Prestasi Sementara), SKS (Satuan Kredit Semester) lulus, usia, asal perguruan tinggi, status mahasiswa, status pernikahan dan status pekerjaan mahasiswa. Hasil penelitian ini menunjukan bahwa algoritma terbaik  antara algoritma  SVM dan K-NN  yaitu algoritma  K-NN dengan  nilai k-7 dengan  nilai akurasi 78,73%, sedangkan algortima SVM sebesar 73,41% dan setelah penambahan algortima PSO akurasi terbaik terdapat pada nilai K-9 dengan akurasi 80,21% dengan penambahan nilai akurasi sebesar 1,48 %. Hasil penelitian ini menunjukan bahwa algortima K-NN menjadi algoritma yang tepat dibandingkan dengan algortima SVM untuk memprediksi kelulusan tepat waktu di STMIK Eresha. Kata Kunci: Kelulusan tepat waktu, Prediksi, SVM, K-NN, PSO  ABSTRACTStudent graduation for university becomes an important element for accreditation assessment. Timely graduation to achieve a master's degree requires normal time for 2 years or 4 semesters, but in reality many students do not graduate on time. Many factors that cause the inaccuracy of graduation time include internal and external factors. In this study a classification method with the Support Vector Machine and K-Nearest Neighbour s based on Particle Swarm Optimization has been applied to find the best method for classifying student data at Eresha STMIK. Related to the attributes used are GPA (Great Point Average), credit passed, age, university origin, student status, marital status and student employment status. The results of this study indicate that the best algorithm between the SVM and K-NN algorithm is the K-NN algorithm with k-7 value with an accuracy value of 78.73%, while the SVM algorithm is 73.41% and after the addition of the PSO algorithm the best accuracy is found in the value K-9 with an accuracy of 80.21% with the addition of an accuracy value of 1.48%. The results of this study indicate that the K-NN algorithm is the right algorithm compared to the SVM algorithm to predict timely graduation at STMIK Eresha.Keywords: Timely graduation prediction, SVM, -NN, PSO 

    Penerapan Adaboost untuk Penyelesaian Ketidakseimbangan Kelas pada Penentuan Kelulusan Mahasiswa dengan Metode Decision Tree

    Full text link
    Universitas Pamulang salah satu perguruan tinggi yang memiliki jumlah mahasiswa yang besar, namun dalam data histori terdapat masalah dengan jumlah kelulusan yang tepat waktu dan terlambat (tidak tepat waktu ) yang tidak seimbang. Metode decision tree memiliki kinerja yang baik dalam menangani klasifikasi tepat waktu atau terlambat tetapi decision tree memiliki kelemahan dalam derajat yang tinggi dari ketidakseimbangan kelas (class imbalance). Untuk mengatasi masalah tersebut dapat dilakukan dengan sebuah metode yang dapat menyeimbangkan kelas dan meningkatkan akurasi. Adaboost salah satu metode boosting yang mampu menyeimbangkan kelas dengan memberikan bobot pada tingkat error klasifikasi yang dapat merubah distribusi data. Eksperimen dilakukan dengan menerapkan metode adaboost pada decision tree (DT) untuk mendapatkan hasil yang optimal dan tingkat akurasi yang baik. Hasil ekperimen yang diperoleh dari metode decision tree untuk akurasi sebesar 87,18%, AUC sebesar 0,864, dan RMSE sebesar 0,320, sedangkan hasil dari decision tree dengan adaboost (DTBoost) untuk akurasi sebesar 90,45%, AUC sebesar 0,951, dan RMSE sebesar 0,273, maka dapat disimpulkan dalam penentuan kelulusan mahasiswa dengan metode decision tree dan adaboost terbukti mampu menyelesaikan masalah ketidakseimbangan kelas dan meningkatkan akurasi yang tinggi dan dapat menurunkan tingkat error klasifikasi

    Pemanfaatan Algoritma Naïve Bayes dan K-Nearest Neighbor Untuk Klasifikasi Jurusan Siswa Kelas XI

    Get PDF
    Sekolah Menengah Atas atau biasa disebut sebagai SMA dalam proses penjurusan siswa dilakukan setiap awal tahun pelajaran. Ada 2 (dua) jurusan yaitu IPA dan IPS. Dalam melakukan penjurusan IPA maupun IPS siswa kelas XI, saat ini masih dilakukan dengan berdasarkan hasil nilai rerata dari beberapa mata pelajaran tertentu sehingga sering kali menyebabkan ketidaksesuaian minat dan bakat siswa terhadap jurusan. Tujuan penelitian ini adalah untuk membandingkan algoritma Naïve Bayes dan K-Nearest Neighbor yang memiliki akurasi tertinggi dalam melakukan klasifikasi jurusan IPA dan IPS sehingga membantu pihak sekolah dalam proses klasifikasi jurusan siswa kelas XI. Data siswa yang digunakan pada penelitian ini adalah data nilai semester 2 (dua) dengan jumlah 277 record dan menggunakan 4 (empat) atribut dari nilai mata pelajaran antara lain PPKN, Sejarah, Prakarya dan PAI. Salah satu tools yang digunakan untuk membantu proses analisis data pada penelitian ini adalah Rapidminer. Metode penelitian dilakukan mulai tahap preprocessing, training data, klasifikasi menggunakan algortima Naïve Bayes dan K-Nearest Neighbor, model data dan mengukur performance atau evaluasi. Hasil penelitian menunjukkan algoritma Naïve Bayes memiliki akurasi sebesar 81.82% dengan sampel data sebanyak 55 data dari 277 data. Sedangkan Algoritma K-Nearest Neighbor menunjukkan akurasi sebesar 92.73% dengan sample data yang sama. Hasil kedua algortima menunjukkan algoritma terbaik dengan urutan pertama K-Nearest Neighbor dan urutan kedua Naïve Bayes, tidak ada perbedaan signifikan karena nilai alpha dibawah 0.05. Secara keseluruhan dapat disimpulkan bahwa dengan memanfaatkan algoritma K-Nearest Neighbor memiliki tingkat akurasi yang lebih tinggi dari pada Algortima Naïve Bayes pada proses klasifikasi penjurusan IPA maupun IPS pada kelas XI SMA menggunakan algoritma klasifikasi sehingga sesuai dengan minat, bakat dan potensi diri siswa dalam penentuan jurusan sehingga memberikan manfaat dan membantu pihak sekolah menjadi lebih cepat dalam pengklasifikasiannya

    Prediksi kelulusan mahasiswa berbasis klasifikasi Data Mining

    Get PDF
    ABSTRAK Jumlah mahasiswa yang mendaftar di Universitas Islam Negeri Maulana Malik Ibrahim Malang terus meningkat, namun tidak semua mahasiswa dapat lulus tepat waktu sesuai dengan masa studi yang telah ditentukan, sehingga terjadi penumpukan mahasiswa yang belum lulus sesuai dengan periode kelulusan mereka. Salah satu aspek yang dievaluasi dalam proses akreditasi Program Studi adalah tingkat kelulusan mahasiswa. Selain itu, untuk setiap semester, Program Studi juga wajib melaporkan data pendidikan ke DIKTI, dan kelulusan mahasiswa menjadi salah satu faktor yang diperhitungkan dalam laporan tersebut. Terdapat ketidakseimbangan antara jumlah mahasiswa yang lulus setiap tahun dan jumlah mahasiswa baru yang diterima. Untuk mengatasi masalah ini, perlu dilakukan prediksi kelulusan mahasiswa agar dapat menentukan apakah mereka akan lulus tepat waktu. Dalam konteks ilmu pengetahuan dan analisis data, prediksi sering digunakan untuk membuat perkiraan tentang masa depan berdasarkan data dan informasi yang ada. Model klasifikasi dalam memprediksi kelulusan mahasiswa diantaranya metode Naive Bayes, Support Vector Machine SVM, dan Random Forest, serta seberapa besar tingkat akurasi dari ketiga metode tersebut. Dari hasil eksperimen dan evaluasi model yang dilakukan, dengan data mahasiswa Program Studi Teknik Informatika berjumlah 458 dengan pembagian data training dan data testing secara acak dengan beberapa percobaan diperoleh nilai akurasi rata-rata untuk model SVM memiliki akurasi tertinggi, mencapai 82% dan Random Forest juga memiliki akurasi yang baik yaitu 80% sedangkan model Naïve Bayes memiliki akurasi yang lebih rendah, yaitu 71%. مستخلص البحث كل عام، يزداد عدد الطلاب الذين يتم قبولهم في جامعة مولانا مالك إبراهيم الإسلامية الحكومية مالانج، ولكن بعض الطلاب لا يستطيعون التخرج في الوقت المحدد وفقًا لفترة الدراسة التي قرّرتها الجامعة، مما يؤدي إلى تراكم الطلاب الذين لم يتخرجوا وفقًا لمتطلباتهم الدراسية، بينما إحدى الجوانب التي يتم تقويمها في عملية الاعتماد الأكاديمي للبرنامج الدراسي هي معدل تخرج الطلاب. بالإضافة إلى ذلك، يجب على برنامج الدراسة في كل فصل دراسي أن يقدم تقارير بيانات التعليم إلى التعليم العالي، ويكون تخرج الطلاب عاملا من العوامل المحسوبة في هذا التقرير. يوجد هناك عدم التوازن بين عدد المتخرّجين والطلاب الجدد الّذين يتم قبولهم في كل عام. فلحلّ هذه المشكلة، تحتاج الجامعة إلى التنبؤات عن تخرج الطلاب لتحديد ما إذا كانوا سيتخرجون في الوقت المناسب. في سياق علم البيانات وتحليل البيانات، يُستخدم التنبؤ كثيرًا لعمل تقديرات حول المستقبل على أساس البيانات والمعلومات المتاحة. ومن نماذج التصنيفات المستخدمة في التنبؤ بتخرج الطلاب هي Naive Bayes، Support Vector Machine SVM، وRandom Forest، وما مدى مستوى دقة ثلاثة تلك الطرق. ومن بيانات نتائج التجارب وتقويم النماذج التي قامه الباحث هي: تمت باستخدام بيانات 458 طالبًا من برنامج دراسة الهندسة المعلوماتية، وتقسيمهم إلى بيانات تدريب واختبار بشكل عشوائي في عدة تجارب تبين أن نموذج SVM يحقق أعلى دقة، بلغت حوالي 82٪. بينما تظهر Random Forest أيضًا دقة جيدة تقدر بحوالي 80٪، في حين يظهر نموذج Naïve Bayes دقة أقل، تقدر بحوالي 71٪. ABSTRACT The number of students registering at the Maulana Malik Ibrahim State Islamic University of Malang continues to increase, but not all students can graduate on time according to the predetermined study period, resulting in a buildup of students who have not graduated according to their graduation period. One of the aspects evaluated in the Study Programme accreditation process is the student graduation rate. In addition, for each semester, the Study Programme is also required to report educational data to DIKTI, and student graduation is one of the factors taken into account in the report. There is an imbalance between the number of students who graduate each year and the number of new students admitted. To overcome this problem, it is necessary to predict student graduation in order to determine whether they will graduate on time. In the context of science and data analysis, prediction is often used to make estimates about the future based on existing data and information. Classification models in predicting student graduation include the Naive Bayes method, Support Vector Machine SVM, and Random Forest, and how much accuracy the three methods have. From the results of experiments and model evaluations carried out, with data from 458 students of the Informatics Engineering Study Program, by randomly dividing the training data and test data into several experiments, the average accuracy value of the SVM model was obtained which had the highest accuracy, reaching 82% and Random Forest also has good accuracy, namely 80%, while the Naïve Bayes model has lower accuracy, namely 71%

    Prediction of Feasibility of Entrepreneurial Proposals in Student Creativity Program

    Get PDF
    Student Creativity Program is a program organized by the Directorate of Learning and Student Affairs, Directorate General of Higher Education, Research, and Technology, Ministry of Education, Culture, Research and Technology as a national level student creativity event as an effort to grow, accommodate, and realize students' creative and innovative ideas. Based on 2017-2021 data, each year an average of 63,337 proposals are received, administrative and substance evaluations involve complex assessment components and are carried out manually so that it takes a relatively long time in the calculation process. Then a special method is needed that speeds up the processing of assessment data. This research was conducted on the substance of the Entrepreneurship Sector to predict the feasibility of a proposal to get funding applying data mining with the Naive Bayes Classifier (NBC) and K-Nearest Neighbor (K-NN) algorithms with a comparison between Euclidean Distance and Manhattan Distance. From the results, it is known that NBC produces 96.49% accuracy and 0.912 Kappa. K-NN with the largest Euclidean Distance calculation in K-5, K-7 and K9 with an accuracy of 99.04% and Kappa 0.975, K-NN Manhattan Distance calculation produces the greatest accuracy of all the methods used by researchers, namely 100% and Kappa 1,00 categorized as Excellent. So the conclution is that the K-NN method with K-5 which produces the greatest accuracy and Kappa can be recommended to PKM stakeholders in funding feasibility algorithms

    Prediction of Feasibility of Entrepreneurial Proposals in Student Creativity Program

    Get PDF
    Student Creativity Program is a program organized by the Directorate of Learning and Student Affairs, Directorate General of Higher Education, Research, and Technology, Ministry of Education, Culture, Research and Technology as a national level student creativity event as an effort to grow, accommodate, and realize students' creative and innovative ideas. Based on 2017-2021 data, each year an average of 63,337 proposals are received, administrative and substance evaluations involve complex assessment components and are carried out manually so that it takes a relatively long time in the calculation process. Then a special method is needed that speeds up the processing of assessment data. This research was conducted on the substance of the Entrepreneurship Sector to predict the feasibility of a proposal to get funding applying data mining with the Naive Bayes Classifier (NBC) and K-Nearest Neighbor (K-NN) algorithms with a comparison between Euclidean Distance and Manhattan Distance. From the results, it is known that NBC produces 96.49% accuracy and 0.912 Kappa. K-NN with the largest Euclidean Distance calculation in K-5, K-7 and K9 with an accuracy of 99.04% and Kappa 0.975, K-NN Manhattan Distance calculation produces the greatest accuracy of all the methods used by researchers, namely 100% and Kappa 1,00 categorized as Excellent. So the conclution is that the K-NN method with K-5 which produces the greatest accuracy and Kappa can be recommended to PKM stakeholders in funding feasibility algorithms

    PENERAPAN K-OPTIMAL PADA ALGORITMA MODIFIED K–NEAREST NEIGHBOR (MK-NN) UNTUK KLASIFIKASI KELULUSAN MAHASISWA (STUDI KASUS : TEKNIK INFORMATIKA UIN SUSKA RIAU)

    Get PDF
    MELDAWATI PUTRI (2021) : PENERAPAN K-OPTIMAL PADA ALGORITMA MODIFIED K–NEAREST NEIGHBOR (MK-NN) UNTUK KLASIFIKASI KELULUSAN MAHASISWA (STUDI KASUS : TEKNIK INFORMATIKA UIN SUSKA RIAU) Kelulusan mahasiswa dapat menimbulkan masalah yang begitu serius terhadap kualitas penyelenggaraan proses pembelajaran pada sebuah program studi, salah satu ancaman bagi pihak program studi adalah masih banyak mahasiswa yang memperoleh kelulusan tidak tepat waktu. Kelulusan tidak tepat waktu pada jurusan Teknik Informatika Universitas Islam Negeri Sultan Syarif Kasim Riau memperoleh 86% dari angkatan 2011 sampai 2015 bahkan bisa lebih jika tidak ada penanganan serius. Diperlukan klasifikasi untuk melihat ketepatan hasil kelulusan mahasiswa menggunakan penerapan K-Optimal dengan dibangunnya sebuah sistem untuk algoritma Modified K–Nearest Neighbor (MKNN). setiap nilai K yang dihasilkan dengan akurasi terbaik akan disimpan dan digunakan pada sebuah parameter nilai K pada proses prediksi data uji pada algoritma Modified K– Nearest Neighbor (MK-NN) serta atribut yang digunakan yaitu Indeks Prestasi Semester (IP 1-4), Satuan Kredit Semester Tempuh (SKS Tempuh 1-4), Indeks Prestasi Kumultif (IPK) serta keterangan lulus tepat waktu atau lulus tidak tepat waktu pada data mahasiswa angkatan 2011 sampai 2015. Hasil akurasi K-Optimal terbaik terdapat pada K=1 pada percobaan ke-8 dengan hasil nilai akurasi sebesar 88.22682% dan nilai akurasi pada algoritma Modified K–Nearest Neighbor (MK-NN) menghasilkan ketepatan untuk kurikulum 2011 sebanyak 62 dari 63 data dengan akurasi sebesar 96.83%, sedangkan kurikulum 2015 menghasilkan ketepatan sebanyak 3 dari 3 data dengan nilai akurasi sebesar 100%. Kata kunci : Kelulusan Mahasiswa, K-Fold Cross Validation , Klasifikasi, MK-N

    Analisis Klasifikasi Konsentrasi Mahasiswa Menggunakan Algoritma K-Nearest Neighbor

    Get PDF
    Hamzanwadi University located in West Nusa Tenggara boasts a Faculty of Engineering, which plays a pivotal role in delivering top-notch higher education. This faculty offers four highly coveted programs—Informatics Engineering, Information Systems, Computer Engineering, and Environmental Engineering—that attract a significant number of students. The increase in enrollment in these programs underscores the faculty's success, particularly owing to the promising job opportunities in these fields. Nevertheless, students often encounter intricate challenges when selecting their area of specialization that resonates with their interests and capabilities. In addressing this concern, the Faculty of Engineering at Hamzanwadi University provides diverse concentration options like Data Science, RPL, and Multimedia. To aid students in making informed decisions regarding their study concentration, this study employs the K-Nearest Neighbor (KNN) algorithm to analyze the classification of student concentrations. This research adopts an experimental approach and utilizes data collection methods such as observation, interviews, and surveys. The dataset comprises seven attributes including NIM, Gender, GPA, Data Science Course Grade, RPL Course Grade, and Multimedia Course Grade, processed using the KNN algorithm through Google Colab. The research outcomes reveal that with k=2 and 8-fold cross-validation, the achieved accuracy stands at 67%

    Implementasi SEM-Multiple Linear Regression dalam Prediksi Jumlah Pendaftaran Mahasiswa Baru di Perguruan Tinggi XYZ

    Get PDF
    Bagi perguruan tinggi swasta (PTS), tidak menutup kemungkinan semakin banyak mahasiswa baru yang diterima, maka PTS tersebut akan terus eksis. Sebaliknya, jika PTS gagal menambah atau bahkan menurunkan jumlah mahasiswa baru setiap tahunnya, hal itu bisa berubah dengan tidak mampu beroperasi lagi bagi PTS dikarenakan pendapatan mereka satu-satunya hanya dari biaya kuliah mahasiswa. Tujuan penelitian ini diantaranya penentuan faktor-faktor yang mendukung prediksi pendaftaran mahasiswa di perguruan tinggi berdasarkan data sebelumnya, mengimplementasikan Multiple Linear Regression terhadap pendaftaran mahasiswa di perguruan tinggi, dan menganalisis tingkat akurasi hasil prediksi pendaftaran mahasiswa di perguruan tinggi. Penelitian ini menggunakan algoritma Multiple Linear Regression. Sebelum melakukan tahap prediksi, terlebih dahulu menentukan faktor-faktor yang mempengaruhi jumlah penerimaan mahasiswa baru menggunakan Structural Equation Modeling (SEM) dengan faktor promosi, biaya Pendidikan, tingkat kelulusan, informasi pendafataran, jenis kelamin dan nilai akreditasi. Berdasarkan hasil SEM didapat faktor promosi, biaya Pendidikan, tingkat kelulusan, informasi pendafataran, dan nilai akreditasi, dapat dilanjutkan ke tahap berikutnya karena faktor tersebut berpengaruh signifikan terhadap mahasiswa baru, sedangkan hasil prediksi menggunakan Multiple Linear Regression didapat bahwa nilai prediksi untuk tahun berikutnya adalah 486 orang calon mahasiswa baru, dengan hasil perhitungan MSE adalah 2657,79 dan MAE adalah 42.29, dimana semakin kecil hasil nilai MSE dan MAE yang diperoleh maka kesalahan pada sistem juga semakin sedikit serta R2 adalah 0.9280 (92,80%) menandakan bahwa pengaruh semua struktur eksogen pada struktur endogen kuat
    corecore