Jurnal Buana Informatika
Not a member yet
543 research outputs found
Sort by
Implementasi LightGBM dengan KNN Imputation untuk Deteksi Dini Risiko Kehamilan: Implementation of LightGBM with KNN Imputation for Early Detection of Pregnancy Risk
Risiko kehamilan merupakan isu penting dalam kesehatan maternal yang berkontribusi pada tingginya angka kesakitan dan kematian ibu serta bayi, sehingga diperlukan metode analisis yang akurat untuk deteksi dini. Penelitian ini bertujuan untuk mengembangkan dan mengevaluasi model klasifikasi tingkat risiko kehamilan dengan menggunakan K-Nearest Neighbor Imputation (KNNI) untuk menangani missing value dan LightGBM sebagai metode utama. Model dioptimalkan melalui uji parameter dan dievaluasi menggunakan Stratified K-Fold Cross-Validation (SKCV). Hasil penelitian menunjukkan bahwa model yang diusulkan mampu mencapai akurasi sebesar 97,64%, sehingga menunjukkan kinerja yang sangat baik dalam mengklasifikasikan tingkat risiko kehamilan. Dengan demikian, pendekatan yang digunakan memiliki potensi untuk dikembangkan sebagai sistem pendukung keputusan dalam bidang kesehatan maternal.
Pregnancy risks are a critical issue in maternal health that contributes to high rates of maternal and infant morbidity and mortality; therefore, accurate analytical methods are needed for early detection. This study aims to develop and evaluate a pregnancy risk classification model using K-Nearest Neighbor Imputation (KNNI) to handle missing values and LightGBM as the primary method. The model was optimized through parameter tuning and evaluated using Stratified K-Fold Cross-Validation (SKCV). The results show that the proposed model achieved an accuracy of 97.64%, demonstrating excellent performance in classifying pregnancy risk levels. Thus, the approach used has the potential to be developed as a decision support system in the field of maternal health
Employee Performance Evaluation Using RECA-based Weighting and RAWEC: Evidence from Textile Manufacturing: Evaluasi Kinerja Karyawan Menggunakan Pembobotan Berbasis RECA dan RAWEC: Studi Empiris pada Industri Manufaktur Tekstil
Employee performance evaluation in the textile industry production division still faces issues of subjectivity, limited indicators, and inconsistency in ranking that do not yet reflect the real contribution of employees. This study aims to assess employee performance using a multi-criteria decision-making approach by integrating the RECA method for determining objective criterion weights and the RAWEC method for generating performance rankings. Performance data is collected based on several key criteria, namely work productivity, production quality, timeliness, work discipline, and production error rates, which reflect the operational conditions in the textile manufacturing environment. The analysis results indicate that the applied approach clearly distinguishes employee performance and produces a stable ranking, with Gina taking first place with a final score of 0.483 and Citra with a score of 0.2933. These findings indicate that RECA and RAWEC support more reliable and data-driven managerial decisions in the textile industry.
Evaluasi kinerja karyawan di divisi produksi industri tekstil masih menghadapi masalah subjektivitas, keterbatasan indikator, dan ketidakkonsistenan pemeringkatan yang belum mencerminkan kontribusi nyata karyawan. Penelitian ini bertujuan untuk menilai kinerja karyawan menggunakan pendekatan pengambilan keputusan multi-kriteria dengan mengintegrasikan metode RECA untuk menentukan bobot kriteria objektif dan metode RAWEC untuk menghasilkan peringkat kinerja. Data kinerja dikumpulkan berdasarkan beberapa kriteria utama, yaitu produktivitas kerja, kualitas produksi, ketepatan waktu, disiplin kerja, dan tingkat kesalahan produksi, yang mencerminkan kondisi operasional pada lingkungan manufaktur tekstil. Hasil analisis menunjukkan bahwa pendekatan yang diterapkan mampu membedakan kinerja karyawan secara jelas dan menghasilkan pemeringkatan yang stabil, di mana Gina menempati peringkat pertama dengan nilai akhir 0.483 Citra dengan nilai 0,2933. Temuan ini menunjukkan RECA dan RAWEC mendukung keputusan manajerial yang lebih andal dan berbasis data di industri tekstil
LexIndoLLM: Large Language Model untuk Konsultasi Regulasi Daerah di Indonesia: LexIndoLLM: A Large Language Model for Consulting Local Regulations in Indonesia
Large Language Model (LLM) berpotensi meningkatkan akses terhadap layanan konsultasi regulasi daerah, tetapi model generik masih sering menghasilkan jawaban yang kurang akurat pada dokumen hukum Indonesia yang panjang, formal, dan kontekstual. Penelitian ini mengembangkan LexIndoLLM, model ringan berbasis Llama 3.2-1B, melalui fine-tuning bertahap pada 393 dokumen regulasi Kabupaten Kutai Kartanegara dan integrasi Retrieval-Augmented Generation (RAG) berbasis FAISS. Evaluasi dilakukan menggunakan RAGAS, perplexity, ROUGE-L, dan metrik efisiensi inferensi. Hasil menunjukkan bahwa pendekatan yang diusulkan meningkatkan kualitas jawaban, ditandai dengan penurunan perplexity dari 9,13 menjadi 1,74, peningkatan ROUGE-L dari 0,2058 menjadi 0,4429, serta nilai faithfulness 0,77 dan answer correctness 0,66. Waktu respons rata-rata di bawah 3,4 detik sehingga cocok untuk deployment lokal. Temuan ini menunjukkan bahwa model ringan yang dipadukan dengan retrieval layak digunakan untuk konsultasi regulasi daerah pada lingkungan komputasi terbatas.
Large Language Models (LLMs) have the potential to improve access to local regulatory consultation services, yet general-purpose models often produce inaccurate responses when handling Indonesian legal documents that are lengthy, formal, and highly contextual. This study develops LexIndoLLM, a lightweight model based on Llama 3.2-1B, through staged fine-tuning on 393 local regulatory documents from Kutai Kartanegara Regency and the integration of FAISS-based Retrieval-Augmented Generation (RAG). The model was evaluated using RAGAS, perplexity, ROUGE-L, and inference efficiency metrics. The results show that the proposed approach improves answer quality, as indicated by a reduction in perplexity from 9.13 to 1.74, an increase in ROUGE-L from 0.2058 to 0.4429, and faithfulness and answer correctness scores of 0.77 and 0.66, respectively. The system maintains an average response time under 3.4 seconds, suitable for local deployment. These findings indicate that a lightweight model combined with retrieval is feasible for local regulatory consultation in resource-constrained environments
Bayesian Tuning terhadap Model Pre-Trained PEGASUS untuk Peringkas Teks Informatif Berbahasa Indonesia: Bayesian Tuning of a Pre-Trained PEGASUS Model for Indonesian Informative Text Summarization
Penelitian ini mengeksplorasi peringkasan teks abstraktif untuk berita berbahasa Indonesia dengan melakukan fine-tuning pada model PEGASUS menggunakan Bayesian Optimization dan input kontekstual yang diperkaya. Dataset berisi 286.277 pasangan dokumen–ringkasan yang diambil dari JPNN.com, lengkap dengan judul dan kata kunci yang digunakan untuk membentuk input informatif. Evaluasi menggunakan ROUGE dan BERTScore menunjukkan peningkatan substansial dari informative input: +16.75% (ROUGE-1), +27.25% (ROUGE-2), +18.58% (ROUGE-L & ROUGE-LSUM), dan +2.7% (BERTScore-F1) dibandingkan dengan input reguler. Analisis saliency menunjukkan bobot kalimat kontekstual yang konsisten tinggi. Penerapan hyperparameter tuning Bayesian melalui Optuna memberikan kenaikan marginal (+1.21% ROUGE-1, +2.1% ROUGE-2, +1.38% ROUGE-L & ROUGE-LSUM, +0.23% BERTScore) yang dipengaruhi oleh jumlah trial terbatas (12) dan ruang pencarian yang sempit. Temuan ini menegaskan efektivitas desain input kontekstual dan potensi hyperparameter tuning untuk peringkasan berbasis Transformer pada bahasa dengan sumber daya terbatas.
This research explores abstractive text summarization of Indonesian news by fine-tuning the PEGASUS model using Bayesian optimization and enriched contextual inputs. The dataset contains 286,277 document-summary pairs scraped from JPNN.com, including titles and keyphrases used to construct informative input. Each section is marked with special tokens such as <TITLE>, <KEYPHRASES>, and <ARTICLE>. Evaluation using ROUGE and BERTScore shows that informative input substantially improves performance: +16.75% (ROUGE-1), +27.25% (ROUGE-2), +18.58% (ROUGE-L and ROUGE-Lsum), and +2.7% (BERTScore-F1) compared with regular input. Saliency analysis also shows consistently high sentence weights for contextual input components. Additionally, Bayesian hyperparameter tuning via Optuna yields marginal gains (+1.21% ROUGE-1, +2.1% ROUGE-2, +1.38% ROUGE-L & ROUGE-Lsum, +0.23% BERTScore) due to a limited number of trials (12) and a constrained hyperparameter search space. These findings demonstrate the effectiveness of contextual input design and the potential of Bayesian tuning to improve Transformer-based summarization for low-resource languages
Penerapan State Pattern dan Retrieval-based Chatbot pada NPC Game Visual Novel di Unity Engine
Penelitian ini membahas integrasi antara State Design pattern dan chatbot berbasis retrieval dalam Non-Playable Character (NPC) untuk meningkatkan interaksi pemain dalam Unity Game Engine. NPC dirancang memiliki tiga kondisi emosional utama: Happy, Normal, dan Angry, yang masing-masing memengaruhi dataset percakapan yang digunakan. Chatbot menggunakan algoritma cosine similarity untuk mencocokkan masukan pemain dengan respons yang paling relevan dari dataset berdasarkan emosi aktif. Metodologi penelitian yang digunakan adalah model waterfall, dengan tahapan implementasi, pengujian transisi state, dan evaluasi respons chatbot. Hasil menunjukkan akurasi pemilihan respons sebesar 95,65% dari 230 data uji, serta tingkat adaptabilitas chatbot sebesar 45% terhadap konteks emosi. Penelitian ini membuktikan bahwa integrasi state emosi dengan chatbot berbasis retrieval mampu menciptakan interaksi NPC yang lebih realistis dan kontekstual, meskipun masih terdapat keterbatasan dalam pemahaman semantik dan keberagaman respons
Pengaruh Jenis Stopwords terhadap Akurasi Model Multinomial Naïve Bayes dalam Proses Sentimen Analisis
Penerapan dari machine learning dalam bisnis telah memungkinkan produsen atau penjual untuk mengetahui kualitas produk dagangan mereka berdasarkan pada analisis ulasan pelanggan menggunakan Sentiment Analysis (SA). Penelitian ini bertujuan untuk mengetahui pengaruh dari jenis stopword terhadap akurasi dari metode Multinomial Naïve Bayes (MNB) dalam proses SA. Terdapat 10 jenis stopword yang digunakan dalam penelitian ini: umum, konjungsi, bahasa gaul, keterangan waktu, kata benda, kata ganti orang, kata seruan, kata kerja, dan kata dengan satu huruf. Berdasarkan pada uji Friedman pada tiga ulasan dari tiga produk sepatu, diketahui bahwa menghilangkan stopword konjungsi (MNB-konjungsi) dapat meningkatkan akurasi model MNB dalam proses SA sebesar 1%. Hasil uji T pada dua dari tiga himpunan data menunjukkan bahwa MNB-konjungsi memiliki akurasi yang lebih baik ketimbang MNB tanpa menghilangkan stopword.
Perbaikan Kualitas Gambar untuk Deteksi Plat Nomor Kendaraan dengan Metode Super Resolution GANs
Penelitian tentang pembelajaran mendalam yang dapat meningkatkan resolusi gambar dapat diterapkan di berbagai bidang. Salah satu implementasinya adalah dalam deteksi plat nomor kendaraan. Dengan menggunakan teknologi Deep Learning SRGAN yang mampu meningkatkan resolusi gambar, membuat proses pengenalan objek menjadi lebih mudah. Dalam studi ini, model dilatih dengan 1.070 gambar, termasuk 535 gambar beresolusi rendah dan 535 gambar beresolusi tinggi. Model kemudian diuji dengan 10 gambar beresolusi rendah. Hasilnya menunjukkan bahwa model dapat meningkatkan resolusi gambar hingga 2x dari gambar masukan. Evaluasi model menghasilkan nilai PSNR rata-rata sebesar 20,1587 dB untuk input image dan 21,1831 dB untuk output model. Nilai SSIM rata-rata adalah 0,5215 untuk input image dan 0,6331 untuk output model
Pengaruh Faktor Adaptasi Model UTAUT terhadap Intensi Adopsi Sistem Hijau pada Bank Indonesia
Bank Indonesia (BI) plays a strategic role in promoting a green financial system, yet faces internal challenges in adopting environmentally sustainable technologies, as reflected in its low “leading by example” score in the Green Central Banking Scorecard. This study applies an adapted UTAUT model, incorporating stakeholder engagement, to examine green Information Systems (IS) adoption at BI. PLS-SEM results show stakeholder engagement significantly influences adoption (β = 0.792, p < 0.001) and performance expectancy positively affects behavioral intention (β = 0.420, p = 0.014). In contrast, facilitating conditions negatively impact adoption (β = –0.374, p = 0.027), indicating limited resource support. Effort expectancy and social influence are not statistically significant. Stakeholder feedback suggests BI remains at the initial stage of green IT maturity (level 1: incipient), highlighting the need for stronger institutional and government support and clearer implementation strategies to advance its green digital transformation
Peningkatan Akurasi Rekomendasi Dokter pada Kondisi Data Sparsity Menggunakan Algoritma Content-Based Filtering
Perkembangan aplikasi layanan kesehatan seperti Halodoc, Alodokter, dan Klikdokter telah menyediakan sistem rekomendasi yang memudahkan pasien untuk menentukan dokter yang relevan. Namun, rekomendasi dokter yang relevan masih menjadi tantangan. Salah satu permasalahannya adalah data sparsity, yaitu kelangkaan atribut data yang menyebabkan akurasi sistem rekomendasi bekerja kurang akurat. Penelitian ini mengembangkan sistem rekomendasi dokter menggunakan pendekatan Content-Based Filtering (CBF) untuk melakukan rekomendasi dokter sesuai dengan preferensi pasien dengan mempertimbangkan lima atribut utama: spesialisasi, rating, biaya konsultasi, lama praktik, dan jenis kelamin. Aturan imputasi data dan pembobotan atribut telah diimplementasikan untuk meningkatkan akurasi sistem rekomendasi. Hasil dari analisis data menunjukan teknik tersebut telah menurunkan Mean Absolute Error (MAE) dari 0,142 menjadi 0,102 dan Root Mean Squared Error (RMSE) dari 0,205 menjadi 0,150, sehingga teknik yang diimplementasikan meningkatkan sistem rekomendasi dokter dengan kondisi data sparsity
Importance of Feature Selection for Multiple Disease Classification
The performance of machine learning in disease classification heavily depends on effective feature selection. This study explores feature selection methods—Boruta and Recursive Feature Elimination (RFE)—with ensemble models like Random Forest, Decision Tree, Gradient Boosting, LightGBM, and XGBoost using Electronic Health Records (EHR) data. Results show that combining Boruta with LightGBM achieves the highest accuracy of 99%. Feature selection enhances precision by focusing on relevant variables and removing unnecessary ones. Further analysis reveals that features such as Red Blood Cells, Insulin, Heart Rate, and Cholesterol significantly influence the classification of specific diseases. These findings highlight the importance of feature selection in multi-disease classification and medical data analysis, improving the efficiency of machine learning systems. Future research should develop more flexible feature selection methods and test models on diverse disease datasets