Application of Data Mining for Rainfall Prediction Classification in Australia with Decision Tree Algorithm and C5.0 Algorithm

Abstract

Tujuan: Penelitian ini bertujuan untuk memprediksi hujan di Australia dengan pendekatan klasifikasi machine learning. Prediksi hujan yang tepat dan akurat sangat penting untuk perencanaan dan pengelolaan sumber daya air, peringatan banjir, kegiatan konstruksi dan operasi penerbangan serta yang lainnya.Perancangan/metode/pendekatan: Metode atau tahapan yang diterapkan dalam melakukan klasifikasi prediksi hujan di Australia yaitu melalui beberapa tahapan diantaranya Pengumpulan Data, Data Pre-processing (termasuk dilakukan penanganan Missing Value didalamnya), Pemodelan Klasifikasi dengan menerapkan dan membandingkan algoritme Decision Tree dan C5.0, Validasi Hasil menggunakan Partisi Dataset dan k-Cross Fold Validation serta Evaluasi Model menggunakan Confussion Matrix.Hasil: Berdasarkan hasil yang diperoleh, evaluasi menggunakan 10-Cross Fold Validation lebih unggul yang memiliki akurasi paling tinggi sebesar 87.35% untuk algoritme Decision Tree dan akurasi sebesar 86.85% untuk algoritme C5.0 Rule-Based Model, dibandingkan dengan metode Split 80:20 pada kasus prediksi hujan di Australia.Keaslian/state of the art: Selain model klasifikasi yang digunakan, validasi dataset baik itu dengan partisi dataset atau k-Cross Fold Validation juga dapat mempengaruhi akurasi hasil prediksi

    Similar works