Terjadi kerusakan pada mesin pompa air dapat menyebabkan masalah yang besar
salah satunya dapat mengakibatkan kesalahan mekanis pada mesin pompa. Tujuan
dari penelitian ini adalah menghitung akurasi dalam proses klasifikasi
menggunakan metode Random forest (RF) serta membandingkan akurasi data
imbalance dan setelah ditangani imbalance data. Pada penelitian ini menggunakan
data sekunder yang bersumber dari web Kaggle yaitu dataset pump sensor data yang
terdiri dari 52 kolom sensor dan 3 status mesin yaitu normal, recorvering, dan
broken. Data ini memiliki masalah ketidakseimbangan data (imbalancing data)
sehingga untuk mengatasi tersebut digunakan metode Synthetic Minority
Oversampling Technique (SMOTE). Pengujian pada penelitian ini dilakukan pada
data yang telah ditangani outlier dan tanpa penanganan outlier dengan data balance
dan imbalance menggunakan rasio perbandingan dan kombinasi dari parameter
RF. Hasil penelitian ini mendapatkan akurasi rata-rata sebesar 99,97% pada
klasifikasi menggunakan data tanpa penanganan outlier dan 80,29% menggunakan
data dengan penanganan outlier. Sehingga dapat disimpulkan metode Random
forest efektif digunakan dalam proses klasifikasi multiclass