Analisis Churn Prediction pada Data Pelanggan Telekomunikasi Seluler Menggunakan Synthetic Minority Oversampling Technique dan Random Forest

Abstract

#Abstrak *Churn* *prediction* merupakan upaya yang digunakan untuk membantu penyedia layanan telekomunikasi agar tidak mengalami kerugian yang besar dengan cara memprediksi atau mengklasifikasi pelanggan jasa telekomunikasi yang berhenti dan berpindah menggunakan jasa telekomunikasi yang lain. Dataset pada kasus *churn* ini biasanya memiliki data pelanggan *non-churn* yang mayor daripada data pelanggan *churn* yang minor sehingga akurasi untuk data minor akan memiliki akurasi yang sangat kecil sehingga menyebabkan *imbalance* data. Data yang *imbalance* akan menyebabkan kesulitan dalam mengembangkan model prediksi yang baik. Salah satu pendekatan untuk menangani *imbalance* data adalah pendekatan *sampling-based*. Pada penelitian Tugas Akhir ini menggunakan data pelanggan dari WITEL PT. Telekomunikasi Regional 7. Pada data yang digunakan memiliki 53 atribut dengan 200,361 *record* data (192,848 *record* data *non-churn* dan 7,513 *record* data *churn*). Tingkat data kelas *churn* pada dataset ini adalah 3.7%. Untuk menangani *imbalance* data menggunakan *Synthetic* *Minority* *Oversampling* *Technique* (SMOTE) yang dikombinasikan dengan metode *Random* *Forest* (RF) untuk klasifikasi data kelas *churn* atau *non-churn*. SMOTE merupakan teknik *oversampling* yang digunakan untuk menghasilkan data sintetis dari kelas *churn* untuk meningkatkan prediksi peluang churn yang terjadi. Penelitian yang dilakukan terbukti dapat meningkatkan performansi model klasifikasi RF dengan penanganan *imbalance* data menggunakan SMOTE yang memberikan peningkatan nilai *f-measure* lebih dari 20% dengan nilai *f-measure* terbaik yaitu 95,27% dan *error* *rate* 4,60%. **Kata** **kunci**: *imbalanced* data, *churn* *prediction*, smote, *random* *forest*

    Similar works