Klasifikasi Bertingkat Berbasis Deep Learning Pada Citra Pap-Smear

Abstract

Setelah bertahun-tahun, kanker masih menjadi ancaman besar bagi dunia medis. Kanker menyerang sel di dalam tubuh manusia sehingga dapat menginfeksi hampir setiap bagian tubuh, salah satunya serviks. Deteksi dini kanker serviks dapat dilakukan dengan tes pap-smear. Dengan kemajuan teknologi, pengolahan tes pap-smear sudah menggunakan algoritma deep learning. Beberapa penelitian sebelumnya menggabungkan fitur tradisional dengan metode klasifikasi deep learning seperti algoritma CNN (Convolutional Neural Network). Hasil yang diperoleh cukup baik, namun sebagian besar membagi citra pap-smear menjadi 2 kelas besar dan terklasifikasi sesuai dengan jumlah kelas pada deskripsi dataset. Hal ini dilakukan karena tingkat kemiripan setiap data antar kelas tinggi. Penelitian ini mengusulkan teknik klasifikasi bertingkat menggunakan algoritma deep learning pada citra pap-smear. Dataset yang digunakan dalam penelitian ini adalah dataset Herlev yang memiliki 7 kelas. Data yang masuk diperbaiki melalui proses preprocessing, kemudian diklasifikasikan dengan klasifikasi bertingkat. Pada klasifikasi tingkat pertama, data diklasifikasikan menjadi 5 kelas. Pada tingkat kedua, data dibagi menjadi 7 kelas sesuai dengan deskripsi dataset. Studi ini menggunakan algoritma deep learning, khususnya CNN, seperti: VGG16, VGG19, ResNet50, MobileNetV3, dan EfficientNetB0. Penggunaan teknik klasifikasi bertingkat yang diusulkan, terbukti berhasil meningkatkan performa sistem pada proses klasifikasi citra pap-smear berbasis deep learning. Akurasi terbaik didapatkan menggunakan arsitektur EfficientNetB0 dengan 78.73%. Peningkatan akurasi tertinggi didapatkan VGG16 dengan peningkatan 27.24%, dari 16.10% menjadi 43.42%. Kinerja sistem menunjukkan hasil terbaik pada penggunaan arsitektur EfficientNetB0 karena akurasi yang tinggi dan stabil. Sebaliknya, arsitektur MobileNetV3 menghasilkan model yang overfit. Penggunaan kelompok data terbaik didapat dengan mengombinasikan data asli, data hasil rotasi, dan data hasil flip. Akurasi sistem dengan kelompok data ini adalah 87.87% menggunakan arsitektur EfficientNetB0. Presisi kelas terbaik pada klasifikasi tingkat pertama didapatkan kelas Normal Intermediete, sedangkan pada tingkat kedua didapatkan kan kelas Light Dysplastic. Penelitian ini nantinya bisa digunakan sebagai ide untuk menglasifikasikan data-data yang memiliki kemiripan yang tinggi antar kelasnya, seperti data medis =================================================================================================================================== After many years, cancer is still an enormous threat to the medical world. Cancer attacks cells and can infect almost every part of the human body. One of them is the cervix. The pap-smear test can detect cervical cancer in its early stages. With advances in technology, pap-smear tests are already using deep learning algorithms processing. Previous studies combined traditional features with deep learning classification methods, such as CNN (Convolutional Neural Network). The results were quite good, but most of them divided the pap-smear images into two large categories, not by the dataset description. The high-similarity images between classes caused this modification. This research proposes the two-stages classification using a deep learning algorithm on pap-smear images. The dataset used is the Herlev dataset which has seven classes. Incoming data is through preprocessing before being classified by two-stage classification. At the first level, data is divided into five categories. After that, at the second level, the data is labeled into seven classes following the dataset description. This study uses deep learning algorithms, especially CNN, such as VGG16, VGG19, ResNet50, MobileNetV3, and EfficientNetB0. The proposed two-stage classification has proven increasing system performance with deep learning on the pap-smear image. The EfficientNetB0 architecture achieved the best accuracy with 78.73%. The highest increase earned by using VGG16 by 27.24%. It increases from 16.10% to 43.42%. The system shows the best results using the EfficientNetB0 architecture caused of its high accuracy and stability. The MobileNetV3 architecture brings out an overfit model. The best data groups are a combination of the original data, rotation data, and flip data. System accuracy with this data group is 87.87% using the EfficientNetB0 architecture. The best class precision at the first level of classification is Normal Intermediate class, while at the second level is Light Dysplastic. Later, this research can be used as a new idea to classify high-similarity data such as other medical dat

    Similar works

    Full text

    thumbnail-image

    Available Versions