İzmir Katip Çelebi Üniversitesi Fen Bilimleri Enstitüsü
Abstract
Yüksek Lisans Bitirme ProjesiGünümüzde kısa mesaj(SMS) üzerinden iletişim kurmak yaygınlaşmıştır. Bu yaygınlaşmanın sonucu olarak gelen kutusundaki kısa mesaj sayısı oldukça artmıştır. Zaman zaman hatalı sınıflandırmalar olsa da günümüzde telefonlarda ki istenmeyen(spam) mesaj filtereleri oldukça başarılı şekilde çalışmaktadır. Bu çalışma kapsamında UCI platformunda paylaşılmış olan SMS Spam Collection adındaki veri seti kullanılarak metin sınıflandırma işlemi gerçekleştirilecektir. Veri seti üzerinde metin ön işleme adımları uygulanacaktır. Makine öğrenmesi modelleri olarak Karar Destek Vektörü, Rastgele Orman, Multinominal Naive Bayes, Karar Ağacı, K-En Yakın Komşu kullanılacaktır. Makine öğrenmesi algoritmalarında hiper parametre seçimi yapılmıştır. Çapraz doğrulama k=10 seçildiği durumda Karar Destek Vektörü ile %98 oranında doğru sınıflandırma başarımı gözlemlenmiştir