'Anadolu Universitesi Bilim ve Teknoloji Dergisi-A: Uygulamali Bilimler ve Muhendislik'
Abstract
Bulanık c ortalamaya dayalı kümeleme algoritmaları sıfır kırılma noktasına sahiptir. Başka bir ifadeyle tek bir aykırı değer modeli tümüyle değiştirebilir. Veri kümesinde aykırı değer olduğunda bulanık c ortalamaya dayalı kümeleme tipi algoritmalar pratik değere sahip değildir. Bu nedenle aykırı değerden etkilenmeyen sağlam kümeleme yöntemleri önerilmiştir.
Bu çalışmada kümeleme analizlerinde yaygın olarak kullanılan katı c ortalamaya dayalı kümeleme ve bulanık c ortalamaya dayalı kümeleme yöntemleri ele alınmıştır. Veri kümesinde aykırı değer olması durumunda aykırı değerden etkilenmeyen gürültü kümeleme, olanaklı c ortalamaya dayalı kümeleme ve karma c ortalamaya dayalı kümeleme yöntemlerinin tanımları verilmiş ve karşılaştırılmıştır.Fuzzy c means algorithms have zero break point. In other words a single outlier can completely change the model. When data set has outlier, fuzzy c means type algorithms haven’t practical value. Therefore, robust clustering methods which are not affected by outlier have been suggested.
In this paper, hard c means clustering and fuzzy c-means clustering methods which are commonly used in clustering analysis are examined. Noise clustering, possibilistic c means clustering and mixed c means clustering methods which aren’t affected by outlier are defined and compared, when data set has outlier