A particle swarm optimization approach for clustering with a modified dunn index

Abstract

Kümeleme analizi, gözlem gruplarını ortak özelliklerine göre kümelere bölümlemek olarak tanımlanmaktadır. Sağlık alanında hastalıkların teşhisi, mühendislikte ürün kusur tespiti ve işletmelerde müşteri segmentasyonu kümelemenin gerçek hayatta uygulama alanlarından birkaçıdır. Kümelemede ön bilgi olmadığı takdirde problem sıklıkla sezgisel algoritmalar kullanılarak çözülmektedir. Çalışmada, önerilen yeni bir uygunluk fonksiyonu ile Parçacık Sürü Optimizasyonu kümeleme probleminin çözümünde kullanılmıştır. Önerilen Değiştirilmiş Dunn İndeksi, literatürde yer alan kümeleme uygunluk fonksiyonları ile kümeleme doğruluğu açısından karşılaştırılmıştır. Öte yandan kullanılan Parçacık Sürü Optimizasyonu yöntemi, Genetik Algoritma ve Rassal Arama yöntemleri ile kümeleme analizinde kıyaslanmıştır. Kümeleme analizi alanında kullanılan beş adet veri seti üzerinde analizler gerçekleştirilmiştir. Elde edilen analiz sonuçları ve yapılan istatistiki testler, önerilen DDI uygunluk fonksiyonunun kümeleme doğruluğu açısından başarılı olduğunu göstermektedir.Cluster analysis is defined as the division of observation groups into clusters according to their common characteristics. Diagnosis of diseases in the field of health, product defect detection in engineering and customer segmentation in enterprises are some of the real life applications of clustering. If there is no prior knowledge in clustering, the problem is often solved by using heuristic algorithms. In this study, Particle Swarm Optimization with a proposed new fitness function is used in the solution of clustering problem. The proposed Modified Dunn Index was compared with the clustering fitness functions in the literature for clustering accuracy. On the other hand, the Particle Swarm Optimization method was compared with the Genetic Algorithm and Random Search methods in clustering analysis. Analysis was performed on five data sets used in the field of cluster analysis. The results of the analysis and the conducted statistical tests indicate that the proposed DDI fitnessfunction is successful in terms of clustering accuracy

    Similar works

    Full text

    thumbnail-image

    Available Versions