'Middle East Technical University, Faculty of Architecture'
Abstract
Data Mining is becoming a famous analysis day by day to reveal the hidden information within big data. In the study, we use data mining techniques on the economic indicators of the countries. The four data mining techniques are to be implemented on the dataset. Making homogenous groups of the countries whose economic characteristics are similar are obtained by the Clustering Algorithm. After the clustering algorithm is performed, we pass to Association Rule Data Mining to investigate the most exported products by Switzerland to the other countries. With the clustering and association rule mining, we complete the first stage of the data mining that is so-called as unsupervised learning. In the second stage, we build up both classification and regression models with panel data based on the new variables that are obtained by the Principal Component Analysis. The main aim of the second stage is to determine the most important economic predictor variables that have an effect on the grouping of the countries and have an effect on the main economic indicators such as Gross Domestic Product (GDP), Gross National Product (GNP), etc.Veri Madenciliği, verinin içinde saklı gizli bilgiyi ortaya çıkarmak için kullanılan ve günden güne popüler olan bir yöntemdir. Bu çalışmada, veri madenciliği yöntemleri, ülkelerin ekononomik indikatörleri üzerinde uygulanmaktadır. Dört veri madenciliği tekniği veri seti üzerinde uygulanmaktadır. Ekonomik açıdan birbirine benzeyen ülke gruplarının oluşturulması Kümeleme Algoritması ile elde edilmektedir. Kümeleme algoritmasından sonra, İsviçre tarafından dünyaya en fazla ihraç edilen ürünleri soruşturmak için İlişki Kuralları Veri Madenciliği kullanılır. Kümeleme ve İlişki Kuralı Veri Madenciliğiyle, veri madenciliğinin ilk kısmı olan ve denetimsiz öğrenme olarak adlandırılan kısım tamamlanmış olmaktadır. İkinci kısımda, veri boyutunu indirgemek amacıyla kullanılan Temel Bileşenler Analizi ile elde ettiğimiz yeni değişkenlere dayalı sınıflandırma ve panel veri ile regresyon modelleri inşaa ederiz. İkinci kısmın temel amacı, ülkelerin gruplandırılması ve Gayrı Safi Yurtiçi Hasıla ve Gayri Safi Milli Hasıla gibi ana ekonomik göstergeler üzerinde etkisi olan en önemli ekonomik tahmin edici değişkenleri belirlemektir.M.S. - Master of Scienc