    Exploring Decision Rules for Election Results by Classification Trees

    This study explores the most important socio-economic variables determining the voting decisions of the provinces in Municipality Elections by using classification trees. We collected data on many potential variables that may affect voting decisions in favor  of a political party. Each province’s economic, geographic and demographic data is taken into consideration as independent variables. The dependent variable is the winner party in 2014 Municipality Elections. Data set consists of 81 provinces’ data on 69 variables. The aim of the study is to find which variables affect voting decision the most and try to find a pattern that may lead political campaigns. Amongst many classification algorithms, we used C5.0 algorithm coded in R. It helps us explore the structure of a set of data, while developing easy to visualize decision rules for predicting a categorical (classification tree) or continuous (regression tree) outcome. The C5.0 algorithm determines the separation criterion with the greatest information gain in each decision node and performs optimal separation. Since our data size is small, we used k=1000 trials (estimations) and then summarized them to provide more robust results. By choosing C5.0 algorithm’s sub-trial size as 5, 5000 trees are formed and the mean of all importance scores of all trees formed are calculated and interpreted. The most important independent variables discriminating the voting decision are found to be the result of the previous elections, mean household population, proportion of population between ages 15 and 19, electricity consumption per person, and proportion of population between ages 55 and 64. Keywords: classification trees, voting decision, C5.0 algorithm, decision tree

    Anket Aracılığı ile Örneklemeye Dayalı Olarak Yapılan Araştırmalarda İzlenecek Adımlar ve Karşılaşılabilecek Sorunlar

    Bu çal#mada anketler aracl& ile örneklemeye dayal olarak yaplan ara#trmalarda izlenecek admlara ve kar#la#labilecek sorunlara de&inilmektedir. Anketler aracl&yla yaplan ara#trmalar günümüzde çok yaygn olarak kullanlmakta ve bu ara#trmalarn istatistiksel olarak geçerli ve güvenilir olabilmesi açsndan belirli bir düzen izleyerek yaplmas ve bu düzen içerisindeki tüm a#amalarda kar#la#labilecek sorunlara dikkat edilmesi gerekmektedir. 28 Mart 2004 de yaplan yerel seçimlerde bunun önemi bir kez daha kantlanm#tr. Yeterli bir örnek hacmi ile temsil edici örnekler seçerek seçim öncesi yaplan ara#trmalarda birçok ara#trma #irketi seçim sonras çok az bir hata pay ile daha sonuçlar açklanmadan sonuçlarn ne yönde oldu&unu göstermi#tir. Ancak bunun tam aksine seçim öncesi halk etkilemek adna çok hatal örnekler seçerek yanltc sonuçlar çkarmak da mümkündür. Tüm bunlar örneklemenin do&ru bir biçimde yaplmas gerekti&inin önemini bir kez daha vurgulamaktadr. Bu çal#mann amac da bu yönde yaplan ara#trmalara #k tutmak, kar#la#labilecek sorunlar ortaya koymak ve çözüm önerileri sunmaktr


    In most situations, modern technological developments give rise to the cases where samples are drawn from a population of real random functions. Functional Data Analysis (FDA) is an appropriate multivariate statistical approximation since the classical multivariate methods can not be used when a random sample consists of such n-real functions. Generally the functions are sampled discretely in time and a certain smoothing technique is used to obtain underlying functions. In this study we first give a detailed theory of B-Splines and then obtain cubic splines as linear combinations based on the coefficients resulted from an implementation of the Roughness Penalty Method. We then present a comprehensive theoretical background of the functional data analysis with a special attention given to the functional and regularized functional principal components concepts that are very useful to explore and interpret the variability of the functions and also their derivatives especially when one has a large number of functions. Finally, an application of the regularized functional principal components on the weekly closing share prices data of the thirteen companies belonging to the ISE-100 index is presented. Interpretations of the derivative functions, covariance surface and principal component functions are also given in detail.Functional Data Analysis, Functional Principal Component Analysis, Regularized Functional Principal Component Analysis, Smoothing, Roughness Penalty Approach, Cubic Spline, Eigenvalue-Eigenfunction Decomposition, Dimension Reduction


    Fonksiyonel Veri Analizi Yöntemleri, reel bir aralığın sonlu bir alt setinde değerlendirilen eğrilerden veya gözlenen fonksiyonlardan oluşan fonksiyonel verileri analiz etmek üzere geliştirilmiştir. Fonksiyonel Veri Analizi teknikleri, xi(t) (i = 1, 2,... , N) şeklinde belirtilen N tane reel fonksiyondan oluşan verilerdeki değişkenliğin veya bu fonksiyonların ilgilenilen dereceden türev fonksiyonlarının incelenerek yorumlanması için kullanılabilir. Pratikte bu fonksiyonlar sıklıkla ayrık noktalarda gözlenen verilere uygulanan düzgünleştirme proseslerinin bir sonucu olarak ortaya çıkarlar. Bu çalışmada da Splayn Düzgünleştirme Yöntemleri ele alınmıştır. Elde edilen fonksiyonların sayısı ve gözlem noktaları arttıkça bu fonksiyonları birlikte ele almak ve yorumlayabilmek gittikçe güçleşmektedir. Bunun sonucu olarak ortaya çıkan karmaşıklığı gidermek üzere kullanılan ve fonksiyonlar arasındaki değişimi sadece birkaç fonksiyon bileşenle açıklama gücüne sahip olan Fonksiyonel ve Düzgünleştirilmiş Fonksiyonel Ana Bileşenler Analizi bu çalışmanın kapsamını oluşturmaktadır. Bu çalışmada Fonksiyonel Veri Analizinin İMKB de bir uygulamasına değinilmektedir. Burada İMKB 30 endeksi farklı bir çok değişkenli istatistiksel bakış açısıyla incelenmiştir


    ÖZ: Bu çalışma, iklim değişikliği bağlamında sosyal kırılganlık çalışmalarının bilimsel gelişimini ve mevcut yapısını bibliyometrik yöntem yaklaşımı ile ortaya çıkartmayı hedeflemektedir. Analiz verileri için Web of Science (WoS) veri tabanında “social vulnerability” ve “climate change” sözcük grubu kullanılarak “topic” seçeneği ile tarama yapılmıştır. Yayın türü olarak “makale, inceleme makalesi, bildiri ve kitap bölümü” olan yayınlar seçilmiştir. Belirlenen filtreler doğrultusunda, 1991-2023 yılları arasında (2023’ün ilk yarısı) toplam 2344 yayına ulaşılmıştır. Veri tabanından elde edilen verilerin bilimsel haritalama tekniği ile bibliyometrik analizi için VOSviewer görselleştirme yazılımı kullanılmıştır. Yazılımda ilgili kriterler seçilmiş, “birlikte bulunabilirlik, atıf ve ortak yazarlık” analizleri uygulanarak ağ haritaları ve yoğunluk haritaları elde edilmiştir. Analizlerin sonucunda anahtar kelimeler, araştırma alanları, yayın türleri, yayın dilleri, endeksler, yazarlar, yayınlar (dokümanlar), dergiler, yayıncı kuruluşlar, ülkeler, üniversite ve kurum/kuruluşlar ile ilgili bulgulara ulaşılmıştır. Çalışma, iklim değişikliği bağlamında sosyal kırılganlık çalışmalarını bibliyometrik yöntem ve bilimsel haritalama tekniği ile değerlendirmesi ve sonuçları itibariyle araştırmacılar için rehber niteliğindedir. ABSTRACT: This study aims to reveal the scientific development and current structure of social vulnerability studies in the context of climate change with the bibliometric method approach. For analysis data, the Web of Science (WoS) database was searched with the "topic" option using the words "social vulnerability" and "climate change". Publications with "articles, review articles, papers and book chapters" were chosen as the type of publication. In line with the determined filters, a total of 2344 publications were reached between the years 1991- 2023 (first half of 2023). VOSviewer visualization software was used for the bibliometric analysis of the data obtained from the database with scientific mapping technique. Relevant criteria were selected in the software, and network maps and density maps were obtained by applying “co-existence, citation and co-authorship” analyzes. Through these analyses, various findings were discovered including keywords, research areas, publication types and languages, indices, authors, publications, journals, publishers, countries, universities, and institutions/organizations. The study is a guide for researchers in terms of evaluation and results of social vulnerability studies in the context of climate change with bibliometric method and scientific mapping technique

    Functional Cluster and Canonical Correlation Analysis of EU Countries by Number of Daily Deaths and Stringency Index During Covid-19 Pandemic

    The danger of a global pandemic, such as the new Coronavirus (Covid-19),is obvious. This study aims to investigate the behavior and relationship of thenumber of daily new conrmed deaths per million and the stringency indexof twenty-seven European Union (EU) countries by utilizing functional clusteranalysis and functional canonical correlation analysis. Functional clusteranalysis was used to observe how countries cluster together according to dailydeaths during the time interval between March and July 2020. Functionalcanonical correlation analysis was also utilized to measure the correlationbetween the frequency index and daily deaths, and also to determine therelative positions of countries concerning their respective variability structure.The data is obtained from OWID. Here, it is seen that Italy, Spain,Belgium, and France are particularly aected by the pandemic during thetime interval within the EU countries, and the course of daily deaths is in adierent position compared to other EU countries. At the same time, a veryhigh relationship emerged between the stringency index and daily deaths asexpected