    Symptom Clustering And Decision Tree Analysis Within The Vast-D Randomized Clinical Trial

    As a secondary analysis of the VAST-D clinical trial data, we employed a multi-layered strategy to describe the complicated clinical features of Major Depressive Disorder (MDD) and the heterogeneity among depressive symptoms, using the following analytical approaches: (1) Cluster analysis was used to transform a large and heterogenous mix of survey questions into a small number of correlated MDD symptom clusters: Four robust and highly-interpretable MDD symptom clusters (core emotional, appetite and weight, sleep disorders, atypical) were identified within the VAST-D trial, consistent with the findings from other relevant studies. (2) Decision tree analysis was used to identify symptom thresholds with particularly effective discriminability in identifying remitters who were being treated with the three different study medications. Classification trees built for remission using a CART algorithm, were used for each of the three treatments and for the total cohort in the VAST-D study to facilitate: (a) Generation of practical guidance that could be used to inform decision-making in real clinical settings; (b) Identification of features for the sub-groups of patients showing low/high responses to each of the three treatments; (c) Identification of the most important factors for remission through the use of random forests

    Estudio de métodos de construcción de ensembles de clasificadores y aplicaciones

    La inteligencia artificial se dedica a la creación de sistemas informáticos con un comportamiento inteligente. Dentro de este área el aprendizaje computacional estudia la creación de sistemas que aprenden por sí mismos. Un tipo de aprendizaje computacional es el aprendizaje supervisado, en el cual, se le proporcionan al sistema tanto las entradas como la salida esperada y el sistema aprende a partir de estos datos. Un sistema de este tipo se denomina clasificador. En ocasiones ocurre, que en el conjunto de ejemplos que utiliza el sistema para aprender, el número de ejemplos de un tipo es mucho mayor que el número de ejemplos de otro tipo. Cuando esto ocurre se habla de conjuntos desequilibrados. La combinación de varios clasificadores es lo que se denomina "ensemble", y a menudo ofrece mejores resultados que cualquiera de los miembros que lo forman. Una de las claves para el buen funcionamiento de los ensembles es la diversidad. Esta tesis, se centra en el desarrollo de nuevos algoritmos de construcción de ensembles, centrados en técnicas de incremento de la diversidad y en los problemas desequilibrados. Adicionalmente, se aplican estas técnicas a la solución de varias problemas industriales.Ministerio de Economía y Competitividad, proyecto TIN-2011-2404

    Data Mining Including Application Of Cognitive Maps And Decision Tree Algorithm

    Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2008Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2008Veri madenciliğinin iş dünyası için gün geçtikçe daha zorunlu bir araç haline gelmesinin nedeni, müşteri bilgisinin pazarlama hizmetleri başarısında kilit rol oynamasıdır. Veri madenciliği sürecinde, kümelenmiş verideki gizlenmiş bilgiyi keşfetmek için çok sayıda analitik yöntem kullanılmaktadır ve tüm bu süreç sonrası elde edilen bilgi, müşteri portföyünün geleceği ile ilgili daha destekleyici tahminler yapmayı olası kılmaktadır. Bu çalışma bilişsel haritalar ve karar ağaçlarının bütünleşik kullanımıyla müşteri profili belirlenmesine bir temel teşkil etmeyi amaçlamaktadır. Çalışmanın ilk aşaması pazarlama başarısında etkin olan firmaya ve müşteriye özgün faktörlerin belirlenmesidir. Çalışmanın bu aşamasında firmaya özgün faktörler ürün karması olarak belirlenirken, müşteriye özgün faktörlerin literatürdeki yaşam biçimi bölümlendirme modelinden alınması kararlaştırılmıştır. İkinci aşamada ise firma faktörleri ile yaşam biçimi bölümlendirme değişkenleri arasındaki ilişkiler bir sebep ve sonuç haritası aracılığıyla belirlenmektedir. Bilişsel harita uygulaması sonrası elde edilen ağırlıkların kullanılarak karar ağaçlarının oluşturulması çalışmanın dördüncü aşamasını teşkil etmektedir. Müşteriler, karar ağaçları yönteminde, memnuniyet dereceleri, futbol ilgileri ve firma sadakatlerine göre sınıflandırılacaklardır. Bu çalışmanın sonuçları firmanın gelecekteki müşteri davranışlarını tahmin etmesine yardımcı olacaktır. Ayrıca, bu çalışma rekabet stratejisi gereği müşteri sadakatini arttırmayı amaçlayan bir dijital televizyon kanalı için pilot uygulama sunmaktadır. Veri madenciliği ve pazarlama yönetimi alanlarındaki uzmanlar kadar, eğlence dünyasındaki işletme yöneticileri de bu çalışmanın hedef kitlesi içerisindedir.Customer data is the key to marketing success and this is why data mining has become an inevitable tool for the business world. Data mining is used to detect the knowledge in the accumulated data for which various analytical methods are used. The knowledge is further used to support the predictions for the future of the customer portfolio. This study aims to illustrate a framework for integrated implementation of the cognitive maps and decision trees in customer profiling. The first step is to identify the company specific and customer specific factors which are effective in marketing. Company specific factors are determined as the product mix and the customer specific factors are decided to be taken from the lifestyle segmentation model in the literature. The second step is to determine the interactions among company specific factors and lifestyle segmentation variables through a cause and effect map. As the third step decision trees are developed using the weights calculated from cognitive mapping. Customers will be classified with respect to their satisfaction level, football interest and loyalty. The findings will help the company to predict future customer behaviour. This paper also represents a pilot application of the framework in a digital TV channel that is in need of developing loyalty as a competitive strategy. This study will contribute both researchers in data mining and marketing fields as well as business managers in recreation industry.Yüksek LisansM.Sc