82 research outputs found
Modeling Stroke Diagnosis with the Use of Intelligent Techniques
The purpose of this work is to test the efficiency of specific intelligent classification algorithms when dealing with the domain of stroke medical diagnosis. The dataset consists of patient records of the ”Acute Stroke Unit”, Alexandra Hospital, Athens, Greece, describing patients suffering one of 5 different stroke types diagnosed by 127 diagnostic attributes / symptoms collected during the first hours of the emergency stroke situation as well as during the hospitalization and recovery phase of the patients. Prior to the application of the intelligent classifier the dimensionality of the dataset is further reduced using a variety of classic and state of the art dimensionality reductions techniques so as to capture the intrinsic dimensionality of the data. The results obtained indicate that the proposed methodology achieves prediction accuracy levels that are comparable to those obtained by intelligent classifiers trained on the original feature space
Feature Selection via Binary Simultaneous Perturbation Stochastic Approximation
Feature selection (FS) has become an indispensable task in dealing with
today's highly complex pattern recognition problems with massive number of
features. In this study, we propose a new wrapper approach for FS based on
binary simultaneous perturbation stochastic approximation (BSPSA). This
pseudo-gradient descent stochastic algorithm starts with an initial feature
vector and moves toward the optimal feature vector via successive iterations.
In each iteration, the current feature vector's individual components are
perturbed simultaneously by random offsets from a qualified probability
distribution. We present computational experiments on datasets with numbers of
features ranging from a few dozens to thousands using three widely-used
classifiers as wrappers: nearest neighbor, decision tree, and linear support
vector machine. We compare our methodology against the full set of features as
well as a binary genetic algorithm and sequential FS methods using
cross-validated classification error rate and AUC as the performance criteria.
Our results indicate that features selected by BSPSA compare favorably to
alternative methods in general and BSPSA can yield superior feature sets for
datasets with tens of thousands of features by examining an extremely small
fraction of the solution space. We are not aware of any other wrapper FS
methods that are computationally feasible with good convergence properties for
such large datasets.Comment: This is the Istanbul Sehir University Technical Report
#SHR-ISE-2016.01. A short version of this report has been accepted for
publication at Pattern Recognition Letter
Подход к построению ансамбля классификаторов с использованием генетического алгоритма
В статье рассматривается новый эволюционный подход к построению ансамбля классификаторов.
Предложенный подход разработан на основе генетического алгоритма с модифицированной схемой
реализации. В процессе оптимизации происходит определение параметров как отдельных классификаторов,
так и всего ансамбля. С использованием подхода выполнено построение ансамбля классификаторов
на нескольких наборах данных из архива данных по машинному обучению и на одном реальном
наборе медицинских данных. Сравнительное тестирование показало преимущества использования
предложенного подхода при работе с многомерными данными, характеризующимися большим количеством
признаков.У статті розглядається новий еволюційний підхід до побудови ансамблю класифікаторів. Запропонований
підхід розроблений на основі генетичного алгоритму з модифікованою схемою реалізації. У процесі
оптимізації відбувається визначення параметрів як окремих класифікаторів, так і всього ансамблю.
З використанням підходу виконана побудова ансамблю класифікаторів на декількох наборах даних з
архіву даних по машинному навчанню й на одному реальному наборі медичних даних. Порівняльне
тестування показало переваги використання запропонованого підходу при роботі з багатовимірними
даними, що характеризуються більшою кількістю ознак.The paper proposes a new evolutionary approach to classifier ensemble design. The proposed approach is
developed on the basis of genetic algorithm with modified realization scheme as applied to the optimization
of feature set decomposition into the subsets, which define the individual ensemble’s classifiers and provide
the high classification accuracy. During optimization both individual classifiers’ parameters and the ensemble
parameters are defined. With the approach a few ensembles were designed for several datasets from machine
learning database and for one real medical dataset. The comparative testing shows the advantages of the
proposed approach for multivariate data analysis with great number of features
Эволюционный подход к выделению информативных признаков в задачах анализа медицинских данных
В статье рассматривается подход к выделению информативных признаков применительно к задаче
распознавания подтипов транзиторных ишемических атак. Согласно предложенному подходу задача
выделения признаков рассматривается как задача многокритериальной оптимизации с двумя критериями.
Оптимизация осуществляется с использованием специального генетического алгоритма, позволяющего в
процессе эволюции получить множество недоминируемых решений оптимизационной задачи. Предло-
женный подход позволяет подключить эксперта на этапе окончательного принятия решений, предоставляя
ему возможность отбора подмножества признаков, наиболее соответствующего его знаниям и
представлениям о решаемой задаче.У статті розглядається підхід до виділення інформативних ознак стосовно до завдання розпізнавання
підтипів транзиторних ішемічних атак. Згідно із запропонованим підходом завдання виділення ознак
розглядається як завдання багатокритеріальної оптимізації із двома критеріями. Оптимізація
здійснюється з використанням спеціального генетичного алгоритму, що дозволяє в процесі еволюції
одержати безліч недомінуючих рішень оптимізаційної задачі. Запропонований підхід дозволяє
підключити експерта на етапі остаточного прийняття рішень, надаючи йому можливість відбору
підмножини ознак, найбільш відповідного його знанням і уявленням про розв’язуване завдання.The paper proposes an approach to informative feature extraction as applied to recognition of transient
ischemia attack subtypes. According to the approach the feature extraction is considered as multi-objective
optimization task with two criteria. The optimization process is performed with special genetic algorithm,
allowing to find the set of non-dominated solutions of optimization task during evolution. The proposed
approach enables the attraction of medical expert to final decision making, taking into account his knowledge
and clear idea of medical task
- …