5 research outputs found
Classification of Signals by Means of Genetic Programming
[Abstract] This paper describes a new technique for signal classification by means of Genetic Programming (GP). The novelty of this technique is that no prior knowledge of the signals is needed to extract the features. Instead of it, GP is able to extract the most relevant features needed for classification. This technique has been applied for the solution of a well-known problem: the classification of EEG signals in epileptic and healthy patients. In this problem, signals obtained from EEG recordings must be correctly classified into their corresponding class. The aim is to show that the technique described here, with the automatic extraction of features, can return better results than the classical techniques based on manual extraction of features. For this purpose, a final comparison between the results obtained with this technique and other results found in the literature with the same database can be found. This comparison shows how this technique can improve the ones found.Instituto de Salud Carlos III; RD07/0067/0005Xunta de Galicia; 10SIN105004P
Metodología para orientar procesos de extracción de conocimiento basados en computación evolutiva : aplicación al desarrollo de modelos y formulaciones en el ámbito del hormigón estructural
[Resumen]
Uno de los problemas típicos ante los que se enfrenta un investigador cuando
aborda el estudio de fenómenos reales es la ingente cantidad de información y
de datos que es posible extraer para su análisis. En muchos casos, además, la
información y los datos son difíciles de relacionar entre sí. Para descubrir,
comprender y entender esa interrelación, una de las posibilidades a disposición
de los expertos es el empleo de procedimientos de extracción de conocimiento
mediante técnicas de Inteligencia Artificial. Su uso, tal como se conocen hoy
en día, presenta diversas limitaciones para la mayoría de problemas ya que, por
un lado, en ocasiones la solución no es capaz de predecir el comportamiento
con un margen de error asumible y, por otro, puede resultar imposible realizar
una interpretación de la solución obtenida. En estos casos el experto desearía
influir en el proceso de búsqueda, alternativa que no suelen ofrecer los
procedimientos disponibles. La tesis se plantea, por tanto, con el objetivo de
desarrollar una metodología capaz de obtener soluciones de un problema
genérico de extracción de conocimiento construido a partir de datos derivados
de ensayos de laboratorio. El aporte fundamental es que ello se hace de forma
supervisada, es decir, dirigiendo el proceso de búsqueda (basado en la
aplicación de técnicas heurísticas) mediante las indicaciones del experto en el
fenómeno concreto, lo que se denomina como “proceso de búsqueda guiado
por el usuario”. Definida la metodología, se implementa mediante un sistema
basado en Programación Genética desarrollando un conjunto de
funcionalidades organizadas por módulos: módulo de operadores y funciones
definidos por el usuario, módulo de probabilidad de aparición de nodos,
módulo de coeficientes de seguridad, módulo de restricciones y módulo de ajuste de expresiones. El sistema desarrollado se aplica en primer lugar a un problema de solución
teórica conocida y probada (la predicción de la distancia máxima que alcanza
un proyectil), lo que permite constatar el buen funcionamiento y las
posibilidades del método. En segundo lugar se aborda la aplicación práctica,
presentándose para ello tres ejemplos reales de predicción en problemas
enmarcados dentro del ámbito del hormigón estructural. El primer caso real
elegido es el de la predicción del esfuerzo a cortante que resisten las vigas de
hormigón en determinadas condiciones. El segundo corresponde a la
predicción de la capacidad adherente entre el hormigón y las barras de acero
que actúan como armaduras en las estructuras. Y, por último, se aplica el
método a un problema de series temporales, concretamente la predicción de
las deformaciones que a lo largo del tiempo sufre el hormigón cuando tiene
una carga constante aplicada (deformaciones de fluencia).
Tales ejemplos muestran que la metodología definida y desarrollada permite
obtener resultados con menor error y más fácilmente interpretables gracias al
proceso guiado, lo que puede extenderse a numerosos campos del
conocimiento en los que aparecen problemas de regresión simbólica.[Abstract]
One of the most common problems in science related to the study of real
phenomena is the huge amount of information and data available.
Furthermore, in many cases it is difficult to establish relationships within data.
Thus, in order to discover and comprehend these data correlations, Artificial
Intelligence techniques of knowledge extraction can be used by experts.
Nowadays, the use of these techniques presents some limitations: on one
hand, the solution can’t provide a behavior prediction with an assumable
error; on the other, interpretation of the results obtained may be impossible.
In these cases, the expert would desire to guide the search process, but most
present day techniques do not allow for this possibility. The objective of this
thesis is to develop a new methodology to obtain knowledge from problems,
and by data obtained from laboratory testing. The main contribution of this
technique is that this process will be done in a supervised way, guiding the
search process (based in heuristics) with expert recommendations. This
process shall be called “user guided search process”. Once the methodology
has been defined, it will be implemented using a Genetic Programming based
system. This system will have a set of functionalities organized by modules:
operators and functions module, module probability of node apparitions
module, safety factors module, constraints module and expression adjustment
module.
The system thus developed will be applied to a problem with theoretical
known solution (the prediction of maximum distance of a projectile) to
provide a validation of the proposed method. Additionally, practical
application of the method will be carried out with three real examples of
prediction problems in the field of structural concrete. The first case chosen is the prediction of shear strength for concrete beams under determinate
circumstances. The second corresponds to the prediction of bond between
concrete and steel used as reinforcement within the structure. Finally, the
method will be applied to a problem of temporal series, the prediction of
strain evolution during the time that concrete endures a constant load
(concrete creep).
These examples will show that the defined and implemented methodology
provides more precise and easier to interpret results, thanks to the guided
process. The methodology proposed can be extended to numerous areas
related to symbolic regression problems
Resolución de problemas de optimización combinatoria utilizando técnicas de computación evolutiva: una aplicación a la biomedicina
[Resumen] Cada día se genera una mayor cantidad de datos, tanto con respecto a su volumen como
por el número de variables que involucran, lo cual representa un problema para las técnicas
tradicionales. En muchos problemas el conjunto de soluciones posibles es tan elevado que
la localización de una solución óptima es imposible en un tiempo razonable, por lo que es
necesario emplear técnicas basadas en heurísticas. Se ha observado que las técnicas de
computación evolutiva (CE) proporcionan resultados satisfactorios en situaciones en que
técnicas tradicionales no los obtuvieron, en especial en su aplicación a datos biomédicos y
relacionados con el diagnóstico de enfermedades.
Así, en este trabajo se ha desarrollado un modelo basado en CE capaz de, a partir de unos
datos de entrada etiquetados como sujetos sanos o enfermos, extraer expresiones con las
que construir un modelo de clasificación. Este modelo ha sido validado tanto contra datos
sintéticos como aplicado a un conjunto de datos clínicos reales, además de comparar sus
resultados con métodos similares. Es de destacar que el modelo propuesto obtiene
expresiones sencillas y que logra clasificar ambos tipos de conjuntos mejor que el resto de
técnicas, resultando de gran utilidad como apoyo al diagnóstico clínico.[Resumo] Cada día xérase unha maior cantidade de datos, tanto con respecto ao seu volume como
polo número de variables que involucran, o cal representa un problema para as técnicas
tradicionais. En moitos problemas o conxunto de solucións posibles é tan elevado que a
localización dunha solución óptima é imposible nun tempo razoable, polo que é necesario
empregar técnicas baseadas en heurísticas. Observouse que as técnicas de computación
evolutiva (CE) proporcionan resultados satisfactorios en situacións en que técnicas
tradicionais non os obtiveron, en especial na súa aplicación a datos biomédicos e
relacionados co diagnóstico de enfermidades.
Así, neste traballo desenvolveuse un modelo baseado en CE capaz de, a partir duns datos
de entrada etiquetados como suxeitos sans ou enfermos, extraer expresións coas que
construír un modelo de clasificación. Este modelo foi validado tanto contra datos sintéticos
como aplicado a un conxunto de datos clínicos reais, ademais de comparar os seus
resultados con métodos similares. Compre destacar que o modelo proposto obtén
expresións sinxelas e que logra clasificar ambos tipos de conxuntos mellor co resto de
técnicas, resultando de gran utilidade como apoio ó diagnóstico clínico.[Abstract] Every day more data are being generated. Not only the volume of data increases, but also
the number of variables does. This represents an issue for traditional techniques.
Furthermore, many problems involve such a large set of possible solutions that finding the
optimal solution in a reasonable amount of time is not feasible. Thus, using techniques
based on heuristics becomes necessary. Evolutionary Computation (EC) has provided
good results in situations in which traditional techniques did not, especially when applied to
biomedical data and disease diagnosis.
Therefore, in this work, a model based on EC has been developed. This model, based on
an input set with data that belong to healthy or diseased subjects, is capable of extracting
expressions in order to build a classification model. The model proposed in this thesis has
been validated on generated data, as well as applied to real clinical data, comparing the
results obtained with those of other similar techniques. It is worth pointing out that the
model presented extracts simple expressions and performs better when classifying both
types of data sets than other existing techniques. As a result, the model presented is
expected to be very useful for clinical diagnostic support
Desarrollo y simplificación de redes de neuronas artificiales mediante el uso de técnicas de computación evolutiva
[Resumen] Esta Tesis propone el uso de técnicas de Computación Evolutiva (CE) con el objetivo de automatizar el proceso de desarrollo de Redes de Neuronas Artificiales (RR,NN.AA.). Tradicionalmente, el desarrollo de RR.NN.AA. es un proceso lento, marcado por el gran trabajo que debe de realizar el experto. Por su parte, los métodos existentes para el desarrollo automatizado de RR.NN.AA. han sido analizados, y como resultado se han hallado una serie de carencias graves. Con el objetivo de paliar estas carencias, y de lograr un sistema totalmente automatizado en todas las etapas de desarrollo de RR.NN.AA., se propone el uso de dos técnicas de CE: Programación Genética (PG) y Algoritmos Genéticos (AA.GG.) para lograr un modelo que tenga dichas características. Los resultados obtenidos en los experimentos realizados, así como en la comparación del modelo desarrollado con los existentes, muestran una alta eficiencia del sistema desarrollado, así como una serie de ventajas tales como una optimización de las redes conseguidas.Esta Tesis propone el uso de técnicas de Computación Evolutiva (CE) con el objetivo de automatizar el proceso de desarrollo de Redes de Neuronas Artificiales (RR.NN.AA.). Tradicionalmente, el desarrollo de RR.NN.AA. es un proceso lento, marcado por el gran trabajo que debe de realizar el experto. Por su parte, los métodos existentes para el desarrollo automatizado de RR.NN.AA. han sido analizados, y como resultado se han hallado una serie de carencias graves. Con el objetivo de paliar estas carencias, y de lograr un sistema totalmente automatizado en todas las etapas de desarrollo de RR.NN.AA., se propone el uso de dos técnicas de CE: Programación Genética (PG) y Algoritmos Genéticos (AA.GG.) para lograr un modelo que tenga dichas características