3 research outputs found
Nuevos Modelos de Aprendizaje H铆brido para Clasificaci贸n y Ordenamiento Multi-Etiqueta
En la 煤ltima d茅cada, el aprendizaje multi-etiqueta se ha convertido en una importante tarea de investigaci贸n, debido en gran parte al creciente n煤mero de problemas reales que contienen datos multi-etiqueta. En esta tesis se estudiaron dos problemas sobre datos multi-etiqueta, la mejora del rendimiento de los algoritmos en datos multi-etiqueta complejos y la mejora del rendimiento de los algoritmos a partir de datos no etiquetados. El primer problema fue tratado mediante m茅todos de estimaci贸n de atributos. Se evalu贸 la efectividad de los m茅todos de estimaci贸n de atributos propuestos en la mejora del rendimiento de los algoritmos de vecindad, mediante la parametrizaci贸n de las funciones de distancias empleadas para recuperar los ejemplos m谩s cercanos. Adem谩s, se demostr贸 la efectividad de los m茅todos de estimaci贸n en la tarea de selecci贸n de atributos. Por otra parte, se desarroll贸 un algoritmo de vecindad inspirado en el enfoque de clasifcaci贸n basada en gravitaci贸n de datos. Este algoritmo garantiza un balance adecuado entre eficiencia y efectividad en su soluci贸n ante datos multi-etiqueta complejos. El segundo problema fue resuelto mediante t茅cnicas de aprendizaje activo, lo cual permite reducir los costos del etiquetado de datos y del entrenamiento de un mejor modelo. Se propusieron dos estrategias de aprendizaje activo. La primer estrategia resuelve el problema de aprendizaje activo multi-etiqueta de una manera efectiva y eficiente, para ello se combinaron dos medidas que representan la utilidad de un ejemplo no etiquetado. La segunda estrategia propuesta se enfoc贸 en la resoluci贸n del problema de aprendizaje activo multi-etiqueta en modo de lotes, para ello se formul贸 un problema multi-objetivo donde se optimizan tres medidas, y el problema de optimizaci贸n planteado se resolvi贸 mediante un algoritmo evolutivo. Como resultados complementarios derivados de esta tesis, se desarroll贸 una herramienta computacional que favorece la implementaci贸n de m茅todos de aprendizaje activo y la experimentaci贸n en esta tarea de estudio. Adem谩s, se propusieron dos aproximaciones que permiten evaluar el rendimiento de las t茅cnicas de aprendizaje activo de una manera m谩s adecuada y robusta que la empleada comunmente en la literatura. Todos los m茅todos propuestos en esta tesis han sido evaluados en un marco experimental
adecuado, se utilizaron numerosos conjuntos de datos y se compararon
los rendimientos de los algoritmos frente a otros m茅todos del estado del arte. Los
resultados obtenidos, los cuales fueron verificados mediante la aplicaci贸n de test
estad铆sticos no param茅tricos, demuestran la efectividad de los m茅todos propuestos
y de esta manera comprueban las hip贸tesis planteadas en esta tesis.In the last decade, multi-label learning has become an important area of research
due to the large number of real-world problems that contain multi-label data. This
doctoral thesis is focused on the multi-label learning paradigm. Two problems were
studied, rstly, improving the performance of the algorithms on complex multi-label
data, and secondly, improving the performance through unlabeled data.
The rst problem was solved by means of feature estimation methods. The e ectiveness
of the feature estimation methods proposed was evaluated by improving
the performance of multi-label lazy algorithms. The parametrization of the distance
functions with a weight vector allowed to recover examples with relevant
label sets for classi cation. It was also demonstrated the e ectiveness of the feature
estimation methods in the feature selection task. On the other hand, a lazy
algorithm based on a data gravitation model was proposed. This lazy algorithm
has a good trade-o between e ectiveness and e ciency in the resolution of the
multi-label lazy learning.
The second problem was solved by means of active learning techniques. The active
learning methods allowed to reduce the costs of the data labeling process and
training an accurate model. Two active learning strategies were proposed. The
rst strategy e ectively solves the multi-label active learning problem. In this
strategy, two measures that represent the utility of an unlabeled example were
de ned and combined. On the other hand, the second active learning strategy proposed
resolves the batch-mode active learning problem, where the aim is to select a
batch of unlabeled examples that are informative and the information redundancy
is minimal. The batch-mode active learning was formulated as a multi-objective
problem, where three measures were optimized. The multi-objective problem was
solved through an evolutionary algorithm.
This thesis also derived in the creation of a computational framework to develop
any active learning method and to favor the experimentation process in the active
learning area. On the other hand, a methodology based on non-parametric
tests that allows a more adequate evaluation of active learning performance was
proposed. All methods proposed were evaluated by means of extensive and adequate experimental
studies. Several multi-label datasets from di erent domains were used, and
the methods were compared to the most signi cant state-of-the-art algorithms. The
results were validated using non-parametric statistical tests. The evidence showed
the e ectiveness of the methods proposed, proving the hypotheses formulated at
the beginning of this thesis
Una mirada a las bases de datos difusas A glance to the fussy databases
<p>En este art铆culo se presenta una introducci贸n general a las bases de datos difusas comentando los modelos de implementaci贸n,聽 la representaci贸n de la informaci贸n, as铆 como el manejo de las mismas.</p><br><em>In this paper is present a general introduction to the Diffuse Databases commenting the implementation models, the representation of the information, as well as the handling of the same ones.</em
Modelos para el dise帽o de bases de datos difusas
La mayor铆a de las tareas que desempe帽a el hombre son bajo informaci贸n incompleta o imprecisa. Resulta necesario disponer de mecanismos de representaci贸n y almacenamiento que permitan el tratamiento de la incertidumbre. Las bases de datos difusas se han convertido en la principal alternativa para el tratamiento de la incertidumbre en bases de datos. En el presente trabajo se exponen los principales modelos que existen para el tratamiento de la incertidumbre en el dise帽o de bases de datos relacionales, en espec铆fico aquellos basados en l贸gica difusa