7 research outputs found
Agrupamiento conceptual jerárquico basado en distancias
En este trabajo de investigación analizamos la relación existente entre el agrupamiento jerárquico basado en distancia y los conceptos que se pueden inducir por generalización a partir de una jerarquÃa, mostrando que pueden surgir diversas inconsistencias a partir de incompatibilidades entre las distancias subyacentes y los operadores de generalización empleados.
En este contexto, hemos definido un marco teórico genérico en el cual, por un lado, hemos propuesto un nuevo algoritmo de agrupamiento en el que integramos el agrupamiento jerárquico basado en distancias y el agrupamiento conceptual, permitiendo observar en las nuevas jerarquÃas obtenidas si un elemento ha sido integrado a un grupo por la distancia de enlazado o porque se encuentra cubierto por el concepto asociado al grupo.
Por otro lado, hemos definido tres niveles diferentes de consistencia entre los operadores de generalización y las distancias a partir de la similitud existente entre las nuevas jerarquÃas conseguidas con nuestro algoritmo y las correspondientes obtenidas por el algoritmo tradicional jerárquico.
Actualmente, nos encontramos trabajando en el análisis de diversas instanciaciones del marco teórico genérico antes mencionado.Eje: Agentes y sistemas inteligentesRed de Universidades con Carreras en Informática (RedUNCI
An instantiation for sequences of hierarchical distance-based conceptual clustering
In this work, we present an instantiation of our framework for Hierarchical Distance-based Conceptual Clustering (HDCC) using sequences, a particular kind of structured data. We analyze the relationship between distances and generalization operators for sequences in the context of HDCC. HDCC is a general approach to conceptual clustering that extends the traditional algorithm for hierarchical clustering by producing conceptual generalizations of the discovered clusters. Since the approach is general, it allows combining the flexibility of changing distances for different data types at the same time that we take advantage of the interpretability offered by the obtained concepts, which is central for descriptive data mining tasks. We propose here different generalization operators for sequences and analyze how they work together with the edit and linkage distances in HDCC. This analysis is carried out based on three different properties for generalization operators and three different levels of agreement between the clustering hierarchy obtained from the linkage distance and the hierarchy obtained by using generalization operators.Sociedad Argentina de Informática e Investigación Operativ
Agrupamiento conceptual jerárquico basado en distancias
En este trabajo de investigación analizamos la relación existente entre el agrupamiento jerárquico basado en distancia y los conceptos que se pueden inducir por generalización a partir de una jerarquÃa, mostrando que pueden surgir diversas inconsistencias a partir de incompatibilidades entre las distancias subyacentes y los operadores de generalización empleados.
En este contexto, hemos definido un marco teórico genérico en el cual, por un lado, hemos propuesto un nuevo algoritmo de agrupamiento en el que integramos el agrupamiento jerárquico basado en distancias y el agrupamiento conceptual, permitiendo observar en las nuevas jerarquÃas obtenidas si un elemento ha sido integrado a un grupo por la distancia de enlazado o porque se encuentra cubierto por el concepto asociado al grupo.
Por otro lado, hemos definido tres niveles diferentes de consistencia entre los operadores de generalización y las distancias a partir de la similitud existente entre las nuevas jerarquÃas conseguidas con nuestro algoritmo y las correspondientes obtenidas por el algoritmo tradicional jerárquico.
Actualmente, nos encontramos trabajando en el análisis de diversas instanciaciones del marco teórico genérico antes mencionado.Eje: Agentes y sistemas inteligentesRed de Universidades con Carreras en Informática (RedUNCI
Un entorno de generalización basado en distancias
Los Operadores de Generalización producen patrones, aún cuando el patrón puede ser útil por sà mismo, esto no es suficiente en muchos casos donde el patrón no es claro para que los seres humanos puedan entenderlo. Es importante que el patrón sea lo suficientemente expresivo para que los seres humanos puedan entenderlo, ya que el patrón deberÃa ser la explicación misma. Las Métricas (distancias métricas) son fáciles de entender y los patrones basados en distancias son útiles además de claras y se explican por sà mismas.
Asà poder relacionar operadores de Generalización, Distancias y Patrones nos darÃa las ventajas de todos ellos. En este trabajo se busca realizar ello en un contexto de Operadores de Clasificación Asistidos.Eje: Agentes y sistemas inteligentesRed de Universidades con Carreras en Informática (RedUNCI
Decision support for data mining: An introduction to ROC analysis and its applications
In this chapter we give an introduction to ROC ("receiver operating characteristics") analysis and its applications to data mining. We argue that ROC analysis provides decision support for data mining in several ways. For model selection, ROC analysis establishes a method to determine the optimal model once the operating characteristics for the model deployment context are known. We also show how ROC analysis can aid in constructing and refining models in the modeling stage.status: publishe