9 research outputs found

    Co-location rules discovery process focused on reference spatial features using decision tree learning

    Get PDF
    The co-location discovery process serves to find subsets of spatial features frequently located together. Many algorithms and methods have been designed in recent years; however, finding this kind of patterns around specific spatial features is a task in which the existing solutions provide incorrect results. Throughout this paper we propose a knowledge discovery process to find co-location patterns focused on reference features using decision tree learning algorithms on transactional data generated using maximal cliques. A validation test of this process is provided.Fil: Merlino, Hernán Daniel. Universidad Nacional de Lanús; Argentina.Fil: Rottoli, Giovanni Daián. Universidad Tecnológica Nacional.Facultad Regional Concepción del Uruguay. Departamento Ingeniería en Sistemas de Información. Grupo de Investigación en Bases de Datos; Argentina.Fil: Rottoli, Giovanni Daián. Universidad Nacional de La Plata; Argentina.Fil: Rottoli, Giovanni Daián. Universidad Nacional de Lanús; Argentina.Fil: García Martínez, Ramón. Universidad Nacional de Lanús. Departamento Desarrollo Productivo y Tecnológico. Grupo de Investigación en Sistemas de Información; Argentina.Fil: García Martínez, Ramón. Comisión de Investigaciones Científicas; Argentina.Peer Reviewe

    Knowledge discovery process for description of spatially referenced clusters

    Get PDF
    Spatial clustering is an important field of spatial data mining and knowledge discovery that serves to partition a spatial data set to obtain disjoint subsets with spatial elements that are similar to each other. Existing algorithms can be used to perform three types of cluster analyses, including clustering of spatial points, regionalization and point pattern analysis. However, all these existing methods do not provide a description of the discovered spatial clusters, which is useful for decision making in many different fields. This work proposes a knowledge discovery process for the description of spatially referenced clusters that uses decision tree learning algorithms. Two proofs of concept of the proposed process using different spatial clustering algorithm on real data are also provided.Facultad de Informátic

    Knowledge discovery process for description of spatially referenced clusters

    Get PDF
    Spatial clustering is an important field of spatial data mining and knowledge discovery that serves to partition a spatial data set to obtain disjoint subsets with spatial elements that are similar to each other. Existing algorithms can be used to perform three types of cluster analyses, including clustering of spatial points, regionalization and point pattern analysis. However, all these existing methods do not provide a description of the discovered spatial clusters, which is useful for decision making in many different fields. This work proposes a knowledge discovery process for the description of spatially referenced clusters that uses decision tree learning algorithms. Two proofs of concept of the proposed process using different spatial clustering algorithm on real data are also provided.Facultad de Informátic

    Knowledge discovery process for description of spatially referenced clusters

    Get PDF
    Spatial clustering is an important field of spatial data mining and knowledge discovery that serves to partition a spatial data set to obtain disjoint subsets with spatial elements that are similar to each other. Existing algorithms can be used to perform three types of cluster analyses, including clustering of spatial points, regionalization and point pattern analysis. However, all these existing methods do not provide a description of the discovered spatial clusters, which is useful for decision making in many different fields. This work proposes a knowledge discovery process for the description of spatially referenced clusters that uses decision tree learning algorithms. Two proofs of concept of the proposed process using different spatial clustering algorithm on real data are also provided.Facultad de Informátic

    Análisis preliminar del rendimiento de algoritmos para el procesos de descubrimiento de reglas de pertenencia a grupos

    Get PDF
    En el campo de la explotación de información, el proceso de descubrimiento de reglas de pertenencia a grupos se caracteriza por la utilización combinada de un proceso de descubrimiento de grupos (clustering) y uno de inducción de reglas. Dada la variedad de algoritmos de clustering e inducción de reglas disponibles en la actualidad, es de interés poder conocer a priori qué pareja de algoritmos es más conveniente para un set de datos, en a base sus características. En este artículo se propone un diseño experimental que permita validar el rendimiento de los algoritmos, en base a métricas internas, para distintos tipos de sets de datos, con características específicas, de forma tal que permita vincular dichas características con la pareja de algoritmos que mejor rendimiento ofrece. En adición, se presentan resultados preliminares obtenidos.XV Workshop Bases de Datos y Minería de Datos (WBDDM)Red de Universidades con Carreras en Informática (RedUNCI

    Análisis preliminar del rendimiento de algoritmos para el procesos de descubrimiento de reglas de pertenencia a grupos

    Get PDF
    En el campo de la explotación de información, el proceso de descubrimiento de reglas de pertenencia a grupos se caracteriza por la utilización combinada de un proceso de descubrimiento de grupos (clustering) y uno de inducción de reglas. Dada la variedad de algoritmos de clustering e inducción de reglas disponibles en la actualidad, es de interés poder conocer a priori qué pareja de algoritmos es más conveniente para un set de datos, en a base sus características. En este artículo se propone un diseño experimental que permita validar el rendimiento de los algoritmos, en base a métricas internas, para distintos tipos de sets de datos, con características específicas, de forma tal que permita vincular dichas características con la pareja de algoritmos que mejor rendimiento ofrece. En adición, se presentan resultados preliminares obtenidos.XV Workshop Bases de Datos y Minería de Datos (WBDDM)Red de Universidades con Carreras en Informática (RedUNCI

    Análisis preliminar del rendimiento de algoritmos para el procesos de descubrimiento de reglas de pertenencia a grupos

    Get PDF
    En el campo de la explotación de información, el proceso de descubrimiento de reglas de pertenencia a grupos se caracteriza por la utilización combinada de un proceso de descubrimiento de grupos (clustering) y uno de inducción de reglas. Dada la variedad de algoritmos de clustering e inducción de reglas disponibles en la actualidad, es de interés poder conocer a priori qué pareja de algoritmos es más conveniente para un set de datos, en a base sus características. En este artículo se propone un diseño experimental que permita validar el rendimiento de los algoritmos, en base a métricas internas, para distintos tipos de sets de datos, con características específicas, de forma tal que permita vincular dichas características con la pareja de algoritmos que mejor rendimiento ofrece. En adición, se presentan resultados preliminares obtenidos.XV Workshop Bases de Datos y Minería de Datos (WBDDM)Red de Universidades con Carreras en Informática (RedUNCI

    Modelo de proceso para proyectos de explotación de información

    Get PDF
    Hace ya más de dos décadas, se registra un esfuerzo sostenido en el tiempo por definir un modelo de proceso que guíe el desarrollo de proyectos de Ingeniería de Explotación de Información. Sin embargo, las propuestas existentes presentan una visión parcial e incompleta, conduciendo a una tasa de fracaso cercana al 60% [Gondar, 2005; Marbán et al., 2009], a partir de lo cual los siguientes autores [Kurgan y Musilek, 2006; Mariscal et al., 2010; Kdnuggets, 2014] señalan la necesidad de definir un modelo de proceso que resuelva las limitaciones existentes. En este contexto, la presente investigación tiene como objetivo desarrollar un modelo de proceso integral, el cual presente una visión unificada, integrando los procesos orientados al producto y a la gestión, completa y detallada, describiendo las actividades involucradas y sus dependencias. Como resultado del trabajo, se propone MoProPEI, un modelo de proceso integrado por los subprocesos de Desarrollo y Gestión, y descompuesto en un mayor grado de detalle en fases y actividades, para las cuales se propone el uso de distintas técnicas y procedimiento que describen las tareas a realizar. La correcta integración de la propuesta fue verificada a partir de su aplicación en tres proyectos pertenecientes a las áreas de educación, salud y análisis web. Las características estáticas fueron evaluadas mediante el marco comparativo de metodologías para proyectos de explotación de información [Moine, 2013]. Finalmente, se implementa la validación mediante un experimento controlado, replicando el único experimento reproducible identificado en la disciplina [Sharma, 2008]. De los resultados derivados de las estrategias de evaluación utilizadas, se observa que MoProPEI presenta una diferencia significativa con respecto a las propuestas antecesoras.For more than two decades, there has been a sustained effort over time to define a process model that guides the development of Information Mining Engineering projects. However, the existing proposals present a partial and incomplete vision, leading to a failure rate close to 60% [Gondar, 2005; Marbán et al., 2009]. Several authors [Kurgan and Musilek, 2006; Mariscal et al., 2010; Kdnuggets, 2014] pointed out the need to define a process model that resolves existing limitations. In this context, this research aims to develop a comprehensive process model, which presents a unified vision, integrating the product-oriented and management processes, complete and detailed, describing the activities involved and their dependencies. This thesis proposes MoProPEI, a process model integrated by the Development and Management subprocesses, and decomposed in a greater degree of detail into phases and activities. For each activity, at least one technique or procedure is selected, describing the tasks to be performed. The correct integration of the proposal was verified from its application in three projects belonging to the areas of: education, health and web analysis. We evaluate the static characteristics through the comparative framework of methodologies for information mining projects [Moine, 2013]. Finally, we carried out a controlled experiment to validate the proposal, replicating the only reproducible experiment identified in the discipline [Sharma, 2008]. From the results derived from the evaluation strategies used, we observed that MoProPEI presents a significant difference with respect to its predecessors.Facultad de Informátic

    Calibración de un algoritmo de detección de anomalías marítimas basado en la fusión de datos satelitales

    Get PDF
    La fusión de diferentes fuentes de datos aporta una ayuda significativa en el proceso de toma de decisiones. El presente artículo describe el desarrollo de una plataforma que permite detectar anomalías marítimas por medio de la fusión de datos del Sistema de Información Automática (AIS) para seguimiento de buques y de imágenes satelitales de Radares de Apertura Sintética (SAR). Estas anomalías son presentadas al operador como un conjunto de detecciones que requieren ser monitoreadas para descubrir su naturaleza. El proceso de detección se lleva adelante primero identificando objetos dentro de las imágenes SAR a través de la aplicación de algoritmos CFAR, y luego correlacionando los objetos detectados con los datos reportados mediante el sistema AIS. En este trabajo reportamos las pruebas realizadas con diferentes configuraciones de los parámetros para los algoritmos de detección y asociación, analizamos la respuesta de la plataforma y reportamos la combinación de parámetros que reporta mejores resultados para las imágenes utilizadas. Este es un primer paso en nuestro objetivo futuro de desarrollar un sistema que ajuste los parámetros en forma dinámica dependiendo de las imágenes disponibles.XVI Workshop Computación Gráfica, Imágenes y Visualización (WCGIV)Red de Universidades con Carreras en Informática (RedUNCI
    corecore