4 research outputs found

    Recuperación de la información

    Get PDF
    Las Técnicas de Recuperación de Información que responden a inquietudes puntuales, se han hecho populares gracias a los buscadores ofrecidos gratuitamente a quienes recurren al Internet. Y no se hace referencia únicamente a grandes repositorios, sino también a medianos y pequeños, con miles de documentos, donde también es un inconveniente la localización del documento o los documentos que respondan a la inquietud del Usuario. El grupo posee sus propios motores orientados a corpus estáticos. De las diversas concepciones existentes ha prestado especial atención a la indexación semántica latente conocidas por sus siglas LSI. Una vez construidos los motores las líneas de investigación se han orientado a enfoques que permitan acelerar los mismos tanto en la búsqueda como en los preprocesos. Uno de ellos es el uso del procesamiento paralelo, tanto en clúster de máquinas como en el uso de placas de video. La técnica LSI es particularmente dependiente en su preproceso de un eficiente cálculo de autovalores y autovectores de matrices de gran tamaño, lo que hace incluir en nuestra temática el cálculo numérico. Se investiga si es factible acelerar la selección de los documentos que responden a un requerimiento por medio de un particionado del corpus basándose en criterios de similitud propia de minería de datos y técnicas de selección de la parte usando redes neuronales. En este sentido se exponen distintas líneas de trabajo a seguir, teniendo como objetivo diseñar, implementar y probar modificaciones en los procesos de filtrado y ordenamiento de documentos, en un Sistema de Recuperación de Información (SRI), aplicando algoritmos de clustering tradicionales.Eje: Bases de Datos y Minería de Datos.Red de Universidades con Carreras en Informátic

    Recuperación de la información

    Get PDF
    Las Técnicas de Recuperación de Información que responden a inquietudes puntuales, se han hecho populares gracias a los buscadores ofrecidos gratuitamente a quienes recurren al Internet. Y no se hace referencia únicamente a grandes repositorios, sino también a medianos y pequeños, con miles de documentos, donde también es un inconveniente la localización del documento o los documentos que respondan a la inquietud del Usuario. El grupo posee sus propios motores orientados a corpus estáticos. De las diversas concepciones existentes ha prestado especial atención a la indexación semántica latente conocidas por sus siglas LSI. Una vez construidos los motores las líneas de investigación se han orientado a enfoques que permitan acelerar los mismos tanto en la búsqueda como en los preprocesos. Uno de ellos es el uso del procesamiento paralelo, tanto en clúster de máquinas como en el uso de placas de video. La técnica LSI es particularmente dependiente en su preproceso de un eficiente cálculo de autovalores y autovectores de matrices de gran tamaño, lo que hace incluir en nuestra temática el cálculo numérico. Se investiga si es factible acelerar la selección de los documentos que responden a un requerimiento por medio de un particionado del corpus basándose en criterios de similitud propia de minería de datos y técnicas de selección de la parte usando redes neuronales. En este sentido se exponen distintas líneas de trabajo a seguir, teniendo como objetivo diseñar, implementar y probar modificaciones en los procesos de filtrado y ordenamiento de documentos, en un Sistema de Recuperación de Información (SRI), aplicando algoritmos de clustering tradicionales.Eje: Bases de Datos y Minería de Datos.Red de Universidades con Carreras en Informátic

    Implementación de un data warehouse para la toma de decisiones en el área académica

    Get PDF
    Este proyecto implementó el primer Data Warehouse (DW cuya mejor traducción al español es Almacén de Datos) de la UNLaM. El mismo, se construyó a partir de la información que generan las aplicaciones que se encuentran en el entorno operativo de la gestión universitaria. Esta información se integra cuando pasa al almacén de datos a través de un proceso conocido como Extraer, Transformar y Cargar (Extract, Transform and Load, frecuentemente abreviado ETL). Este acto de integración es siempre una tarea compleja y tediosa que utiliza técnicas para consolidar y administrar información de variadas fuentes, eliminando gran cantidad de datos inútiles o no deseados, con el objetivo de responder consultas a las autoridades departamentales, y tomar decisiones de una forma que antes no era posible. En este segundo año de trabajo, en principio se explica el desarrollo para la construcción del esquema lógico y físico del DW, el cual se llevó a cabo mediante transformaciones aplicadas al esquema lógico de la base de datos del Sistema de Gestión de Académica SIU-Guaraní. Se explican, además, las rutinas empleadas en los procesos ETL, con el objetivo de poder concretar finalmente, el esquema conceptual OLAP del DW. Este esquema representa la información como matrices multidimensionales o cuadros de múltiples entradas denominados cubos. A los ejes de la matriz se los llama dimensiones y representan los criterios de análisis, y a los datos almacenados en la matriz se los denomina medidas y representan los indicadores o valores a analizar. Por último, se muestra como se realizaron los diferentes cubos o Data Marts.Fil: Ryckeboer, Hugo Emilio Julio Ludovico. Universidad Nacional de La Matanza; Argentina.Fil: Spositto, Osvaldo Mario. Universidad Nacional de La Matanza; Argentina.Fil: Castro, Hugo Martín. Universidad Nacional de La Matanza; Argentina.Fil: Matteo, Lorena Romina. Universidad Nacional de La Matanza; Argentina.Fil: Barone, Miriam Andrea Teresa. Universidad Nacional de La Matanza; Argentina.Fil: Etcheverry, Martín Esteban. Universidad Nacional de La Matanza; Argentina.Fil: Bossero, Julio César. Universidad Nacional de La Matanza; Argentina

    Comparación de algoritmos de aprendizaje supervisado para la obtención de perfiles de alumnos desertores

    No full text
    [8 p.]En los últimos años, las técnicas de Minería de Datos han sido progresivamente incorporadas al ámbito universitario, como consecuencia del gran volumen de datos del que se dispone y del notable esfuerzo que se requiere para realizar análisis de los mismos. Este artículo presenta la comparación del rendimiento de dos algoritmos del tipo Aprendizaje Supervisado. Por un lado una arquitectura de Red Neuronal Artificial, del tipo Perceptrón Multicapa y por el otro, una Máquina de Vectores de Soporte, con el fin de determinar cuál tiene mayor porcentaje de aciertos en la obtención de perfiles de posibles alumnos que abandonen tempranamente sus estudios universitarios. Con base en la información extraída de un Almacén de Datos Institucional, se construyó un modelo que fue implementado, utilizando la herramienta WEKA. La exactitud de predicción se obtuvo a través de Matrices de Confusión y Curvas ROC. Los modelos predictivos obtuvieron resultados superiores al 90% de aciertos en todos los casos.Fil: Bossero, Julio César. Universidad Católica de Salta. Facultad de Ingeniería e Informática; Argentina.Fil: Spositto, Osvaldo Mario. Universidad Católica de Salta. Facultad de Ingeniería e Informática; Argentina
    corecore