4 research outputs found
Recuperación de la información
Las Técnicas de Recuperación de Información que responden a inquietudes puntuales, se han hecho populares gracias a los buscadores ofrecidos gratuitamente a quienes recurren al Internet. Y no se hace referencia únicamente a grandes repositorios, sino también a medianos y pequeños, con miles de documentos, donde también es un inconveniente la localización del documento o los documentos que respondan a la inquietud del Usuario.
El grupo posee sus propios motores orientados a corpus estáticos. De las diversas concepciones existentes ha prestado especial atención a la indexación semántica latente conocidas por sus siglas LSI.
Una vez construidos los motores las lÃneas de investigación se han orientado a enfoques que permitan acelerar los mismos tanto en la búsqueda como en los preprocesos.
Uno de ellos es el uso del procesamiento paralelo, tanto en clúster de máquinas como en el uso de placas de video.
La técnica LSI es particularmente dependiente en su preproceso de un eficiente cálculo de autovalores y autovectores de matrices de gran tamaño, lo que hace incluir en nuestra temática el cálculo numérico.
Se investiga si es factible acelerar la selección de los documentos que responden a un requerimiento por medio de un particionado del corpus basándose en criterios de similitud propia de minerÃa de datos y técnicas de selección de la parte usando redes neuronales.
En este sentido se exponen distintas lÃneas de trabajo a seguir, teniendo como objetivo diseñar, implementar y probar modificaciones en los procesos de filtrado y ordenamiento de documentos, en un Sistema de Recuperación de Información (SRI), aplicando algoritmos de clustering tradicionales.Eje: Bases de Datos y MinerÃa de Datos.Red de Universidades con Carreras en Informátic
Recuperación de la información
Las Técnicas de Recuperación de Información que responden a inquietudes puntuales, se han hecho populares gracias a los buscadores ofrecidos gratuitamente a quienes recurren al Internet. Y no se hace referencia únicamente a grandes repositorios, sino también a medianos y pequeños, con miles de documentos, donde también es un inconveniente la localización del documento o los documentos que respondan a la inquietud del Usuario.
El grupo posee sus propios motores orientados a corpus estáticos. De las diversas concepciones existentes ha prestado especial atención a la indexación semántica latente conocidas por sus siglas LSI.
Una vez construidos los motores las lÃneas de investigación se han orientado a enfoques que permitan acelerar los mismos tanto en la búsqueda como en los preprocesos.
Uno de ellos es el uso del procesamiento paralelo, tanto en clúster de máquinas como en el uso de placas de video.
La técnica LSI es particularmente dependiente en su preproceso de un eficiente cálculo de autovalores y autovectores de matrices de gran tamaño, lo que hace incluir en nuestra temática el cálculo numérico.
Se investiga si es factible acelerar la selección de los documentos que responden a un requerimiento por medio de un particionado del corpus basándose en criterios de similitud propia de minerÃa de datos y técnicas de selección de la parte usando redes neuronales.
En este sentido se exponen distintas lÃneas de trabajo a seguir, teniendo como objetivo diseñar, implementar y probar modificaciones en los procesos de filtrado y ordenamiento de documentos, en un Sistema de Recuperación de Información (SRI), aplicando algoritmos de clustering tradicionales.Eje: Bases de Datos y MinerÃa de Datos.Red de Universidades con Carreras en Informátic
Implementación de un data warehouse para la toma de decisiones en el área académica
Este proyecto implementó el primer Data Warehouse (DW cuya mejor traducción al español es Almacén de Datos) de la UNLaM. El mismo, se construyó a partir de la información que generan las aplicaciones que se encuentran en el entorno operativo de la gestión universitaria. Esta información se integra cuando pasa al almacén de datos a través de un proceso conocido como Extraer, Transformar y Cargar (Extract, Transform and Load, frecuentemente abreviado ETL). Este acto de integración es siempre una tarea compleja y tediosa que utiliza técnicas para consolidar y administrar información de variadas fuentes, eliminando gran cantidad de datos inútiles o no deseados, con el objetivo de responder consultas a las autoridades departamentales, y tomar decisiones de una forma que antes no era posible.
En este segundo año de trabajo, en principio se explica el desarrollo para la construcción del esquema lógico y fÃsico del DW, el cual se llevó a cabo mediante transformaciones aplicadas al esquema lógico de la base de datos del Sistema de Gestión de Académica SIU-GuaranÃ. Se explican, además, las rutinas empleadas en los procesos ETL, con el objetivo de poder concretar finalmente, el esquema conceptual OLAP del DW. Este esquema representa la información como matrices multidimensionales o cuadros de múltiples entradas denominados cubos. A los ejes de la matriz se los llama dimensiones y representan los criterios de análisis, y a los datos almacenados en la matriz se los denomina medidas y representan los indicadores o valores a analizar. Por último, se muestra como se realizaron los diferentes cubos o Data Marts.Fil: Ryckeboer, Hugo Emilio Julio Ludovico. Universidad Nacional de La Matanza; Argentina.Fil: Spositto, Osvaldo Mario. Universidad Nacional de La Matanza; Argentina.Fil: Castro, Hugo MartÃn. Universidad Nacional de La Matanza; Argentina.Fil: Matteo, Lorena Romina. Universidad Nacional de La Matanza; Argentina.Fil: Barone, Miriam Andrea Teresa. Universidad Nacional de La Matanza; Argentina.Fil: Etcheverry, MartÃn Esteban. Universidad Nacional de La Matanza; Argentina.Fil: Bossero, Julio César. Universidad Nacional de La Matanza; Argentina
Comparación de algoritmos de aprendizaje supervisado para la obtención de perfiles de alumnos desertores
[8 p.]En los últimos años, las técnicas de MinerÃa de Datos han sido progresivamente incorporadas al ámbito universitario, como consecuencia del gran volumen de datos del que se dispone y del notable esfuerzo que se requiere para realizar análisis de los mismos. Este artÃculo presenta la comparación del rendimiento de dos algoritmos del tipo Aprendizaje Supervisado. Por un lado una arquitectura de Red Neuronal Artificial, del tipo Perceptrón Multicapa y por el otro, una Máquina de Vectores de Soporte, con el fin de determinar cuál tiene mayor porcentaje de aciertos en la obtención de perfiles de posibles alumnos que abandonen tempranamente sus estudios universitarios. Con base en la información extraÃda de un Almacén de Datos Institucional, se construyó un modelo que fue implementado, utilizando la herramienta WEKA. La exactitud de predicción se obtuvo a través de Matrices de Confusión y Curvas ROC. Los modelos predictivos obtuvieron resultados superiores al 90% de aciertos en todos los casos.Fil: Bossero, Julio César. Universidad Católica de Salta. Facultad de IngenierÃa e Informática; Argentina.Fil: Spositto, Osvaldo Mario. Universidad Católica de Salta. Facultad de IngenierÃa e Informática; Argentina