14 research outputs found

    Hash2Vec: Feature Hashing for Word Embeddings

    Get PDF
    In this paper we propose the application of feature hashing to create word embeddings for natural language processing. Feature hashing has been used successfully to create document vectors in related tasks like document classification. In this work we show that feature hashing can be applied to obtain word embeddings in linear time with the size of the data. The results show that this algorithm, that does not need training, is able to capture the semantic meaning of words.We compare the results against GloVe showing that they are similar. As far as we know this is the first application of feature hashing to the word embeddings problem and the results indicate this is a scalable technique with practical results for NLP applications.Sociedad Argentina de Informática e Investigación Operativa (SADIO

    Hash2Vec: Feature Hashing for Word Embeddings

    Get PDF
    In this paper we propose the application of feature hashing to create word embeddings for natural language processing. Feature hashing has been used successfully to create document vectors in related tasks like document classification. In this work we show that feature hashing can be applied to obtain word embeddings in linear time with the size of the data. The results show that this algorithm, that does not need training, is able to capture the semantic meaning of words.We compare the results against GloVe showing that they are similar. As far as we know this is the first application of feature hashing to the word embeddings problem and the results indicate this is a scalable technique with practical results for NLP applications.Sociedad Argentina de Informática e Investigación Operativa (SADIO

    Hash2Vec: Feature Hashing for Word Embeddings

    Get PDF
    In this paper we propose the application of feature hashing to create word embeddings for natural language processing. Feature hashing has been used successfully to create document vectors in related tasks like document classification. In this work we show that feature hashing can be applied to obtain word embeddings in linear time with the size of the data. The results show that this algorithm, that does not need training, is able to capture the semantic meaning of words.We compare the results against GloVe showing that they are similar. As far as we know this is the first application of feature hashing to the word embeddings problem and the results indicate this is a scalable technique with practical results for NLP applications.Sociedad Argentina de Informática e Investigación Operativa (SADIO

    Un caso de big data punta a punta: análisis de datos de transporte y su uso en el negocio

    Get PDF
    En este artículo se presentan los resultados de un proyecto de análisis de datos de una empresa de transporte, que involucró la recolección, preparación, visualización, transformación y análisis de 3 años de datos de viajes de colectivos, incluyendo boletos y posicionamiento geográfico. Este caso cubre el proyecto de punta a punta, incluyendo la incorporación de los resultados en el proceso de negocio. Nosotros sostenemos que una característica clave de los proyectos de big data debe encontrarse en el proceso que se lleva a cabo y que inicia con la captura de grandes cantidades de datos, pasando por el procesamiento (que en muchos casos requiere una infraestructura especial o particular, con más de una computadora, en modo distribuido) hasta el análisis y el aprovechamiento de la información en el negocio. En nuestro punto de vista, este último paso (la inserción de la información en la toma de decisiones) es tan importante como el uso de bases NoSQL o Hadoop o procesar varios terabytes.Sociedad Argentina de Informática e Investigación Operativa (SADIO

    Un caso de big data punta a punta: análisis de datos de transporte y su uso en el negocio

    Get PDF
    En este artículo se presentan los resultados de un proyecto de análisis de datos de una empresa de transporte, que involucró la recolección, preparación, visualización, transformación y análisis de 3 años de datos de viajes de colectivos, incluyendo boletos y posicionamiento geográfico. Este caso cubre el proyecto de punta a punta, incluyendo la incorporación de los resultados en el proceso de negocio. Nosotros sostenemos que una característica clave de los proyectos de big data debe encontrarse en el proceso que se lleva a cabo y que inicia con la captura de grandes cantidades de datos, pasando por el procesamiento (que en muchos casos requiere una infraestructura especial o particular, con más de una computadora, en modo distribuido) hasta el análisis y el aprovechamiento de la información en el negocio. En nuestro punto de vista, este último paso (la inserción de la información en la toma de decisiones) es tan importante como el uso de bases NoSQL o Hadoop o procesar varios terabytes.Sociedad Argentina de Informática e Investigación Operativa (SADIO

    Reproductive biology of chuquiraga avellanedae (aSteraceae), an endemic Shrub of Patagonia

    Get PDF
    Chuquiraga avellanedae (Asteraceae) es una especie endémica de la estepa patagónica que representa un componente fundamental de los ecosistemas de la región. Conocer el sistema reproductivo, la dependencia a los agentes polinizadores y el ensamble de visitantes florales es importante para la comprensión de los patrones de flujo génico y la cantidad y la calidad de las semillas producidas. Los objetivos de este trabajo fueron determinar el grado de autoincompatibilidad de C. avellanedae y evaluar si es una especie ambófila.Mediante cruces controlados se puso a prueba la capacidad de producir semillas bajo distintos tratamientos: polinización cruzada, autopolinización forzada, polinización por viento, autopolinización espontánea y control. Además, se realizaron observaciones de los insectos polinizadores durante dos temporadas. La producción de semillas fue significativamente mayor en el tratamiento de polinización cruzada y el control, diferenciándose de la autopolinización forzada y la polinización por viento. No hubo producción de semillas en el tratamiento de autopolinización espontánea. Las flores fueron frecuentemente visitadas por especies de Hymenoptera y Diptera. Hubo variación inter-anual en la abundancia de los taxones más frecuentes que componen el ensamble de polinizadores. Chuquiraga avellanedae resultó autoincompatible y con un ensamble de polinizadores generalista. Los insectos polinizadores son cruciales para el éxito reproductivo de este arbusto. Coincidiendo con otros antecedentes, este trabajo indica que la interacción C. avellanedae-insectos representa un componente relevante en procesos y servicios ecosistémicos a nivel regional.Chuquiraga avellanedae (Asteraceae) is an endemic species of the Patagonian steppes and a key component of the ecosystem. Knowing the reproductive system and the dependence on pollinating agents is important for understanding gene flow and seed production. The objectives were to determine whether this species is self-incompatible and ambophilous. M&M: A field experiment was carried out and the following treatments were applied: cross-pollination, self-pollination, wind pollination, spontaneous pollination and control. Pollinating insects were recorded during two seasons. Results: Seed production was significantly higher in the cross-pollination treatment and the control, differing from self-pollination and wind pollination. There was no seed production in the spontaneous pollination treatment. Flowers were frequently visited by insects mainly belonging to Hymenoptera and Diptera. There was interannual variation in the abundance of the major pollinator taxa. Conclusions: Chuquiraga avellanedae is considered a self-incompatible species and a generalist-pollinated plant visited by many pollinators. This work reveals that pollinator insects are crucial for the reproductive success of this shrub. In agreement with previous knowledge, these findings indicate that the interaction C. avellanedae-insects represents a relevant component for ecosystem processes and services at regional scale.Fil: Zaffaroni, Facundo T.. Universidad Nacional de la Patagonia "San Juan Bosco"; ArgentinaFil: Campanella, María Victoria. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Centro Nacional Patagónico. Instituto Patagónico para el Estudio de los Ecosistemas Continentales; ArgentinaFil: Martínez, Fernando Joaquín. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Centro Nacional Patagónico. Instituto Patagónico para el Estudio de los Ecosistemas Continentales; Argentina. Universidad Nacional de la Patagonia "San Juan Bosco"; Argentin

    Un caso de big data punta a punta: análisis de datos de transporte y su uso en el negocio

    Get PDF
    En este artículo se presentan los resultados de un proyecto de análisis de datos de una empresa de transporte, que involucró la recolección, preparación, visualización, transformación y análisis de 3 años de datos de viajes de colectivos, incluyendo boletos y posicionamiento geográfico. Este caso cubre el proyecto de punta a punta, incluyendo la incorporación de los resultados en el proceso de negocio. Nosotros sostenemos que una característica clave de los proyectos de big data debe encontrarse en el proceso que se lleva a cabo y que inicia con la captura de grandes cantidades de datos, pasando por el procesamiento (que en muchos casos requiere una infraestructura especial o particular, con más de una computadora, en modo distribuido) hasta el análisis y el aprovechamiento de la información en el negocio. En nuestro punto de vista, este último paso (la inserción de la información en la toma de decisiones) es tan importante como el uso de bases NoSQL o Hadoop o procesar varios terabytes.Sociedad Argentina de Informática e Investigación Operativa (SADIO

    Dónde, cuándo y cómo ocurren grandes incendios en la provincia de La Pampa, Argentina. Una caracterización basada en sensores remotos.

    Get PDF
    Los incendios son fenómenos catastróficos, devastadores, peligrosos y costosos para una región. A pesar de su relevancia, se conoce poco sobre su dinámica espacial y temporal en la provincia de La Pampa. El objetivo general de este trabajo fue identificar y caracterizar los incendios —en particular, los más extensos—ocurridos en la provincia de La Pampa durante el período julio 2001-junio 2017 (16 campañas) empleando información provista por sensores remotos. Para ello se utilizó información de focos de calor de MODIS Rapid Response distribuidos por el sistema web FIRMS. Combinando información de índices espectrales (NBR), datos de precipitación y tipos de vegetación se estudió la influencia de los factores predisponentes sobre la ocurrencia de estos eventos. Se observó que, en el período analizado, se quemaron entre 21200 y 667500 ha/año, con un tamaño promedio de evento de 708 ha. Sin embargo, en las últimas cuatro campañas se registró un incremento en la superficie total quemada y en el número de eventos ≥5000 ha. En la última campaña, además de registrarse la mayor superficie quemada (667500 ha), ocurrió la mayor cantidad de eventos (10) ≥10000 ha (50% de los eventos totales de esa categoría). La superficie quemada total en una campaña se relacionó positivamente con las precipitaciones de la campaña previa (R2=0.76, P<0.001). La vegetación más afectada fue el bosque xérico, seguido en menor medida por los bosques de algarrobo y las estepas y matorrales psamófilos. Se espera que la caracterización de la dinámica espacial y temporal de incendios mediante el uso de sensores contribuya a diseñar sistemas de prevención, alerta temprana y control en la región.Fire, as a catastrophic phenomenon, is devastating, dangerous and costly for a region. Despite its relevance, little is known about the spatial and temporal dynamics of this phenomenon in the province of La Pampa. The general objective of this work was to identify and characterize the fires, particularly the most extensive ones, that occurred in the province of La Pampa during the period July 2001-June 2017 (16 campaigns), based on the use of information provided by remote sensors. For this, information from MODIS Rapid Response heat sources, distributed by the FIRMS web system, was used. Combining information from spectral indices (NBR), precipitation data and vegetation types, the influence of predisposing factors on the occurrence of these events was studied It was observed that, in the analyzed period, between 21200 and 667500 ha/year were burned, with an average event size of 708 ha. However, in the last four seasons, an increase was recorded both in the total area burned and in the number of events ≥5 thousand ha. In the last campaign, in addition to registering the largest burned area (667500 ha), the largest number of events (10) ≥10 thousand ha (50% of the total events in this category) were observed. The total burned area in a campaign was positively related to the rainfall of the previous campaign (R2=0.76, P<0.001). The most affected vegetation was the xeric forest, followed to a lesser extent by the carob forests and the steppes and psamophilic scrubs. It is expected that the characterization of the spatial and temporal dynamics of fires using sensors will contribute to the design of prevention, early warning and control systems in the region.Fil: Sánchez, Milagros. Universidad de Buenos Aires. Facultad de Agronomía. Departamento de Métodos Cuantitativos y Sistema de Información; ArgentinaFil: Baldassini, Pablo. Universidad de Buenos Aires. Facultad de Agronomía. Departamento de Métodos Cuantitativos; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Parque Centenario. Instituto de Investigaciones Fisiológicas y Ecológicas Vinculadas a la Agricultura; Argentina. Instituto Nacional de Investigaciones Agropecuarias (INIA) La Estanzuela; UruguayFil: Fischer, María de los Ángeles. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Clima y Agua; ArgentinaFil: Torres Zaffaroni, Joaquín. Instituto Nacional de Investigaciones Agropecuarias (INIA) La Estanzuela; UruguayFil: Di Bella, Carlos Marcelo. Universidad de Buenos Aires. Facultad de Agronomía. Departamento de Métodos Cuantitativos; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentin

    Análisis de resultados electorales: comparación de métodos y estimación de votos por franja etaria

    No full text
    El Estado, como organizador de la Sociedad, y sus ciudadanos generan enormes cantidades de datos. Éstos, una vez almacenados y procesados, pueden dar soporte a inquietudes de ramas de las Ciencias Sociales, donde es frecuente encontrarnos con el problema de razonar sobre unidades de análisis diferentes a aquellas sobre las que tenemos datos. En las votaciones, podríamos querer entender la decisión sobre los resultados agrupados por mesa. El problema de estimar valores para una unidad utilizando valores de la otra se conoce como inferencia ecológica. En este trabajo, comparamos dos métodos para estimar el porcentaje de votos para cada partido, en base a la franja etaria del electorado. El trabajo se complementa con análisis de variación entre votos de primera y de segunda vuelta, y de un plebiscito independiente durante la primera vuelta. Realizamos nuestro análisis utilizando resultados de elecciones nacionales de 2014 en Uruguay.Sociedad Argentina de Informática e Investigación Operativ

    Ensamble de insectos polinizadores asociados a Chuquiraga avellanedae Lorentz (quilembay)

    No full text
    Las interacciones planta-polinizadores son críticas no sólo para el flujo génico en las poblaciones de plantas, sino también para el mantenimiento de la biodiversidad y la integridad de los ecosistemas. A pesar de que el quilembay es un arbusto característico de la Provincia Fitogeográfica Patagónica, se desconoce su grado de dependencia a los polinizadores. El objetivo de este trabajo fue describir por primera vez el ensamble de insectos polinizadores del quilembay. Los muestreos se realizaron semanalmente en comunidades vegetales ubicadas en los alrededores de Puerto Madryn (Chubut). Se registraron y capturaron los visitantes florales que establecieron contacto con las anteras y/o los estigmas de las flores abiertas. Para determinar la frecuencia de visita se realizaron observaciones durante intervalos de 10 min. por planta. Además, se realizaron colectas mediante trampas de agua a lo largo de una transecta ubicada en las proximidades de ejemplares de quilembay en flor. Tanto las colectas como las observaciones se realizaron durante el período reproductivo del quilembay (diciembre-febrero), en el horario de mayor actividad de los polinizadores (11-14 hs.). Los ejemplares colectados se conservaron en alcohol y se determinaron hasta el nivel taxonómico más bajo posible, separándolos en morfoespecies. El ensamble de visitantes florales estuvo compuesto por 32 morfoespecies pertenecientes a los órdenes Hymenoptera (18 spp.), Diptera (9 spp.), Lepidoptera (4 spp.) y Coleoptera (1 sp.). Los visitantes más frecuentes fueron el lepidóptero Nymphalidae sp1 (35% y un promedio de 3 flores visitadas) y el díptero Bombyliidae sp4 (24% y 4 flores visitadas). Seguidos por el coleóptero Chrysomelidae sp1 (7%), el himenóptero Halictidae sp1 (6%), Bombyliidae sp5 (6%) y Bombyliidae sp1 (5%) con frecuencia de visitas intermedia. Sólo el 19 % de los visitantes florales registrados fueron capturados por las trampas de agua. Este trabajo representa la primera aproximación al ensamble de insectos polinizadores del quilembay en la región. Esta información de base resulta fundamental para comprender la respuesta de los polinizadores a modificaciones ambientales, lo que puede repercutir no sólo en la reproducción de las plantas sino también en diversos procesos ecosistémicos de gran importancia.Fil: Zaffaroni, Facundo Tomas. Universidad Nacional de la Patagonia. Facultad de Ciencias Naturales. Sede Puerto Madryn; ArgentinaFil: Campanella, María Victoria. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Centro Nacional Patagónico. Instituto Patagónico para el Estudio de los Ecosistemas Continentales; ArgentinaFil: Martínez, Fernando Joaquín. Universidad Nacional de la Patagonia. Facultad de Ciencias Naturales. Sede Puerto Madryn; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Centro Nacional Patagónico. Instituto Patagónico para el Estudio de los Ecosistemas Continentales; ArgentinaX Congreso Argentino de Entomología: Enfrentando nuevos desafíos: Biodiversidad, modificaciones ambientales, sustentabilidad y globalizaciónMendozaArgentinaServicio Nacional de Sanidad y Calidad AgroalimentariaConsejo Nacional de Investigaciones Científicas y Técnicas - Centro Científico Tecnológico MendozaInstituto Nacional de Tecnología AgropecuariaUniversidad Nacional de Cuyo. Facultad de Ciencias Agraria
    corecore