1,541 research outputs found
Efecto de los <i>trending topics</i> en el volumen de consultas a los motores de búsqueda
Las redes sociales se han convertido en aplicaciones muy populares en Internet, principalmente para publicar información y comunicarse en grupos. Una caso bien conocido es Twitter, considerado un servicio de microblogging. Aquí se generan temas que se vuelven muy populares en la red social en un determinado momento, denominados trending topics (TT). En este trabajo se intenta determinar el efecto de estos temas en cuanto al volumen de consultas enviadas a un motor de búsqueda web. Para ello, se utiliza información de Twitter y tendencias de búsqueda. Los resultados iniciales muestran indicios de que los trending topics se utilizan luego para consultas al buscador: aproximadamente el 65% de las consultas muestran un aumento del interés cuando son TT e - inclusive - entre el 44% y 59% obtienen su pico de inter és. Estos resultados se consideran indicios positivos respecto de la hipótesis planteada abriendo oportunidades de aprovechamiento de esta información para optimizar procesos internos de un motor de búsqueda.X Workshop bases de datos y minería de datosRed de Universidades con Carreras en Informática (RedUNCI
Efecto de los <i>trending topics</i> en el volumen de consultas a los motores de búsqueda
Las redes sociales se han convertido en aplicaciones muy populares en Internet, principalmente para publicar información y comunicarse en grupos. Una caso bien conocido es Twitter, considerado un servicio de microblogging. Aquí se generan temas que se vuelven muy populares en la red social en un determinado momento, denominados trending topics (TT). En este trabajo se intenta determinar el efecto de estos temas en cuanto al volumen de consultas enviadas a un motor de búsqueda web. Para ello, se utiliza información de Twitter y tendencias de búsqueda. Los resultados iniciales muestran indicios de que los trending topics se utilizan luego para consultas al buscador: aproximadamente el 65% de las consultas muestran un aumento del interés cuando son TT e - inclusive - entre el 44% y 59% obtienen su pico de inter és. Estos resultados se consideran indicios positivos respecto de la hipótesis planteada abriendo oportunidades de aprovechamiento de esta información para optimizar procesos internos de un motor de búsqueda.X Workshop bases de datos y minería de datosRed de Universidades con Carreras en Informática (RedUNCI
Efecto de los <i>trending topics</i> en el volumen de consultas a los motores de búsqueda
Las redes sociales se han convertido en aplicaciones muy populares en Internet, principalmente para publicar información y comunicarse en grupos. Una caso bien conocido es Twitter, considerado un servicio de microblogging. Aquí se generan temas que se vuelven muy populares en la red social en un determinado momento, denominados trending topics (TT). En este trabajo se intenta determinar el efecto de estos temas en cuanto al volumen de consultas enviadas a un motor de búsqueda web. Para ello, se utiliza información de Twitter y tendencias de búsqueda. Los resultados iniciales muestran indicios de que los trending topics se utilizan luego para consultas al buscador: aproximadamente el 65% de las consultas muestran un aumento del interés cuando son TT e - inclusive - entre el 44% y 59% obtienen su pico de inter és. Estos resultados se consideran indicios positivos respecto de la hipótesis planteada abriendo oportunidades de aprovechamiento de esta información para optimizar procesos internos de un motor de búsqueda.X Workshop bases de datos y minería de datosRed de Universidades con Carreras en Informática (RedUNCI
Gaussian Anamorphosis for Ensemble Kalman Filter Analysis of SAR-Derived Wet Surface Ratio Observations
Flood simulation and forecast capability have been greatly improved thanks to
advances in data assimilation (DA) strategies incorporating various types of
observations; many are derived from spatial Earth Observation. This paper
focuses on the assimilation of 2D flood observations derived from Synthetic
Aperture Radar (SAR) images acquired during a flood event with a dual
state-parameter Ensemble Kalman Filter (EnKF). Binary wet/dry maps are here
expressed in terms of wet surface ratios (WSR) over a number of subdomains of
the floodplain. This ratio is further assimilated jointly with in-situ
water-level observations to improve the flow dynamics within the floodplain.
However, the non-Gaussianity of the observation errors associated with
SAR-derived measurements break a major hypothesis for the application of the
EnKF, thus jeopardizing the optimality of the filter analysis. The novelty of
this paper lies in the treatment of the non-Gaussianity of the SAR-derived WSR
observations with a Gaussian anamorphosis process (GA). This DA strategy was
validated and applied over the Garonne Marmandaise catchment (South-west of
France) represented with the TELEMAC-2D hydrodynamic model, first in a twin
experiment and then for a major flood event that occurred in January-February
2021. It was shown that assimilating SAR-derived WSR observations, in
complement to the in-situ water-level observations significantly improves the
representation of the flood dynamics. Also, the GA transformation brings
further improvement to the DA analysis, while not being a critical component in
the DA strategy. This study heralds a reliable solution for flood forecasting
over poorly gauged catchments thanks to available remote-sensing datasets.Comment: 19 pages, 13 figures. Submitted to the IEEE Transactions on
Geoscience and Remote Sensin
An Embarrassment of Witches
A review of the 2020 book by Sophie Goldstein and Jenn Jordan, "An Embarrassment of Witches," for inclusion in ARLIS/NA's 2020 Notable Graphic Novels Review
Redes sociales y motores de búsqueda
Internet puede verse desde hace algunos años como un flujo constante de información. Esto se debe en gran parte al contenido producido en las redes sociales. Dicha cuestión puede apreciarse, por ejemplo, en las plataformas de microblogging y dentro de ellas sobre todo en Twitter.
Entre las características más importantes de esta plataforma se encuentran los Trending Topics, que son un listado de frases, términos y etiquetas relacionados a los temas emergentes más populares en la red social en determinado momento.
Así, teniendo en cuenta las cuestiones previamente mencionadas, cabe preguntarse si el hecho de que cierto tema sea Trending Topic, influye de algún modo en el volumen de consultas que recibe un motor de búsqueda sobre dicho tema.
Este proyecto propone explorar y analizar dicha cuestión y su aplicación en la mejora de los algoritmos de búsqueda.Eje: Bases de Datos y Minería de DatosRed de Universidades con Carreras en Informática (RedUNCI
Enhancing Flood Forecasting with Dual State-Parameter Estimation and Ensemble-based SAR Data Assimilation
Hydrodynamic
Búsquedas selectivas sobre flujos de documentos
La cantidad de información digital que se genera día a día impone restricciones a los usuarios en cuanto a la facilidad de acceso. Considerando la necesidad de acceder a información relevante, la alta tasa de aparición de nuevo contenido genera la necesidad de contar con herramientas de búsqueda que puedan manejar el tamaño, complejidad y dinamismo de las fuentes de información digital actuales. Este problema no puede ser resuelto en el ámbito de un solo equipo de cómputo por lo que requiere de una arquitectura que involucra procesamiento paralelo y distribuido, la cual incluye diseñar y optimizar estructuras de datos y algoritmos eficientes que las gestionen.
Esta arquitectura es desafiada cuando los documentos aparecen en flujos en tiempo real como, por ejemplo, las publicaciones en las redes sociales. Un caso paradigmático son las publicaciones en Twitter, en la cual millones de usuarios alrededor del mundo publican “documentos cortos” (tweets) desde diferentes tipos de dispositivos (generalmente, móviles), los cuales deben estar disponibles casi de inmediato (segundos) por lo que las estructuras de datos deben soportar un alto dinamismo. Esto contrasta con la búsquedas web clásicas, donde el índice invertido se actualiza en modo batch ya que existe un tiempo entre actualizaciones debido a la necesidad de recolectar los nuevos documentos a indexar.
Un abordaje actual a este problema es la partición de la colección en porciones (shards) de acuerdo a algún criterio (por ejemplo, temático) de manera tal de enviar las consultas solamente a un número reducido n de nodos (n C P) que contengan particiones de la colección que potencialmente pueden satisfacer la consulta. Este problema se lo conoce como “búsquedas selectivas” (selective search) e incluye métodos que permiten seleccionar los recursos adecuados, algoritmos de fusión de resultados parciales y estrategias adaptadas de caching.
Este trabajo presenta las líneas de investigación en el contexto de las búsquedas en tiempo real utilizando una arquitectura basada en búsquedas selectivas. Las propuestas abarcan el estudio, diseño y evaluación de los criterios de actualización del índice invertidos por partición, las estrategias de cache a implementar y el algoritmo de búsqueda final y cómo estos impactan en la performance que se pretende optimizar (eficiencia y/o efectividad).Eje: Base de Datos y Minería de Datos.Red de Universidades con Carreras en Informátic
Algoritmos eficientes para búsquedas a gran escala integrando datos masivos
El crecimiento explosivo de contenido en la web crea nuevas necesidades de almacenamiento, procesamiento y propone múltiples desafíos a los sistemas de búsquedas. Por un lado, existen necesidades puntuales de los servicios que recolectan y utilizan esta información y por el otro, aparecen oportunidades únicas para avances científico/tecnológicos en áreas como algoritmos, estructuras de datos, sistemas distribuidos y procesamiento de datos a gran escala, entre otras.
El acceso a la información en tiempo y forma es un factor esencial en muchos procesos que ocurren en dominios diferentes: la academia, la industria, el entretenimiento, entre otros. En la actualidad, el enfoque más general para acceder a la información en la web es el uso de motores de búsqueda. listos son sistemas distribuidos de altas prestaciones que se basan en estructuras de datos y algoritmos altamente eficientes ya que operan bajo estrictas restricciones de tiempo: las consultas deben ser respondidas en pequeñas fracciones de tiempo, típicamente, milisegundos. Esta problemática tiene aún muchas preguntas abiertas y - mientras se intentan resolver cuestiones - aparecen nuevos desafíos .
En este proyecto se estudian y evalúan estructuras de datos y algoritmos eficientes junto con el análisis de datos masivos para mejorar procesos internos de un motor de búsqueda.Eje: Base de Datos y Minería de DatosRed de Universidades con Carreras en Informática (RedUNCI
Reducing Uncertainties of a Chained Hydrologic-hydraulic Model to Improve Flood Forecasting Using Multi-source Earth Observation Data
The challenges in operational flood forecasting lie in producing reliable
forecasts given constrained computational resources and within processing times
that are compatible with near-real-time forecasting. Flood hydrodynamic models
exploit observed data from gauge networks, e.g. water surface elevation (WSE)
and/or discharge that describe the forcing time-series at the upstream and
lateral boundary conditions of the model. A chained hydrologic-hydraulic model
is thus interesting to allow extended lead time forecasts and overcome the
limits of forecast when using only observed gauge measurements. This research
work focuses on comprehensively reducing the uncertainties in the model
parameters, hydraulic state and especially the forcing data in order to improve
the overall flood reanalysis and forecast performance. It aims at assimilating
two main complementary EO data sources, namely in-situ WSE and SAR-derived
flood extent observations.Comment: Copyright 2023 IEEE. Published in the IEEE 2023 International
Geoscience & Remote Sensing Symposium (IGARSS 2023), scheduled for July 16 -
21, 2023 in Pasadena, California, US
- …