162 research outputs found

    Indexación de Sitios Web para Optimizar la Búsqueda de Paquetes Turísticos Basado en Web Scraping

    Get PDF
    The Web Scraping technique allows the extraction of content from various websites, collecting information of interest to the user. The purpose of this project is to develop a website in which you can store information on the different tourist packages that are offered by travel agencies that operate in the Puno region using the web Scraping technique. The population is made up of 38 web pages as registered in IPERÚ Puno. For the elaboration of the extraction algorithm, the XP software development methodology was used and the Wilcoxon signed rank test was used to test the hypothesis. As a result, the analysis of the DOM structure allowed the development of the extraction algorithm, making use of Python as the programming language, the efficiency of the algorithm was also tested, which proved to be efficient compared to the webscraper program. The algorithmic complexity was determined to be linear. The performance of our website according to the global PageSpeed ​​Insights score is in the fast category (97 points). The evaluation of the website based on the ISO 25000 standard gave a rating of 6.67 / 10 points as total quality, considered as acceptable level and satisfactory grade. It is concluded that the implementation of the website facilitates the search for different tourist packages.La técnica del Web Scraping permite la extracción de contenido de varios sitios web, recabando información de interés para el usuario. El presente proyecto tiene como finalidad desarrollar un sitio web en la cual pueda almacenar información de los diferentes paquetes turísticos que son ofertados por las agencias de viaje que operan en la región de Puno utilizando la técnica del web Scraping. La población está conformada por 38 páginas web según inscritas en IPERÚ Puno. Para la elaboración del algoritmo de extracción se utilizó la metodología de desarrollo de software XP y para el contaste de la hipótesis se utilizó prueba de rangos con signo de Wilcoxon. Como resultado, el análisis de la estructura DOM permitió el desarrollo del algoritmo de extracción, haciendo uso de Python como lenguaje de programación, también se puso a prueba la eficiencia del algoritmo, el cual demostró ser eficiente en comparación con la el programa webscraper. Se determinó que la complejidad algorítmica es lineal. Del desempeño de nuestro sitio web según la puntuación global de PageSpeed Insights está en la categoría rápida (97 puntos). La evaluación del sitio web basado en la norma ISO 25000 proporcionó una valoración de 6.67/10 puntos como calidad total, considerado como nivel aceptable y grado satisfactorio. Se concluye que la implementación del sitio web facilita la búsqueda de diferentes paquetes turísticos

    BotMentor: Bot de ayuda al estudiante en la plataforma Telegram

    Get PDF
    Este documento detalla el proceso de análisis, diseño e implementación del proyecto de fin de grado BotMentor, así como otras etapas necesarias para su realización. Este proyecto consiste en una plataforma pensada inicialmente para alumnos, que, haciendo uso de los sistemas de información de la universidad y más en concreto de la facultad de informática de la complutense, provea a éstos de la información relevante que puede interesar a un alumno y la provee de manera rápida y eficaz. Dicho sistema se basa en una plataforma de bots. Para su desarrollo se ha optado por la elaboración de un servicio que mediante scraping recolecta información de la web de la facultad, almacenándola en una base de datos, un servicio web que consulta esa base de datos devolviendo la información útil solicitada y un bot en la plataforma Telegram que permite el acceso seguro y rápido a dicha información

    Raspando la Arqueología: Una Aproximación Metodológica desde el Web Scraping y Text Mining

    Get PDF
    A medida que la cantidad de información disponible en la web aumenta, también lo hace la tarea de localizarla y analizarla, por lo cual realizar esta tarea de forma manual puede ser costosa en función al tiempo y esfuerzo invertido. Aunque los buscadores y los motores de bases de datos pueden ayudar a encontrar la información requerida, en infraestructuras digitales grandes donde los resultados de búsqueda se cuentan por millares – o más– se precisan de nuevas herramientas para obtener el contenido buscado de manera efectiva. Este trabajo propone la aplicación de Web Scraping y Text Mining como insumos metodológicos para poder compilar y procesar grandes volúmenes de datos en infraestructuras digitales de una forma más automatizada. La automatización de ambos procesos aporta una gran ventaja al analizar corpus textuales de miles de registros lo cual simplifica de manera significativa la obtención de diferentes tipos de datos, facilitando el trabajo considerablemente. Se espera que esta contribución permita ampliar las posibilidades de la comunidad arqueológica en clave de una metodología novedosa para la obtención y el manejo de datos estructurados y no estructurados que pueden ser integrados a las investigaciones de la comunidad arqueológica en general

    Implementación y construcción de vistas Front-end y base de datos normalizada para la plataforma de marcado de autogestión de riesgos -MAR

    Get PDF
    RESUMEN: La gerencia de Investigación, Desarrollo e Innovación (I+D+I) perteneciente a la vicepresidencia de Auditoria Interna del Grupo Bancolombia propuso el desarrollo de una plataforma de Marcado de Autogestión de Riesgos –MAR–, RegTech, con el objetivo de proporcionar a los clientes una herramienta funcional para la prevención de riesgos, así como para facilitar la adaptación a los cambios. Debido a ello, se realizó un soporte y acompañamiento en el desarrollo del proyecto orientado al desarrollo front-end de la plataforma, el diseño y la organización de la base de datos y, el ingreso de información a esta mediante la técnica de Web scraping en diferentes listas de control propuestas y definidas por la misma entidad bancaria. Para este desarrollo, fue necesario consultar la documentación sobre Django y Bootstrap, sobre los frameworks propuestos para el desarrollo back-end y front-end para la gestión de la base de datos, y el desarrollo de la interfaz de usuario (UI), respectivamente; también se desarrollaron habilidades en la técnica Web scraping para la extracción de información de las páginas web. Adicional, a lo largo de la práctica se definió la metodología Scrum, implementando sprints semanales con lo cual fue posible cumplir con los objetivos propuestos. Finalmente, a partir del análisis de resultados fue posible concluir que el desarrollo de este proyecto permitió construir una primera versión funcional de la plataforma, amigable con el usuario y funcional en el tema de consulta de información

    Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping

    Get PDF
    La técnica del Web Scraping permite la extracción de contenido de varios sitios web, recabando información de interés para el usuario; a fin de ser presentada de forma ordenada y estructurada para su posterior utilización. El presente proyecto tiene como finalidad desarrollar un sitio web en la cual pueda almacenar información de los diferentes paquetes turísticos que son ofertados por las agencias de viaje que operan en la región de Puno utilizando la técnica del web Scraping. La población está conformada por 38 páginas web según inscritas en IPERÚ Puno. Para la elaboración del algoritmo de extracción se utilizó la metodología de desarrollo de software XP y para el contaste de la hipótesis se utilizó prueba de rangos con signo de Wilcoxon. Como resultado, el análisis de la estructura DOM permitió el desarrollo del algoritmo de extracción, haciendo uso de Python como lenguaje de programación, también se puso a prueba la eficiencia del algoritmo, el cual demostró ser eficiente en comparación con la el programa webscraper. Se determinó que la complejidad algorítmica es lineal O(n). Del desempeño de nuestro sitio web según la puntuación global de PageSpeed Insights está en la categoría rápida (97 puntos). La evaluación del sitio web basado en la norma ISO 25000 proporcionó una valoración de 6.96/10 puntos como calidad total, considerado como nivel aceptable y grado satisfactorio. Se concluye que la implementación del sitio web facilita la búsqueda de diferentes paquetes turísticos, reduciendo el tiempo empleado de forma significativa p-valor (0.015)< α(0.05)Tesi

    Big Data, Algorithms and Politics: The Social Sciences in the Era of Social Media

    No full text
    El presente artículo ofrece un estado del arte de cómo se ha venido a estudiar empíricamente la relación entre política y redes sociales en la última década, desde el punto de vista de la naturaleza del objeto de estudio, las nuevas técnicas de análisis y métodos sobre las que se han apoyado las ciencias sociales, las agendas de investigación a que ha dado lugar y algunos de los dilemas éticos que suscita. El artículo consta de tres partes. Primero, desarrollamos una discusión de los principales métodos de análisis de la relación entre política y redes sociales, el big data y los algoritmos, y lo comparamos con los métodos tradicionales de encuestas de opinión. Segundo, ofrecemos una revisión de las principales preocupaciones que han guiado la investigación en los últimos diez años: la representación y campañas políticas, nuevas comunidades políticas y nuevas formas de acción colectiva. Finalmente, la tercera sección reflexiona sobre los dilemas éticos y debates que plantea el uso de las nuevas técnicas de análisis en las ciencias sociales.The article offers a state of art about the empirical study of the relationship between politics and social media during the last decade, from the point of view of the nature of the subject, new research techniques and methods used in the social sciences, the research agendas it has fostered, and some of the ethical dilemmas this research raises. The article is divided in three main parts. Firstly, we develop a discussion of the main research methods to approach the relationship between politics and digital media, big data and algorithms, which we compare with traditional opinion polls. Secondly, we offer a review of the main issues that have guided this research agenda during the last ten years: political representation and campaigns, emerging political communities, and new forms of collective action. Finally, the last section reflects on the ethical dilemmas and debates that arise from the utilization of new research methods in the social sciences

    Herramientas y recursos para la elaboración y análisis de mapas electorales

    Get PDF
    A través de la comunicación, el presente autor pretender dar a conocer cuales son las herramientas (QGIS, CartoDB, OpenStreetMap, MapBox,Google Maps, D3.js y NVD3, Excel, Google Refine, etc...) y recursos existentes para elaborar un mapa electoral en el que se muestren los resultados electorales por debajo del nivel municipal (distritos, secciones y colegios electorales), investigando cuales son las limitaciones existentes tanto a nivel práctico como legal en relación a la información aportada por la administración, que tal y como se podrá comprobar a lo largo de este documento es manifiestamente mejorable, así como su utilización en diferentes medios de comunicación. En una segunda parte se darán recursos para poder hacer un uso correcto de las terminologías existente en cuanto se plantee el debate cíclico de la reforma de la "ley electoral" que como se podrá comprobar resala un concepto ambiguo y que abarca una amplia gama de conceptos que agrupa en verdad el "sistema electoral", cuyas consecuencias sobre los votantes pueden ayudar a la vez a explicar parte de los datos mostrados en la representaciones geográficas que son abordadas en esta comunicación

    Discursividades y violencias: la (re)apropiación de la consigna #NiUnaMenos en Twitter

    Get PDF
    En esta ponencia indagaremos las formaciones discursivas que circulan en la red social digital Twitter en torno a las (re)apropiaciones de la consigna #NiUnaMenos en los días previos a la realización de una movilización el pasado 3 de junio de 2017. Buscamos analizar la actividad de las y los usuarios desde las diversas interacciones que surgen a partir de tuits o retuits donde aparezca el hashtag #NiUnaMenos para poder dar cuenta de los modos en los que circulan los discursos en torno a esta consigna, qué significaciones se entretejen en los escenarios online y qué implicancias tienen en las prácticas cotidianas.Usos y apropiaciones de las tecnologías en la vida cotidiana.Universidad Nacional de La Plata (UNLP) - Facultad de Periodismo y Comunicación Socia

    Discursividades y violencias: la (re)apropiación de la consigna #NiUnaMenos en Twitter

    Get PDF
    En esta ponencia indagaremos las formaciones discursivas que circulan en la red social digital Twitter en torno a las (re)apropiaciones de la consigna #NiUnaMenos en los días previos a la realización de una movilización el pasado 3 de junio de 2017. Buscamos analizar la actividad de las y los usuarios desde las diversas interacciones que surgen a partir de tuits o retuits donde aparezca el hashtag #NiUnaMenos para poder dar cuenta de los modos en los que circulan los discursos en torno a esta consigna, qué significaciones se entretejen en los escenarios online y qué implicancias tienen en las prácticas cotidianas.Usos y apropiaciones de las tecnologías en la vida cotidiana.Universidad Nacional de La Plata (UNLP) - Facultad de Periodismo y Comunicación Socia

    Discursividades y violencias: la (re)apropiación de la consigna #NiUnaMenos en Twitter

    Get PDF
    En esta ponencia indagaremos las formaciones discursivas que circulan en la red social digital Twitter en torno a las (re)apropiaciones de la consigna #NiUnaMenos en los días previos a la realización de una movilización el pasado 3 de junio de 2017. Buscamos analizar la actividad de las y los usuarios desde las diversas interacciones que surgen a partir de tuits o retuits donde aparezca el hashtag #NiUnaMenos para poder dar cuenta de los modos en los que circulan los discursos en torno a esta consigna, qué significaciones se entretejen en los escenarios online y qué implicancias tienen en las prácticas cotidianas.Usos y apropiaciones de las tecnologías en la vida cotidiana.Universidad Nacional de La Plata (UNLP) - Facultad de Periodismo y Comunicación Socia
    corecore