15 research outputs found

    Real-time focused extraction of social media users

    Get PDF
    In this paper, we explore a real-time automation challenge: the problem of focused extraction of Social Media users. This challenge can be seen as a special form of focused crawling where the main target is to detect users with certain patterns. Given a specific user profile, the task consists of rapidly ingesting Social Media data and early detecting target users. This is a real-time intelligent automation task that has numerous applications in domains such as safety, health or marketing. The volume and dynamics of Social Media contents demand efficient real-time solutions able to predict which users are worth to explore. To meet this aim, we propose and evaluate several methods that effectively allow us to harvest relevant users. Even with little contextual information (e.g., a single user submission), our methods quickly focus on the most promising users. We also developed a distributed microservice architecture that supports real-time parallel extraction of Social Media users. This modular architecture scales up in clusters of computers and it can be easily adapted for user extraction in multiple domains and Social Media sources. Our experiments suggest that some of the proposed prioritisation methods, which work with minimal user context, are effective at rapidly focusing on the most relevant users. These methods perform satisfactorily with huge volumes of users and interactions and lead to harvest ratios 2 to 9 times higher than those achieved by random prioritisationThis work was supported in part by the Ministerio de Ciencia e Innovación (MICINN) under Grant RTI2018-093336-B-C21 and Grant PLEC2021-007662; in part by Xunta de Galicia under Grant ED431G/08, Grant ED431G-2019/04, Grant ED431C 2018/19, and Grant ED431F 2020/08; and in part by the European Regional Development Fund (ERDF)S

    A Big Data Platform for Real Time Analysis of Signs of Depression in Social Media

    Get PDF
    In this paper we propose a scalable platform for real-time processing of Social Media data. The platform ingests huge amounts of contents, such as Social Media posts or comments, and can support Public Health surveillance tasks. The processing and analytical needs of multiple screening tasks can easily be handled by incorporating user-defined execution graphs. The design is modular and supports different processing elements, such as crawlers to extract relevant contents or classifiers to categorise Social Media. We describe here an implementation of a use case built on the platform that monitors Social Media users and detects early signs of depressionThis work was funded by FEDER/Ministerio de Ciencia, Innovación y Universidades—Agencia Estatal de Investigación/ Project (RTI2018-093336-B-C21). Our research also receives financial support from the Consellería de Educación, Universidade e Formación Profesional (accreditation 2019–2022 ED431G-2019/04, ED431C 2018/29, ED431C 2018/19) and the European Regional Development Fund (ERDF), which acknowledges the CiTIUS-Research Center in Intelligent Technologies of the University of Santiago de Compostela as a Research Center of the Galician University SystemS

    An unsupervised perplexity-based method for boilerplate removal

    Get PDF
    The availability of large web-based corpora has led to significant advances in a wide range of technologies, including massive retrieval systems or deep neural networks. However, leveraging this data is challenging, since web content is plagued by the so-called boilerplate: ads, incomplete or noisy text and rests of the navigation structure, such as menus or navigation bars. In this work, we present a novel and efficient approach to extract useful and well-formed content from web-scraped data. Our approach takes advantage of Language Models and their implicit knowledge about correctly formed text, and we demonstrate here that perplexity is a valuable artefact that can contribute in terms of effectiveness and efficiency. As a matter of fact, the removal of noisy parts leads to lighter AI or search solutions that are effective and entail important reductions in resources spent. We exemplify here the usefulness of our method with two downstream tasks, search and classification, and a cleaning task. We also provide a Python package with pre-trained models and a web demo demonstrating the capabilities of our approachS

    Variables psicológicas implicadas en la actitud e iniciativa emprendedora

    Get PDF
    Identificar variables individuales relacionadas con la iniciativa emprendedora y el fomento de competencias transversales relacionadas con la misma, supone un desafío en la investigación actual sobre emprendimiento. El proyecto titulado Variables psicológicas implicadas en la actitud e iniciativa emprendedora, realizado bajo el programa Innova Docencia promovido por el Vicerrectorado de Calidad de la UCM en la convocatoria 2016-2017, ha tenido por objetivo analizar y evaluar variables psicológicas relacionadas con emprendimiento que presentan una muestra de estudiantes de la Universidad Complutense de Madrid. En dicho estudio han participado 1222 estudiantes de la UCM correspondientes a 27 titulaciones: 14 de Grado, 2 de Dobles Grados, y 11 de Máster. El 28,6% de la muestra fueron hombres y el 71% fueron mujeres. La media de edad fue de 20,43 años. El equipo investigador estuvo compuesto por 40 personas: 25 PDI de la UCM, 2 PAS, 8 alumnos y alumnas, 1 técnico, y 4 PDI de las universidades de Castilla-La Mancha (UCLM), UNED, Carlos III de Madrid (UC3M), y Alcalá de Henares (UAH). El PDI de la UCM correspondía a las siguientes facultades: Psicología (7), Ciencias de la Documentación (3), Ciencias Económicas y Empresariales (6), Ciencias Políticas y Sociología (3), Comercio (1), Trabajo Social (1), Ciencias Biológicas (2), Informática (1), y Bellas Artes (1). Un equipo UCM perteneciente a 9 facultades, que representó a 13 departamentos y a todas las áreas de conocimiento. La metodología empleada consistió en un cuestionario que evaluaba los siguientes aspectos: datos sociodemográficos, actitud emprendedora, y las variables psicológicas: personalidad, inteligencia emocional, resolución de problemas y tolerancia a la ambigüedad. Se optó por instrumentos estandarizados, con buenas características psicométricas de fiabilidad y validez que permitieran obtener resultados robustos, con amplia evidencia empírica y que evaluaban adecuadamente variables que la literatura ha relacionado con la actitud e iniciativa emprendedora. Además todos ellos se han utilizado en investigaciones relacionadas con emprendimiento, lo que aumentó la validez externa. Se ha analizado la iniciativa emprendedora desde el punto de vista de los estudiantes y también teniendo en cuenta variables del entorno familiar y personal. Los resultados nos muestran que son las variables psicológicas de extraversión, reparación emocional y estrategias de resolución de problemas las que predicen la iniciativa emprendedora. Los estudiante que compaginan estudios y trabajo tienen una mayor iniciativa emprendedora, y aquellos cuyos padres y/o pareja desarrollan su actividad laboral como autónomos. Se presentan datos por titulación académica, sexo, actividad laboral de los padres y compaginar estudios y trabajo. Se muestran datos de todas las variables psicológicas por titulación académica, y una comparativa de dichas variables entre los universitarios, un grupo de estudiantes de Formación Profesional (FP) y una muestra de emprendedores reales. Los resultados obtenidos son relevantes para tomar decisiones orientadas a la mejora de la actitud, iniciativa y comportamiento emprendedor. Permitirán el diseño y ejecución de actividades académicas para sensibilizar a los estudiantes en la cultura emprendedora, y formar en competencias transversales, cada vez más demandadas, para mejorar la empleabilidad y competitividad como claves para el crecimiento de nuestra sociedad

    Variables psicológicas implicadas en la actitud e iniciativa emprendedora (II): personalidad, cognición y emoción

    Get PDF
    El proyecto titulado: Variables implicadas en la actitud e iniciativa emprendedora (II): personalidad, cognición y emoción, es la continuidad de otro presentado en la convocatoria anterior (2016-2017) cuyo objetivo era evaluar variables psicológicas en la actitud emprendedora de los estudiantes universitarios de la Universidad Complutense de Madrid (UCM). Este segundo proyecto ha tenido por objetivo principal ampliar la evaluación a otras facultades y áreas de conocimiento de nuestra universidad a fin de obtener el mapa y perfil de la iniciativa emprendedora del universitario UCM

    EstuPlan: Methodology for the development of creativity in the resolution of scientific and social problems

    Full text link
    [EN] Creative thinking is necessary to generate novel ideas and solve problems. "EstuPlan" is a methodology in which knowledge and creativity converge for the resolution of scientific problems with social projection. It is a training programme that integrates teachers, laboratory technicians and PhD students, master and undergraduate students which form working groups for the development of projects. Projects have a broad and essential scope and projection in terms of environmental problems, sustainable use of natural resources, food, health, biotechnology or biomedicine. The results show the success of this significant learning methodology using tools to develop creativity in responding to scientific and social demand for problem-solving to transfer academic knowledge to different professional environments. Bioplastics, Second Life of Coffee, LimBio, Algae oils, Ecomers, Caring for the life of your crop and Hate to Deforestate are currently being developed.Astudillo Calderón, S.; De Díez De La Torre, L.; García Companys, M.; Ortega Pérez, N.; Rodríguez Martínez, V.; Alzahrani, S.; Alonso Valenzuela, R.... (2019). EstuPlan: Methodology for the development of creativity in the resolution of scientific and social problems. En HEAD'19. 5th International Conference on Higher Education Advances. Editorial Universitat Politècnica de València. 711-717. https://doi.org/10.4995/HEAD19.2019.9205OCS71171

    Modelo De Negocios Canvas: Análisis De Sus Horizontes Epistemológicos

    Get PDF
    El objeto de la investigación es analizar los componentes del modelos de negocios Canvas para deducir su horizonte epistemológico y contrastarlo con el paradigma del modelo educativo de Universidad de Guayaquil, Facultad de Ciencias Administrativas, tipología de trabajo de titulación : Modelos de Negocio. El alcance del estudio es exploratorio y descriptivo, se utilizó el método teórico de análisis- síntesis y el método empírico a través de encuestas; dirigidas a estudiantes del último nivel, entrevistas a docentes tutores y expertos. Se reflexiona y debate que el modelo de negocio Canvas, contiene un enfoque epistemológico de carácter tecnológico o conectivismo desde lo empírico, positivismo, mercantilismo, que no evoluciona a lo holístico y critico social; por tanto se prioriza: el mercado- empresa-inversión financiera y no a la sociedad que la acoge, coincide con los componentes del modelo de negocio para trabajos de titulación. No, así la Universidad de Guayaquil quien proclama un modelo educativo por competencias y procesos, de visión holístico y crítico social, sistémico. Se delega para futuras investigaciones de carácter correlacional y explicativa; el diseño de un modelo de negocios de factibilidad económico social que determine la visión económica- social  de la universidad y su relación formativa en futuros graduados

    DNA Methylation in Neurodegenerative and Cerebrovascular Disorders

    No full text
    DNA methylation is an epigenetic mechanism by which methyl groups are added to DNA, playing a crucial role in gene expression regulation. The aim of the present study is to compare methylation status of healthy subjects with that of patients with Alzheimer’s, Parkinson’s or Cerebrovascular diseases. We also analyze methylation status of a transgenic Alzheimer’s disease mouse model (3xTg-AD). Our results show that both global methylation (n = 141) and hydroxymethylation (n = 131) levels are reduced in DNA samples from buffy coats of patients with neurodegenerative disorders and age-related cerebrovascular disease. The importance of methylation and hydroxymethylation reduction is stressed by the finding that DNMT3a mRNA levels are also downregulated in buffy coats of patients with Dementia (n = 25). Global methylation is also reduced in brain, liver and serum samples of 3xTg-AD vs. wild type mice, such as DNMT3a mRNA levels that are also decreased in the brain of 3xTg-AD (n = 10). These results suggest that the use of global methylation and hydroxymethylation levels, together with the study of DNMT3a expression, could be useful as a new diagnostic biomarker for these prevalent disorders
    corecore