9 research outputs found
Análisis comparativo del comportamiento de diferentes motores de búsqueda en el tratamiento de la investigación sobre Enfermedades Raras
[ES] Las Enfermedades Raras son aquellas que afectan a una pequeña proporción de la
población, con los consiguientes problemas de investigación y financiación que existen. Para
dar visibilidad a las mismas en internet, se quiere conocer el tratamiento que dan los
buscadores a la información que se encuentra online.
Las búsquedas en Internet son esenciales para poder encontrar información, debido a esto
se plantea conocer la visibilidad y presencia de los portales de asociaciones de Enfermedades
Raras en la Web mediante los motores de búsqueda., analizando el sesgo que estos aplican
sobre la información relacionada con Enfermedades Raras.
Para ello, se realiza un análisis acerca del interés sobre Enfermedades Raras, listando todas
las asociaciones relacionadas extraídas de diversas fuentes de información, y elaborando un
directorio unificado con 438 entradas. Se selecciona un top 50 de enfermedades y, tras cruzar
los datos con el listado de asociaciones, se escogen cien distintas.
Se realiza la extracción de datos relativa a diversos indicadores para cada una de ellas,
empleando varios programas creados para este proyecto, que automáticamente recogen los
datos de los dos buscadores analizados, Google y Bing. Finalmente, se procesan y analizan
para conocer el tratamiento que dan los motores de búsqueda a la información existente sobre
Enfermedades Raras.
De los 100 portales analizados, únicamente el 25% obtiene buenos resultados. El impacto
en general no es bueno, de media se sitúa en 5,25 puntos según el Factor de Impacto en la
Web (WIF). Debido a la correlación que existe entre los diferentes resultados obtenidos,
Google es el más indicado para encontrar información relativa a Enfermedades Raras. En
función de los resultados obtenidos, se concluye que la presencia y visibilidad en la Web de
las Enfermedades Raras debería ser mejorada.[CA] Les Malalties Rares són aquelles que afecten una menuda proporció de la població, amb els
consegüents problemes d'investigació i finançament que existeixen. Per a donar visibilitat a les
mateixes en Internet, es vol conéixer el tractament que donen els buscadors a la informació
que es troba online.
Les busques en Internet són essencials per a trobar informació, per açò es planteja conéixer
la visibilitat i presència dels portals d'associacions de Malalties Rares en la Web per mitjà dels
motors de busca, analitzant el biaix que apliquen a la informació relacionada amb Malalties
Rares.
Per a això, es realitza una anàlisi sobre l’interès sobre Malalties Rares, llistant totes les
associacions relacionades extretes de diverses fonts d'informació, i elaborant un directori
unificat amb 438 entrades. Es selecciona un top 50 de malalties i, creuant les dades amb el
llistat d'associacions, es trien cent distintes. Es realitza l'extracció de dades de diversos
indicadors per a cadascuna d’elles, utilitzant diversos programes creats per a este projecte, que
automàticament arrepleguen les dades dels dos buscadors analitzats, Google i Bing.
Finalment, es processen i analitzen per a conéixer el tractament que donen els motors de
busca a la informació sobre Malalties Rares. Dels 100 portals analitzats, únicament el 25%
obté bons resultats. L'impacte en general no és bo, de mitja es situa en 5,25 punts segons el
Factor d'Impacte en la Web (WIF). A causa de la correlació que existeix entre els diferents
resultats obtinguts, Google és el més indicat per a trobar informació relativa a Malalties Rares.
En funció dels resultats obtinguts, es conclou que la presència i visibilitat en la Web de les
Malalties Rares hauria de ser millorada.[EN] Rare Diseases are those who affect a small portion of the population, with the related
problems in research and financial problems that this has. To give visibility to them on the
Internet, it’s necessary to know how the search engines manage the online information.
Internet searches are essential to find information, because of this, knowing about the
visibility and presence of Rare Diseases association’s portals in the web through search
engines is required, analysing the bias applied by them to the Rare Diseases information.
To do this, an analysis of interest on Rare Diseases is made, listing all related associations
drawn from various sources of information, and developed an unified directory with 438
entries. Selected a top 50 diseases and, after crossing the data with the list of associations, a
hundred associations are chosen.
Data extraction is performed on several indicators, using different programs developed for
this project, which automatically collect data from two search engines, Google and Bing.
Finally, data is processed and analysed to determine how the search engines manage rare
diseases information.
Of the hundred portals analysed, only 25% has good results. The overall impact is not
good, the average stands at 5,25 points according to Web Impact Factor (WIF). Regarding the
correlation between the results, Google is the best suited to find information on Rare Diseases.
Depending on the results, it is concluded that the presence and visibility on the Web of Rare
Disesase should be improved.Font Julián, CI. (2016). Análisis comparativo del comportamiento de diferentes motores de búsqueda en el tratamiento de la investigación sobre Enfermedades Raras. http://hdl.handle.net/10251/71688.TFG
Descubrimiento y evaluación de recursos web de calidad mediante Patent Link Analysis
[ES] Las patentes son documentos legales que describen el funcionamiento exacto de una invención, otorgando el derecho de explotación económica a sus dueños a cambio de dar a conocer a la sociedad los detalles de funcionamiento de dicha invención. Para que una patente pueda ser concedida debe cumplir tres requisitos: ser novedad (no haber sido expuesto o publicado con anterioridad), cumplir la actividad inventiva y tener aplicación industrial. Es por ello que las patentes son documentos valiosos, ya que contienen una gran cantidad de información técnica no incluida antes en otro tipo de documento (publicado o disponible). Debido a las características particulares de las patentes, los recursos que éstas mencionan, así como los recursos que mencionan a las patentes, contienen enlaces que pueden ser útiles y dar apoyo a diversas aplicaciones (vigilancia tecnológica, desarrollo e innovación, Triple-Helix, etc.) al disponer de información complementaria, así como de la creación de herramientas y técnicas que permitan extraerlos y analizarlos.
El método propuesto para alcanzar los objetivos que definen la tesis se encuentra divido en dos bloques complementarios: Patent Outlink y Patent Inlink, que juntos conforman la técnica de Patent Link Analysis.
Para realizar el estudio se selecciona la Oficina de Patentes y Marcas de Estados Unidos (USPTO), recogiendo todas aquellas patentes concedidas entre los años 2008 y 2018 (ambos incluidos). Una vez extraída la información a analizar en cada bloque se cuenta con: 3.133.247 de patentes, 2.745.973 millones de enlaces contenidos en patentes, 2.297.366 millones de páginas web de patentes enlazadas, 17.001 paginas únicas web enlazando a patentes y 990.663 patentes únicas enlazadas desde documentos web.
Los resultados del análisis de Patent Outlink muestran como tanto la cantidad de patentes que contienen enlaces (20%), como el número de enlaces contenido en patentes (mediana 4-5) es todavía bajo, pero ha crecido significativamente durante los últimos años y se puede esperar un mayor uso en el futuro. Existe una diferencia clara en el uso de enlaces entre áreas de conocimiento (42% pertenecen a Física, especialmente Computación y Cálculos), así como por secciones dentro de los documentos, explicando los resultados obtenidos y la proyección de análisis futuros.
Los resultados del análisis de Patent Inlink identifica una cantidad considerable menor de dominios webs que enlazan a patentes (17.001 frente a 256.724), pero existen más enlaces por documento enlazante (el número de enlaces total es similar para ambos bloques de análisis). Así mismo, los datos muestran una elevada dispersión, con unos pocos dominios generando una gran cantidad de enlaces. Ambos bloques muestran la existencia de una alta relación con empresas y servicios tecnológicos, existiendo diferencias relativas a los enlaces a Universidades y Gobiernos (más enlaces en Outlink).
Los resultados muestran que el modelo de análisis propuesto permite y facilita el descubrimiento y evaluación de recursos web de calidad. Así mismo, se concluye que la cibermetría, mediante el análisis de enlaces, aporta información de interés para el análisis de los recursos web de calidad a través de los enlaces contenidos y dirigidos a documentos de patentes.
El método propuesto y validado permite de un modo eficiente, eficaz y replicable la extracción y análisis de los enlaces contenidos y dirigidos a documentos de patentes. Permitiendo, a su vez, definir, modelar y caracterizar el Patent Link Analysis como un subgénero del Link Analysis que puede ser utilizado para la construcción de sistemas de monitorización de link intelligence, de evaluación y/o de calidad entre otros, mediante el uso de los enlaces entrantes y salientes de documentos de patentes aplicable universidades, centros de investigación, así como empresas públicas y privadas.[CA] Les patents són documents legals que descriuen el funcionament exacte d'una invenció, atorgant el dret d'explotació econòmica als seus amos a canvi de donar a conéixer a la societat els detalls de funcionament d'aquesta invenció. Perquè una patent puga ser concedida ha de complir tres requisits: ser novetat (no haver sigut exposat o publicat amb anterioritat), complir l'activitat inventiva i tindre aplicació industrial. És per això que les patents són documents valuosos, ja que contenen una gran quantitat d'informació tècnica no inclosa abans en un altre tipus de document (publicat o disponible). A causa de les característiques particulars de les patents, els recursos que aquestes esmenten, així com els recursos que esmenten les patents, contenen enllaços que poden ser útils i donar suport a diverses aplicacions (vigilància tecnològica, desenvolupament i innovació, Triple-Helix, etc.) en disposar d'informació complementària, així com de la creació d'eines i tècniques que permeten extraure'ls i analitzar-los. El mètode proposat per a aconseguir els objectius que defineixen la tesi es troba dividisc en dos blocs complementaris: Patent Outlink i Patent Inlink, que junts conformen la tècnica de Patent Link Analysis. Per a realitzar l'estudi es selecciona l'Oficina de Patents i Marques dels Estats Units (USPTO), recollint totes aquelles patents concedides entre els anys 2008 i 2018 (tots dos inclosos). Una vegada extreta la informació a analitzar en cada bloc es compta amb: 3.133.247 de patents, 2.745.973 milions d'enllaços continguts en patents, 2.297.366 milions de pàgines web de patents enllaçades, 17.001 pàgines úniques web enllaçant a patents i 990.663 patents úniques enllaçades des de documents web. Els resultats de l'anàlisi de Patent Outlink mostren com tant la quantitat de patents que contenen enllaços (20%), com el nombre d'enllaços contingut en patents (mitjana 4-5) és encara baix, però ha crescut significativament durant els últims anys i es pot esperar un major ús en el futur. Existeix una diferència clara en l'ús d'enllaços entre àrees de coneixement (42% pertanyen a Física, especialment Computació i Càlculs), així com per seccions dins dels documents, explicant els resultats obtinguts i la projecció d'anàlisis futures. Els resultats de l'anàlisi de Patent Inlink identifica una quantitat considerable menor de dominis webs que enllacen a patents (17.001 enfront de 256.724), però hi ha més enllaços per document enllaçant (el nombre d'enllaços total és similar per a tots dos blocs d'anàlisis). Així mateix, les dades mostren una elevada dispersió, amb uns pocs dominis generant una gran quantitat d'enllaços. Tots dos blocs mostren l'existència d'una alta relació amb empreses i serveis tecnològics, existint diferències relatives als enllaços a Universitats i Governs (més enllaços en Outlink). Finalment, es verifica que el model d'anàlisi proposat i facilita l'extracció i anàlisi dels enllaços continguts i dirigits a documents de patents, així com facilitar el descobriment i avaluació de recursos web de qualitat. A més, es conclou que la cibermetría, mitjançant l'anàlisi d'enllaços, aporta informació d'interés per a l'anàlisi dels recursos web de qualitat a través dels enllaços continguts i dirigits a documents de patents. El mètode proposat i validat permet definir, modelar i caracteritzar el Patent Link Analysis com un subgènere del Link Analysis que pot ser utilitzat per a la construcció de sistemes de monitoratge de link intelligence, d'avaluació i/o de qualitat entre altres, mitjançant l'ús dels enllaços entrants i sortints de documents de patents aplicable a universitats, centres d'investigació, així com empreses públiques i privades.[EN] Patents are legal documents that describe the exact operation of an invention, granting the right of economic exploitation to its owners in exchange for describing the details of the operation of said invention. For a patent to be granted, it must meet three requirements: be novel (not have been previously exhibited or published), comply with the inventive step, and have industrial application. That is why patents are valuable documents, since they contain a large amount of technical information not previously included in another type of document (published or available). Due to the particular characteristics of patents, the resources that they mention, as well as the resources that mention patents, contain links that can be useful and give support to various applications (technological surveillance, development and innovation, Triple-Helix, etc.) by having complementary information, as well as the creation of tools and techniques that allow them to be extracted and analyzed.
The proposed method to achieve the objectives that define the thesis is divided into two complementary blocks: Patent Outlink and Patent Inlink, which together make up the Patent Link Analysis technique.
To carry out the study, the United States Patent and Trademark Office (USPTO) is selected, collecting all those patents granted between 2008 and 2018 (both included). Once the information to be analyzed has been extracted in each block, there are: 3,133,247 patents, 2,745,973 million links contained in patents, 2,297,366 million linked patent web pages, 17,001 unique web pages linking patents and 990,663 Unique patents linked from web documents.
The results of the Patent Outlink analysis show that both the number of patents that contain links (20%) and the number of links contained in patents (median 4-5) is still low, but has grown significantly in recent years and you can expect more use in the future. There is a clear difference in the use of links between areas of knowledge (42% belong to Physics, especially Computing and Calculus), as well as by sections within the documents, explaining the results obtained and the projection of future analyzes.
The results of the Patent Inlink analysis identify considerably fewer web domains that link to patents (17,001 vs. 256,724), but there are more links per linking document (the total number of links is similar for both analysis blocks). Likewise, the data shows a high dispersion, with a few domains generating a large number of links. Both blocks show the existence of a high relationship with companies and technological services, with differences related to links to Universities and Governments (more links in Outlink).
Finally, it is verified that the proposed model allows in an efficient, effective and replicable way the extraction and analysis of the links contained and directed to patent documents, as well as facilitating the discovery and evaluation of quality web resources. In addition, it is concluded that cybermetrics, through the link analysis technique, provides information of interest for the analysis of quality web resources through the links contained and directed to patent documents.
The proposed and validated method allows defining, modeling and characterizing Patent Link Analysis as a subgenre of Link Analysis that can be used for the construction of link intelligence monitoring, evaluation and / or quality systems, among others, through the use of the inbound and outbound links of applicable patent documents universities, research centers, as well as public and private companies.La presente tesis doctoral ha sido financiada por el Gobierno de España mediante el
contrato predoctoral para la formación de doctores FPI BES-2017-079741 otorgada
por el Ministerio de Ciencia e Innovación.Font Julián, CI. (2021). Descubrimiento y evaluación de recursos web de calidad mediante Patent Link Analysis [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/170640TESI
Universidades en Google: hacia un modelo de análisis multinivel del posicionamiento web académico: material complementario
Material complementario con datos brutos utilizados en artículo aceptado para su publicación en la Revista Española de Documentación Científica.
Se incluye la taxonomía de consultas realizada, las combinaciones de palabras clave y consultas efectuadas, los resultados de posicionamiento de universidades públicas valencianas en Google (top 20) así como la clasificación temática del primer sitio web posicionado de cada universidad para cada consulta.Gonzalez-Llinares, J.; Font Julián, CI.; Orduña Malea, E. (2020). Universidades en Google: hacia un modelo de análisis multinivel del posicionamiento web académico: material complementario. https://doi.org/10.4995/Dataset/10251/13872
Spatiotemporal Characteristics of the Largest HIV-1 CRF02_AG Outbreak in Spain: Evidence for Onward Transmissions
Background and Aim: The circulating recombinant form 02_AG (CRF02_AG) is the predominant clade among the human immunodeficiency virus type-1 (HIV-1) non-Bs with a prevalence of 5.97% (95% Confidence Interval-CI: 5.41–6.57%) across Spain. Our aim was to estimate the levels of regional clustering for CRF02_AG and the spatiotemporal characteristics of the largest CRF02_AG subepidemic in Spain.Methods: We studied 396 CRF02_AG sequences obtained from HIV-1 diagnosed patients during 2000–2014 from 10 autonomous communities of Spain. Phylogenetic analysis was performed on the 391 CRF02_AG sequences along with all globally sampled CRF02_AG sequences (N = 3,302) as references. Phylodynamic and phylogeographic analysis was performed to the largest CRF02_AG monophyletic cluster by a Bayesian method in BEAST v1.8.0 and by reconstructing ancestral states using the criterion of parsimony in Mesquite v3.4, respectively.Results: The HIV-1 CRF02_AG prevalence differed across Spanish autonomous communities we sampled from (p < 0.001). Phylogenetic analysis revealed that 52.7% of the CRF02_AG sequences formed 56 monophyletic clusters, with a range of 2–79 sequences. The CRF02_AG regional dispersal differed across Spain (p = 0.003), as suggested by monophyletic clustering. For the largest monophyletic cluster (subepidemic) (N = 79), 49.4% of the clustered sequences originated from Madrid, while most sequences (51.9%) had been obtained from men having sex with men (MSM). Molecular clock analysis suggested that the origin (tMRCA) of the CRF02_AG subepidemic was in 2002 (median estimate; 95% Highest Posterior Density-HPD interval: 1999–2004). Additionally, we found significant clustering within the CRF02_AG subepidemic according to the ethnic origin.Conclusion: CRF02_AG has been introduced as a result of multiple introductions in Spain, following regional dispersal in several cases. We showed that CRF02_AG transmissions were mostly due to regional dispersal in Spain. The hot-spot for the largest CRF02_AG regional subepidemic in Spain was in Madrid associated with MSM transmission risk group. The existence of subepidemics suggest that several spillovers occurred from Madrid to other areas. CRF02_AG sequences from Hispanics were clustered in a separate subclade suggesting no linkage between the local and Hispanic subepidemics
APP para la Gestión de Incidencias
> es una aplicación que trata de solventar un problema en concreto entre un servicio técnico y sus clientes. Se trata de una aplicación con la que se intenta facilitar la resolución de incidencias a ambas partes, ayudando a recoger los datos de los usuarios para agilizar el trabajo al soporte técnico o dando soluciones a los problemas que puedan tener los usuarios con su certificado digital. Para poder usar la aplicación sólo es necesario un teléfono con sistema operativo Android.Font Julián, CI. (2014). APP para la Gestión de Incidencias. http://hdl.handle.net/10251/39656.Archivo delegad
[Dataset] Coronavirus en YouTube
Este dataset contiene por una parte la muestra inicial de 73.268 vídeos recuperados en YouTube ante consultas específicas relacionadas con covid-19 y España y, por otra parte, la muestra final de 39-702 vídeos en los que aparece explícitamente el término coronavirus, covid-19 o SARS-CoV-2 en el título o descripción de los vídeos.
Para cada vídeo se ofrecen distintos descriptores (autor, canal, fecha de publicación, categorización, título, duración) y métricas (visualizaciones, likes, dislikes y comentarios). Los datos fueron obtenidos mediante la herramienta Webometric Analyst durante mayo de 2020.
Este dataset forma parte del estudio titulado "Covid-19: análisis métrico de vídeos y canales de comunicación en YouTube", aceptado para su publicación en la revista El profesional de la información.Orduña Malea, E.; Font Julián, CI.; Ontalba Ruipérez, JA. (2020). [Dataset] Coronavirus en YouTube. https://doi.org/10.4995/Dataset/10251/14367
Comunicación científica (XXXVIII). Cómo hacer una estrategia «social media» para pediatras (V). Academic SEO a través de Google Scholar
[EN] The scientists¿ search behavior in their quest for scientific information has shift in recent years, increasing the use of Google Scholar as a main source of inquiry. Therefore, it is imperative to better understand how is possible to improve the findability of scientific production within this search engine. In the article, a selection of factors and communication actions are presented, so as to implement them in order to improve the online presence of pediatricians, supporting the online impact of their digital scientific production.[ES] La interacción de los científicos en sus conductas de búsqueda de información científica ha cambiado en los últimos años, con la utilización cada vez más de Google Scholar como fuente principal de indagación. Por tanto, para mejorar el impacto científico es necesario entender cómo mejorar la encontrabilidad de la producción científica en este buscador, por lo que en este artículo se desglosa una selección de factores y acciones de comunicación que llevar a cabo con el fin de mejorar la presencia online de los pediatras y apoyar el impacto de su producción digital.Serrano Cobos, JI.; Font Julián, CI.; González De Dios, J.; Aleixandre-Benavent, R. (2016). Comunicación científica (XXXVIII). Cómo hacer una estrategia «social media» para pediatras (V). Academic SEO a través de Google Scholar. Acta pediátrica española. 74(10):266-272. http://hdl.handle.net/10251/91860S266272741
Discovering HIV related information by means of association rules and machine learning
Acquired immunodeficiency syndrome (AIDS) is still one of the main health problems worldwide. It is therefore essential to keep making progress in improving the prognosis and quality of life of affected patients. One way to advance along this pathway is to uncover connections between other disorders associated with HIV/AIDS-so that they can be anticipated and possibly mitigated. We propose to achieve this by using Association Rules (ARs). They allow us to represent the dependencies between a number of diseases and other specific diseases. However, classical techniques systematically generate every AR meeting some minimal conditions on data frequency, hence generating a vast amount of uninteresting ARs, which need to be filtered out. The lack of manually annotated ARs has favored unsupervised filtering, even though they produce limited results. In this paper, we propose a semi-supervised system, able to identify relevant ARs among HIV-related diseases with a minimal amount of annotated training data. Our system has been able to extract a good number of relationships between HIV-related diseases that have been previously detected in the literature but are scattered and are often little known. Furthermore, a number of plausible new relationships have shown up which deserve further investigation by qualified medical experts
How do women living with HIV experience menopause? Menopausal symptoms, anxiety and depression according to reproductive age in a multicenter cohort
CatedresBackground: To estimate the prevalence and severity of menopausal symptoms and anxiety/depression and to assess the differences according to menopausal status among women living with HIV aged 45-60 years from the cohort of Spanish HIV/AIDS Research Network (CoRIS). Methods: Women were interviewed by phone between September 2017 and December 2018 to determine whether they had experienced menopausal symptoms and anxiety/depression. The Menopause Rating Scale was used to evaluate the prevalence and severity of symptoms related to menopause in three subscales: somatic, psychologic and urogenital; and the 4-item Patient Health Questionnaire was used for anxiety/depression. Logistic regression models were used to estimate odds ratios (ORs) of association between menopausal status, and other potential risk factors, the presence and severity of somatic, psychological and urogenital symptoms and of anxiety/depression. Results: Of 251 women included, 137 (54.6%) were post-, 70 (27.9%) peri- and 44 (17.5%) pre-menopausal, respectively. Median age of onset menopause was 48 years (IQR 45-50). The proportions of pre-, peri- and post-menopausal women who had experienced any menopausal symptoms were 45.5%, 60.0% and 66.4%, respectively. Both peri- and post-menopause were associated with a higher likelihood of having somatic symptoms (aOR 3.01; 95% CI 1.38-6.55 and 2.63; 1.44-4.81, respectively), while post-menopause increased the likelihood of having psychological (2.16; 1.13-4.14) and urogenital symptoms (2.54; 1.42-4.85). By other hand, post-menopausal women had a statistically significant five-fold increase in the likelihood of presenting severe urogenital symptoms than pre-menopausal women (4.90; 1.74-13.84). No significant differences by menopausal status were found for anxiety/depression. Joint/muscle problems, exhaustion and sleeping disorders were the most commonly reported symptoms among all women. Differences in the prevalences of vaginal dryness (p = 0.002), joint/muscle complaints (p = 0.032), and sweating/flush (p = 0.032) were found among the three groups. Conclusions: Women living with HIV experienced a wide variety of menopausal symptoms, some of them initiated before women had any menstrual irregularity. We found a higher likelihood of somatic symptoms in peri- and post-menopausal women, while a higher likelihood of psychological and urogenital symptoms was found in post-menopausal women. Most somatic symptoms were of low or moderate severity, probably due to the good clinical and immunological situation of these women