9 research outputs found

    Hit count estimate variability for website-specific queries in search engines: The case for rare disease association websites

    Full text link
    "This article is (c) Emerald Group Publishing and permission has been granted for this version to appear here https://doi.org/10.1108/AJIM-10-2017-0226. Emerald does not grant permission for this article to be further copied/distributed or hosted elsewhere without the express permission from Emerald Group Publishing Limited"[EN] Purpose - The purpose of this paper is to determine the effect of the chosen search engine results page (SERP) on the website-specific hit count estimation indicator. Design/methodology/approach - A sample of 100 Spanish rare disease association websites is analysed, obtaining the website-specific hit count estimation for the first and last SERPs in two search engines (Google and Bing) at two different periods in time (2016 and 2017). Findings - It has been empirically demonstrated that there are differences between the number of hits returned on the first and last SERP in both Google and Bing. These differences are significant when they exceed a threshold value on the first SERP. Research limitations/implications - Future studies considering other samples, more SERPs and generating different queries other than website page count (ositeW) would be desirable to draw more general conclusions on the nature of quantitative data provided by general search engines. Practical implications - Selecting a wrong SERP to calculate some metrics (in this case, website-specific hit count estimation) might provide misleading results, comparisons and performance rankings. The empirical data suggest that the first SERP captures the differences between websites better because it has a greater discriminating power and is more appropriate for webometric longitudinal studies. Social implications - The findings allow improving future quantitative webometric analyses based on website-specific hit count estimation metrics in general search engines. Originality/value - The website-specific hit count estimation variability between SERPs has been empirically analysed, considering two different search engines (Google and Bing), a set of 100 websites focussed on a similar market (Spanish rare diseases associations), and two annual samples, making this study the most exhaustive on this issue to date.Font-Julian, CI.; Ontalba Ruipérez, JA.; Orduña Malea, E. (2018). Hit count estimate variability for website-specific queries in search engines: The case for rare disease association websites. Aslib Journal of Information Management. 70(2):192-213. https://doi.org/10.1108/AJIM-10-2017-0226S192213702Bar-Ilan, J. (2001). Scientometrics, 50(1), 7-32. doi:10.1023/a:1005682102768Bowler, L., Hong, W., & He, D. (2011). The visibility of health web portals for teens: a hyperlink analysis. Online Information Review, 35(3), 443-470. doi:10.1108/14684521111151469European Organization for Rare Diseases (2012), “What is a rare disease?”, available at: www.eurordis.org/content/what-rare-disease (accessed 10 January 2018).Forman, J., Taruscio, D., Llera, V. A., Barrera, L. A., Coté, T. R., … Edfjäll, C. (2012). The need for worldwide policy and action plans for rare diseases. Acta Paediatrica, 101(8), 805-807. doi:10.1111/j.1651-2227.2012.02705.xGao, Y., & Vaughan, L. (2005). Web hyperlink profiles of news sites. Aslib Proceedings, 57(5), 398-411. doi:10.1108/00012530510621851Gouveia, F. C., & Kurtenbach, E. (2009). Mapping the web relations of science centres and museums from Latin America. Scientometrics, 79(3), 491-505. doi:10.1007/s11192-007-1949-8Groselj, D. (2014). A webometric analysis of online health information: sponsorship, platform type and link structures. Online Information Review, 38(2), 209-231. doi:10.1108/oir-01-2013-0011Lewandowski, D. (2008). A three-year study on the freshness of web search engine databases. Journal of Information Science, 34(6), 817-831. doi:10.1177/0165551508089396Li, X. (2003). A review of the development and application of the Web impact factor. Online Information Review, 27(6), 407-417. doi:10.1108/14684520310510046Noruzi, A. (2006). The web impact factor: a critical review. The Electronic Library, 24(4), 490-500. doi:10.1108/02640470610689188Orduna-Malea, E. (2014), “Caracterización y rendimiento del sistema museístico de la comunidad valenciana a través de un análisis cibermétrico”, in Gimenez-Chornet, V. (Ed.), Gestión Cultural: Innovación y Tendencias, Tirant Lo Blanch, Valencia, pp. 13-43.Orduña-Malea, E., Delgado López-Cózar, E., Serrano-Cobos, J., & Romero, N. L. (2015). Disclosing the network structure of private companies on the web. Online Information Review, 39(3), 360-382. doi:10.1108/oir-11-2014-0282Park, H. W., Kim, C.-S., & Barnett, G. A. (2004). Socio-Communicational Structure among Political Actors on the Web in South Korea. New Media & Society, 6(3), 403-423. doi:10.1177/1461444804042522Rodríguez i Gairín, J. M. (1997). Valoración del impacto de la información en Internet: Altavista, el «Citation Index» de la red. Revista española de Documentación Científica, 20(2), 175-181. doi:10.3989/redc.1997.v20.i2.591Romero-Frías, E., & Vaughan, L. (2010). European political trends viewed through patterns of Web linking. Journal of the American Society for Information Science and Technology, 61(10), 2109-2121. doi:10.1002/asi.21375Satoh, K. and Yamana, H. (2012), “Hit count reliability: how much can we trust hit counts?”, in Sheng, Q.Z., Wang, G., Jensen, C.S. and Xu, G. (Eds), Asia-Pacific Web Conference, Springer, Berlin Heidelberg, April, pp. 751-758.Snyder, H., & Rosenbaum, H. (1999). Can search engines be used as tools for web‐link analysis? A critical view. Journal of Documentation, 55(4), 375-384. doi:10.1108/eum0000000007151Uyar, A. (2009). Investigation of the accuracy of search engine hit counts. Journal of Information Science, 35(4), 469-480. doi:10.1177/0165551509103598Vaughan, L., & Thelwall, M. (2004). Search engine coverage bias: evidence and possible causes. Information Processing & Management, 40(4), 693-707. doi:10.1016/s0306-4573(03)00063-3Vaughan, L., & Wu, G. (2004). Links to commercial websites as a source of business information. Scientometrics, 60(3), 487-496. doi:10.1023/b:scie.0000034389.14825.bcWilkinson, D., & Thelwall, M. (2013). Search markets and search results: The case of Bing. Library & Information Science Research, 35(4), 318-325. doi:10.1016/j.lisr.2013.04.00

    Search engine positioning of Spanish official websites of provincial capitals on searches of city brand

    Get PDF
    Study of ranking in Google and Yahoo of big Spanish municipal corporation websites while searching by city tourist brand. Analysis of whether city tourist brands are promoting properly in the internet. Results of the daily ranking monitoring in Google and Yahoo are shown, for the searches made in 2009 by touristic brands of Spanish provincial capitals. The results show that 66% of official websites are situated after number 40 and, also, that in 46% of the searches made by touristic brands of province capital there is an official website within the top 10 positions. Empirical evidence about the weight of backlinks and keywords for SEO has also been detected

    ¿Quién hace SEO en España? Metodología cibermétrica para la construcción de universos de empresas

    Get PDF
    Due to their widespread use, search engines, and specifically Google, are extremely important to attract qualified traffic and thereby achieve the commercial objectives of corporations. Search engine optimization (SEO) allows enhanced connection of corporate websites with their audiences through search engines, using certain keywords. This study describes a methodology to determine the most important Spanish companies offering SEO services to third parties, representing an exploratory study of applied cybermetrics for the construction of a universe of companies. One of the relevant results of this work is the design of an information retrieval strategy based on a statistical analysis of search terms and the performance of geolocated searches in all the provincial capitals and Spanish cities with more than 100,000 inhabitants. After cleaning and reviewing the unique URLs, it is concluded that there are 1,043 companies offering SEO services in Spain positioned in Google. These are basically companies with more than one person, operating from a single location, and that offer other services in their portfolio together with SEO. In addition to providing a starting point for future research on the SEO sector in Spain, this research proposes a methodology for the creation of study universes of brands or companies.Debido a su uso generalizado, los buscadores y en concreto Google, tienen una enorme importancia para captar tráfico cualificado y así conseguir los objetivos de negocio de las corporaciones. El SEO (search engine optimization) permite mejorar la conexión de las webs de las corporaciones con sus públicos a través de los buscadores, según determinadas palabras clave. En esta investigación se presenta una metodología para conocer la oferta española, con mejor posicionamiento, de servicios SEO a terceros. Se trata de un estudio exploratorio de cibermetría aplicada, para la construcción de un universo de empresas. Uno de los resultados relevantes es el diseño de la estrategia de recuperación de la información, basado en el análisis estadístico de términos de búsqueda y la realización de búsquedas geolocalizadas en todas las capitales de provincia y ciudades españolas de más de 100.000 habitantes. Tras la depuración y revisión de las urls únicas, se concluye que existen 1.043 negocios que ofrecen el servicio SEO en España posicionados en Google. Fundamentalmente son empresas de más de una persona, con una única localización y que cuentan con otros servicios en cartera conjuntamente con el SEO. Además de ser un punto de partida para próximas investigaciones sobre el sector del SEO en España, esta investigación plantea una metodología para la creación de universos de estudio de marcas o empresas.This work is linked to the project “Interactive narration and digital visibility in interactive documentaries and structured journalism” [“Narración interactiva y visibilidad digital en el documental interactivo y el periodismo estructurado”], RTI2018-095714-B-C21 (Micinn/Feder), Ministerio de Ciencia, Innovación y Universidades, Spain

    Attentes versus réalité

    Get PDF
    Les chercheurs qui analysent le Web s’appuient sur des données qui sont souvent collectées à l’aide des moteurs de recherche. Dans une précédente contribution (Bar-Ilan, 2005), l’auteur a proposé une liste d’objectifs pour le moteur de recherche idéal en expliquant le besoin de fonctionnalités spécifiques pour ce type d’activité. Ici, il revisite cette liste et examine si les principaux moteurs de recherche actuels peuvent répondre, au moins partiellement, aux exigences de l’outil de recherche idéal. Les principaux outils de recherche sont commerciaux et destinés à l’utilisateur « moyen » et non au chercheur scientifique qui analyse le Web, ils ne peuvent donc pas satisfaire toutes les demandes.Web research is based on data from the Web. Often data is collected using search engines. In a previous paper (Bar-Ilan, 2005) we proposed a “wish list” for the ideal search engine and explained the need for specific features. In this paper we revisit this list and examine whether the currently existing major search engines can at least partially fulfil the requirements of the ultimate search tool. The major search tools are commercial and are oriented towards the “average” user and not towards the Web researcher, and therefore are unable to meet all the requests

    Els museus catalans a la web 2.0: anàlisi de la difusió dels seus fons i de les seves activitats a les xarxes socials

    Get PDF
    [cat] Les xarxes socials han revolucionat i modificat les formes de relació i comunicació entre les persones i les institucions. Aquestes relacions a través de les xarxes s’han convertit en un nou paradigma comunicatiu. L’objectiu principal de la tesi és mostrar com els museus de Catalunya interactuen i difonen el seu patrimoni a través de les xarxes socials. L’estudi i l’anàlisi s’han desenvolupat metodològicament des d’una doble perspectiva: quantitativa i qualitativa, creant paràmetres i indicadors per l’estudi de webmetria i s’ha fet un seguiment d’observació i recollida de dades en diferents plataformes. Els resultats mostren una situació molt heterogènia en tots els sentits del sistema museístic de Catalunya, amb una complexa organització territorial. La interacció museu-visitant (presencial o virtual) a Catalunya té mancances significatives. Algunes propostes de reflexió i debat, a mode de conclusió, intenten contribuir a nous plantejaments per una comunicació més efectiva entre els museus i els seus seguidors/visitants.[eng] Social networks have shaken up and modified the way of relationship and communication between people and institutions. These relationships have become a new communicational paradigm. The main objective of the thesis is to display how the museums in Catalonia interact and spread their heritage through social networks. The study and analysis have been methodologically developed from a double perspective: quantitative and qualitative, creating parameters and indicators for the webometrics study and tracking observation and data collection on different platforms. The results show a very heterogeneous situation in every way of the museum system of Catalonia with a complex territorial organization. The museum-visitor interaction (face-to-face or virtual) in Catalonia has a significant lack. Some suggestions of reflection and discussion, as a conclusion, attempt to contribute new approaches for a more effective communication between museums and their supporters/visitors

    The Janus Faced Scholar:a Festschrift in honour of Peter Ingwersen

    Get PDF

    Web manifestations of knowledge-based innovation systems in the UK

    Get PDF
    Innovation is widely recognised as essential to the modern economy. The term knowledgebased innovation system has been used to refer to innovation systems which recognise the importance of an economy’s knowledge base and the efficient interactions between important actors from the different sectors of society. Such interactions are thought to enable greater innovation by the system as a whole. Whilst it may not be possible to fully understand all the complex relationships involved within knowledge-based innovation systems, within the field of informetrics bibliometric methodologies have emerged that allows us to analyse some of the relationships that contribute to the innovation process. However, due to the limitations in traditional bibliometric sources it is important to investigate new potential sources of information. The web is one such source. This thesis documents an investigation into the potential of the web to provide information about knowledge-based innovation systems in the United Kingdom. Within this thesis the link analysis methodologies that have previously been successfully applied to investigations of the academic community (Thelwall, 2004a) are applied to organisations from different sections of society to determine whether link analysis of the web can provide a new source of information about knowledge-based innovation systems in the UK. This study makes the case that data may be collected ethically to provide information about the interconnections between web sites of various different sizes and from within different sectors of society, that there are significant differences in the linking practices of web sites within different sectors, and that reciprocal links provide a better indication of collaboration than uni-directional web links. Most importantly the study shows that the web provides new information about the relationships between organisations, rather than just a repetition of the same information from an alternative source. Whilst the study has shown that there is a lot of potential for the web as a source of information on knowledge-based innovation systems, the same richness that makes it such a potentially useful source makes applications of large scale studies very labour intensive.EThOS - Electronic Theses Online ServiceGBUnited Kingdo

    Präsenz und Sichtbarkeit von Meeresforschungsinstituten im World Wide Web : eine Fallstudie zum Potential der Webometrie zur Untersuchung der internationalen Einbettung wissenschaftlicher Einrichtungen

    Get PDF
    Ruschenburg T. Präsenz und Sichtbarkeit von Meeresforschungsinstituten im World Wide Web : eine Fallstudie zum Potential der Webometrie zur Untersuchung der internationalen Einbettung wissenschaftlicher Einrichtungen. Bielefeld (Germany): Bielefeld University; 2010.Das World Wide Web hat in den 20 Jahren seit seiner Entstehung die Vernetzung und den Austausch von Informationen innerhalb der wissenschaftlichen Gemeinschaft enorm erleichtert. In der quantitativen Wissenschaftsforschung sowie der Informationswissenschaft wird seit Mitte der 90er Jahre darüber diskutiert, inwiefern das World Wide Web Aufschluss über die sozialen Strukturen der Wissenschaft gegeben kann. Vorbild war dabei zunächst die etablierte quantitative Methode der Wissenschaftsforschung: die Bibliometrie. Auf der Grundlage von Publikations-, Zitations- und Koautorenschaftsdaten lassen sich mit bibliometrischen Verfahren beispielsweise Erkenntnisse über den Stellenwert und die Vernetzung einzelner ForscherInnen, Gruppen, Forschungseinrichtungen oder Nationen gewinnen. In Anlehnung daran werden nun unter dem Begriff "Webometrie" Daten zur Größe von Websites und ihrer Vernetzung durch Links analysiert, um die virtuelle Präsenz und Vernetzung verschiedener wissenschaftlicher Entitäten zu bestimmen. Neben oberflächlichen Parallelen zur Bibliometrie wurden jedoch schnell auch fundamentale Unterschiede deutlich. Sie resultieren aus spezifischen Eigenschaften des World Wide Webs, das anderen Zwecken dient als Fachzeitschriften und das - anders als Publikationsdatenbanken - keine retrospektiven Untersuchungen zulässt, das kaum formal standardisiert ist und in dem eine systematische Qualitätskontrolle fehlt, wie sie in wissenschaftlichen Zeitschriften mit der Peer-Review fest verankert ist. Folglich befasst sich ein großer Teil der webometrischen Literatur mit der Entwicklung neuer Verfahren und Indikatoren sowie mit der Prüfung ihrer Aussagekraft. Dies gilt auch für die vorliegende Dissertation, die sich mit der Frage befasst, inwiefern webometrische Verfahren dazu geeignet sind, internationale Zusammenhänge in der Wissenschaft zu untersuchen. Diese Frage ist bislang nicht systematisch betrachtet worden. Um sie beantworten zu können, wurden auf der Grundlage zweier literaturbasierter Kapitel - zur Entwicklung der Webometrie sowie zur webometrischen Untersuchung internationaler Zusammenhänge in der Wissenschaft - drei Leitfragen entwickelt: 1. Wie aussagekräftig sind Top-Level-Domains als Indikatoren der nationalen Verortung? 2. Inwieweit ähneln sich die Bilder, die webometrische und bibliometrische Indikatoren von der internationalen Einbettung von Forschungseinrichtungen zeigen? 3. Hängen Präsenz und Vernetzung wissenschaftlicher Einrichtungen im World Wide Web (bzw. im Web of Science) mit dem Entwicklungsstand ihrer Sitzländer zusammen? Die drei Leitfragen wurden im Rahmen einer empirischen Fallstudie geklärt. Gegenstand der Fallstudie waren zehn Meeresforschungseinrichtungen in deutsch- und englischsprachigen Ländern. Die Ergebnisse dieser Dissertation sprechen dafür, dass die Webometrie eher eine Ergänzung als ein Ersatz für die Bibliometrie darstellt. Beide befassen sich mit sehr unterschiedlichen Datenquellen, die ihre eigenen Anforderungen an die Methode stellen. Im Hinblick auf internationale Fragestellungen hat eine Limitierung in der Reichweite webometrischer Anwendungen gezeigt: Da keine zuverlässigen, automatisiert auszuwertenden Indikatoren für die nationale Zuordnung von Webseiten zur Verfügung stehen, muss die Webometrie internationale Fragestellungen weiterhin anhand ausgewählter Websites durchführen, deren nationale Verortung bekannt ist. Darüber hinaus zeigte sich ein eher negatives Bild, was die Einbindung von Forschungseinrichtungen in Entwicklungsländern in Webstrukturen betrifft: Durch die global digital divide im Internetzugang weisen die untersuchten Meeresforschungseinrichtungen in englischsprachigen Entwicklungsländern - im Verhältnis zu ihrer personellen Größe - deutlich kleinere Websites auf als diejenigen in Deutschland und den USA. Sie sind zudem wesentlich schwächer verlinkt. Im Gegensatz dazu stellte sich heraus, dass die Publikationen der Forschungsinstitute durchgängig zu hohen Teilen im Web of Science erfasst werden. Das Einrichten und Pflegen einer Webpräsenz ist offensichtlich eine Anforderung, die Forschungseinrichtungen in Industrieländern - u.a. mit Hilfe von spezialisiertem Personal - besser bewältigen und für sich nutzen können als solche in Entwicklungsländern. Dort belastet diese zusätzliche, wissenschaftsfremde Aufgabe die ohnehin knappen Forschungsressourcen. Bisher verschärft das World Wide Web somit die bestehende Ungleichheit in der globalen Forschungslandschaft eher, als dass es sie mildert. Es ist anzunehmen, dass Forschungseinrichtungen, die nicht die Möglichkeit haben, ihre Existenz und ihre Aktivitäten im World Wide Web darzustellen, Chancen - beispielsweise auf neue Kooperationen - entgehen

    Neuroinformatics in Functional Neuroimaging

    Get PDF
    This Ph.D. thesis proposes methods for information retrieval in functional neuroimaging through automatic computerized authority identification, and searching and cleaning in a neuroscience database. Authorities are found through cocitation analysis of the citation pattern among scientific articles. Based on data from a single scientific journal it is shown that multivariate analyses are able to determine group structure that is interpretable as particular “known ” subgroups in functional neuroimaging. Methods for text analysis are suggested that use a combination of content and links, in the form of the terms in scientific documents and scientific citations, respectively. These included context sensitive author ranking and automatic labeling of axes and groups in connection with multivariate analyses of link data. Talairach foci from the BrainMap ™ database are modeled with conditional probability density models useful for exploratory functional volumes modeling. A further application is shown with conditional outlier detection where abnormal entries in the BrainMap ™ database are spotted using kernel density modeling and the redundancy between anatomical labels and spatial Talairach coordinates. This represents a combination of simple term and spatial modeling. The specific outliers that were found in the BrainMap ™ database constituted among others: Entry errors, errors in the article and unusual terminology
    corecore