5 research outputs found

    Multilingual log analysis: LogCLEF

    Get PDF
    The current lack of recent and long-term query logs makes the verifiability and repeatability of log analysis experiments very limited. A first attempt in this direction has been made within the Cross-Language Evaluation Forum in 2009 in a track named LogCLEF which aims to stimulate research on user behaviour in multilingual environments and promote standard evaluation collections of log data. We report on similarities and differences of the most recent activities for LogCLEF

    Multilingual adaptive search for digital libraries

    Get PDF
    This paper describes a framework for Adaptive Multilingual Information Retrieval (AMIR) which allows multilingual resource discovery and delivery using on-the-fly machine translation of documents and queries. Result documents are presented to the user in a contextualised manner. Challenges and affordances of both Adaptive and Multilingual IR, with a particular focus on Digital Libraries, are detailed. The framework components are motivated by a series of results from experiments on query logs and documents from The European Library. We conclude that factoring adaptivity and multilinguality aspects into the search process can enhance the user’s experience with online Digital Libraries

    The Archive Query Log: Mining Millions of Search Result Pages of Hundreds of Search Engines from 25 Years of Web Archives

    Full text link
    The Archive Query Log (AQL) is a previously unused, comprehensive query log collected at the Internet Archive over the last 25 years. Its first version includes 356 million queries, 166 million search result pages, and 1.7 billion search results across 550 search providers. Although many query logs have been studied in the literature, the search providers that own them generally do not publish their logs to protect user privacy and vital business data. Of the few query logs publicly available, none combines size, scope, and diversity. The AQL is the first to do so, enabling research on new retrieval models and (diachronic) search engine analyses. Provided in a privacy-preserving manner, it promotes open research as well as more transparency and accountability in the search industry.Comment: SIGIR 2023 resource paper, 13 page

    Multilinguale Herausforderungen in der Sacherschließung

    Get PDF
    In einer Zeit, in der vermehrt automatische Verfahren der Inhaltserschließung eingesetzt und (weiter)entwickelt werden, leistet die vorliegende Studie einen Beitrag zur Diskussion um die Bedeutung der intellektuellen Sacherschließung beim Information Retrieval in einem multilingualen Kontext. Am Fallbeispiel des Online-Katalogs des Ibero-Amerikanischen Instituts wird in einem Retrievaltest die Beteiligung der überwiegend deutschsprachigen Schlagworte aus einem lokalen Thesaurus beim Auffinden von Dokumenten evaluiert. In der Studie werden 80 aus einem Logfile gewonnene Suchanfragen getestet, die in zwei gleich große Purpose Samples unterteilt wurden: ein deutsch- und ein fremdsprachiges. Ein zentrales Ergebnis der Analyse ist, dass die Indexierung mit lokalen Schlagworten für einen erheblichen Anteil der zu den Suchanfragen aufgefundenen Dokumenten verantwortlich ist. Es lassen sich jedoch unter Berücksichtigung der Multilingualität der Suchanfragen deutliche Unterschiede mit Blick auf die Bedeutung der lokalen Schlagworte ausmachen. Auch das Verhältnis der intellektuellen Sacherschließung zur automatischen Indexierung von Elementen der Kataloganreicherung (Inhaltsverzeichnisse, Volltexte o.Ä.) wird näher beleuchtet und Stärken und Schwächen der verschiedenen Erschließungsformen werden diskutiert. Abschließend werden Möglichkeiten aufgezeigt, das Potential der lokalen Schlagworte insbesondere für fremdsprachige Suchanfragen stärker einzusetzen, um die zeit- und damit kostenintensive intellektuelle Sacherschließung sinnvoll nachzunutzen

    LogCLEF 2010: the CLEF 2010 Multilingual Logfile Analysis Track Overview

    No full text
    Log data constitutes a relevant aspect in the evaluation process of multilingual search services. Activity logs allow to study the usage of search engines and to better adapt them to the needs of their users. The study of multilingual log analysis was promoted by the Cross Language Evaluation Forum (CLEF). For the second time, the track LogCLEF was conducted. As is 2009, large log files were obtained from information providers. One log covers 30 months of activities on the website of The European Library (TEL) and the second log shows user activities of users on the German EduServer. Seven groups explored the data using a variety of approaches They analyzed language of queries, activities within sessions and success of searches. The data for the track, the evaluation methodology and results are presented and discusse
    corecore