    A study of search intermediary working notes: implications for IR system design

    This paper reports findings from an exploratory study investigating working notes created during encoding and external storage (EES) processes, by human search intermediates using a Boolean information retrieval (JR) system. EES processes have been an important area of research in educational contexts where students create and use notes to facilitate learning. In the context of interactive IR, encoding can be conceptualized as the process of creating working notes to help in the understanding and translating a user's information problem into a search strategy suitable for use with an IR system. External storage is the process of using working notes to facilitate interaction with IR systems. Analysis of 221 sets of working notes created by human search intermediaries revealed extensive use of EES processes and the creation of working notes of textual, numerical and graphical entities. Nearly 70% of recorded working notes were textual/numerical entities, nearly 30% were graphical entities and 0.73% were indiscernible. Segmentation devices were also used in 48% of the working notes. The creation of working notes during EES processes was a fundamental element within the mediated, interactive IR process. Implications for the design of IR interfaces to support users' EES processes and further research is discussed

    Evaluating document clustering for interactive information retrieval

    Pesquisa de informação em catálogos científicos

    Mestrado em MatemáticaA actividade científica depende fortemente da pesquisa e consulta de literatura científica. Na actualidade, muito desse material bibliográfico e de referência encontra-se disponível na Internet. No entanto, com o rápido crescimento da rede telemática tem surgido uma dificuldade acrescida para investigadores identificarem e utilizarem toda a informação relevante ao seu trabalho. Em particular, na área da matemática o problema também começa a irromper. De facto, a literatura matemática tem uma longa tradição de organização, devido à sua natureza acumulativa e, ao contrário de outras Ciências, a importância que resultados antigos têm na investigação presente. Actualmente, a produção científica é elaborada e transmitida em forma digital, o que permite que esta possa ser disponibilizada e acedida na rede. No entanto, neste universo complexo de informação torna-se difícil classificar a relevância, para determinado utilizador/investigador, do conteúdo de certos documentos científicos. Em geral, os documentos científicos de mais fácil acesso tendem a ser mais citados. Este facto, impele os próprios investigadores a desejar que os catálogos científicos sejam mais eficientes e passíveis de fácil acesso na Internet. Formas de pesquisa global e integrada são cada vez mais importantes e necessárias para o desenvolvimento e progresso da Ciência, em particular, na Matemática. Assim, no âmbito deste trabalho é proposto um modelo matemático para pesquisa de documentos matemáticos em catálogos científicos. Este modelo permitirá que o sistema mostre ao utilizador de forma organizada numa topologia hierárquica, os documentos mais relevantes de acordo com a sua pesquisa. Para isso, formula-se um mecanismo que calcula a afinidade entre todos os artigos de acordo com uma distância criada a partir dos códigos MSC (Mathematical Subject Classification) que os mesmos contêm. Para além disso, o sistema poderá englobar um conjunto de novas funcionalidades: permitirá, não obstante a comum pesquisa básica de artigos, que o utilizador registado tenha acesso a notícias personalizadas automaticamente e actualizadas periodicamente. Essas notícias chegarão ao conhecimento do utilizador dando-lhe conta que um novo artigo próximo da sua área científica, ou interesse declarado, foi publicado no sistema. Um utilizador/autor poderá ter acesso a uma lista de autores que têm interesses na mesma área de investigação, de certo modo, que se encontram na sua vizinhança científica. ABSTRACT: The scientific activity strongly depends of the search and queries of bibliographic content. Nowadays that content in highly available in the Internet. With the fast increasing of the World Wide Web becomes difficult for authors, reviewers and users identify and work with all information relevant for their investigations. As well, in mathematics this problem is growing up. The reasons for this are that mathematical literacy have a long tradition of organization, in part because her accumulative nature, in part because of necessities of mathematicians to create systems of information retrieval more efficient and possible to access by web. The mathematical articles that are easier to access usually became more cited. In these days, all mathematical articles are elaborated and transmitted in a digital format, permitting their access by users in web. Although, in this complex world of information becomes difficult categorize as relevant the content of these documents, especially when we focus on all the different needs of users. Ways of global and integrated search are each time more important and necessary for the development and progress of scientific catalogs. Therefore, in the scope of this work we propose a mathematical model for search of mathematical documents in citation database systems. This model will allow the system to show the user, in an organized way by a hierarchical topology, relevant documents related with his search. Thus, is formulate an mechanism to reckon up the analogy between all the articles according to a distance created based in MSC codes (Mathematical Subject Classification) that the same articles have. Besides, the system may agglomerate a set of new functionalities: consent, in spite of the common search of articles, that register users have access to RSS Feeds. This feeds will reach the user, giving him the opportunity to know that relevant articles have been published in the system. Users/authors may have access to a list of authors that have interest in the same investigation area, in some sense, that are in some scientific neighborhood


    De l'avènement des nouvelles technologies, du « tout numérique », de l'essor d'Internet et plus particulièrement du World Wide Web (ou web) résulte une profusion d'informations à la portée de tous. Néanmoins, la localisation des informations pertinentes au sein de cette masse informationnelle reste posé.Le contexte de mes travaux est la recherche d'information textuelle sur le Web et s'inscrit dans le cadre du GDR I3 du CNRS. Ma thèse s'intitule « Interface adaptative pour l'aide à la recherche d'information sur le web ». Elle concerne la conception et la réalisation d'une interface permettant d'aider l'utilisateur dans sa démarche de recherche d'information afin qu'il puisse trouver plus efficacement des documents pertinents. Le caractère « adaptatif » de cette interface réside dans le fait qu'elle s'adapte aux besoins de l'utilisateur en lui proposant une aide personnalisée. Ce point est d'autant plus important que la vulgarisation de la recherche d'information implique la prise en compte de la différence entre les usagers et de leur spécificités. Il s'agit donc d'étudier et de proposer des outils permettant d'aider l'utilisateur dans sa tâche de recherche d'information en caractérisant notamment sa place au sein d'un tel processus. Nos travaux ont permis la conception et l'implantation d'un système nommé Easy-DOR « Easy DOcument Retrieval ». L'aide que nous proposons à l'utilisateur au travers de ce système intervient à tous les niveaux de sa recherche d'information :- en amont du processus de recherche. Le système aide l'utilisateur à faire évoluer son expertise des domaines relatifs à ses centres d'intérêt afin qu'il puisse effectuer de meilleures recherches ultérieures,- au cours du processus de recherche. Le système exploite les informations provenant de l'utilisateur pour tenter d'identifier ses besoins et ainsi lui apporter rapidement des documents pertinents. Par ailleurs, nous proposons une interface de visualisation lui permettant de mieux apprécier de façon globale les résultats de recherche d'information provenant d'un outil de recherche intégré,- en aval du processus de recherche. Le système propose à l'utilisateur une mise à jour ainsi qu'une aide à l'organisation des documents pertinents qu'il souhaite mémoriser au travers de ses signets (ou favoris).Par ailleurs, l'aide à la recherche d'information sur laquelle repose notre démarche est basée sur un aspect coopératif. Nous privilégions, en effet, le partage des informations pour les diffuser aux utilisateurs possédant les mêmes centres d'intérêt