18 research outputs found
Ambiguity in information retrieval
Discutem-se questões relativas à extração de informações contidas em textos completos e posterior recuperação, por meio de métodos de tratamento automático da linguagem natural. Além da extração de palavras do texto, procura-se manter as relações de significado que estas palavras possuem no contexto do discurso em que ocorrem. Assim, defende-se o
tratamento de determinados fenômenos lingüísticos que afetam a qualidade da recuperação, como o da ambigüidade. Como referencial teórico-metodológico para efetuar a análise e organização sintático-semântica de conteúdos, utilizam-se a Gramática de Valências de Borba e a teoria de Gráficos Conceituais de Sowa. Emprega-se um sistema de tratamento automático da linguagem natural – o Zstation – em um corpus constituído de documentos oficiais do Mercosul, para testes de desambiguação. Conclui-se que um sistema de recuperação da informação em
linguagem natural pode solucionar determinados tipos de ambigüidades quando dispõe de informações relativas à valência sintático-semântica das unidades lexicais que compõem um enunciado. Os resultados obtidos demonstram ser possível introduzir procedimentos automáticos de solução de ambigüidades em sistemas de tratamento da linguagem natural.
_____________________________________________________________________________________________ ABSTRACTTIssues relative to information extraction from complete texts and subsequent
retrieval by means of automatic natural language treatment methods are discussed. Besides
extracting words from the text, the relationship of significance that these words have in the
context of the speech in which they occur is attempted to be preserved. An information retrieval
system using natural language should be able to treat given linguistic phenomena that affect the
quality of information, such as, for instance, the issues of ambiguity. The Valence Grammar and
the Conceptual Graphics are used as theoretical and methodological. An automatic natural
language treatment system – Zstation – is utilized, as well as a pool of official documents
concerning the Mercosul, for the ambiguity solutions tests. The conclusion is reached that a
natural language treatment system can solve certain types of ambiguities when information is
available regarding the syntactic-semantic valence of the lexical units that compose an
enunciation. The results obtained show that it is possible to introduce automatic procedures for
solving ambiguities in a natural language treatment. syste
Knowledge organization systems in the Information Science's approach
O artigo apresenta os sistemas de organização do conhecimento e a relação com as bases teóricas utilizadas na construção de tesauros, taxonomias, ontologias e sistemas de classificação na literatura da área de Ciência da Informação. O estudo utiliza a metodologia de revisão de literatura na área de organização e representação do conhecimento, além de pesquisa nas bases de dados, a fim de investigar a produção bibliográfica sobre o tema, entre 1998 e 2009. Identifica um caminho teórico percorrido na construção desses sistemas passando pela teoria da classificação, teoria do conceito, relacionamentos entre conceitos e princípios da Linguística e Terminologia. A partir de amostra representativa, faz-se análise nas suas características extrínsecas e intrínsecas. Conclui-se que tesauros e sistemas de classificação são mais citados na literatura, inclusive servindo de referência teórica para o desenvolvimento desses sistemas. Apesar dessa base teórica proveniente dos estudos sobre tesauros e classificações com normas e padrões reconhecidos internacionalmente, evidencia-se a necessidade da consolidação de padrões comuns para o desenvolvimento dos diferentes tipos de SOC. Aponta-se a necessidade de congregar interesses multidisciplinares pela convergência de objetivos e, com isso, gerar melhores práticas de organização e representação do conhecimento. _______________________________________________________________________________________________________________ ABSTRACTThis article presents the knowledge organization systems related to theories to build thesaurus, taxonomies, ontologies and classification systems in the literature field of Information Science. It uses the methodology of literature review and a research on the same field databases in order to investigate the bibliographic production about the theme, from 1998 up to July 2009. It identifies the same theoretical way to build KOS through the classification theory, concept theory, the relationship between the concepts and the foundation of Linguistics and Terminology. Extrinsic and intrinsic characteristics were analysed from the representative sample of the bibliographic production about KOS. The last chapter verifies that the thesaurus and classification systems are the most quoted in the literature about KOS, being a theoretical reference to the development of these systems based on the international standards and rules. It highlights the importance of consolidating common standards to build different types of KOS and shows the need of gathering the multidisciplinary interests linked by the same goals and also getting better practices in the knowledge organization and representation. _______________________________________________________________________________________________________________ RESUMENEl artículo presenta los sistemas de organización del conocimiento y la relación com os fundamentos teóricos utilizados en la construcción de tesauros, taxonomias, ontologias y sistemas de classificación en la literatura de Ciencia de la Información. El estudio utiliza la metodología de revisión de la literatura en el área de organización y representación del conocimiento, y la búsqueda de las bases de datos con el fin de investigar la producción de la literatura sobre el tema entre 1998 y 2009. Identifica un camino recorrido teórico en la construcción de estos sistemas a través de la teoría de la clasificación, la teoría del concepto, las relaciones entre los conceptos y principios de la Lingüística y Terminología. De una muestra representativa, es el análisis de sus características intrínsecas y extrínsecas. Se concluye que los sistemas de tesauros y la clasificación son los más citados, incluyendo servir como marco teórico para el desarrollo de tales sistemas. A pesar de esta base teórica de los estudios de las normas de tesauros y la clasificación y con las normas reconocidas internacionalmente, pone de relieve la necesidad de consolidación de las normas comunes para el desarrollo de diferentes tipos de SOC. Este artículo pone de relieve la necesidad de poner en común la convergencia de intereses y objetivos multidisciplinario, lo que genera las mejores prácticas en la organización y representación del conocimiento
Terminologia brasileira em ciência da informação: uma análise
Aplica metodologia e princípios da Terminologia no levantamento e análise da terminologia brasileira em Ciência da Informação. Identifica, a partir da coleta de termos realizada na revista Ciência da Informação e no Catálogo de Teses e Dissertações em Ciência da Informação e Biblioteconomia.alguns problemas terminológicos, tais como: ambigüidade, polissemia, uso de termos provenientes de línguas estrangeiras e criação de neologismos semlevar em conta a estrutura morfossintática da língua portuguesa. Ressalta a necessidade de estudos terminológicos para a implantação e fortalecimento de uma terminologia brasileira em Ciência da Informação.
Brazilian terminology in information science: ananalysis
Abstract
The methods and principies of terminological workare applied in the survey and analysis of Brazilian terminology in Information Science. Identifies,from terms collected in the journal Ciência da Informação and the Catálogo de Teses e Dissertações em Ciência da Informação e Biblioteconomia, some terminological problems,such as ambiguity, polysemy, use of foreign words or expressions and neologisms, that do not take into account the Portuguese language structure or its syntactic and morphological aspects, The need of terminological studies for the establishment of a true Brazilian terminology in Information Scienceis emphasize
Requisitos Funcionales de los Registros Bibliográficos - FRBR : un estudio el “Catálogo Coletivo da Rede Bibliodata”
Este estudo visou perceber os reflexos do modelo FRBR em um catálogo eletrônico, através do exame dos registros bibliográficos no formato Machine Readable Cataloging (MARC), buscando sistematizar os relacionamentos entre os elementos. Por meio da análise de literatura pertinente e das características consideradas como potenciais para realizar o estudo, foram selecionados registros a partir do Catálogo Coletivo da Rede Bibliodata, caracterizando um estudo de caso. Foi utilizada a ferramenta conversora FRBR Display Tool, da Library of Congress.
Complementando o estudo, houve um retorno à literatura para atingir o objetivo de
sistematizar os relacionamentos, dado o relativo insucesso da ferramenta neste aspecto. As
etapas analíticas englobam os registros da amostra e dos registros convertidos no documento que contém os registros modelados. Os resultados encontrados apontam para a necessidade de normalização de registros e sugere-se o uso de campos MARC de ligação para uma possível melhor visualização do potencial do modelo. ______________________________________________________________________________________________________________ ABSTRACTThis study aims to perceive the reflexes of the FRBR model in an electronic catalog, through the examination of bibliographic records in Machine Readable Cataloging - MARC format, in order to systematize the relationship between the elements. Reviewing the literature and characteristics regarding potentials to realize the study, records were selected according to the "Catálogo Coletivo da Rede Bibliodata" and a case study was characterized. The conversional tool FRBR Display Tool was used, developed by Library of Congress. In order to complete the study, a few issues encountered in the literature were brought back as a manner to reach
the goal of systematizing the relationships, motivated by the relative failure of the tool under this aspect. Analytics stages comprise the sample records and of the records converted in document that contains modeled records. The results founded show the necessity of records normalization and it is suggested the use of MARC linking tags for a better visualization of the potential model. _________________________________________________________________________________________________________________ RESUMENEste estudio buscó percibir los reflejos del modelo FRBR en un catálogo electrónico, a través del examen de los registros bibliográficos en el formato Machine Readable Cataloging -
MARC, buscando sistematizar las relaciones entre los elementos. Por medio de la análisis de
la literatura y de las potenciales caracteristicas consideradas para realizar el estudio, los registros fueron seleccionados según el "Catálogo Coletivo da Rede Bibliodata", caracterizado
como estudio de caso. Para llevar a cabo el estudio, fue usada la herramienta transformadora FRBR Display Tool, elaborada por la Library of Congress. Para complementar el estudio, fue necesario un regreso a la literatura para alcanzar el objetivo de sistematizar las relaciones. Las etapas de análisis engloban los registros de la muestra y de los convertidos en el documiento que continene estos registros.Los resultados señalan la necesidad de normalización de los registros y son sugeridos campos de enlace del formato MARC para mejor visualización mejor del potencial del FRBR
Folksonomy : knowledge representation system?
O artigo tem como objetivo estudar a folksonomia sob a óptica da representação do conhecimento. Para isso, apoia-se em revisão bibliográfica das abordagens em organização do conhecimento propostas por Hjorland, nas
quais a folksonomia encontra bases para ser analisada: abordagem baseada no usuário, cognitiva, social e da recuperação da informação. Traz uma breve discussão sobre organização do conhecimento e organização da informação, definindo como tais conceitos serão tratados no artigo. Ressalta os pontos positivos e negativos da folksonomia como esquema de representação do conhecimento, analisando também como essa estrutura pode ou não refletir conhecimento. Identifica a folksonomia como um sistema construído de forma inversa em relação aos outros sistemas, em que a coleta de termos e estruturação é feita a posteriori. Enquadra a folksonomia nos esquemas de representação, no sentido de ser vista como ferramenta semântica. Propõe novos tipos de estudos que comparem a folksonomia com os esquemas tradicionais de representação do conhecimento, como tesauros, taxonomias e ontologias. _________________________________________________________________________________________________________________ ABSTRTACTThe article aims to study folksonomy in the view of knowledge representation. A bibliographic review of the approaches to knowledge organization proposed by Hjorland is conducted in order to find out how folksonomy can be matched. The approaches are: user-based, cognitive, social and information retrieval approach. The
article also includes a brief discussion about knowledge organization and information organization, defining how those concepts will be addressed in the article. It highlights the positive and negative aspects of folksonomy as a
knowledge representation scheme, and it also analyzes how it can reflect or fail to reflect knowledge. In addition,
it identifies folksonomy as a system designed differently than other systems, in which term collections and structure is done a posteriori. It sets folksonomy in the representation schemes, in order to be considered a semantic tool. It suggests new studies to compare folksonomy to the traditional knowledge representation schemes, such as thesauri, taxonomies and ontology
Information organization and bibliometry
22 p.Padrões de organização da informação são necessários em pesquisas bibliométricas para que documentos que possuam características similares possam ser recolhidos em fontes primárias e secundárias e para que se possa atingir confiabilidade na análise dos dados. Com o objetivo de identificar as dificuldades encontradas por pesquisadores quanto aos aspectos de organização da informação, efetuou-se um levantamento de 59 relatos de teses e dissertações e realizaram-se entrevistas com especialistas da área. Conclui-se que, de maneira geral, as dificuldades se concentram principalmente na padronização de títulos de periódicos e de nomes de autor (descrição física), assim como na diversidade de representações de assunto (descrição de conteúdo). A necessidade de controle da literatura por meio da manutenção de bases de dados atualizadas é apontada pelos especialistas entrevistados como uma das principais dificuldades encontradas na realização de pesquisas na área de bibliometria no Brasil. _________________________________________________________________________________ ABSTRACTStandards of information organization are imperative in bibliometric research, so that documents with similar characteristics may be efficiently collected from primary and secondary sources. Standards are also needed in order to improve the reliability of the data analysed. In order to identify the difficulties encountered by researchers within the field of information organization, we examined 59 reports of thesis and dissertations, as well as conducted a series of interviews with area experts. In general, the main difficulties were found in the standardization of journal titles and author names (physical description), and in the diversity of subject representation (subject description). The need to literature control by access to regularly updated databases was emphasized by most experts as one of the main difficulties for the conduction of research in the field of bibliometrics in Brazil
Organización del Conocimiento : teorias semánticas como base para estudios y representación de conceptos
Considera que a organização do conhecimento envolve a análise semântica e que a Ciência da Informação necessita de referencial teórico para os estudos que visam à representação conceitual de domínios do conhecimento. Apresenta alternativas teórico-metodológicas oriundas da Linguística e que partem de uma base semântica do estudo da língua: Teoria da Valência, Gramática de Casos, Gráficos Conceituais e a Teoria da Gramática Funcional. Prioriza as propostas teórico-metodológicas que tenham como princípio de interpretação a problemática semântica e que oferecem um caminho para pensar e refletir questões relacionadas aos diferentes aspectos semânticos no campo da Organização do Conhecimento. ___________________________________________________________________________________________________________________ ABSTRACTThis paper takes into consideration that knowledge organization involves semantic analysis and that Information Science needs a theoretical reference for studies that focus on the conceptual representation of knowledge domains. It presents methodological-theoretical alternatives rooted in Linguistics and that are based semantically on language studies: Valence Theory, Case Grammar, Conceptual Graphs and the Functional Grammar Theory. It prioritizes methodological-theoretical proposals based on the principle of interpretation of semantic problems that offer a way to consider and reflect on issues related to the different semantic aspects in the field of Knowledge Organization. ___________________________________________________________________________________________________________________ RESUMENEn este trabajo se considera que la organización del conocimiento involucra el análisis semántico y que las Ciencias de la Información necesitan de un marco de referencia teórico para los estudios que tienen por reto la representación conceptual de campos de conocimiento. Además, presenta alternativas teórico-metodológicas oriundas de la Lingüística y que parten de una base semántica del estudio de la lengua: Teoría de la Valencia, Gramática de Casos, Gráficos Conceptuales y Teoría de la Gramática Funcional. Prioriza las propuestas teórico-metodológicas que tengan como principio de interpretación los problemas semánticos y que ofrecen un camino para pensar y reflexionar sobre cuestiones relacionadas a los diferentes aspectos semánticos en el campo de la Organización del Conocimiento
Information Science : 32 years ( 1972-2004) on the way of the history and the horizons of a Brazilian scientific journal
Análise da revista Ciência da Informação, do IBICT, nas suas qualidades extrínsecas e intrínsecas. As primeiras, relativas à forma, incluem as seções, padrões bibliográficos e sistema de avaliação. As características intrínsecas abrangem a análise de conteúdo dos artigos, a produtividade de autores e padrões de autoria, tendo sido constatada tanto a sua repercussão nacional quanto internacional. O processo evolutivo da Ciência da Informação, na sua
transformação para formato eletrônico , potencializou a disseminação e acesso universal à informação. Os resultados demonstram que o periódico Ciência da Informação é um espaço de discussão de temas relevantes e atuais da área, nos seus avanços, contribuindo para a consolidação e expansão da Ciência da Informação no Brasil.Analysis of Information Science (Ciência da informação) journal of IBICT, in its extrinsic and intrinsic qualities. The former are related to form and include the sections, the bibliographic patterns and the refereeing system. The intrinsic characteristics cover the analysis of paper’s contents, the productivity of authors and the authorship patterns. Results give evidence of its national and international repercussion. The evolution process of Information Science in its change to the electronic format accentuate the dissemination and universal access to information. Results demonstrate that the Information Science journal is a space to discuss relevant and current themes of the Area in its advancements and it contributes to the consolidation and expansion of Information Science in Brazil
Ten years of ElPub : an analysis of its major trends
Electronic publishing constitutes one of the hottest topics discussed amongst researchers from a variety of disciplines since the seminal work by Harnad, in the 1980's, “The scholarly skywriting”, when its potentialities started to challenge the well-established business model of commercial publishers. It was certainly in this context that the first ElPub thinkers initiated the conference. In fact, the International Conference on Electronic Publishing (ElPub) is the realisation of an idea that was brought into reality in 1997 by a group of librarians, including the most persistent ElPubers Peter Linde and John Smith. In its very beginning, ElPub only comprised
the presentation of papers. In 1999, there were two panel debates whose speakers were invited to participate and received grants from the conference for that. Over the subsequent years, ElPub has gradually incorporated
features of greater, well-established international conferences. Especially since 2003, a variety of sessions started to be part of the conference programme, annually organised in two tracks, namely general and technical. Those sessions comprise: special sessions focusing on a specific topic and sponsored by a specific organisation, workshops - mostly on technical aspects of electronic publishing -, posters and demonstrations. A gradual increasing variety of topics has also been defined in the Call for Papers of the conference, as constituents of the
topic. Since then, ElPub has covered a number of interesting topics, presented by people from ca. 44 countries so far