1 research outputs found
Wikifier biomédico
Mestrado em Engenharia de Computadores e TelemáticaDurante os últimos anos a gestão de dados não estruturados tem
vindo a ganhar uma importância crescente relativamente à
organização em arquivos estruturados.
Vários factores têm contribuído para este crescimento
nomeadamente, o sucesso da Internet como rede de conteúdos
documentais, dos motores de busca e das enciclopédias online.
O objectivo desta dissertação consiste em desenvolver um
Wikifier biomédico. Este sistema deve ser capaz de fazer a
extracção e marcação dos conceitos relevantes no contexto desta
área científica: a Biomedicina.
Foram desenvolvidas estratégias para identificação e anotação de
termos com base num dicionário. O conteúdo deste será
construído recorrendo a bases de dados científicas e os termos
serão associados com informações provenientes de várias fontes
numa interface simples e clara que permita enriquecer os
documentos.
Os resultados obtidos foram satisfatórios, sendo que o sistema
atingiu, como iremos ver, um desempenho bastante interessante e
um comportamento estável e proporcional à quantidade de
informação analisada.During the last few years the management of unstructured data
has gained an increasing importance relatively to the organization
in structured archives.
Several factors have contributed to that growth in particular, the
success of the Internet as a network of documentary content,
search engines and online encyclopedias.
The aim of this thesis is to develop a biomedical Wikifier. This
system must be capable of extracting and marking relevant
concepts in the context of this scientific area: biomedicine.
Strategies for identification and annotation of terms had been
developed based on a dictionary. The content of dictionary will be
built using scientific databases and the terms will be linked with
information from various sources in a simple and clear interface
that allows to enrich the documents.
The results were satisfactory, and the system has reached, as we
will see, a very interesting performance and was stable and
proportional to the amount of information analyzed