1 research outputs found
Implementaci贸n de un software para b煤squeda de publicaciones cient铆ficas en bases de datos estructuradas mediante datos enlazados
En la actualidad, la informaci贸n es uno de los activos m谩s importantes tanto en niveles
personales, educativos y organizacionales. La informaci贸n permite el desarrollo y el avance de
los estados del conocimiento. Desde la aparici贸n del Internet y su exponencial evoluci贸n, el
acceso a la informaci贸n se ha vuelto universal y su cantidad disponible sigue aumentando
considerablemente.
Para las organizaciones es muy valioso el resguardo y uso de la informaci贸n ya que, de
esta administraci贸n depende su capacidad para seguir creciendo y obteniendo valor dentro de sus
respectivos campos de acci贸n. Del mismo modo, para una persona el obtener informaci贸n
importante es adquirir conocimientos que ser谩n relevantes para la consecuci贸n de sus objetivos
planteados. En cualquiera de los 谩mbitos el uso de la informaci贸n permite la formulaci贸n y la
ejecuci贸n de los planes estrat茅gicos. Sin embargo, el encontrar aquella informaci贸n que
realmente se necesita se ha vuelto una tarea cada vez m谩s complicada.
En el campo de la investigaci贸n cient铆fica la recopilaci贸n de fuentes de informaci贸n
representa el punto de partida. Trasladando esta necesidad al contexto peruano, se observa que la
producci贸n cient铆fica est谩 en aumento y en un ritmo acorde al crecimiento de otras naciones. Sin
embargo, actualmente resulta complicado para los investigadores el obtener la informaci贸n
relevante para iniciar sus investigaciones con la certeza de que no existen investigaciones
previas o que abarquen el mismo campo de estudio. Para lograr una buena recopilaci贸n se debe
navegar entre los distintos repositorios digitales existentes que son de libre acceso o incluso
pagados.
En tal sentido, existe una soluci贸n conocida como Datos Enlazados, un enfoque que no
se contrapone a la web actual que permite el v铆nculo entre p谩ginas web (documentos HTML),
pero s铆 lo complementa ya que permite la vinculaci贸n de datos entre distintos contextos y fuentes
de informaci贸n. El presente trabajo de fin de carrera propone una alternativa de soluci贸n para la b煤squeda integral y automatizada en distintos repositorios digitales que son de libre acceso y
cuyas bases de datos est谩n estructuradas mediante Datos Enlazados.
Se implement贸 un m茅todo de b煤squeda adaptativo en base a las ontolog铆as que manejan
los distintos repositorios digitales (datasets). De tal manera, se obtiene una ontolog铆a de dominio
adaptable que permite la extracci贸n de datos relevantes de cada repositorio, para su posterior
reestructuraci贸n y su visualizaci贸n. Para lograr la ontolog铆a din谩mica se implement贸 un
algoritmo adaptador que analiza el vocabulario ontol贸gico del dataset e identifica las entidades
relevantes para el dominio de investigaciones y publicaciones. Luego, se implementaron
m茅todos de extracci贸n con funciones en SPARQL que dependen de la ontolog铆a y finalmente,
los datos relevantes son guardados en grafos RDF para luego ser serializados en documentos
RDF/XML y Turtle.
Se concluye que el proyecto ha sido exitoso en cuanto que el software permite realizar la
b煤squeda de publicaciones de distintos autores peruanos que tienen indexados sus documentos
en repositorios digitales como DBLP o IEEE Library Project, contribuyendo de esta manera a la
b煤squeda integral de informaci贸n.Tesi