1 research outputs found

    Implementaci贸n de un software para b煤squeda de publicaciones cient铆ficas en bases de datos estructuradas mediante datos enlazados

    Get PDF
    En la actualidad, la informaci贸n es uno de los activos m谩s importantes tanto en niveles personales, educativos y organizacionales. La informaci贸n permite el desarrollo y el avance de los estados del conocimiento. Desde la aparici贸n del Internet y su exponencial evoluci贸n, el acceso a la informaci贸n se ha vuelto universal y su cantidad disponible sigue aumentando considerablemente. Para las organizaciones es muy valioso el resguardo y uso de la informaci贸n ya que, de esta administraci贸n depende su capacidad para seguir creciendo y obteniendo valor dentro de sus respectivos campos de acci贸n. Del mismo modo, para una persona el obtener informaci贸n importante es adquirir conocimientos que ser谩n relevantes para la consecuci贸n de sus objetivos planteados. En cualquiera de los 谩mbitos el uso de la informaci贸n permite la formulaci贸n y la ejecuci贸n de los planes estrat茅gicos. Sin embargo, el encontrar aquella informaci贸n que realmente se necesita se ha vuelto una tarea cada vez m谩s complicada. En el campo de la investigaci贸n cient铆fica la recopilaci贸n de fuentes de informaci贸n representa el punto de partida. Trasladando esta necesidad al contexto peruano, se observa que la producci贸n cient铆fica est谩 en aumento y en un ritmo acorde al crecimiento de otras naciones. Sin embargo, actualmente resulta complicado para los investigadores el obtener la informaci贸n relevante para iniciar sus investigaciones con la certeza de que no existen investigaciones previas o que abarquen el mismo campo de estudio. Para lograr una buena recopilaci贸n se debe navegar entre los distintos repositorios digitales existentes que son de libre acceso o incluso pagados. En tal sentido, existe una soluci贸n conocida como Datos Enlazados, un enfoque que no se contrapone a la web actual que permite el v铆nculo entre p谩ginas web (documentos HTML), pero s铆 lo complementa ya que permite la vinculaci贸n de datos entre distintos contextos y fuentes de informaci贸n. El presente trabajo de fin de carrera propone una alternativa de soluci贸n para la b煤squeda integral y automatizada en distintos repositorios digitales que son de libre acceso y cuyas bases de datos est谩n estructuradas mediante Datos Enlazados. Se implement贸 un m茅todo de b煤squeda adaptativo en base a las ontolog铆as que manejan los distintos repositorios digitales (datasets). De tal manera, se obtiene una ontolog铆a de dominio adaptable que permite la extracci贸n de datos relevantes de cada repositorio, para su posterior reestructuraci贸n y su visualizaci贸n. Para lograr la ontolog铆a din谩mica se implement贸 un algoritmo adaptador que analiza el vocabulario ontol贸gico del dataset e identifica las entidades relevantes para el dominio de investigaciones y publicaciones. Luego, se implementaron m茅todos de extracci贸n con funciones en SPARQL que dependen de la ontolog铆a y finalmente, los datos relevantes son guardados en grafos RDF para luego ser serializados en documentos RDF/XML y Turtle. Se concluye que el proyecto ha sido exitoso en cuanto que el software permite realizar la b煤squeda de publicaciones de distintos autores peruanos que tienen indexados sus documentos en repositorios digitales como DBLP o IEEE Library Project, contribuyendo de esta manera a la b煤squeda integral de informaci贸n.Tesi
    corecore