1 research outputs found
Extracci贸n de estructura a partir de descripciones textuales bot谩nicas
El presente proyecto presenta una soluci贸n al problema de an谩lisis
y edici贸n de textos en un dominio de aplicaci贸n espec铆fico,
as铆 como su inserci贸n a una base de datos. La soluci贸n
se propone en el contexto de la Biblioteca Digital Flor铆stica (FDL),
la cual se est谩 desarrollando en el Centro de Inform谩tica
Bot谩nica del Jard铆n Bot谩nico de Missouri con la
participaci贸n del Laboratorio de Tecnolog铆as Interactivas y
Cooperativas (ICT) de la Universidad de las Am茅ricas Puebla (UDLAP).
El objetivo del proyecto FDL es recolectar y publicar informaci贸n
sobre especies de plantas briofitas y vasculares que crecen en diversas regiones,
incluyendo la Flora de Norteam茅rica (FNA), la Flora de China (FOC)
y la Flora de Mesoam茅rica (FM). S贸lo en FNA est谩n
participando cerca de 800 autores de documentos llamados tratamientos
taxon贸micos y que representan el elemento de informaci贸n
fundamental de FDL.
Cada tratamiento taxon贸mico contiene una descripci贸n
morfol贸gica cuya introducci贸n manual, revisi贸n y
edici贸n representa una enorme inversi贸n de tiempo. Esto se
debe principalmente a que las descripciones morfol贸gicas, aunque utilizan
un lenguaje restringido, no observan un formato fijo, sino que cada
descripci贸n contiene un n煤mero diferente de caracter铆sticas.
La soluci贸n que se propone demuestra el potencial del uso de una
gram谩tica en la determinaci贸n de la estructura de la
informaci贸n contenida en un texto determinado dentro de una biblioteca
digital. Dado un texto en formato HTML o formato libre el sistema lo analiza
para present谩rselo al usuario con el fin de su verificaci贸n
antes de que se actualice la base de datos. Esta transformaci贸n es
煤til tambi茅n en el proceso de almacenar descripciones
morfol贸gicas existentes en una base de datos con un formato
preestablecido.
El proyecto forma parte de un sistema, m谩s general, de apoyo a los
autores de descripciones morfol贸gicas. Con su uso se espera agilizar
la construcci贸n de la biblioteca digital adem谩s de contribuir
a la investigaci贸n en el 谩rea de extracci贸n de
informaci贸n en una biblioteca digital