Framework para el procesamiento lingüístico de artículos científicos : Caso de estudio: Universidad Nacional de Chilecito

Frati, Fernando Emmanuel; Texier, José; Zambrano, Jusmeidy

Framework para el procesamiento lingüístico de artículos científicos : Caso de estudio: Universidad Nacional de Chilecito

Authors: Fernando Emmanuel Frati
José Texier
Jusmeidy Zambrano
Publication date: 1 October 2017
Publisher

Abstract

El crecimiento de los datos producto del Acceso Abierto a las publicaciones académicas y científicas han generado estudios que posibilitan la interrelación de áreas como la lingüística y la computación en, por ejemplo, la extracción automática de datos para la creación de modelos teóricos, reconocimiento de estructuras para validación, etc. Este trabajo tiene como objetivo describir un framework elaborado a partir de la Rhetorical Structure Theory (RST) con el lenguaje Python a un corpus de 42 artículos científicos en español de la Universidad Nacional de Chilecito. El análisis se hizo sobre la base de un diseño modular informático y el trabajo manual de un lingüista experto, proceso que sirve para calibrar la propuesta y, luego, ser aplicada a un corpus mayor. Las variables que se consideraron fueron el título, resumen y palabras clave de los 42 artículos y la estructura canónica de un resumen científico (introducción, método, resultados y discusión -IMRD). Los resultados muestran que existen discrepancias en la frecuencia de ciertos elementos en los textos, pero a su vez, denotan coincidencias interesantes para este tipo de análisis textuales.XIV Workshop Bases de Datos y Minería de Datos (WBDDM).Red de Universidades con Carreras en Informática (RedUNCI

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

Servicio de Difusión de la Creación Intelectual

oai:sedici.unlp.edu.ar:10915/6...

Last time updated on 02/12/2017

El Servicio de Difusión de la Creación Intelectual

oai:sedici.unlp.edu.ar:10915/6...

Last time updated on 17/04/2020