research

Segmentador de oraciones para textos en español basado en red neuronal

Abstract

En este trabajo se muestra la utilización de una red neuronal para segmentar textos en español en sus oraciones constitutivas. Esta operación debe efectuarse habitualmente como un paso previo en multitud de aplicaciones de procesamiento de lenguaje natural. A pesar de tratarse de una tarea conceptualmente sencilla, y de obtenerse resultados aceptables por diversos procedimientos, la división de un texto en oraciones tiene el inconveniente de ser fuertemente dependiente de la fuente, estructura, tipo de lenguaje, género literario, etc.… Esto obliga prácticamente a rehacer el trabajo no solo para cada tipo de aplicación, sino para cada tipo de texto que vaya a ser tratado_ Frente a otros tipos de técnicas, la utilización de redes neuronales tiene la ventaja de liberar al desarrollador de la tarea de programación, empleándose colecciones de ejemplos correctamente clasificados para el entrenamiento del segmentador

    Similar works