1 research outputs found

    Aproximaci贸n a una estaci贸n lexicol贸gica orientada a Internet

    No full text
    Director de la tesis: Octavio Santana Su谩rez, Universidad de Las Palmas de Gran CanariaEsta tesis es una proyecci贸n natural de los trabajos realizados por el Grupo de Estructuras de Datos y Ling眉铆stica Computacional de la ULPGC en los 煤ltimos a帽os. Estos trabajos se han desarrollado en el 谩mbito de la Ling眉铆stica Computacional y han dado lugar, entre otros resultados, al desarrollo de herramientas de reconocimiento y generaci贸n morfol贸gica. En esta tesis se propone la utilizaci贸n de dichas herramientas como parte de nuevas aplicaciones cuyo objetivo es obtener provecho del enorme caudal de informaci贸n ling眉铆stica que supone Internet. Se caracterizan dos clases de aplicaciones -en funci贸n del grado de interactividad de los estudios ling眉铆sticos que se pretenda realizar- y se desarrollan sendos prototipos -denominado DAWeb y NAWeb- con una arquitectura estudiada para obtener los rendimientos m谩s adecuados a cada caso. Las modalidades de an谩lisis abarcan: la detecci贸n de neologismos, estudio del uso de las palabras con diversas medidas cuantitativas y cualitativas, y aspectos cercanos a la sintaxis tales como colocaciones l茅xicas o reg铆menes preposicionales.This thesis follows up the works performed in the recent last years by the Data Structures and Computational Linguistics Group at ULPGC. These works has been developed about Computational Linguistics and, as one of their results, some tools for morphologic identification and generation have been released. This thesis proposes the use of those tools as parts of new applications designed to benefit from the great linguistic information flow from Internet. Two kinds of applications are identified, both according to the interactivity of the linguistics studies to be made, and two prototypes, named DAWeb and NAWeb, are developed with special attention on their architecture in order to maximize the efficiency of both. Analysis modes include: neologism detection, word use (qualitative and quantitative measurements) and nearing sintax aspects like lexical collocations or prepositional regimes
    corecore