research

Análisis sintáctico para el español basado en el formalismo de la teoría significado <=> texto

Abstract

Se presenta la aplicación del formalismo de la teoría Significado Texto (Meaning Text Theory) para el análisis sintáctico del español. En este método, basado en gramáticas de dependencias, el diccionario combinatorio empleado para el análisis sintáctico consta de patrones para palabras, principalmente verbos, donde se describen todas sus valencias y las formas en que ellas se realizan. No se considera un orden fijo en la oración por lo que resultan muy adecuados para el análisis del español. Los patrones del diccionario combinatorio no solamente ayudan a reducir el número de posibles variantes obtenidas por el analizador sino que incluyen información del nivel sintáctico que está conectada con la semántica de la palabra y que es requerida a niveles más profundos del análisis del lenguaje. Adicionalmente, incluimos información estadística de las realizaciones de cada valencia y de las combinaciones de valencias para cada verbo con el propósito de incrementar la eficiencia de resolución de ambigüedad en el análisis sintáctico.The application of the Meaning Text Theory to Spanish parsing is presented. This formalism is based on dependency grammars. The combinatorial dictionary of this method is employed for the syntactic analysis; it consists of patterns for words, mainly verbs, where all its valences and the way they are realized are described. In this method, no fixed word order in the sentence is considered so it is highly adequate for Spanish parsing. The patterns of the combinatorial dictionary help not only to reduce the number of possible variants obtained from the parser but they include information of the syntactic level related to the semantic of the word which is required in deep levels of language analysis. We include statistical information of realizations for each valence and statistics of valence combinations for each verb in order to increase the efficiency of ambiguity resolution in syntactic analysis.Trabajo realizado con apoyo parcial del Gobierno de México (CONACyT y SNI), CGEPI-IPN y PIFI-IPN, México

    Similar works