Reconocimiento de sintagmas nominales construidos con indefinidos a través del sistema NooJ en corpus de español como segunda lengua


The goal of this work, which is part of a research project on the teaching of Spanish through computer tools, is to show how the automatic recognition of noun phrases formed by indefinite articles, which are found in corpus of texts written by students of Spanish as a second language, can be carried out. It should be noted that the sample is divided into two groups of texts according to the level of knowledge of the language of the participating subjects. For this purpose, the NooJ system, not only will be used to recognize the constructions that coincide with the target language, but also those that deviate from it, distinguishing them by means of a label. The work methodology will consist of a linguistic description of the noun phrases in Spanish and then propose a classification for the indefinite ones that will permit to use the resource of the software in respect of generating "productive syntactic grammars" that allow to detect the idiosyncratic structures present in the corpus.The results obtained from the analysis of the data may contribute to the studies within the perspective of the interlanguage hypothesis, demonstrating that certain constructions are common to the productions of students who receive the same level of instruction, but these may decrease in quantity and even disappear as soon as the students make progress in the process of acquiring a second language, due to the transitory character of the mentioned linguistic system.El propósito de este trabajo, que se enmarca dentro de un proyecto de investigación acerca de la enseñanza del español a través de herramientas informáticas, es lograr el reconocimiento automático de sintagmas nominales construidos con indefinidos, que se hallan en un corpus de producciones escritas de estudiantes brasileños de español como segunda lengua. Cabe aclarar que, la muestra se divide en dos grupos de textos de acuerdo al nivel de conocimiento de la lengua de los sujetos participantes. Para ello, se empleará el sistema NooJ, con el que se reconocerá tanto a las construcciones coincidentes con la lengua meta como también a las que se desvían de esta, distinguiéndolas mediante una etiqueta. La metodología de trabajo consistirá en realizar una descripción lingüística de los SN en español y proponer luego una clasificación para los indefinidos que servirá a los fines de poder emplear el recurso del software respecto de la generación de “gramáticas sintácticas productivas” que permitan detectar las estructuras idiosincrásicas presentes en el corpus. Los resultados obtenidos del análisis de los datos podrán contribuir a los estudios dentro de la perspectiva de la hipótesis de interlengua, demostrando que ciertas construcciones son comunes a las producciones de estudiantes que comparten un mismo nivel de instrucción, pero que éstas pueden disminuir en cantidad e incluso desaparecer a medida que se avanza en el proceso de adquisición de una segunda lengua, debido al carácter transitorio del mencionado sistema lingüístico

    Similar works