5 research outputs found
Syntactic annotation of non-canonical linguistic structures
This paper deals with the syntactic annotation of corpora that contain both âcanonicalâ and ânon-canonicalâ sentences
Entwicklung und Evaluierung eines auf dem Stellungsfeldermodell basierenden syntaktischen Annotationsverfahrens fĂŒr Lernerkorpora innerhalb einer Mehrebenen-Architektur mit Schwerpunkt auf schriftlichen Texten fortgeschrittener Deutschlerner
Die Arbeit zeigt exemplarisch die Möglichkeiten, die die Mehrebenen-Korpusarchitektur bei der Annotation von âstandard-â und ânicht standardsprachlichenâ ĂuĂerungen in einem gemeinsamen Korpus bieten. // Konkret beschĂ€ftigt sie sich mit der Entwicklung und Evaluierung eines auf dem Stellungsfeldermodell basierenden syntaktischen Annotationsverfahrens fĂŒr Lernerkorpora, bestehend aus schriftlichen Texten fortgeschrittener Deutschlerner, innerhalb einer Mehrebenen-Architektur. Die Felderannotation wurde durchgefĂŒhrt an zwei Subkorpora des frei zugĂ€nglichen fehlerannotierten Lernerkorpus (Falko). Es handelte sich vorwiegend um schriftliche Essays fortgeschrittener Lerner. // Der Schwerpunkt liegt sowohl auf der Entwicklung von Kriterien zur Einteilung von ĂuĂerungen in topologische Felder als auch auf der Aufstellung von Kriterien zu der feldermodellbasierten Bestimmung von kanonisch (Grammatikmodell konform) und nichtkanonisch, mit dem Ziel, eine bessere Konsistenz bei der Annotation zu erreichen, und um daraus auch ein besseres VerstĂ€ndnis der KomplexitĂ€t der daran beteiligten Faktoren zu gewinnen. Dabei werden ausgewĂ€hlte PhĂ€nomene des Deutschen, wie kohĂ€rente und inkohĂ€rente Strukturen und Zustandspassiv eingehender betrachtet und viele Lernerbeispiele zur Analyse herangezogen. // Im Weiteren werden quantitative Methoden hinzugezogen, um die âQualitĂ€tâ der Annotation zu evaluieren bzw. kontrollieren. Inter-Rater-Daten zeigen, dass das Feldermodell auf Anhieb relativ eingĂ€ngig ist auch fĂŒr Personen mit wenig linguistischer Vorkenntnis. Sie zeigen aber auch die Notwendigkeit, konkrete Festlegungen zu treffen.This thesis shows the potential of stand-off corpus architecture with multiple annotation levels for the annotation of rule-system compliant and non-compliant utterances within a common corpus. // The concrete subject matter deals with the creation and evaluation of a method within a multi-level annotation framework for annotating written data of advanced German learners based on topological fields, a descriptive model used for the representation of German word order (syntax). The topological field annotation was implemented for two sub-corpora within the error annotated learner corpus âFalkoâ. The majority of the annotated data consists of essays written by advanced German learners. // The main objective is to develop clear criteria to obtain consistent and accurate annotation for classifying utterances as canonical or non-canonical (model compliant or non-compliant) and accordingly segmenting them into topological fields and thus gain a better understanding of the complex factors that are involved in such a process. For the analysis, selected German linguistic phenomena (e.g. passive) and many learner examples have been utilized. // Furthermore, quantitative methods are introduced to evaluate the quality of the annotation. The inter-rater evaluation shows that segmenting utterances into topical fields is easily learned even by annotators with little linguistic knowledge but it also points to the necessity of clear annotation guidelines
Syntactic annotation of non-canonical linguistic structures
This paper deals with the syntactic annotation of corpora that contain both âcanonicalâ and ânon-canonicalâ sentences.Not Reviewe