Entwicklung eines Produkt-Prozess-Korpus zur Unterstützung des Erwerbs von Kompetenzen im Bereich Digital Literacy (SPPC Swiss Process-Product Corpus of Student Writing Development)
Eingeladener Vortrag am Clarin-WorkshopDigital Literacy kann verstanden werden als Kompetenz, digitale multimodale Kommunikation im Kontext adäquat zu erfassen, zu reflektieren, zu verarbeiten und zu entwickeln, um so Beziehungen herzustellen und sich diskursiv zu beteiligen. Der Schwerpunkt liegt oft auf «neuartigen» Kommunikationsformen, wobei «Schreiben» eine der wichtigsten Kommunikationsarten bleibt.
Die Gestaltung und Umsetzung von Interventionen und Unterrichtssequenzen, die Studierende dabei unterstützen, solche digitalen Kompetenzen zu erwerben und erfolgreich an akademischen und beruflichen Diskursen teilzunehmen, ist eine anspruchsvolle Aufgabe. Studierende lernen während ihres Studiums das Schreiben wissenschaftlicher Texte; der Fokus in der Lehre verlagert sich dabei vom Produkt zum Prozess. Bislang wurde Forschung und Entwicklung in diesem Bereich durch die Schwierigkeit behindert, den Prozess und das Produkt gleichzeitig zu untersuchen, um ein ganzheitliches Verständnis der Komplexität des Schreibens zu erhalten. Dies ist auf einen Mangel an (1) geeigneten Methoden und (2) geeigneten Korpora zurückzuführen.
Problem (1) kann durch das Konzept der transforming sequences (Mahlow et al. 2022) auf der Grundlage von Änderungen im Produktionsmodus gelöst werden (Mahlow 2015) gelöst werden. Dies ermöglicht es, Text- und Satzverläufe zu extrahieren, die Entwicklung von Texten auf linguistischer Ebene zu untersuchen und so den Prozess mit dem Produkt in Beziehung zu setzen. Dieser Schritt in Richtung einer linguistischen Modellierung und Analyse von Schreibprozessdaten während des Schreibens in natürlichen Umgebungen geht über Analysen auf Wortebene (Leijten et al. 2019, Leijten et al. 2012) und Analysen auf der Grundlage manueller linguistischer Annotation (Cislaru und Olive 2018) nach einer Schreibsitzung hinaus.
Um Problem (2) anzugehen, erstellen wir eine neue Art von Schreibkorpus: das Swiss Process-Product Corpus of Student Writing Development (SPPC), das sowohl Prozess- als auch Produktdaten sowie Feedback zu Entwürfen von Betreuenden, Schreibberatenden oder Peers enthalten wird. SPPC wird aus schriftlichen Arbeiten von Studierenden (Entwurfe und eingereichte Endtexte) in ihrer Erstsprache (L1)
Deutsch erstellt.
Wir stellen hier unseren Ansatz vor, Texte (in verschiedenen Versionen), Prozessdaten und Analysen mit THETool (Mahlow et al. 2022) im XML-Format in einer speziellen XML-Datenbank, BaseX (https://basex.org), zu speichern. Für die Verbindung verschiedener Versionen eines Textes mit Feedback- Kommentaren verwenden wir TEI (https://tei-c.org).
Literatur
Georgetta Cislaru and Thierry Olive (2018) Le processus de textualisation. Analyse des unités linguistiques de performance écrite. De Boeck Supérieur, Louvain-la-Neuve.
Mariëlle Leijten, Eric Van Horenbeeck, and Luuk Van Waes (2019) Analysing keystroke logging data from a linguistic perspective. In Ob- serving writing, Eva Lindgren and Kirk Sullivan (eds.). Brill, Leiden, 71–95. https://doi.org/10.1163/9789004392526_005
Mariëlle Leijten, Lieve Macken, Veronique Hoste, Eric Van Horenbeeck, and Luuk Van Waes (2012) From character to word level: Enabling the linguistic analyses of Inputlog process data. In Proceedings of the Second Workshop on Computational Linguistics and Writing (CL&W 2012): Linguistic and cognitive aspects of document creation and document engineering, 1–8. Retrieved from http://aclanthology.org/W12–0301
Mahlow (2015) A definition of “version” for text production data and natural language document drafts. In Proceedings of the 3rd International Workshop on (Document) Changes: Modeling, detection, storage and visualization (DChanges 2015), 27–32. https://doi.org/10.1145/2881631.2881638
Cerstin Mahlow, Malgorzata Anna Ulasik, Don Tuggener (2022) Extraction of transforming sequences and sentence histories from writing process data: a first step towards linguistic modeling of writing. Reading and Writing. DOI 10.1007/s11145–021–10234–