Search CORE

6 research outputs found

Von der Tonbandaufnahme zur integrierten Text-Ton-Datenbank. Instrumente für die Arbeit mit Gesprächskorpora

Author: Bodmer Mory Franck
Fach Marcus L.
Schmidt Rudolf
Schütte Wilfried
Publication venue: Tübingen : Narr
Publication date: 02/11/2015
Field of study

The development of tools for computer-assisted transcription and analysis of extensive speech corpora is one main issue at the Institute of German Language (IDS) and the Institute of Natural Language Processing (IMS). Corpora of natural spoken dialogue have been transcribed, and the analogue recordings of these discourses are digitized. An automatic segmentation system is employed which is based on Hidden Markov Models. The orthographic representation of the speech signal is transformed into a phonetic representation, the phonetic transcription is transformed into a system-internal representation, and the time alignment between text and speech signal follows. In this article, we also describe the retrieval software Cosmas II and its special features for searching discourse transcripts and playing time aligned passages

Publikationsserver des Instituts für Deutsche Sprache

Mit COSMAS II "in den Weiten der IDS-Korpora unterwegs"

Author: Bodmer Mory Franck
Publication venue: Mannheim : Institut für Deutsche Sprache
Publication date: 03/06/2014
Field of study

Publikationsserver des Instituts für Deutsche Sprache

COSMAS II - Recherchieren in den Korpora des IDS

Author: Bodmer Mory Franck
Publication venue
Publication date: 04/06/2014
Field of study

Publikationsserver des Instituts für Deutsche Sprache

Abfragekomponente von COSMAS-II

Author: Bodmer Mory Franck
Publication venue: Mannheim : Institut für Deutsche Sprache
Publication date: 17/02/2017
Field of study

Publikationsserver des Instituts für Deutsche Sprache

Computertechnische Erschließung von Gesprächskorpora

Author: Bodmer Mory Franck
Schmidt Rudolf
Publication venue: Wiesbaden : VS Verlag
Publication date: 17/02/2017
Field of study

Um gesprochene Sprache leichter analysieren zu können, müssen zuvor die auf Audio- oder Videokassetten befindlichen Aufnahmen transkribiert werden. Dabei kommt der Darstellung von Synchronität des Gesprochenen z.B. in Partiturschreibweise und dem Annotieren von Situationen, Verhalten einzelner Diskursteilnehmer u.dgl. eine bedeutende Rolle zu. Die Vielfalt der transkribierten Details und Informationsebenen setzt ein differenziertes Kodierungsschema voraus. Des Weiteren besteht bei der Gesprächsanalyse der Wunsch, neben dem Auffinden bestimmter Stellen im Schriftmaterial (Transkript) auch deren akustisches Ereignis wiedergeben zu können, was die Synchronisation von Text und Aufnahme voraussetzt. Im Folgenden wird nach einer Einleitung, welche die Geschichte und Motive für die in diesem Papier beschriebenen Komponenten kurz darstellt, eine Zusammenfassung linguistischer Desiderate für die Erschließung von Gesprächskorpora präsentiert und im Anschluss daran ein Modell für Diskurstranskripte vorgestellt, das die technische Grundlage für die diskursanalytische Erschließung von Gesprächskorpora am Institut für Deutsche Sprache (IDS) durch den Computer bildet. Anschließend wird der technische Prozess der Korpuserstellung skizziert, gefolgt von der Beschreibung dreier dabei zum Einsatz kommenden Werkzeuge, des DIDA-Editors, des SPRAT-Alignment- Systems und des DMM-Konverters. Schließlich wird die Volltextdatenbank COSMAS II vorgestellt, mit der die Analyse in den resultierenden SGML-Diskurstranskripten durchgeführt wird. Im Mittelpunkt steht dabei die Fähigkeit von COSMAS II, mit Hilfe der aus der Diskursstruktur abgeleiteten Diskursmetrik eine breite Palette von Suchanfragen zu ermöglichen und sie mit Hilfe der grafischen Suchanfragekomponente als SGML-Suchanfragen zu formulieren. Abschließend wird kurz auf die geplante Weiterentwicklung eingegangen

Publikationsserver des Instituts für Deutsche Sprache

Neues von KorAP

Author: Bodmer Mory Franck
Diewald Nils
Harders Peter
Kupietz Marc
Margaretha Eliza
Stallkamp Helge
Publication venue: 'Walter de Gruyter GmbH'
Publication date: 25/02/2019
Field of study

Crossref

Publikationsserver des Instituts für Deutsche Sprache