7 research outputs found
Text Mining: Wissensgewinnung aus natĂĽrlichsprachigen Dokumenten
Das noch recht junge Forschungsgebiet "Text Mining" umfaĂźt eine
Verbindung von Verfahren der Sprachverarbeitung mit Datenbank-
und Informationssystemtechnologien. Es entstand aus der
Beobachtung, dass ca. 85% aller Datenbankinhalte nur in
unstrukturierter Form vorliegen, so dass sich die Techniken des
klassischen Data Mining zur Wissensgewinnung nicht anwenden
lassen. Beispiele fĂĽr solche Daten sind Volltextdatenbanken mit
BĂĽchern, Unternehmenswebseiten, Archive mit Zeitungsartikeln
oder wissenschaftlichen Publikationen, aber auch Ströme
kontinuierlich auflaufender Emails oder Meldungen von
Nachrichtenagenturen (Newswires).
Im Gegensatz zum Information Retrieval geht es beim Text Mining
nicht darum, lediglich Dokumente anhand von Anfragen
aufzufinden, sondern aus einem einzelnen oder einem Satz von
Dokumenten neues Wissen zu gewinnen, etwa durch automatische
Textzusammenfassungen, die Erkennung und Verfolgung benannter
Objekte oder die Aufdeckung neuer Trends in Forschung und
Industrie. Durch die ständig wachsende Zahl elektronisch
verfĂĽgbarer Texte werden automatisch arbeitende Verfahren zur
Bewältigung der Informationsflut immer dringender, was Text
Mining zu einem sehr aktiven und auch kommerziell interessanten
Forschungsgebiet macht.
Der vorliegende Bericht enthält eine Auswahl von Themen, die von
Studierenden der Universität Karlsruhe im Rahmen eines
Hauptseminars am IPD im Wintersemester 2004/2005 erarbeitet
wurden. Sie reichen von den Grundlagen der Computerlinguistik
ĂĽber einzelne Algorithmen zur Sprachverarbeitung bis hin zu
konkreten Anwendungen im Text Mining. Zahlreiche
Literaturreferenzen zu jedem Kapitel sollen dem Leser eine
weitergehende Studie der einzelnen Themen ermöglichen
Das Weltsozialforum: Eine Institution der Globalisierungskritik zwischen Organisation und Bewegung
Das Weltsozialforum (WSF) ist das Relikt globalisierungskritischer Bewegungen der Jahrtausendwende. Auch ĂĽber ein Jahrzehnt nach dem ersten WSF 2001 in Porto Alegre (Brasilien) ziehen die Protest-Events zehntausende Gegner_innen neoliberaler Weltordnung an. Mit seiner umfassenden ethnografischen Forschung verfolgt der Autor die Spuren des WSF vom Ursprung bis zum WSF 2013 in Tunesien. Im Mittelpunkt steht dabei die Frage, wie es dem WSF - anders als vielen anderen Bewegungen - gelingt, so lange fortzubestehen, ohne seinen Bewegungscharakter zu verlieren. Basierend auf umfangreichen Analysen wird das Prinzip der Transpoiesis herausgearbeitet, demzufolge Bewegungen dann ĂĽberdauern, wenn sie zwischen Zerfall und Institutionalisierung oszillieren.Ethnography of the World Social Forum - this volume reconstructs the (a-)typical course of a protest movement that began in 2001 and remains active around the world until today
Die Phonetik von äh und ähm
In diesem Open-Access-Buch wird untersucht, welche akustischen Eigenschaften Füllpartikeln wie äh und ähm in spontansprachlichen Dialogen des Deutschen zeigen und welche linguistischen Kontexte dabei auf welche Weise ihre akustische Form beeinflussen. Malte Belz betrachtet hierfür die phonetischen Parameter Dauer, Tonhöhe, Vokalqualität sowie Phonationsmodus und analysiert den Einfluss dreier granular verschiedener Kontextebenen auf die Form: die Mikroebene enthält Annotationen der adjazenten Laut- oder Pausenumgebung, die Mesoebene erfasst Intonationsphrasen und auf der Makroebene sind dialogstrukturelle Einheiten wie Fragen oder Antworten annotiert.
Der Intonationsphrasenkontext übt den deutlichsten Effekt auf Füllpartikeln aus – so ist am Phrasenanfang ihr Vokal offener, während am Phrasenende ihre Dauer länger und ihre Tonhöhe tiefer ist. Dieses Ergebnis wird komplementiert durch Effekte auf der Mikroebene, während der Einfluss der Dialogstruktur inkonsistent bleibt. Die vorliegende Untersuchung zeigt damit, dass die Realisierung von Füllpartikeln – wie andere Wörter auch – allgemeinen prosodischen Prinzipien folgt
Datenbasierte und linguistisch interpretierbare Intonationsmodellierung
In this thesis a data-driven and linguistically interpretable intonation model for the automatic analysis and synthesis of fundamental frequency (F0) contours was developed. The model can be characterised as parametric, contour-based, and superpositional. Its intonation representation consists of a superposition of global and local contour classes and can be derived in a purely data-driven manner, which guarantees consistency and easy adaptability to new data.
The model's linguistic interpretability was examined by automatic linguistic corpus analyses resulting in hypotheses
about possible relations between contours and linguistic concepts. These hypotheses were subsequently tested by perception experiments. By these means a systematic linguistic anchoring of the model was achieved in form of a decision tree to predict the linguistically appropriate contour class. The adequacy of its predictions was assured by a further perception test.
Due to its simultaneous signal proximity and linguistic anchoring, the model covers the entire chain from text to signal and therefore can be used for intonation analysis and generation on a linguistic as well as on a phonetic-acoustic level. It is qualified for employment in speech
technology applications as well as in phonetic fundamental research to automatically analyse raw speech data
Grammatik und Interaktion. Untersuchungen zum Zusammenhang von grammatischen Strukturen und Gesprächsprozessen
Die in diesem Band zusammengestellten Beiträge geben einen Einblick in den aktuellen Forschungsstand zum Thema "Grammatik und Interaktion". Sie gehen zurück auf Vorträge der 11. Arbeitstagung zur Gesprächsforschung, die vom 6. bis 8. April 2005 unter dem Rahmenthema "Grammatik und Interaktion" am Institut für Deutsche Sprache (IDS) in Mannheim stattfand. Für die Veröffentlichung wurden diese Vorträge um Artikel von Peter Auer und Susanne Günthner ergänzt. Alle Beiträge eint das Anliegen, Formen, Verwendung und Motivation grammatischer Strukturen in der Interaktion auf der Basis authentischer Daten zu rekonstruieren. Sie alle gehen davon aus, dass sich interaktive Aufgaben und grammatische Strukturen wechselseitig bedingen: Die rekurrente Bearbeitung von Aufgaben der Interaktion führt zur Herausbildung funktionaler grammatischer Strukturen und lexikalisch-syntaktischer Konstruktionen. Diese wiederum bilden eine flexible Ressource zur Lösung variierender Interaktionsaufgaben und strukturieren ihrerseits so interaktive Prozesse vor
Optimierung von Gesprächen in der professionellen Telefonie
Telephone service conversations are a central component of social and economic communication practice. They are to a considerable extent pre-planned and standardized. In addition to the desired positive effects (uniformity, efficiency, customer orientation), established call standards lead to unwanted negative effects such as speaking-linguistic stereotypes, over-marking or automated call handling. These and other phenomena are the object of investigation in the research focus on professional telephony at the Martin Luther University Halle-Wittenberg. The author bundles and systematizes the past research work, extended by own investigations and illustrates exemplary approaches, concepts and concrete measures for optimization of conversations in telephone customer service. Judith Pietschmann completed her PhD at the Martin Luther University Halle-Wittenberg in 2017. As a lecturer in the Department of Speech Science and Phonetics, she teaches and researches in the main areas of oral communication in institutional contexts, qualitative and quantitative speech impact research, prosody in interaction and communicative promotion of competence in professional qualification