7 research outputs found

    Text Mining: Wissensgewinnung aus natĂĽrlichsprachigen Dokumenten

    Get PDF
    Das noch recht junge Forschungsgebiet "Text Mining" umfaßt eine Verbindung von Verfahren der Sprachverarbeitung mit Datenbank- und Informationssystemtechnologien. Es entstand aus der Beobachtung, dass ca. 85% aller Datenbankinhalte nur in unstrukturierter Form vorliegen, so dass sich die Techniken des klassischen Data Mining zur Wissensgewinnung nicht anwenden lassen. Beispiele für solche Daten sind Volltextdatenbanken mit Büchern, Unternehmenswebseiten, Archive mit Zeitungsartikeln oder wissenschaftlichen Publikationen, aber auch Ströme kontinuierlich auflaufender Emails oder Meldungen von Nachrichtenagenturen (Newswires). Im Gegensatz zum Information Retrieval geht es beim Text Mining nicht darum, lediglich Dokumente anhand von Anfragen aufzufinden, sondern aus einem einzelnen oder einem Satz von Dokumenten neues Wissen zu gewinnen, etwa durch automatische Textzusammenfassungen, die Erkennung und Verfolgung benannter Objekte oder die Aufdeckung neuer Trends in Forschung und Industrie. Durch die ständig wachsende Zahl elektronisch verfügbarer Texte werden automatisch arbeitende Verfahren zur Bewältigung der Informationsflut immer dringender, was Text Mining zu einem sehr aktiven und auch kommerziell interessanten Forschungsgebiet macht. Der vorliegende Bericht enthält eine Auswahl von Themen, die von Studierenden der Universität Karlsruhe im Rahmen eines Hauptseminars am IPD im Wintersemester 2004/2005 erarbeitet wurden. Sie reichen von den Grundlagen der Computerlinguistik über einzelne Algorithmen zur Sprachverarbeitung bis hin zu konkreten Anwendungen im Text Mining. Zahlreiche Literaturreferenzen zu jedem Kapitel sollen dem Leser eine weitergehende Studie der einzelnen Themen ermöglichen

    Das Weltsozialforum: Eine Institution der Globalisierungskritik zwischen Organisation und Bewegung

    Get PDF
    Das Weltsozialforum (WSF) ist das Relikt globalisierungskritischer Bewegungen der Jahrtausendwende. Auch ĂĽber ein Jahrzehnt nach dem ersten WSF 2001 in Porto Alegre (Brasilien) ziehen die Protest-Events zehntausende Gegner_innen neoliberaler Weltordnung an. Mit seiner umfassenden ethnografischen Forschung verfolgt der Autor die Spuren des WSF vom Ursprung bis zum WSF 2013 in Tunesien. Im Mittelpunkt steht dabei die Frage, wie es dem WSF - anders als vielen anderen Bewegungen - gelingt, so lange fortzubestehen, ohne seinen Bewegungscharakter zu verlieren. Basierend auf umfangreichen Analysen wird das Prinzip der Transpoiesis herausgearbeitet, demzufolge Bewegungen dann ĂĽberdauern, wenn sie zwischen Zerfall und Institutionalisierung oszillieren.Ethnography of the World Social Forum - this volume reconstructs the (a-)typical course of a protest movement that began in 2001 and remains active around the world until today

    Die Phonetik von äh und ähm

    Get PDF
    In diesem Open-Access-Buch wird untersucht, welche akustischen Eigenschaften Füllpartikeln wie äh und ähm in spontansprachlichen Dialogen des Deutschen zeigen und welche linguistischen Kontexte dabei auf welche Weise ihre akustische Form beeinflussen. Malte Belz betrachtet hierfür die phonetischen Parameter Dauer, Tonhöhe, Vokalqualität sowie Phonationsmodus und analysiert den Einfluss dreier granular verschiedener Kontextebenen auf die Form: die Mikroebene enthält Annotationen der adjazenten Laut- oder Pausenumgebung, die Mesoebene erfasst Intonationsphrasen und auf der Makroebene sind dialogstrukturelle Einheiten wie Fragen oder Antworten annotiert. Der Intonationsphrasenkontext übt den deutlichsten Effekt auf Füllpartikeln aus – so ist am Phrasenanfang ihr Vokal offener, während am Phrasenende ihre Dauer länger und ihre Tonhöhe tiefer ist. Dieses Ergebnis wird komplementiert durch Effekte auf der Mikroebene, während der Einfluss der Dialogstruktur inkonsistent bleibt. Die vorliegende Untersuchung zeigt damit, dass die Realisierung von Füllpartikeln – wie andere Wörter auch – allgemeinen prosodischen Prinzipien folgt

    Die Phonetik von äh und ähm

    Get PDF

    Datenbasierte und linguistisch interpretierbare Intonationsmodellierung

    Get PDF
    In this thesis a data-driven and linguistically interpretable intonation model for the automatic analysis and synthesis of fundamental frequency (F0) contours was developed. The model can be characterised as parametric, contour-based, and superpositional. Its intonation representation consists of a superposition of global and local contour classes and can be derived in a purely data-driven manner, which guarantees consistency and easy adaptability to new data. The model's linguistic interpretability was examined by automatic linguistic corpus analyses resulting in hypotheses about possible relations between contours and linguistic concepts. These hypotheses were subsequently tested by perception experiments. By these means a systematic linguistic anchoring of the model was achieved in form of a decision tree to predict the linguistically appropriate contour class. The adequacy of its predictions was assured by a further perception test. Due to its simultaneous signal proximity and linguistic anchoring, the model covers the entire chain from text to signal and therefore can be used for intonation analysis and generation on a linguistic as well as on a phonetic-acoustic level. It is qualified for employment in speech technology applications as well as in phonetic fundamental research to automatically analyse raw speech data

    Grammatik und Interaktion. Untersuchungen zum Zusammenhang von grammatischen Strukturen und Gesprächsprozessen

    Get PDF
    Die in diesem Band zusammengestellten Beiträge geben einen Einblick in den aktuellen Forschungsstand zum Thema "Grammatik und Interaktion". Sie gehen zurück auf Vorträge der 11. Arbeitstagung zur Gesprächsforschung, die vom 6. bis 8. April 2005 unter dem Rahmenthema "Grammatik und Interaktion" am Institut für Deutsche Sprache (IDS) in Mannheim stattfand. Für die Veröffentlichung wurden diese Vorträge um Artikel von Peter Auer und Susanne Günthner ergänzt. Alle Beiträge eint das Anliegen, Formen, Verwendung und Motivation grammatischer Strukturen in der Interaktion auf der Basis authentischer Daten zu rekonstruieren. Sie alle gehen davon aus, dass sich interaktive Aufgaben und grammatische Strukturen wechselseitig bedingen: Die rekurrente Bearbeitung von Aufgaben der Interaktion führt zur Herausbildung funktionaler grammatischer Strukturen und lexikalisch-syntaktischer Konstruktionen. Diese wiederum bilden eine flexible Ressource zur Lösung variierender Interaktionsaufgaben und strukturieren ihrerseits so interaktive Prozesse vor

    Optimierung von Gesprächen in der professionellen Telefonie

    Get PDF
    Telephone service conversations are a central component of social and economic communication practice. They are to a considerable extent pre-planned and standardized. In addition to the desired positive effects (uniformity, efficiency, customer orientation), established call standards lead to unwanted negative effects such as speaking-linguistic stereotypes, over-marking or automated call handling. These and other phenomena are the object of investigation in the research focus on professional telephony at the Martin Luther University Halle-Wittenberg. The author bundles and systematizes the past research work, extended by own investigations and illustrates exemplary approaches, concepts and concrete measures for optimization of conversations in telephone customer service. Judith Pietschmann completed her PhD at the Martin Luther University Halle-Wittenberg in 2017. As a lecturer in the Department of Speech Science and Phonetics, she teaches and researches in the main areas of oral communication in institutional contexts, qualitative and quantitative speech impact research, prosody in interaction and communicative promotion of competence in professional qualification
    corecore