341 research outputs found

    „Gefühl ist alles; Name ist Schall und Rauch.“ Der Einsatz von Sentiment Analysis in der quantitativen Dramenanalyse

    Get PDF
    In der vorliegenden Masterarbeit wird ein mehrteiliges Projekt vorgestellt, das den Einsatz von Sentiment Analysis (SA) in der quantitativen Dramenanalyse exploriert. Als beispielhafter Untersuchungsgegenstand wird ein Korpus von 11 Dramen des Schriftstellers Gotthold Ephraim Lessing (1729 – 1782) verwendet. Die Arbeit stellt eine Erweiterung eines bestehenden Tools zur quantitativen Dramenanalyse (Katharsis) um eine SA-Komponente dar. Es wurden Python-Programme zur Durchführung der SA entwickelt. Als zentraler SA-Ansatz wird mangels annotierter Trainings-Korpora ein Lexikon-basierter Ansatz gewählt. Um ein optimiertes SA-Verfahren zu identifizieren, werden mehrere Optionen und Herangehensweisen für die SA implementiert und auf ihre Leistung für den spezifischen Anwendungsfall untersucht. Es werden fünf der bekanntesten deutschsprachigen SA-Lexika implementiert sowie eine kombinierte Gesamtversion dieser erstellt. Als weitere Optionen wird der Einfluss einer Lexikonerweiterung mit historischen linguistischen Varianten, von Lemmatisierung über zwei Lemmatisierer und drei Lemmatisierungsarten, von drei verschiedenen Stoppwortlisten und der Beachtung von Groß- und Kleinschreibung implementiert und untersucht. Es werden für alle kombinatorischen Möglichkeiten von Lexika und Optionen verschiedene Sentiment-Metriken auf verschiedenen Ebenen berechnet. Als Ebenen des Dramas werden Sentiment-Metriken für die strukturelle Ebene (Drama, Akt, Szene, Replik), die Sprecher-Ebene (pro Drama, Akt, Szene, Replik) und für Sprecherbeziehungen (pro Dra-ma, Akt, Szene, Replik) kalkuliert. Es werden unterschiedliche Metriken für die Polari-tät (positiv, negativ) und 8 Emotionskategorien auf diesen Ebenen berechnet. Es werden mehrere Evaluationsverfahren durchgeführt. In einer ersten informellen Evaluation wird der Anteil der Wörter der Lexika in Zusammenhang mit den genannten Optionen am Vokabular des Korpus untersucht und diskutiert. Zur Ausführung einer systematischen Evaluation wird ein Gold-Standard von annotierten Repliken erstellt. In einer Annotationsstudie beurteilen 5 Teilnehmer einen repräsentativen Korpus von 200 Repliken bezüglich Polarität und Emotionen. In einem anschließenden Fragebogen konnten Einsichten zu Probleme und Schwierigkeiten bei der Annotation erhoben werden. Die Ergebnisse der Annotation werden statistisch ausgewertet und hinsichtlich Annotationsverhalten untersucht. Als Hauptergebnisse stellt man einen grundsätzlich geringeren Übereinstimmungsgrad als bei anderen Untersuchungsgegenständen in der SA fest. Auffällig ist auch eine starke Ungleichverteilung der Polaritäten im Korpus. Es werden deutlich mehr Repliken als negativ denn als positiv wahr-genommen. Das finale Evaluations-Korpus (Gold Standard, GS) besteht aus 139 negativen und 61 positiven Repliken basierend auf der Mehrheitsentscheidung der Annotatoren. Über ein in Python entwickeltes Evaluationsframework wurde systematisch die SA-Leistung aller Lexika und Methoden hinsichtlich der Prädiktion der Polarität einer Replik untersucht. Verschieden Evaluations-Metriken wurden zur differenzierten Ana-lyse und Diskussion aller Ansätze berechnet. Es können Erkennungsraten von bis zu 70% festgestellt werden. Unter Analyse aller Evaluationsergebnisse wird das leistungsstärkste Verfahren bestimmt. Es setzt sich aus der Methoden-Kombination des Lexikons SentiWS, erweitert durch historische linguistische Varianten, mit einer Lemmatisierung auf Text- und Lexikon-Ebene über den pattern-Lemmatisierer, ohne Stoppwortiste und unter Beachtung von Groß- und Kleinschreibung im letzten Abgleichschritt, zusammen. Für das als am besten identifizierte Verfahren wird ein Front-End zur Visualisierung der SA-Metriken als Web-Anwendung implementiert. Es stehen interaktive Visualisierungen für Polaritäten und Emotionskategorien zur Verfügung. Es können Verteilungen und Verläufe auf Dramen-, Akt-, Szenen-, Replik-, Sprecher- und Sprecherbeziehungs (je pro Drama, Akt, Szene, Replik) exploriert werden. Der mögliche Einsatz in der Dramenanalyse wird anhand vereinzelter Fallbeispiele beschrieben. Ab-schließend werden die Ergebnisse des Gesamtprojekts im Kontext der Forschung diskutiert und mögliche Anknüpfungspunkte besprochen

    Wie entsteht "Stellenwert"? Eine Analyse zur Charakterisierung von SchlĂĽsselstellen in der Literatur

    Get PDF
    Gegenstand dieser Arbeit ist die Charakterisierung von Schlüsselstellen ausgewählter literarischer Werke auf der Grundlage computergestützter literatur- und sprachwissenschaftlicher Methoden. Im Zentrum der Untersuchungen steht die Frage, inwiefern sich der Begriff der Schlüsselstelle über stilistische oder sprachliche Merkmale definieren lässt. Der Begriff wird in einen fachwissenschaftlichen Kontext eingeordnet, wobei der Fokus auf den Disziplinen Literaturwissenschaft sowie Computational Literary Studies liegt. Unter Zuhilfenahme quantifizierender Verfahren werden die zitierten und nicht zitieren Stellen zweier literarischer Werke hinsichtlich ausgewählter textueller Merkmale eingehender analysiert. Ergebnisse zur Länge und Verteilung von Stellen im Text, deren Sentiment und den darin enthaltenen Wortarten werden vorgestellt sowie methodenkritisch interpretiert. Des Weiteren wird ein erster Ansatz zur Visualisierung der Ergebnisse präsentiert. Der zugehörige Prototyp soll zur Reflexion über die Relation einzelner Textstellen zum gesamten Text anregen. In der Arbeit werden diverse Abzweigungen offengelegt, deren konsekutive Verfolgung umfangreiches Forschungspotenzial verspricht

    Computer im Musenhain. Von träumenden Büchern und der Aura des Digitalen

    Get PDF
    Die Inhalte dieser Festschrift für Andrea Rapp reichen von Wolfram über Lichtenberg zu Goethe, von Liebesbriefen bis zu virtuellen Forschungsumgebungen, Informationsinfrastrukturen und Open Access. Der Titel der Festschrift, „Computer im Musenhain – Von träumenden Büchern und der Aura des Digitalen” greift Wechselwirkungen auf, die entstehen, wenn Philologie und Technologie zusammengedacht und zusammengebracht werden

    “The Bard meets the Doctor” – Computergestützte Identifikation intertextueller Shakespearebezüge in der Science Fiction-Serie Dr. Who.

    Get PDF
    A single abstract from the DHd-2019 Book of Abstracts.Sofern eine editorische Arbeit an dieser Publikation stattgefunden hat, dann bestand diese aus der Eliminierung von Bindestrichen in Ăśberschriften, die aufgrund fehlerhafter Silbentrennung entstanden sind, der Vereinheitlichung von Namen der Autor*innen in das Schema "Nachname, Vorname" und/oder der Trennung von Ăśberschrift und UnterĂĽberschrift durch die Setzung eines Punktes, sofern notwendig

    Reflektierte algorithmische Textanalyse. Interdisziplinäre(s) Arbeiten in der CRETA-Werkstatt

    Get PDF
    The Center for Reflected Text Analytics (CRETA) develops interdisciplinary mixed methods for text analytics in the research fields of the digital humanities. This volume is a collection of text analyses from specialty fields including literary studies, linguistics, the social sciences, and philosophy. It thus offers an overview of the methodology of the reflected algorithmic analysis of literary and non-literary texts

    One Girl, Three Names: The Political Participation of New Women in Maria Leitner’s Work

    Get PDF
    This contribution presents a reading of Maria Leitner’s novel "Mädchen mit drei Namen" (1932). The novel intervenes in the contemporary discourse on the New Woman and extends it by two crucial aspects. First, it documents the desolate living and working conditions of young working women in Berlin in the early 1930s. Second, it addresses these women as potential activists of the workers’ movement. The article investigates whether or under what conditions the literary mobilization of the young generation of women succeeded. The analysis of Leitner’s novel is complemented by examining the discussion of Irmgard Keun’s novel "Gilgi, eine von uns" in the social democratic newspaper "Vorwärts". Drawing on these two exceptional contributions to Weimar’s new generation of women, the article reveals the intricate intertwining of the discourse on their political participation with the ongoing debate about female representations in the mass media.This contribution presents a reading of Maria Leitner’s novel "Mädchen mit drei Namen" (1932). The novel intervenes in the contemporary discourse on the New Woman and extends it by two crucial aspects. First, it documents the desolate living and working conditions of young working women in Berlin in the early 1930s. Second, it addresses these women as potential activists of the workers’ movement. The article investigates whether or under what conditions the literary mobilization of the young generation of women succeeded. The analysis of Leitner’s novel is complemented by examining the discussion of Irmgard Keun’s novel "Gilgi, eine von uns" in the social democratic newspaper "Vorwärts". Drawing on these two exceptional contributions to Weimar’s new generation of women, the article reveals the intricate intertwining of the discourse on their political participation with the ongoing debate about female representations in the mass media

    Korpusbasierte Verfahren zur Generierung lexikalischer Ressourcen für das Opinion Mining. Statistische Ansätze und deren Einsatzmöglichkeiten

    Get PDF
    Die ständig zunehmende Anzahl nutzergenerierter textueller Daten im World Wide Web, wie beispielsweise Kundenrezensionen, und die Begehrlichkeiten diese Daten hinsichtlich der darin ausgedrückten Meinungen zu Unternehmen, Produkten, Dienstleistungen etc. maschinell auszuwerten, erfordern gut funktionierende, angepasste Methoden des Opinion Mining. Die Grundlage für viele dieser Methoden bilden lexikalische Ressourcen in Form von Lexika meinungstragender Wörter und Phrasen. Diese Lexika existieren bisher allerdings nur für ausgewählte Sprachen, haben diverse inhaltliche Lücken, und sind automatisch (für verschiedene Sprachen) nur mit großem Aufwand zu erzeugen. In dieser Arbeit wird deshalb ein neues Verfahren vorgestellt, das dazu beitragen soll, die benannten Probleme – durch den Einsatz statistischer Methoden – zu überwinden. Zudem wurde, mittels dieses Verfahrens, der Prototyp eines neuen Lexikons mit meinungstragenden Wörtern und Phrasen für die deutsche Sprache generiert und anschließend evaluiert. Dafür wurde im Rahmen eines Experiments mit 20 Teilnehmern ein Basis-Referenzlexikon für die deutsche Sprache manuell erzeugt. Klassische Einsatzgebiete der Opinion Mining Algorithmen und Ressourcen, und damit des vorgestellten Verfahrens, sind Systeme zur Erfassung von Kundenmeinungen zu verschiedenen Unternehmensbereichen zur Unterstützung des Beschwerde- und Reputationsmanagements. Allerdings sind die Möglichkeiten des neu entwickelten Verfahrens nicht auf diese klassischen Anwendungsfelder begrenzt. Auch der interdisziplinäre Einsatz, z.B. zur Untersuchung von Sprachvarietäten im Forschungsfeld der Sprachstatistik, ist denkbar.The constantly increasing number of user-generated textual data on the World Wide Web, such as customer reviews, and the desire to automatically analyze this data with regard to the opinions expressed therein regarding companies, products, services, etc., require well-functioning, adapted opinion mining methods. Lexical resources – i.e. lexicons of opinion-bearing words and phrases – form the basis for many of these methods. However, these lexicons only exist for selected languages, have various content gaps, and can only be generated automatically (for different languages) with great effort. In this thesis a new method is presented to help overcome the above described problems by using statistical methods. In addition, the prototype of a new lexicon including opinion-bearing words and phrases for the German language was generated by using this method. In order to evaluate this automatically generated resource, an experiment with 20 participants was performed to manually create a reference lexicon for the German language. Traditional application areas of opinion mining algorithms and resources, and thus of the presented approach, are systems for recording customer opinions on various areas of companies in support of complaint and reputation management. However, the possibilities of the newly developed method are not limited to these classic fields of application. Interdisciplinary use, e.g. to study language varieties in the research field of language statistics, is also conceivable

    Quantitative Ansätze in den Literatur- und Geisteswissenschaften

    Get PDF
    Since the beginning of the 19th century, quantitative techniques have been used in literary and human sciences to describe, analyze and interpret texts. Such approaches were underrepresented until the end of the 20th century, but are becoming increasingly important in the digital humanities. The aim of the volume is to contextualize theories of theory, methodology and subject history on the one hand, and on the other hand to examine the significance of their results with a view to the digital present. In view of the innovative verve of digital humanities, it should not be forgotten that the idea of ​​juxtaposing interpretive close reading with descriptive-analytical, remote reading is not much younger than the idea of ​​close reading itself. Counting is by no means the first through the 'digital revolution' of the humanities. Rather, what has been determined by late Dilthey as the subject of the understanding and qualitatively oriented humanities has been declared 'measurable' for some 200 years
    • …
    corecore