2 research outputs found
Medienanalyse und Visualisierung: Auswertung von Online-Pressetexten durch Text Mining
Obwohl sich die Medienwissenschaft als inter- oder transdisziplinÀres Arbeitsfeld versteht, haben methodische AnsÀtze aus der angewandten Informatik bisher kaum
Eingang in das Methodeninventar der Medienwissenschaft gefunden (vgl. Rusch 2002b: 70f). Die so genannten âNeuen Medienâ finden sich zwar als Subjekt medienwissenschaftlicher Betrachtungen wieder (vgl. Ludes 1998: 51ff, 129), es besteht aber ein Defizit hinsichtlich der Modernisierung geeigneter Methoden fĂŒr die Medienanalyse, die bisher von qualitativen und an einzelnen Publikationen bzw. Medienereignissen orientierten Verfahren geprĂ€gt ist (vgl. Posner 2001, Andringa 2002, Schreier
2002). Dieser Beitrag versucht aufzuzeigen, wie Text Mining-Verfahren fĂŒr die inhaltliche Auswertung von Pressetexten genutzt werden können und so als âangewandte Medieninformatikâ einen interdisziplinĂ€ren Beitrag zur Medienanalyse leisten können. Es wird ein im World Wide Web verfĂŒgbarer Informationsdienst vorgestellt, der tagesaktuell
ĂŒberregionale Online-Medien auswertet und begriffsbasiert die jeweils als relevant erkannten Konzepte als âWörter des Tagesâ prĂ€sentiert. Dabei kommen sowohl Darstellungen relevanter Begriffe, die einem einfachen Kategoriensystem zugeordnet sind zum Zuge, als auch Visualisierungen von aktuellen Begriffsassoziationen und Visualisierungen des AktualitĂ€tsverlaufs einzelner Konzepte
Nutzen und Benutzen von Text Mining fĂŒr die Medienanalyse
Einerseits werden bestehende Ergebnisse aus so unterschiedlichen Richtungen wie etwa der empirischen Medienforschung und dem Text Mining zusammengetragen. Es geht dabei um Inhaltsanalyse, von Hand, mit UnterstĂŒtzung durch Computer, oder völlig automatisch, speziell auch im Hinblick auf die Faktoren wie Zeit, Entwicklung und VerĂ€nderung. Die Verdichtung und Zusammenstellung liefert nicht nur einen Ăberblick aus ungewohnter Perspektive, in diesem Prozess geschieht auch die Synthese von etwas Neuem.
Die Grundthese bleibt dabei immer eine einschlieĂende: So wenig es möglich scheint, dass in Zukunft der Computer Analysen völlig ohne menschliche Interpretation betreiben kann und wird, so wenig werden menschliche Interpretatoren noch ohne die jeweils bestmögliche UnterstĂŒtzung des Rechners in der Lage sein, komplexe Themen zeitnah umfassend und ohne allzu groĂe subjektive EinflĂŒsse zu bearbeiten â und so wenig werden es sich substantiell wertvolle Analysen noch leisten können, völlig auf derartige Hilfen und Instrumente der QualitĂ€tssicherung zu verzichten.
Daraus ergeben sich unmittelbar Anforderungen: Es ist zu klĂ€ren, wo die StĂ€rken und SchwĂ€chen von menschlichen Analysten und von Computerverfahren liegen. Darauf aufbauend gilt es eine optimale Synthese aus beider Seiten StĂ€rken und unter Minimierung der jeweiligen SchwĂ€chen zu erzielen. Praktisches Ziel ist letztlich die Reduktion von KomplexitĂ€t und die Ermöglichung eines Ausgangs aus dem Zustand des systembedingten âovernewsed but uninformedâ-Seins.:Abbildungsverzeichnis v
Tabellenverzeichnis viii
1 einleitung 1
1.1 Sinn einer wissenschaftlichen Arbeit zu Beginn des
21. Jahrhunderts 1
1.2 Verortung der Arbeit in der Ordnung der Wissenschaften
1
1.3 Vor dem Text 2
1.4 Beitrag zu Forschung und Praxis 3
1.5 Anlage und Aufbau der Arbeit 4
2 grundlagen 5
2.1 Textdaten 5
2.1.1 Zeichen 5
2.1.2 Verweise 6
2.1.3 Encoding 6
2.1.4 Umwandlung 7
2.2 Untersuchungsobjekte 7
2.2.1 Begriffe 7
2.2.2 Verteilung 8
2.2.3 Kookkurrenzen 12
2.3 Exkurs: Ein Verteilungsexperiment 12
2.3.1 Setup 12
2.3.2 Einfluss der SamplegröĂe 14
2.3.3 Einfluss der KorpusgröĂe 14
2.3.4 Wiederauftauchen von Types und Kookkurrenzen
14
2.4 Zeit 18
2.4.1 Definition 18
2.4.2 Betrachtungsarten 18
2.4.3 Zeitreihenanalyse 18
2.5 Wahrheit und Information 19
3 zugÀnge zu text 21
3.1 Inhaltsanalyse 21
3.1.1 Geschichte 21
3.1.2 Vorgehen 22
3.1.3 Kritik 23
3.1.4 Mit Computer 23
3.1.5 Medienresonanzanalyse 24
3.1.6 Exkurs: Automatische Analyse von Meinungen
und Einstellungen 25
3.1.7 Ein anderer Zugang zu Text durch Text Mining
26
3.2 Beispiele 27
3.2.1 Nachrichtensuchmaschinen 27
3.2.2 Nachrichtenzusammenfassungen 28
3.2.3 NachrichtenĂŒberblicke 29
4 die wörter des tages 34
4.1 Einordnung und Ursprung 34
4.1.1 Projekt Deutscher Wortschatz 34
4.1.2 Idee zu âWörtern des Tagesâ 37
4.1.3 Verwandte AnsÀtze und Arbeiten 38
4.2 Archivierung 39
4.2.1 Zur Funktion von Archiven 40
4.2.2 Rechtliche Rahmenbedingungen 40
4.3 Implementierung 44
4.3.1 Daten und Datenacquise 45
4.3.2 Vorverarbeitung 50
4.3.3 Linguistische Aufbereitung 54
4.3.4 TĂ€gliche Verarbeitung 58
4.3.5 PrÀsentation 65
4.3.6 Evaluation 70
4.4 Weiterentwicklungen und Perspektiven 71
4.4.1 Anwendungen 71
4.4.2 Mashup 74
4.4.3 Medien- und Trendanalyse 78
5 schluss 84
a weitere beispiele aus der anwendung 85
a.1 Wirtschaft 85
a.2 Papst: Tod und Neuwahl 87
a.3 Weltsicherheitsrat 93
b listings 94
c datenbankschema 110
d wissenschaftlicher werdegang 112
e publikationen 113
literaturverzeichnis 11