1 research outputs found
Nutzen und Benutzen von Text Mining fĂŒr die Medienanalyse
Einerseits werden bestehende Ergebnisse aus so unterschiedlichen Richtungen wie etwa der empirischen Medienforschung und dem Text Mining zusammengetragen. Es geht dabei um Inhaltsanalyse, von Hand, mit UnterstĂŒtzung durch Computer, oder völlig automatisch, speziell auch im Hinblick auf die Faktoren wie Zeit, Entwicklung und VerĂ€nderung. Die Verdichtung und Zusammenstellung liefert nicht nur einen Ăberblick aus ungewohnter Perspektive, in diesem Prozess geschieht auch die Synthese von etwas Neuem.
Die Grundthese bleibt dabei immer eine einschlieĂende: So wenig es möglich scheint, dass in Zukunft der Computer Analysen völlig ohne menschliche Interpretation betreiben kann und wird, so wenig werden menschliche Interpretatoren noch ohne die jeweils bestmögliche UnterstĂŒtzung des Rechners in der Lage sein, komplexe Themen zeitnah umfassend und ohne allzu groĂe subjektive EinflĂŒsse zu bearbeiten â und so wenig werden es sich substantiell wertvolle Analysen noch leisten können, völlig auf derartige Hilfen und Instrumente der QualitĂ€tssicherung zu verzichten.
Daraus ergeben sich unmittelbar Anforderungen: Es ist zu klĂ€ren, wo die StĂ€rken und SchwĂ€chen von menschlichen Analysten und von Computerverfahren liegen. Darauf aufbauend gilt es eine optimale Synthese aus beider Seiten StĂ€rken und unter Minimierung der jeweiligen SchwĂ€chen zu erzielen. Praktisches Ziel ist letztlich die Reduktion von KomplexitĂ€t und die Ermöglichung eines Ausgangs aus dem Zustand des systembedingten âovernewsed but uninformedâ-Seins.:Abbildungsverzeichnis v
Tabellenverzeichnis viii
1 einleitung 1
1.1 Sinn einer wissenschaftlichen Arbeit zu Beginn des
21. Jahrhunderts 1
1.2 Verortung der Arbeit in der Ordnung der Wissenschaften
1
1.3 Vor dem Text 2
1.4 Beitrag zu Forschung und Praxis 3
1.5 Anlage und Aufbau der Arbeit 4
2 grundlagen 5
2.1 Textdaten 5
2.1.1 Zeichen 5
2.1.2 Verweise 6
2.1.3 Encoding 6
2.1.4 Umwandlung 7
2.2 Untersuchungsobjekte 7
2.2.1 Begriffe 7
2.2.2 Verteilung 8
2.2.3 Kookkurrenzen 12
2.3 Exkurs: Ein Verteilungsexperiment 12
2.3.1 Setup 12
2.3.2 Einfluss der SamplegröĂe 14
2.3.3 Einfluss der KorpusgröĂe 14
2.3.4 Wiederauftauchen von Types und Kookkurrenzen
14
2.4 Zeit 18
2.4.1 Definition 18
2.4.2 Betrachtungsarten 18
2.4.3 Zeitreihenanalyse 18
2.5 Wahrheit und Information 19
3 zugÀnge zu text 21
3.1 Inhaltsanalyse 21
3.1.1 Geschichte 21
3.1.2 Vorgehen 22
3.1.3 Kritik 23
3.1.4 Mit Computer 23
3.1.5 Medienresonanzanalyse 24
3.1.6 Exkurs: Automatische Analyse von Meinungen
und Einstellungen 25
3.1.7 Ein anderer Zugang zu Text durch Text Mining
26
3.2 Beispiele 27
3.2.1 Nachrichtensuchmaschinen 27
3.2.2 Nachrichtenzusammenfassungen 28
3.2.3 NachrichtenĂŒberblicke 29
4 die wörter des tages 34
4.1 Einordnung und Ursprung 34
4.1.1 Projekt Deutscher Wortschatz 34
4.1.2 Idee zu âWörtern des Tagesâ 37
4.1.3 Verwandte AnsÀtze und Arbeiten 38
4.2 Archivierung 39
4.2.1 Zur Funktion von Archiven 40
4.2.2 Rechtliche Rahmenbedingungen 40
4.3 Implementierung 44
4.3.1 Daten und Datenacquise 45
4.3.2 Vorverarbeitung 50
4.3.3 Linguistische Aufbereitung 54
4.3.4 TĂ€gliche Verarbeitung 58
4.3.5 PrÀsentation 65
4.3.6 Evaluation 70
4.4 Weiterentwicklungen und Perspektiven 71
4.4.1 Anwendungen 71
4.4.2 Mashup 74
4.4.3 Medien- und Trendanalyse 78
5 schluss 84
a weitere beispiele aus der anwendung 85
a.1 Wirtschaft 85
a.2 Papst: Tod und Neuwahl 87
a.3 Weltsicherheitsrat 93
b listings 94
c datenbankschema 110
d wissenschaftlicher werdegang 112
e publikationen 113
literaturverzeichnis 11