Search CORE

188 research outputs found

Quantitative Methoden einer kognitiven Texttypologie

Author: Wisiorek Axel
Publication venue: Ludwig-Maximilians-Universität München
Publication date: 19/02/2021
Field of study

Vorliegende Arbeit verbindet automatische Verfahren der Mustererkennung und der explorativen Feature-Analyse mit textlinguistischen Parametern einer kognitiven Texttypologie, um eine Methodik für eine kognitiv adäquate, gebrauchsbasierte Genre-Klassifizierung anhand von annotierten Korpusdaten zu entwickeln. Zu den hier relevanten Parametern zählen, neben einfachen textstatistischen Maßen mit kognitiver Interpretation als Elaborationsmaße, vor allem Merkmale des referentiellen, relationalen sowie informationsstrukturellen Aufbaus textuell kodierter kognitiver Modelle, wie referentielle Distanz, häufige Ereignisschemata, Informationsdichte oder Muster textinterner Diskursstrukturierung. Durch Anwendung von Klassifikations- und Clusteringalgorithmen auf ein zeitlich und dialektal geschichtetes, syntaktisch, semantisch und informationsstrukturell annotiertes Korpus obugrischer Volkserzählungen sowie weiterer, primär mündlicher Genres wird die Eignung dieser Methodik einer automatischen Induktion quantitativer Textstrukturtypen für die Rekonstruktion von Text-Weltmodellen als genrespezifischen, durch Typisierung von Sprachgebrauchssituationen erlernten, schematischen Textstruktur-Modellen der menschlichen Kognition evaluiert.This research combines automatic pattern recognition with parameters of a cognitive text typology to develop a method for genre classification based on annotated corpus data, considering text-linguistic parameters such as information density, elaboration measures or frequent event schemata. Using a corpus of Ob-Ugrian folk tales and other, primarily oral genres, classification and clustering algorithms are applied to evaluate the effectiveness of this method for the induction of quantitative text structure types. This aims to reconstruct text world models as genre-specific, schematic text structure models of human cognition, learned through typification of language use

Digitale Hochschulschriften der LMU

Heka und Maat : Netzwerkanalyse als Instrument ägyptologischer Bedeutungsanalyse

Author: Elwert Frederik
Gafus Georg
Hofmann Beate
Wimmer Stefan Jakob
Publication venue
Publication date: 01/01/2014
Field of study

Publikationsserver der Universität Tübingen

Tesla - ein virtuelles Labor für experimentelle Computer- und Korpuslinguistik

Author: Schwiebert Stephan
Publication venue
Publication date: 01/01/2012
Field of study

Linguistisch motivierte Komponentensysteme bieten die Möglichkeit, Prozessketten zur maschinellen Annotation natürlichsprachlicher Daten zu definieren und auszuführen. Bisherige Ansätze unterliegen dabei verschiedenen Einschränkungen: So werden i.d.R. datenorientierte Austauschformate verwendet, die eine Abbildung generierter Daten auf proprietäre Metaformate erfordern, wodurch die Flexibilität bei der Implementation neuer Komponenten reduziert wird. Zudem wird der Reproduzierbarkeit von Ergebnissen nur eine niedrige Priorität eingeräumt, was die Nachvollziehbarkeit und Adaption neuer Verfahren erschwert. In dieser Arbeit wird mit Tesla (Text Engineering Software Laboratory) ein alternatives Komponentensystem vorgestellt, das die skizzierten Kritikpunkte ebenso wie weitere Nachteile und Einschränkungen derartiger Systeme vermeidet. Anhand eines Verfahrens zur automatischen Extraktion syntaktischer Strukturen, das auf die distributionelle Analyse nach Harris zurückgeführt werden kann, werden zunächst die Anforderungen, denen ein computerlinguistisches Komponentensystem genügen muss, konkretisiert und diskutiert. Im Anschluss daran werden verschiedene Frameworks hinsichtlich dieser Anforderungen evaluiert, um schließlich Konzept, Design und Implementation von Tesla vorzustellen und dadurch zu verdeutlichen, dass das beschriebene Strukturierungsverfahren in Form verschiedener experimenteller Versuchsaufbauten analysiert, erweitert und auf neue Untersuchungsgegenstände angewendet wird

Kölner UniversitätsPublikationsServer

Szenen kritischer Relationalität

Author
Publication venue: Lüneburg
Publication date: 01/01/2024
Field of study

Kritische Relationalität interveniert in Ordnungen des Denkens, die Kritik als Operation des Trennens und Auseinanderhaltens entworfen und damit die modernen Dualismen von Menschlichem und Nicht-Menschlichem, Subjekten und Objekten, Organischem und Technischem, Natur und Kultur geprägt haben. Ausgehend von multiplen, verschränkten Krisen suchen die Beiträge dieses Bandes konkrete Szenen auf, in denen das kritische Potenzial von Verbindungen und Verstrickungen anschaulich wird. Das Ausloten von Relationalität wird dabei zu einem analytischen Modus, der für die Produktivität von Verbindungen sensibilisiert und zugleich ihre differenziellen Dimensionen anerkennt

SSOAR - Social Science Open Access Repository

Werkzeuge für Rechtsdatenbanken

Author: Voltmer Leonhard A. G.
Publication venue: Ludwig-Maximilians-Universität München
Publication date: 27/01/2005
Field of study

Wenn in Rechtstexten Wissen über das Recht enthalten ist, dann müsste in vielen Texten viel Recht zu finden sein. Die Korpuslinguistik bearbeitet linguistische Fragestellungen anhand großer Textmengen, die ausgewählt, erworben, aufbereitet (annotiert) und dann durchsucht/bearbeitet werden. Die fünf Kapitel dieser Arbeit widmen sich jeweils einem wichtigen Thema, zu dem Methoden vorgestellt, in Werkzeugen implementiert und diskutiert werden. Im ersten Kapitel (Dokumentklassifikation) wird eine Methode vorgestellt, mit der gezielt Rechtstexte aus dem Internet ausgewählt, akquiriert und geordnet in ein Korpus abgelegt werden können. Auch hier sollen die Voraussetzungen so gering wie möglich gehalten werden, damit möglichst breiter Gebrauch von der Methode gemacht werden kann. Die Einteilung des Rechts in einzelne Fachgebiete hat weitreichende Folgen. Sowohl Texte wie Rechtskonzepte erlangen ihre spezielle Bedeutung durch ihr Fachgebiet. Das zweite Kapitel (Fachgebietsklassifikation) gibt einen Überblick über die Problematik der Fachgebietseinteilung und stellt zwei automatische Fachgebietserkenner vor, die diese Spezialaufgabe besser lösen als die in Kapitel 1 vorgestellte allgemeine Dokumentklassifikation. Eine große Veränderung erfährt die Rechtsterminologie und -terminografie durch den Übergang von der physischen zur elektronischen Schrift. Damit muss nicht mehr eine Darstellungsweise allen Anforderungen gerecht werden, sondern die Darstellung kann dynamisch an die Umstände angepasst werden. Im dritten Kapitel (Dynamische Termdarstellung) wird das Konzept einer dynamischen Termdarstellung vorgestellt und seine technische Umsetzung skizziert. Das vierte Kapitel Termextraktion durch Beispielterme stellt eine automatische Termextraktionsmethode vor, die mit relativ geringen Voraussetzungen gute Ergebnisse liefert und damit für weniger stark verbreitete Sprachen eine Alternative zu kommerziellen Programmen darstellt. Dieses Instrument kann bei der zentralen Aufgabenstellung der Terminografie, dem Auffinden und der Auswahl der Termini, eingesetzt werden. Hier wird aber auch gezeigt, wie die Termextraktion zur Indizierung des in den meisten terminografischen Projekten vorhandenen Hintergrundkorpus verwendet werden kann. Das fünfte Kapitel (Organisation rechtlichen Wissens) gibt einen Überblick über die vielfältigen Möglichkeiten der Einteilung und Repräsentation von (rechtlichem) Wissen. Eine Methode der Wissensrepräsentation mit formaler Sprache, die logische Operationen ermöglicht, ist eine Ontologie. Es wurde eine Ontologie für eine Rechtsdatenbank erstellt und alle damit zusammenhängenden Aspekte diskutiert. Im Fazit wird schließlich diskutiert, für welche Bereiche der Arbeit mit Rechtsdatenbanken bereits jetzt relativ einfache Werkzeuge zur Verfügung stehen und wo die Entwicklung von weiteren Werkzeugen ansetzen könnte. Die Kapitel sind so geschrieben, dass sie auch einzeln gelesen werden können, ohne jedoch allzu starke Überschneidungen zuzulassen.La thèse de doctorat «Outils pour des bases de données juridiques» traîte des méthodes linguistiques et informatiques pour comprendre, mémoriser et communiquer des connaissances juridiques. Les sujets traités sont: I. La classification de documents Je discute les classes importantes pour des documents juridiques et je propose une classi-fication automatique qui n’utilise pas seulement le texte du document, mais aussi d’autres critères comme l’adresse du document, l’adresse des liens et le contexte de la recherche de documents. II. L’identification de disciplines en terminographie Je prétends que toute répartition en disciplines et sous-disciplines est par nature relative. Puis je présente deux méthodes pour l’identification de la discipline d’un texte. La pre-mière utilise les termes et la deuxième les textes (définitions et contextes) présents dans la base de données terminographique. III. La présentation dynamique de termes Je discute les problèmes de la présentation de termes traditionnelle pour livres et les avantages d’une présentation adaptée dynamiquement aux besoins concrets de chaque client. Pour prouver la faisabilité de cette nouvelle approche, j’indique la technologie applicable pour chaque fonction et je présente une mise en œuvre dans le système termi-nographique BISTRO (www.eurac.edu/bistro) IV. L’extraction de termes Je discute les caractéristiques des trois méthodes pour l’extraction de termes. Après je montre l’efficacité de la méthode basée sur des exemples lors d’une expérience. L’outil est librement accessible en Internet et peut servir pour l’indexation d’un corpus. V. L’organisation du savoir juridique Je discute exhaustivement tous les systèmes répandus d’organisation du savoir, de mots-clés jusqu’aux ontologies. Ensuite je décrits le procédé et les problèmes concrets pour organiser une base de données juridiques avec une ontologie

Digitale Hochschulschriften der LMU

Rezensiv - Online-Rezensionen und Kulturelle Bildung

Author
Publication venue: 'Transcript Verlag'
Publication date: 21/02/2022
Field of study

Online-Rezensionen zu künstlerischen Artefakten können Bildungsprozesse anstoßen. Sowohl in der produktiven Auseinandersetzung mit einem Werk als auch in der Aufbereitung dieser Erfahrung in einem rezensiven Text und für ein spezifisches Publikum liegt ein hohes Potenzial hinsichtlich der kulturellen Teilhabe und Überwindung von Bildungsbarrieren. Aber welche Prozesse, Inhalte und Kontexte spielen dabei eine Rolle? Dieser Frage widmete sich das interdisziplinäre Forschungsprojekt Rez@Kultur, dessen Ergebnisse hier erstmals umfassend dargestellt werden. Ergänzt werden die Befunde um Anschlussperspektiven und Kommentare aus Forschung und Praxis

Directory of Open Access Books (DOAB)

Rezensiv - Online-Rezensionen und Kulturelle Bildung

Author
Publication venue: Bielefeld
Publication date: 01/01/2021
Field of study

SSOAR - Social Science Open Access Repository

Erweiterung eines Data Warehouse mit Big-Data-Quellen am Beispiel Twitter

Author: Frisch Martin (M.Sc.)
Publication venue: Köln : Hochschulbibliothek der Technischen Hochschule Köln
Publication date: 01/01/2015
Field of study

Im Zusammenhang mit dem Begriff Big Data können nicht nur immer größere Datenmengen verarbeitet werden, sondern auch neue Arten von Datenquellen genutzt werden. Insbesondere Web 2.0-Inhalte bieten dabei vielfältige Potenziale. So können beispielsweise mit Hilfe einer Sentiment-Analyse Meinungen und Stimmungen zu Produkten und Unternehmen in sozialen Netzwerken beobachtet werden. Diese Infor-mationen sind für sich gesehen bereits wertvoll für viele Unternehmen. Jedoch ist eine effiziente Analyse und Auswertung der Informationen nur in Kombination mit weiteren Unternehmensdaten möglich, die typischerweise in einem Data Warehouse liegen. Diese Arbeit diskutiert die Unter-schiede, Möglichkeiten und Herausforde-rungen diese Kombination zu realisieren. Veranschaulicht wird dies durch einen Show-Case, der eine Ende-zu-Ende-Umsetzung am Beispiel der Fernsehsendung Tatort zeigt. Dabei werden Zuschauerkommentare aus Twitter extrahiert, mit einer Sentiment-Analyse bewertet und schließlich in einem Data Warehouse ausgewertet. Dabei können klassische BI-Kennzahlen, wie beispiels- weise Einschaltquoten, Folgen pro Ermittler etc. den Ergebnissen der Sentiment-Analyse gegenübergestellt werden

ePublications

Automatischer Aufbau eines multilingualen Thesaurus durch Extraktion semantischer und lexikalischer Relationen aus der Wikipedia

Author: Kinzler Daniel
Publication venue
Publication date: 26/10/2017
Field of study

Die vorliegende Diplomarbeit beschreibt und analysiert Methoden, um aus den Datenbeständen der Wikipedia in verschiedenen Sprachen einen multilingualen Thesaurus zu erstellen. Dabei sollen insbesondere die Beziehungen zwischen Termen (Wörtern, Wortformen, Phrasen) zu sprachunabhängigen Konzepten extrahiert werden sowie die Beziehungen zwischen solchen Konzepten, speziell Beziehungen der Über- bzw. Unterordnung (Subsumtion) sowie der semantischen Verwandtheit und Ähnlichkeit. Zu diesem Zweck werden die Anforderungen sowie die verfügbaren Rohdaten analysiert, ein Prototyp zur Extraktion der gewünschten Daten entwickelt und die mit dem Prototyp gewonnenen Daten in Bezug auf die zuvor formulierten Anforderungen evaluiert

Qucosa - Publikationsserver der Universität Leipzig

Rezensiv - Online-Rezensionen und Kulturelle Bildung

Author
Publication venue: 'Transcript Verlag'
Publication date
Field of study

OAPEN Library