Konstruktion von Lexika von relationalen Phrasen

Abstract

Knowledge Bases are one of the key components of Natural Language Understanding systems. For example, DBpedia, YAGO, and Wikidata capture and organize knowledge about named entities and relations between them, which is often crucial for tasks like Question Answering and Named Entity Disambiguation. While Knowledge Bases have good coverage of prominent entities, they are often limited with respect to relations. The goal of this thesis is to bridge this gap and automatically create lexicons of textual representations of relations, namely relational phrases. The lexicons should contain information about paraphrases, hierarchy, as well as semantic types of arguments of relational phrases. The thesis makes three main contributions. The first contribution addresses disambiguating relational phrases by aligning them with the WordNet dictionary. Moreover, the alignment allows imposing the WordNet hierarchy on the relational phrases. The second contribution proposes a method for graph construction of relations using Probabilistic Graphical Models. In addition, we apply this model to relation paraphrasing. The third contribution presents a method for constructing a lexicon of relational paraphrases with fine-grained semantic typing of arguments. This method is based on information from a multilingual parallel corpus.Wissensbanken sind Schlüsselkomponenten für sprachverarbeitende Systeme. Prominente Vertreter wie zum Beispiel DBpedia, Yago und Wikidata enthalten und organisieren Wissen über benannte Entitäten und deren Relationen zueinander. Das so strukturierte Wissen spielt oft eine zentrale Rolle für Aufgaben wie automatische Fragebeantwortung (engl. Question Answering) oder Disambiguierung von Entitäten. Wissensbanken haben eine gute Abdeckung an Entitäten, sind aber hinsichtlich Relationen oft limitiert. Das Ziel dieser Dissertation ist es diese Lücke zu schließen und automatisch Lexika zu erstellen, die textuelle Repräsentationen von Relationen, so genannte relationale Phrasen, zur Verfügung stellen. Die Lexika sollten neben Informationen zu Paraphrasen und der Hierarchie relationaler Phrasen auch semantische Typisierung der Argumente einer Relation umfassen. Diese Dissertation leistet dafür drei wesentliche Beiträge. Der erste Beitrag behandelt die Disambiguierung relationaler Phrasen durch Verknüpfung mit Einträgen des WordNet Lexikons. Diese Verknüpfung ermöglicht es die WordNet Hierarchie auf relationale Phrasen zu übertragen. Im zweiten Beitrag wird eine Methode zur Konstruktion eines Graphen aus Relationen mittels probabilistischer graphischer Modelle vorgeschlagen. Das erzeugte Modell wird darüber hinaus zur Paraphrasierung von Relationen angewandt. Der dritte Beitrag ist eine Methode zur Lexikonkonstruktion relationaler Paraphrasen mit feingranularer semantischer Typisierung der Argumente von Relationen. Diese Methode basiert auf Informationen aus multilingualen parallelen Korpora

    Similar works

    Full text

    thumbnail-image

    Available Versions