15 research outputs found
Natural Language Dialogue Service for Appointment Scheduling Agents
Appointment scheduling is a problem faced daily by many individuals and
organizations. Cooperating agent systems have been developed to partially
automate this task. In order to extend the circle of participants as far as
possible we advocate the use of natural language transmitted by e-mail. We
describe COSMA, a fully implemented German language server for existing
appointment scheduling agent systems. COSMA can cope with multiple dialogues in
parallel, and accounts for differences in dialogue behaviour between human and
machine agents. NL coverage of the sublanguage is achieved through both
corpus-based grammar development and the use of message extraction techniques.Comment: 8 or 9 pages, LaTeX; uses aclap.sty, epsf.te
An Intelligent Text Extraction and Navigation System
We present sppc, a high-performance system for intelligent text extraction and navigation from German free text documents. The main purpose of sppc is to extract as much linguistic structure as possible for performing domain-specific processing. sppc consists of a set of domain-independent shallow core components which are realized by means of cascaded weighted finite state machines and generic dynamic tries. All extracted information is represented uniformly in one data structure (called the text chart) in a highly compact and linked form in order to support indexing and navigation through the set of solutions. Germa
Annotated Bibliography for the DEWPOINT project
This bibliography covers aspects of the Detection and Early Warning of Proliferation from Online INdicators of Threat (DEWPOINT) project including 1) data management and querying, 2) baseline and advanced methods for classifying free text, and 3) algorithms to achieve the ultimate goal of inferring intent from free text sources. Metrics for assessing the quality and correctness of classification are addressed in the second group. Data management and querying include methods for efficiently storing, indexing, searching, and organizing the data we expect to operate on within the DEWPOINT project
Verknüpfung von Text- und Modellentitäten von Softwarearchitektur-Modellen mithilfe von Wortvektoren
Die Verknüpfung von Entitäten von Softwarearchitektur-Dokumentationen und -Modellen bietet Möglichkeiten, die Qualität eines Software-Entwicklungsprozesses zu verbessern. Zu diesen Möglichkeiten zählen beispielsweise die Analyse der Konsistenz und das Übertragen von Änderungen zwischen den Artefakten Dokumentation und Modell. Um solche Verknüpfungen automatisiert berechnen zu können, bedarf es Methoden der linguistischen Datenverarbeitung. In der vorliegenden Arbeit wird ein Verfahren präsentiert, welches dieses Problem mithilfe von Wortvektoren angeht. Diese werden für vielfältige Aufgaben der linguistischen Datenverarbeitung genutzt und übertreffen dabei häufig herkömmlicheVerfahren. In dieser Arbeit werden sie dazu verwendet, Ähnlichkeiten zwischen Entitäten zu berechnen. Dabei wird zwischen Nominalphrasen und Verbphrasen unterschieden, wobei Erstere mit nicht-relationalen und Letztere mit relationalen Architekturmodellentitäten verknüpft werden können. Dazu wird mithilfe des PARSE-Rahmenwerks ein Graph aufgebaut, der den Dokumentationstext repräsentiert und eine Klassifikation von Phrasen und Wörtern enthält. Anhand dieses Graphen und einer Repräsentation des Architekturmodells kann das in dieser Arbeit entwickelte Verfahren Verknüpfungen berechnen und an den Graphen annotieren. Es wurden verschiedene Parametrisierungen des Verfahrens evaluiert, wobei allgemein festgehalten werden kann, dass das Referenzverfahren, ein String-Ähnlichkeitsvergleich mithilfe der Levenshtein-Distanz, im F1-Maß überboten werden kann. Für Nominalphrasen wurde ein durchschnittlicher Vorsprung von 13.6 Prozentpunkten des Wortvektor-Verfahrens gegenüber dem Levenshtein-Verfahren gemessen