4 research outputs found

    Informationsextraktion durch Zusammenfassung maschinell selektierter Textsegmente

    Get PDF
    In dieser Diplomarbeit werden zwei Stufen entwickelt, die die KĂŒrzung von Texten unter einem inhaltlichen Gesichtspunkt ermöglichen. Die erste Stufe ist die Auswahl von einzelnen SĂ€tzen aus beliebigen Texten unter dem Gesichtspunkt ihrer Zugehörigkeit zu einem vorgegebenen Thema. In der zweiten Stufe werden die extrahierten SĂ€tze gekĂŒrzt, möglichst ohne dass wichtige Informationen verloren gehen. Eine Beispielanwendung, die nĂ€her untersucht wird, ist die Umwandlung von Emailtexten, die Terminabsprachen enthalten, in (lĂ€ngenbeschrĂ€nkte) SMS-Nachrichten. Die Verfahren sind allgemein zur Textzusammenfassung oder Informationsextraktion anwendbar

    Sprachliche Kontrolle von Anforderungsdokumenten

    Get PDF
    In der Softwareentwicklung beschreiben Anforderungen, wie sich ein System oder eine Komponente in bestimmten Situationen verhalten soll. Anforderungen stellen also Vorgaben an die Software dar, die entwickelt werden soll. Die natĂŒrliche Sprache ist noch immer das vorherrschende Mittel, um Anforderungen zu formulieren. Aus dem Anforderungstext werden TestfĂ€lle abgeleitet, mit welchen ĂŒberprĂŒft wird, ob die in den Anforderungen beschriebenen Funktionen korrekt umgesetzt wurden. Da die Aufwendungen fĂŒr die TestaktivitĂ€ten einen groĂżen Teil der Entwicklungszeit und Entwicklungskosten einnehmen, besteht Bedarf an der sprachlichen Kontrolle von Anforderungstexten. Ist eine Anforderung so formuliert, dass sie beispielsweise aufgrund fehlender Information zu Interpretationsspielraum fĂŒhrt, kann dies dazu fĂŒhren, dass ein falscher Testfall abgeleitet wird oder eine Funktion falsch entwickelt wird. Ein Ziel dieser Arbeit ist, zu untersuchen, welche Kriterien eine Anforderung aus sprachwissenschaftlicher Sicht erfĂŒllen muss, um als testbar zu gelten bzw. welche sprachlichen PhĂ€nomene dazu fĂŒhren, dass eine Anforderung nicht testbar ist. HierfĂŒr werden Leitlinien aus der technischen Dokumentation sowie Literatur aus dem Bereich des Requirements Engineering analysiert. Die identifizierten PhĂ€nomene werden in einem QualitĂ€tsmodell fĂŒr testbare Anforderungen zusammengetragen, nach linguistischen Kriterien sortiert und nach KritikalitĂ€t bewertet. FĂŒr ausgewĂ€hlte PhĂ€nomene aus dem QualitĂ€tsmodell wird untersucht, inwiefern sich automatisierte PrĂŒfmethoden entwickeln lassen, die kritische Instanzen der PhĂ€nomene zuverlĂ€ssig identifizieren, also diejenigen, die Interpretationsspielraum verursachen können. FĂŒr die Analyse der PhĂ€nomene werden computerlinguistische Analysemethoden eingesetzt und Regeln entwickelt, die auf (morpho-)syntaktische Annotationen zugreifen. Sprachliche PhĂ€nomene, die einen Einfluss auf die Testbarkeit einer Anforderung haben, lassen sich durch die verwendeten computerlinguistischen Analysemethoden automatisiert identifizieren. FĂŒr bestimmte PhĂ€nomene können zudem Regeln entworfen werden, welche zuverlĂ€ssig zwischen den kritischen und unkritischen Instanzen eines PhĂ€nomens unterscheiden. Die formbasierte Computerlinguistik stöÿt allerdings an ihre Grenzen, wenn diese Unterscheidung auf Welt- und Expertenwissen beruht. Die entwickelten Analysemethoden heben sich von existierenden Werkzeugen zur ÜberprĂŒfung von Texten dadurch ab, dass nicht nur reine Wortlistenabgleiche durchgefĂŒhrt werden, sondern auch der Satzkontext, in welchem die PhĂ€nomene auftreten, in die Analyse miteinbezogen wird. Dieser Ansatz kann die Anzahl der Fehlwarnungen an den Benutzer erheblich reduzieren, sodass der Aufwand bei der Durchsicht der potentiell kritischen Instanzen gesenkt werden kann.In software development, requirements describe how a system or a component is supposed to act in specific situations. Therefore, requirements provide guidelines for the software which is to be developed. Natural language is still the predominant technique used to formulate requirements. Test cases are derived from these requirements to check for correct implementation of the functions described in the requirements. Since the expenses for the test activities make up a huge part of the development time and its costs, there is need for linguistic control of requirements specifications. If a requirement is formulated in a misleading way causing various possibilities of interpretation due to missing information, it can lead to a wrong test case or in developing an incorrect function. One objective of this dissertation is to investigate which criteria must be met by a requirement from a linguistical point of view for the requirement to be considered testable; respectively which linguistic phenomena lead to untestable requirements. For this purpose, guidelines from the field of technical documentation as well as literature concerning requirements engineering are analyzed. The identified phenomena are gathered in a quality model for testable requirements, arranged from a linguistical point of view and evaluated according to criticality. For selected phenomena which are integrated in the quality model it is investigated to what extent automated checks which identify the critical instances reliably can be developed; that means those that leave room for interpretation. Computational linguistics analysis methods and rules which access morphosyntactic annotations are applied. The developed computational linguistics analysis method makes it possible to automatically identify phenomena which have an influence on the testability of a requirement. Furthermore, for specific phenomena rules can be designed which difierentiate between critical and uncritical instances. If this decision relies on world and expert knowledge, though, form-based computational linguistics reaches its limit. The developed analysis methods stand out from existing tools for revising texts insofar as not only pure word lists comparisons are executed, but also the context in which the phenomena occur is included in the analysis. This approach can significantly reduce the number of false warnings to the user reducing the effort involved in viewing the potentially critical instances

    Definitionen in Wörterbuch und Text

    Get PDF
    Obwohl gute Suchmaschinen heute bereits den Zugang zu Dokumenten erleichtern, bleibt das BedĂŒrfnis nach intelligenten, zielgerichteten Suchfunktionen innerhalb von Dokumenten. Die große Zahl der Dokumente und vor allem die rasche Zunahme und geringe Halbwertszeit der Daten verbietet die rein manuelle Auszeichnung. Alternativ entwickeln Computerlinguisten Methoden, die auf der Grundlage eines kleinen Ausschnitts manuell aufbereiteter Daten Verfahren zur automatischen Extraktion implementieren. Gegenstand der vorliegenden Dissertation ist es, den Begriff der Definition im Sinn von Annotationsrichtlinien zu operationalisieren sowie Ressourcen und Methoden zur automatischen Extraktion definitorischer Textsegmenten zu untersuchen. Auf der Basis eines mit diesen Annotationsrichtlinien manuell aufbereiteten Korpus wurden Merkmale zum AufspĂŒren und Auszeichnen von definitorischen Textsegmenten abgeleitet. Diese Merkmale wurden in einem System implementiert, das zur automatischen Extraktion von Definitionen eingesetzt werden und z. B. als Hilfsmittel fĂŒr die lexikographische Arbeit dienen kann. Im Zusammenhang mit den verschiedenen Extraktionsexperimenten wurde zudem eine Sammlung von mehr als 3.000 Textsegmenten zusammengetragen, die entsprechend der in den Annotationsrichtlinien erarbeiteten Operationalisierung als Definitionen interpretiert und als eigenstĂ€ndiges Korpus verwendet werden können. Die verschiedenen Experimente des Dissertationsprojekts zeigen allerdings, dass es sich bei Definitionen hĂ€ufig um syntaktisch, semantisch und pragmatisch Ă€ußerst komplexe Textsegmente handelt, die nicht nur schwer zu extrahieren, sondern vor allem schwer zu annotieren sind. Ob also ein Textsegment von einem Rezipienten als Definition interpretiert und genutzt wird, hĂ€ngt daher von individuellen Faktoren wie der Bildung und teilweise auch der Einstellung ab

    Vom Menschen. Handbuch Historische Anthropologie

    Full text link
    Wenn im Kontext dieses Buches von historischer Anthropologie die Rede ist, dann geschieht dies auf dem Hintergrund der in Deutschland entwickelten philosophischen Anthropologie, der in der angelsĂ€chsischen Tradition stehenden Kulturanthropologie und der von der französischen Geschichtswissenschaft initiierten MentalitĂ€tsgeschichte. Auf dieser Basis zielt historische Anthropologie darauf, menschliche Lebens-, Ausdrucks- und Darstellungsformen zu beschreiben, Gemeinsamkeiten und Differenzen herauszuarbeiten, Ähnlichkeiten und Unterschiede in Einstellungen und Deutungen, Imaginationen und Handlungen zu analysieren und so ihre Vielfalt und KomplexitĂ€t zu erforschen. Sie untersucht Fremdes und Vertrautes in bekannten und in fremden Kulturen in Vergangenheit und Gegenwart. Historische Anthropologie dient als Bezeichnung fĂŒr vielfĂ€ltige transdisziplinĂ€re BemĂŒhungen nach dem Ende der Verbindlichkeit einer abstrakten anthropologischen Norm, weiterhin PhĂ€nomene des Menschlichen zu erforschen. (DIPF/Orig.
    corecore