1 research outputs found

    Wörtliche Übereinstimmungen und Übernahmen in frühneuhochdeutschen Rechtstexten. Erkennung und Auswertung

    Get PDF
    Wörtliche Übereinstimmungen sind nicht nur für die Plagiatserkennung von Interesse, sondern generell für die Untersuchung von intertextuellen Beziehungen, die sich als geringfügig oder gar nicht verändernde Übernahme von Textpassagen oder sogar weitgehend vollständigen Texten beschreiben lassen. Abhängigkeitsverhältnisse dieser Art waren und sind teilweise noch heute in verschiedenen Textsorten nichts Ungewöhnliches. Die Erkennung von Übereinstimmungen weist für nicht normierte Sprachen mit starker Schreibungsvarianz besondere Probleme auf. Deshalb werden hier zwei Ansätze miteinander kombiniert, nämlich die Ermittlung von exakten Übereinstimmungen einer bestimmten Mindestlänge - mehrere Programme aus dem Bereich der Bioinformatik können dies nach Anpassungsmaßnahmen auch für Textdaten leisten - und ein in der Tradition von Soundex und anderen phonetischen Algorithmen stehendes, Besonderheiten des Frühneuhochdeutschen berücksichtigendes Codierungsverfahren, das Buchstaben mit vermutlich ähnlichem Lautwert durch gleiche Codezeichen ersetzt. Dieses Vorgehen funktioniert gut, wenn es nicht um sehr kurze Übereinstimmungen geht. Auch etwas längere Matches sind allerdings vielfach nicht auf die Verwendung von Vorlagen zurückzuführen, sondern auf gängige Formulierungen. Das gilt besonders für Texte wie die hier untersuchten, die durch formelhafte Sprache geprägt sind. Deshalb werden Ansätze zur Matchbewertung anhand einfacher Kriterien entwickelt, und es werden Visualisierungsmöglichkeiten vorgestellt, die es erleichtern, Zusammenhänge zwischen Texten und auch Textgruppen zu erkennen. Im letzten Teil der Arbeit wird an einigen Beispielen aus dem untersuchten Korpus (einem Teil des Korpus von "DRQEdit - Deutschsprachige Rechtsquellen in digitaler Edition") gezeigt, wie sich auf dieser Basis neue Erkenntnisse gewinnen lassen
    corecore