Identifikation problematischer Substantivierungen in natürlichsprachigen Anforderungsdokumenten

Abstract

Nominalisierungen in natürlichsprachigen Anforderungsdokumenten können potentiell gefährlich für das Gelingen des Projekts sein. Bei dem Einsatz von Nominalisierungen wird häufig zusätzliche Information weggelassen, die aber für das vollständige Verständnis benötigt wird. So ist etwa bei der Nominalisierung Anmeldung ohne eine nähere Spezifikation unklar, wo sich wer auf welche Weise anmeldet. Daher ist eine Erkennung von unterspezifizierten Nominalisierungen wichtig, damit eine Fehlinterpretation der Anforderung, was eine potentielle Gefahr für das Scheitern des Projekts darstellt, vermieden wird. Die Fachliteratur rät davon ab Nominalisierungen zu verwenden. Bei der bisherigen Erkennung von Nominalisierungen mit dem Werkzeug RESI wurden ebenso alle Nominalisierungen aufgezeigt. Allerdings ist nicht jede Nominalisierung an sich kritisch. Somit erhielt der Nutzer eine unnötig hohe Anzahl an Warnungen, was die Akzeptanz des Werkzeuges schmälert. In dieser Arbeit wird eine Kategorisierung von Nominalisierungen vorgestellt, die sie in potentiell gefährliche und ungefährliche Nominalisierungen einteilt. Mit dieser Kategorisierung wird eine Möglichkeit gezeigt, wie unproblematische Nominalisierungen erkannt werden können. Dafür wird mit Hilfe von Ontologien und einem Parser die Nominalisierung und der Satz, in dem sie steht, auf spezifizierende Wörter, Nominalphrasen etc. untersucht. Mit diesem Ansatz wurden Lastenhefte der Daimler AG untersucht. Das Prüfungskorpus beinhaltete knapp 60.000 Wörter, welches über 1.100 Nominalisierungen beinhaltet. Davon konnte ein Großteil als unproblematisch gefiltert und damit 129 als problematisch identifiziert werden. Durch diesen Ansatz konnte somit eine große Anzahl von Fehlwarnungen unterdrückt werden, wodurch die Akzeptanz beim Nutzer und die Praxistauglichkeit gesteigert wird

    Similar works