5 research outputs found
Research on NLP for RE at UPC: a report
[Team Overview] The Software and Service Engineering Group
(GESSI) of UPC has traditionally conducted research in many fields
of software engineering. [Research Plan on NLP] As a result of
our participation in the OpenReq project, natural language processing
(NLP) has become one of our highest priority research fields. We are
using NLP for interdependency detection and requirements reuse, being the center piece of both tasks the identification of similar requirements.Peer ReviewedPostprint (published version
Recommended from our members
Building the Emirati Arabic FrameNet
The Emirati Arabic FrameNet (EAFN) project aims to initiate a FrameNet for Emirati Arabic, utilizing the Emirati Arabic Corpus. The goal is to create a resource comparable to the initial stages of the Berkeley FrameNet. The project is divided into manual and automatic tracks, based on the predominant techniques being used to collect frames in each track. Work on the EAFN is progressing, and we here report on initial results for annotations and evaluation. The EAFN project aims to provide a general semantic resource for the Arabic language, sure to be of interest to researchers from general linguistics to natural language processing. As we report here, the EAFN is well on target for the first release of data in the coming year
Adding nominal spice to SALSA – frame-semantic annotation of German nouns and verbs
This paper presents Release 2.0 of the SALSA corpus, a German resource for lexical semantics. The new corpus release provides new annotations for German nouns, complementing the existing annotations of German verbs in Release 1.0. The corpus now includes around 24,000 sentences with more than 36,000 annotated instances. It was designed with an eye towards NLP applications such as semantic role labeling but will also be a useful resource for linguistic studies in lexical semantics
Frame Shifts und Frame-Vergleichbarkeit bei Englisch-Deutscher Übersetzung am Beispiel einer Volltextannotation mit FrameNet
In dieser Masterarbeit wird eine selbst erstelle Volltextannotation einer deutschen Übersetzung aus dem Englischen untersucht und die beiden Textversionen und ihre Annotation miteinander verglichen. Im Mittelpunkt stehen die Fragen, inwieweit sich die in FrameNet für das Englische formulierten Frames für die Volltextannotation eines deutschen Textes nutzen lassen und welche Abweichungen zwischen englischem Original und deutscher Übersetzung auf Ebene der Frames und ihrer Lexikalisierung bestehen.
Zu Beginn der Arbeit wird ein Überblick über den relevanten theoretischen Hintergrund und Forschungsstand der Frame-Semantik einschließlich ihrer Anwendung im FrameNet Project, in der Annotation und in der sprachübergreifenden Forschung gegeben. Im dritten Kapitel wird die Untersuchung einschließlich des verwendeten Materials und der Methoden vorgestellt. Darauf aufbauend folgt die Präsentation der Ergebnisse, die in Kapitel fünf mit Bezug auf die Forschungsfragen ausgewertet werden. Den Abschluss bilden Schlussfolgerungen zur sprachübergreifenden Nutzung von FrameNet und zur Volltextannotation sowie ein Ausblick auf weitere Forschungsfelder.:1 Einleitung
2 Hintergrund und Forschungsstand
2.1 Ansätze der kognitiven Linguistik
2.2 Frame-Semantik
2.3 FrameNet Project
2.4 Framesemantische Annotation
2.5 Sprachübergreifende Annotation und Frame-Semantik
3 Vorstellung der Untersuchung
3.1 Textmaterial
3.2 Methodisches Vorgehen
3.2.1 Volltextannotation
3.2.2 Vergleich der annotierten Textversionen
4 Ergebnisse und Diskussion
4.1 Volltextannotation der deutschen Übersetzung
4.1.1 Übertragbarkeit von FrameNet-Frames auf den deutschen Text
4.2 Vergleich der annotierten Textversionen
4.2.1 Frame Shifts
4.3 Evaluation der Methoden
5 Fazit und Ausblick
5.1 Volltextannotation
5.2 Sprachübergreifende Nutzung von FrameNet
5.3 Verbindung von Frame-Semantik und Konstruktionsgrammatik
5.4 Abschließendes Fazit
Literaturverzeichni
Can humain association norm evaluate latent semantic analysis?
This paper presents the comparison of word association norm created by a psycholinguistic experiment to association lists generated by algorithms operating on text corpora. We compare lists generated by Church and Hanks algorithm and lists generated by LSA algorithm. An argument is presented on how those automatically generated lists reflect real semantic relations