63 research outputs found
Aufbau eines Referenzkorpus zur deutschsprachigen internetbasierten Kommunikation als Zusatzkomponente für die Korpora im Projekt 'Digitales Wörterbuch der deutschen Sprache' (DWDS)
Dieser Beitrag gibt einen Überblick über die laufenden Arbeiten im Projekt „Deutsches Referenzkorpus zur internetbasierten Kommunikation“ (DeRiK), in dem ein Korpus zur Sprachverwendung in der deutschsprachigen internetbasierten Kommunikation aufgebaut wird. Das Korpus ist als eine Zusatzkomponente zu den Korpora im BBAW-Projekt „Digitales Wörterbuch der deutschen Sprache“ (DWDS, http://www.dwds.de) konzipiert, die die geschriebene deutsche Sprache seit 1900 dokumentieren
Wörterbuchportale : Fragen der Benutzerführung
In diesem Beitrag geht es um Fragen der Benutzerführung in lexikografisch-lexikologischen Portalen, und zwar inbesondere um die Portale OWID (Mannheim) und „Wörterbuch-Portal“ (Berlin). Diese werden mit ihrer jeweiligen Konzeption sowie ihrem technischen Aufbau vorgestellt und dann aus Benutzersicht bewertet. An Vorschläge für die Weiterentwicklung dieser Angebote schließen sich einige grundsätzliche Überlegungen zur Zukunft lexikografischer Portale an.This contribution discusses questions of user interaction in dictionary portals. The dictionary portals OWID (Institut für Deutsche Sprache, Mannheim) and „Wörterbuch-Portal“ (Berlin-Brandenburgische Akademie der Wissenschaften) are presented as showcases. Their conceptual as well as their technical layer are discussed in detail. Both portals are evaluated with regard to their interaction with their prospective users. Suggestions for the advancement of these portals as well as some considerations about the future of internet-based dictionary portals conclude this paper
Cranberry Expressions in English and in German
The authors describe two data sets submitted to the database of MWE evaluation resources: (1) cranberry expressions in English and (2) cranberry expressions in German. The first package contains a collection of 444 cranberry words in German (CWde.txt) and a collection of the corresponding cranberry expressions (CCde.txt). The second package consists of a collection of 77 cranberry words in English (CWen.txt) and a collection of the corresponding cranberry expressions (CCen.txt). The data included in these packages was extracted from the Collection of Distributionally Idiosyncratic Items (CoDII), an electronic linguistic resource of lexical items with idiosyncratic occurrence patterns. Each package contains a readme file, and can be downloaded from multiword.wiki.sourceforge.net/Resources
Representing human and machine dictionaries in Markup languages
International audienceIn this chapter we present the main issues in representing machine readable dictionaries in XML, and in particular according to the Text Encoding Dictionary (TEI) guidelines
Wortartentagging für die Lexikographie
Dieser Artikel erschien zuvor bereits im CLARIN-D Blog, https://www.clarin-d.net/de/blog-clarin-d/. Verwendet mit freundlicher Genehmigung. Moderne Lexikographie ist heute in der Regel korpusbasiert. Die meisten uns bekannten größeren lexikographischen Vorhaben nutzen meist sehr große Textkorpora als Grundlage der lexikographischen Beschreibung ihrer Stichwörter. Anders ausgedrückt: die Benutzer von Wörterbüchern erwarten zu Recht, verlässliche und geprüfte Informationen vorzufinden. Eine Vo..
- …