Publikationsserver des Instituts für Deutsche Sprache
Not a member yet
    10842 research outputs found

    Sprache im hochschulbezogenen fremdsprachlichen Deutschunterricht

    Get PDF
    Infolge der Vielschichtigkeit und Heterogenität des zu vermittelnden sprachlichen Inputs und der zugrunde liegenden Normenvielfalt erscheint der Spracherwerb ausländischer Studierender komplex und unübersichtlich. Neben äußerer und innerer Mehrsprachigkeit sowie der Heterogenität der Adressatengruppen stellen vor allem die mediale und konzeptuelle Abgrenzung von Mündlichkeit und Schriftlichkeit sowie die grundsätzlich anzustrebende Annäherung an authentische Kommunikation in multikulturellen Lernergruppen didaktische Herausforderungen dar. Vor dem Hintergrund individueller Lernbiografien bewegt sich die Sprachvermittlung im didaktischen Spannungsfeld der je spezifischen Normen von Mündlichkeit und Schriftlichkeit, Textsorten und Registern. Der fremdsprachliche Deutschunterricht an Hochschulen erweist sich als didaktische Gratwanderung, als deren wichtigstes Ziel neben der sprachpraktischen Einübung studienrelevanter kommunikativer Fertigkeiten die Schaffung sprachlicher Bewusstheit (language awareness) als sinnvolles, eigenständiges Lernziel zu fordern ist

    Statistical errors undermine claims about the evolution of polysynthetic languages - a comment on Bromham, Yaxley, Wilson, and Hua

    No full text
    We identify major flaws in the statistical analysis of Bromham et al. (2025), whose claims about polysynthesis and phylogenetic isolation rely on incorrect implementations of Bayesian model averaging and spatial filtering. Reanalysis using appropriate methods shows that key predictors lose statistical support

    Human languages trade off complexity against efficiency

    Get PDF
    From a cross-linguistic perspective, language models are interesting because they can be used as idealised language learners that learn to produce and process language by being trained on a corpus of linguistic input. In this paper, we train different language models, from simple statistical models to advanced neural networks, on a database of 41 multilingual text collections comprising a wide variety of text types, which together include nearly 3 billion words across more than 6,500 documents in over 2,000 languages. We use the trained models to estimate entropy rates, a complexity measure derived from information theory. To compare entropy rates across both models and languages, we develop a quantitative approach that combines machine learning with semiparametric spatial filtering methods to account for both language- and document-specific characteristics, as well as phylogenetic and geographical language relationships. We first establish that entropy rate distributions are highly consistent across different language models, suggesting that the choice of model may have minimal impact on cross-linguistic investigations. On the basis of a much broader range of language models than in previous studies, we confirm results showing systematic differences in entropy rates, i.e. text complexity, across languages. These results challenge the long-held notion that all languages are equally complex. We then show that higher entropy rate tends to co-occur with shorter text length, and argue that this inverse relationship between complexity and length implies a compensatory mechanism whereby increased complexity is offset by increased efficiency. Finally, we introduce a multi-model multilevel inference approach to show that this complexity-efficiency trade-off is partly influenced by the social environment in which languages are used: languages spoken by larger communities tend to have higher entropy rates while using fewer symbols to encode messages

    Lexical semantic change annotation with large language models

    Get PDF
    This paper explores the application of state-of-the-art large language models (LLMs) to the task of lexical semantic change annotation (LSCA) using the historical German DURel dataset. We evaluate five LLMs, and investigate whether retrieval-augmented generation (RAG) with historical encyclopedic knowledge enhances results. Our findings show that the Llama3.3 model achieves comparable performance to GPT-4o despite significant parameter differences, while RAG marginally improves predictions for smaller models but hampers performance for larger ones. Further analysis suggests that our additional context benefits nouns more than verbs and adjectives, demonstrating the nuances of integrating external knowledge for semantic tasks

    Die semantische Paraphrase in elexiko

    Get PDF
    Klicken Benutzer auf der Startseite eines redaktionell ausgearbeiteten elexiko-Wortartikels unter der Überschrift „Lesartenbezogene Angaben“ auf die Etikettierung einer bestimmten Lesart, präsentiert sich ihnen direkt die zur jeweiligen Lesart gehörende Bedeutungserläuterung. Zum gleichen Bereich zählen obligatorisch ein bis drei extra zu öffnende Paraphrasenbelege, die Informationen zur satzfunktionalen Wortklasse sowie gegebenenfalls enzyklopädische Hinweise, Abbildungen und/oder ein definitorischer Beleg. Die Bedeutungserläuterung in elexiko – auch semantische Paraphrase genannt – fasst wichtige Informationen zahlreicher anderer Angabenbereiche innerhalb der lesartenbezogenen Angaben zusammen und bietet dem Nutzer so eine kurze Übersicht über die Bedeutung und Verwendung des jeweiligen Stichwortes bzw. seiner Lesarten. Dadurch steht der Angabebereich der Bedeutungserläuterung in besonders engem Zusammenhang mit den weiteren lesartenbezogenen Angabebereichen der Wortartikel, wie im Abschnitt 4 dieses Beitrags dargestellt ist. Weiterhin beschreibt dieser Beitrag, wie die ursprüngliche Konzeption zur semantischen Paraphrase in elexiko heute umgesetzt wird (Abschnitt 2) und wie die in elexiko bestehende Beschreibungstechnik von den Lexikografen beurteilt wird (Abschnitt 3)

    ‘Repatriierte’ und Vertriebene: Wechselseitige Vorurteile in autobiographischen Berichten

    Get PDF
    Das untersuchte Textmaterial ist einem narrativen Interview mit einer Polin entnommen, die von den Kriegsereignissen unmittelbar betroffen wurde. Die Erzählerin, Frau S., kam 1945 - im Rahmen der ‘Repatriierung’ der polnischen Bevölkerung aus den früheren polnischen Ostgebieten - aus Wilna in die Masuren und hat dort die Vertreibung der Deutschen unmittelbar miterlebt. Da das Textmaterial starke Bezüge zu historischen und makropolitischen Sachverhalten aufweist, wird auch die geschichtliche und makropolitische Situierung der autobiographischen Aussagen in die Analyse des Textmaterials mit einbezogen. Die zentrale Fragestellung richtet sich auf die Inkonsistenz zwischen zwei vorurteilshaften Interviewpassagen über die masurischen Frauen einerseits und dem im Interview dokumentierten Wissen der Erzählerin über die historisch bedingte Notsituation von 1945 andererseits. Mittels einer am biographieanalytischen Ansatz von Schütze orientierten Vorgehensweise und unter Hinzunahme weiterer theoretischer Konzepte wird der Frage nachgegangen, warum das eigentlich zu erwartende Mitleid an einer bestimmten Stelle der Rekonstruktion der Erfahrungen von Frau S. ausbleibt. Die Ergebnisse der Untersuchung hängen mit der Ausarbeitung und der Diskussion hypothetischer Antworten auf die Frage nach den Grenzen des Mitleids zusammen. Es werden vier komplementäre Erklärungsversuche erörtert, die die diskursive „Motivierung“ der vorurteilshaften Äußerungen über die masurischen Frauen und somit die Inkonsistenz im Interview mit Frau S. erläutern könnten

    Zur Ereignisstruktur von Kommunikationsverben

    Get PDF

    Zwischen bewährten Traditionen und neuen Kontakten: das Internationale Promovierenden-Netzwerk bei der 61. Jahrestagung

    Get PDF

    Äquivalenzerscheinungen in der Datenbank der Sprichwortplattform – unter besonderer Berücksichtigung der Relation Deutsch – Ungarisch

    Get PDF
    In der kontrastiven Phraseologie unterscheidet man mehrere Äquivalenztypen. Diese sind auch in unserer Datenbank (www.sprichwort-plattform.org) dokumentiert. In meinem Beitrag gehe ich auf Gemeinsamkeiten und Unterschiede in den untersuchten Sprachen ein, wobei der Akzent vor allem auf Äquivalenzerscheinungen zwischen dem Deutschen und dem Ungarischen liegen wird. In der Literatur gibt es bekanntermaßen unterschiedliche Auffassungen von phraseologischer Äquivalenz (vgl. z. B. Hessky 1987, S. 57-60; Forgács 2007, S. 247f.). Wie in den meisten Arbeiten wird den Sprichwortäquivalenten auch in unserer Datenbank die Bedeutungsidentität auf denotativer Ebene zugrunde gelegt

    9,323

    full texts

    10,842

    metadata records
    Updated in last 30 days.
    Publikationsserver des Instituts für Deutsche Sprache is based in Germany
    Access Repository Dashboard
    Do you manage Open Research Online? Become a CORE Member to access insider analytics, issue reports and manage access to outputs from your repository in the CORE Repository Dashboard! 👇