Publikationsserver des Instituts für Deutsche Sprache
Not a member yet
10842 research outputs found
Sort by
Verbbasierte Konstruktionen in der Interaktion. Formale und funktionale Variation
Die Forschung zu besonders häufigen Verben in der Mündlichkeit hat gezeigt, dass einzelne Verblemmata meist Teil unterschiedlicher, teilverfestigter Einheiten sind, die oft spezifische Gesprächsfunktionen haben. Hinter jeder dieser verbbasierten Konstruktionen steht zudem ein formales und funktionales Variationsspektrum. Der Beitrag argumentiert anhand von Fallstudien, dass für die empirische Erschließung der Vielfalt der hinter einem abstrakten Verblemma stehenden Konstruktionen ebenso wie für die Bestimmung der Variabilität einzelner Konstruktionen ein Bottom-up-Vorgehen sinnvoll ist. Außerdem wird diskutiert, welche theoretischen Modellierungen des (synchronen oder diachronen) Zusammenhangs zwischen unterschiedlichen Varianten sich an die empirischen Ergebnisse anschließen lassen
Lautwandel in Norddeutschland. Entwicklungen auf dialektaler und regiolektaler Ebene
Im öffentlichen Diskurs über den Wandel des gesprochenen Deutsch findet die Lautebene meist wenig Berücksichtigung. Auch die wissenschaftliche Forschung ist vor allem auf Lexik, Grammatik und Orthographie fokussiert. In meinem Beitrag soll die lautliche Entwicklungsdynamik des Deutschen an einigen Beispielen veranschaulicht und über mögliche Tendenzen der künftigen Entwicklung reflektiert werden. Hierbei wird zunächst auf neuere Befunde der Regionalsprachforschung eingegangen, mit Schwerpunkt auf der Beschreibung dialektaler und regiolektaler Wandelprozesse im „Norddeutschen Sprachatlas“ (NOSA). Davon ausgehend wird dafur plädiert, neben dem Abbau traditioneller Formen auch die Entstehung von lautlichen Neuerungen stärker als bisher in den Blick zu nehmen. Dies erfordert eine Einbeziehung rezenter Formen der Mehrsprachigkeit (z. B. Deutsch/ Türkisch, Deutsch/Arabisch, Deutsch/Englisch)
Zweitspracherwerb in Dialektregionen. Soziolinguistische Perspektiven auf inter- und intraindividuelle Variation
Im oberdeutschen Sprachraum ist dialektales Sprechen weithin integraler Bestandteil des Alltags und somit auch Teil des sprachlichen Inputs, mit dem Zweitsprachlernende konfrontiert sind. Bei Untersuchungen zum Erwerb des Deutschen wurde Non-Standardsprache(n) trotz ihrer Alltagsrelevanz lange Zeit wenig Aufmerksamkeit geschenkt. Anhand von Sprachgebrauchsdaten und subjektiven Daten von Zweitsprachbenutzer:innen aus der Deutschschweiz wird analysiert, in welchem Ausmaß Zweitsprachbenutzer:innen Dialekt- und/oder Standardkompetenzen aufbauen und wie die Beschaffenheit des sprachlichen Repertoires durch ihre Spracherfahrungen und Spracheinstellungen beeinflusst wird. Für die meisten Zweitsprachbenutzer:innen gilt dabei, dass sie nicht nur sehr erfolgreich kommunizieren können, sondern dass ihr Sprachgebrauch auch soziale Bedeutung vermittelt und der Aufbau ihrer Variationskompetenz von personalen, sozialen und affektiven Faktoren beeinflusst wurde. Für einzelne Personen rücken vor dem Hintergrund der funktional-kommunikativen Gleichwertigkeit von Dialekt, Standard oder Mischungen sprachsystematische und sozioindexikalische Unterschiede in den Hintergrund. In einem Ausblick auf die Situation in anderen dialektal beeinflussten Regionen und auf den Sprachvermittlungskontext wird die Relevanz von regional bedingter Sprachvariation im Kontext des Zweitspracherwerbs rekapituliert
Ein Gesetz zum Schutz der deutschen Sprache? Sprache in Zahlen: Folge 15
Das Leibniz-Institut für Deutsche Sprache (IDS) führt seit den 1990er Jahren regelmäßig Repräsentativerhebungen zu Spracheinstellungen und Sprachkompetenzen in Deutschland durch. Über die Deutschland-Erhebung 2017 wurde in den Folgen 1 bis 6 und 13 berichtet, über die Erhebung Dialekt und Beruf 2019 in den Folgen 7 bis 9. Im Winter 2022 hat das IDS die Deutschland-Erhebung 2022 durchgeführt. Darin wurden Einstellungen zum Deutschen und zu anderen Sprachen sowie die Wahrnehmung von sprachlichen Veränderungen erfasst. Erste Ergebnisse dieser Erhebung wurden in den Folgen 10 bis 12 vorgestellt. Die vorliegende Folge beschäftigt sich ebenfalls mit der Deutschland-Erhebung 2022, nämlich mit der dort gestellten Frage, ob es in Deutschland ein Gesetz zum Schutz der deutschen Sprache geben sollte. Eine Liste aller bisher erschienenen Folgen der Reihe „Sprache in Zahlen“ mit Verweis auf die zugehörigen Hefte des SPRACHREPORTs findet sich am Ende dieses Artikels
Ein Internationalismus kontrastiv: korpusbasierte Untersuchungen zu OKAY in der deutschen und französischen Sprachversion der Wikipedia
OKAY hat seinen Ursprung im Amerikanischen Englisch und ist seit seiner Entstehung 1839 in vielen Sprachen der Welt vertreten (vgl. Read 1963, Metcalf 2011). Dabei entwickelten sich Funktionen und Bedeutungen von OKAY heraus, die sich im Laufe der Zeit an die jeweiligen Sprachsysteme angepasst haben und die heute unterschiedlich detailliert in der Literatur untersucht sind (vgl. Metcalf 2011). Die Wikipedia, als vielsprachige Ressource mit derzeit 296 aktiven Sprachversionen (Wikipedia 2018), stellt eine ideale Datengrundlage für einen kontrastiven Vergleich von Funktion, Position und Form von OKAY im Deutschen und Französischen dar. Kontrastive Wikipedia-Studien (vgl. Franz 2011, Rogers 2013, Wessler et al. 2017) fokussieren vorrangig die Analyse von Wikipedia-Artikelseiten. Neben den Artikelseiten gibt es weitere Schreib- und Interaktionsbereiche, sogenannte „Namensräume, die spezielle Funktionen haben. So dient der Namensraum der Artikeldiskussionen dazu, Fragen zu diskutieren, die sich bei dem gemeinschaftlichen Bearbeiten der Artikel ergeben (vgl. Gredel et al. 2018). Gerade auf den Wikipedia-Artikeldiskussionsseiten, auf denen sich die Nutzer spontan und dialogisch austauschen und Bearbeitungen der Artikelseiten interaktiv aushandeln (vgl. Storrer 2013), wird die funktionale Vielfalt, wie sie OKAY auch innerhalb der Gesprächsorganisation zukommt (vgl. Schegloff/Sacks 1973, Beach 1993),
deutlich.
Der vorliegende Beitrag legt dar, welche sprachspezifischen und universalen Funktionen von OKAY auf den deutschen und französischen Wikipedia-Artikeldiskussionen auftreten und welche topologischen Merkmale OKAY in den beiden Sprachen aufweist. Ebenso werden die formalen Varianten von OKAY beschrieben und auf ihre Normkonformität überprüft. Im Anschluss werden typische Gebrauchsmuster von OKAY im Deutschen und Französischen untersucht. Hierzu werden die Ergebnisse durchgeführter Kookkurrenzanalysen präsentiert, die aufzeigen, dass sich sprachspezifische Gebrauchsmuster in den beiden Sprachen ausprägen.
Die Datengrundlage der Untersuchungen stellen die am Institut für deutsche Sprache (IDS) Mannheim zur Verfügung gestellten Wikipedia-Korpora dar. Für einen Vergleich beider Sprachen wurden die Korpora der deutschsprachigen Wikipedia-Artikeldiskussionen (vgl. Wiki-D-de15) sowie der französischsprachigen Wikipedia-Artikeldiskussionen (vgl. Wiki-D-fr15) verwendet, die mithilfe der Korpusrechercheplattform COSMAS II abgefragt wurden. COSMAS II wurde ebenfalls zur Durchführung der Kookkurrenzanalysen
verwendet
Unlocking the corpus. Enriching metadata with state-of-the-art NLP methodology and linked data
In research data management, metadata are indispensable to describing data and are a key element in preparing data according to the FAIR principles. Metadata in catalogues and registries are usually recorded either by archivists or subject matter experts, i.e. researchers involved in the creation or assembling of the data, or provided in the data preparation workflow. Extracting metadata from textual research data is currently not part of most metadata workflows, even more so if a research data set can be subdivided into smaller parts, such as a newspaper corpus containing multiple newspaper articles. If we look at descriptive metadata from a large corpus of newspapers, the basic metadata may consist of information, for example, about the title, or year of publication. Our approach is to add semantic metadata on the text level to facilitate the search over data. We show how to enrich metadata with three methods: named entity recognition, keyword extraction, and topic modeling. The goal is to make it possible to search for texts that are about certain topics or described using certain keywords or to identify people, places, and organisations mentioned in texts without actually having to read them