Search CORE

17 research outputs found

Gebrauchsbasierte Grammatik: Statistische Regelhaftigkeit

Author: Keibel Holger
Kupietz Marc
Publication venue: 'Walter de Gruyter GmbH'
Publication date: 09/10/2018
Field of study

Das Phänomen Sprache ist in Form des beobachtbaren Sprachgebrauchs fast allgegenwärtig, gleichzeitig bleibt das offenkundig Regel- und Systemhafte dieses Phänomens überraschend ungreifbar. Wegen der überwältigenden Komplexität natürlicher Sprachen entsteht bei jedem Versuch, dieses Systemhafte in einer Theorie mit explanatorischem Anspruch zu fassen, eine breite Kluft zwischen der angestrebten theoretischen Beschreibungsebene einerseits und der phänomenologisch zugänglichen Ebene des Sprachgebrauchs andererseits. Ausgehend von allgemeinen wissenschaftstheoretischen Überlegungen, wie man angesichts dieser Kluft überhaupt zu hinreichend abgesicherten Erkenntnissen für eine explanatorische Theoriebildung kommen kann, betonen die Autoren die Notwendigkeit, sich dem Untersuchungsgegenstand Sprache mit möglichst wenigen Vorannahmen über diesen Gegenstand selbst zu nähern und sich dabei konsequent von der Empirie leiten zu lassen. Sie werben nachdrücklich für eine emergentistische Perspektive auf Sprache, der zufolge alles Regelhafte und Konventionelle in der Sprache ein Epiphänomen des Sprachgebrauchs ist und von den Sprachteilnehmern fortlaufend ausgehandelt wird. Eine treibende Kraft hierbei ist, so wird argumentiert, der Begriff der Ähnlichkeit. Auf dieser Grundlage wird schließlich ein Forschungsprogramm entworfen, das die Wirkung des Faktors Ähnlichkeit auf die Sprache nachzuzeichnen und dadurch schrittweise zu ähnlichen Generalisierungen zu gelangen versucht wie die Sprachgemeinschaft

Publikationsserver des Instituts für Deutsche Sprache

Valenz und Kookkurrenz

Author: Belica Cyril
Keibel Holger
Kupietz Marc
Lüngen Harald
Perkuhn Rainer
Publication venue: Mannheim : Institut für Deutsche Sprache
Publication date: 12/03/2015
Field of study

Publikationsserver des Instituts für Deutsche Sprache

A brief tutorial on using collocations for uncovering and contrasting meaning potentials of lexical items

Author: Keibel Holger
Perkuhn Rainer
Publication venue: Tokyo : Tokyo University of Foreign Studies
Publication date: 15/03/2016
Field of study

This introductory tutorial describes a strictly corpus-driven approach for uncovering indications for aspects of use of lexical items. These aspects include ‘(lexical) meaning’ in a very broad sense and involve different dimensions, they are established in and emerge from respective discourses. Using data-driven mathematical-statistical methods with minimal (linguistic) premises, a word’s usage spectrum is summarized as a collocation profile. Self-organizing methods are applied to visualize the complex similarity structure spanned by these profiles. These visualizations point to the typical aspects of a word’s use, and to the common and distinctive aspects of any two words

Publikationsserver des Instituts für Deutsche Sprache

"Wörter sind die Schuhe der Gedanken, damit kommt man überall hin" : Wissenschaft im Dialog: Das IDS beim Wissenschaftssommer 2006 München, 15. – 21. Juli 2006

Author: Keibel Holger
Perkuhn Rainer
Publication venue
Publication date: 04/06/2014
Field of study

Publikationsserver des Instituts für Deutsche Sprache

Mathematische Häufigkeitsmaße in der Korpuslinguistik. Eigenschaften und Verwendung

Author: Keibel Holger
Publication venue: Mannheim : Institut für Deutsche Sprache
Publication date: 05/04/2023
Field of study

In der Korpuslinguistik und der Quantitativen Linguistik werden ganz verschiedenartige formale Maße verwendet, mit denen die Gebrauchshäufigkeit eines Wortes, eines Ausdrucks oder auch abstrakter oder komplexer sprachlicher Elemente in einem gegebenen Korpus gemessen und ggf. mit anderen Gebrauchshäufigkeiten verglichen werden kann. Im Folgenden soll für eine Auswahl dieser Maße (absolute Häufigkeit, relative Häufigkeit, Wahrscheinlichkeitsverteilung, Differenzenkoeffizient, Häufigkeitsklasse) zusammengefasst werden, wie sie definiert sind, welche Eigenschaften sie haben und unter welchen Bedingungen sie (sinnvoll) anwendbar und interpretierbar sind – dabei kann eine Rolle spielen, ob das Häufigkeitsmaß auf ein Korpus als Ganzes angewendet wird oder auf einzelne Teilkorpora. Zusätzlich zu den bei den einzelnen Häufigkeitsmaßen genannten Einschränkungen gilt generell der folgende vereinfachte Zusammenhang: Je seltener ein Wort im gegebenen Korpus insgesamt vorkommt und je kleiner dieses Korpus ist, desto stärker hängt die beobachtete Gebrauchshäufigkeit des Wortes von zufälligen Faktoren ab, d.h., desto geringer ist die statistische Zuverlässigkeit der Beobachtung

Publikationsserver des Instituts für Deutsche Sprache

Approaching grammar: Detecting, conceptualizing and generalizing paradigmatic variation

Author: Belica Cyril
Keibel Holger
Kupietz Marc
Perkuhn Rainer
Publication venue: Tübingen : Narr
Publication date: 13/04/2016
Field of study

This paper presents ongoing research which is embedded in an empirical-linguistic research program, set out to devise viable research strategies for developing an explanatory theory of grammar as a psychological and social phenomenon. As this phenomenon cannot be studied directly, the program attempts to approach it indirectly through its correlates in language corpora, which is justified by referring to the core tenets of Emergent Grammar. The guiding principle for identifying such corpus correlates of grammatical regularities is to imitate the psychological processes underlying the emergent nature of these regularities. While previous work in this program focused on syntagmatic structures, the current paper goes one step further by investigating schematic structures that involve paradigmatic variation. It introduces and explores a general strategy by which corpus correlates of such structures may be uncovered, and it further outlines how these correlates may be used to study the nature of the psychologically real schematic structures

Publikationsserver des Instituts für Deutsche Sprache

The german reference corpus DeReKo : a primordial sample for linguistic research

Author: Belica Cyril
Keibel Holger
Kupietz Marc
Witt Andreas
Publication venue: Paris : ELRA
Publication date: 04/07/2014
Field of study

^This paper describes DeReKo (Deutsches Referenzkorpus), the Archive of General Reference Corpora of Contemporary Written German at the Institut für Deutsche Sprache (IDS) in Mannheim, and the rationale behind its development. We discuss its design, its legal background, how to access it, available metadata, linguistic annotation layers, underlying standards, ongoing developments, and aspects of using the archive for empirical linguistic research. The focus of the paper is on the advantages of DEREKO’s design as a primordial sample from which virtual corpora can be drawn for the specific purposes of individual studies. Both concepts, primordial sample and virtual corpus are explained and illustrated in detail. Furthermore, we describe in more detail how DEREKO deals with the fact that all its texts are subject to third parties’ intellectual property rights, and how it deals with the issue of replicability, which is particularly challenging given DEREKO’s dynamic growth and the possibility to construct from it an open number of virtual corpora

Publikationsserver des Instituts für Deutsche Sprache

Web as corpus: Kooperation mit der Universität Bologna

Author: Belica Cyril
Keibel Holger
Kupietz Marc
Perkuhn Rainer
Publication venue
Publication date: 15/07/2014
Field of study

Publikationsserver des Instituts für Deutsche Sprache

Zur Erstellung und Interpretation der Zeitverlaufsgrafiken

Author: Keibel Holger
Lüngen Harald
Publication venue: Mannheim : Institut für Deutsche Sprache
Publication date: 18/04/2016
Field of study

Publikationsserver des Instituts für Deutsche Sprache