57 research outputs found

    Informationsinfrastrukturen am Institut fĂŒr Deutsche Sprache

    Get PDF
    This paper describes the effort of the Institut fĂŒr Deutsche Sprache (IDS), the central research institution for the German language, connected with Information and Communications Technology (ICT). Use of ICT in a language research institute is twofold. On the one hand, ICT provides basic services for researches to accomplish their daily work. On the other hand, several national and international institutions have a strong interest in ICT. Therefore, ICT can also be seen as an amplifier for language research. The first part of this paper reports on the activates of the IDS in internal and external ICT-related projects and initiatives. The second part describes a general strategy towards an ICT strategy that could be useful both for the IDS and other national language institutes. We think such a general strategy is necessary to create a strong foundation not only for the ICT-related projects, but as a basis for a modem research institute

    EXMARaLDA und Datenbank "Mehrsprachigkeit" - Konzepte und praktische Erfahrungen

    Get PDF
    In diesem Aufsatz geht es um die Datenbank ‚Mehrsprachigkeit’ und das System EXMARaLDA, die am SFB 538 ‚Mehrsprachigkeit’ der UniversitĂ€t Hamburg entwickelt werden. Da deren konzeptuelle und technische Details bereits an anderer Stelle ausfĂŒhrlich dargestellt worden sind (z.B. Schmidt 2004), soll der Schwerpunkt hier einerseits auf solchen Aspekten liegen, die – gemĂ€ĂŸ dem Thema des Workshops – mit allgemeineren Fragen zum Umgang mit computerverwertbaren, heterogenen linguistischen DatenbestĂ€nden zu tun haben. Andererseits soll versucht werden, aus den praktischen Erfahrungen der nunmehr vierjĂ€hrigen Projektarbeit einige Erkenntnisse abzuleiten, die ĂŒber den konkreten Projektzusammenhang hinaus fĂŒr die weitere Arbeit auf diesem Gebiet interessant sein könnten.This paper presents some concepts and principles used in the development of a database of multilingual spoken discourse at the University of Hamburg. The emphasis of the first part is on general considerations for the handling of heterogeneous data sets: After showing that diversity in transcription data is partly conceptually and partly technologically motivated, it is argued that the processing of transcription corpora should be approached via a three-level architecture which separates form (application) and content (data) on the one hand, and logical and physical data structures on the other hand. Such an architecture does not only pave the way for modern text-technological approaches to linguistic data processing, it can also help to decide where and how a standardization in the work with heterogeneous data is possible and desirable and where it would run counter to the needs of the research community. It is further argued that, in order to ensure user acceptance, new solutions developed in this approach must take care not to abandon established concepts too quickly. The focus of the second part is on some practical experiences with users and technologies gained in the four years’ project work. Concerning the practical development work, the value of open standards like XML and Unicode is emphasized and some limitations of the “platform-independent” JAVA technology are indicated. With respect to users of the EXMARaLDA system, a predominantly conservative attitude towards technological innovations in transcription corpus work can be stated: individual users tend to stick to known functionalities and are reluctant to adopt themselves to the new possibilities. Furthermore, an active commitment to cooperative corpus work still seems to be the exception rather than the rule. It is concluded that technological innovations can contribute their share to a progress in the work with heterogeneous linguistic data, but that they will have to be supplemented, in the long run, with an adequate methodological reflection and the creation of an appropriate infrastructure

    Digitale Infrastrukturen fĂŒr die germanistische Forschung

    Get PDF
    Modern research in linguistics is increasingly reliant on digital infrastructure and information systems. This development began at the turn of the millennium and has since accelerated. The volume examines national and European infrastructure networks and the range of language resources in German linguistics that can be discovered, disclosed, and re-applied through digital infrastructure

    Digitale Infrastrukturen fĂŒr die germanistische Forschung

    Get PDF

    Sprachenrepertoires und Mehrsprachigkeitskompetenzen im Sprachendorf aktivieren

    Get PDF
    Aufbauend auf aktuellen Entwicklungen in der Mehrsprachigkeitsforschung und -didaktik zeigt dieser Beitrag, wie Sprachenrepertoires und Mehrsprachigkeitskompetenzen in einem didaktischen Szenario erhoben, beschrieben und aktiviert werden können. Dieses als Sprachendorf konzipierte Szenario enthĂ€lt fĂŒnf mehrsprachige Stationen, an denen SchĂŒlerInnen in mehr als zehn Arbeitssprachen verschiedene Aufgaben- bzw. Problemstellungen bewĂ€ltigen. Auf der Grundlage von Daten aus dem SĂŒdtiroler Forschungsprojekt RepertoirePluS (2016–2019) beantwortet unser Beitrag folgende Fragen: Wie ist ein mehrsprachiges Sprachendorf konzipiert? Wie kann man es zur Aktivierung von Sprachenrepertoires einsetzen? Welche Mehrsprachigkeitskompetenzen kann man im Rahmen des Sprachendorfs erheben? Wie lĂ€sst sich ein Sprachendorf auch im schulischen Kontext zur Förderung der Mehrsprachigkeit aller SchĂŒlerInnen und ihrer gesamten Sprachenrepertoires integrieren?Building on current developments in multilingualism research and didactics, our contribution aims to show how language repertoires and multilingual competence can be collected, described and activated in a didactic scenario. This scenario, which was conceived as a ‘language village’, contains five multilingual stations at which pupils cope with different tasks and problems in more than ten working languages. On the basis of data from the South Tyrolean project RepertoirePluS (2016–2019), our contribution will answer the following questions: How is a multilingual ‘language village’ conceived? How can it be used to activate language repertoires? Which multilingual competencies can be surveyed within the framework of the ‘language village’? How can a ‘language village’ also be integrated in a school context to promote the multilingualism of all pupils and their entire language repertoires

    Das institutionelle Forschungsdatenrepositorium FDAT der UniversitĂ€t TĂŒbingen

    Get PDF
    Das eScience-Center der UniversitĂ€t TĂŒbingen bietet mit dem Forschungsdatenrepositorium FDAT lokalen Forschungsprojekten und Forschenden diverse Dienstleistungen sowie die nötige technische Ausstattung fĂŒr die Langzeitarchivierung und Nachnutzung ihrer Forschungsdaten an. Dabei folgt FDAT den Richtlinien eines offenen Archivinformationssystems OAIS und wurde von unabhĂ€ngiger Stelle zertifiziert. Ziel ist es, wissenschaftliche Daten sicher aufzubewahren und der breiten Öffentlichkeit nach Möglichkeit Open Access5 zur VerfĂŒgung zu stellen. DarĂŒber hinaus sollen Wissenschaftlerinnen und Wissenschaftler in allen Phasen des Lebenszyklus ihrer Forschungsdaten durch die Betreiber des Repositoriums beraten und technisch unterstĂŒtzt werden. Das Repositorium wird legitimiert durch die von der UniversitĂ€t TĂŒbingen verabschiedeten Leitlinien zum Umgang mit Forschungsdaten, und neben dem eScience-Center konkret betreut durch die UniversitĂ€tsbibliothek TĂŒbingen und das ansĂ€ssige Zentrum fĂŒr Datenverarbeitung. Das Repositorium hat am 01.01.2017 seinen produktiven Betrieb aufgenommen und hĂ€lt derzeit (15.08.2018) 6741 digitale Objekte vor

    Einsatz und Bewertung komponentenbasierter Metadaten in einer föderierten Infrastruktur fĂŒr Sprachressourcen am Beispiel der CMDI

    Get PDF
    Die Arbeit setzt sich mit dem Einsatz der Component Metadata Infrastructure CMDI im Rahmen der föderierten Infrastruktur CLARIN auseinander, wobei diverse konkrete ProblemfĂ€lle aufgezeigt werden. FĂŒr die Erarbeitung entsprechender Lösungsstrategien werden unterschiedliche Verfahren adaptiert und fĂŒr die QualitĂ€tsanalyse von Metadaten und zur Optimierung ihres Einsatzes in einer föderierten Umgebung genutzt. Konkret betrifft dies vor allem die Übernahme von Modellierungsstrategien der Linked Data Community, die Übernahme von Prinzipien und QualitĂ€tsmetriken der objektorientierten Programmierung fĂŒr CMD-Metadatenkomponenten, sowie den Einsatz von ZentralitĂ€tsmaßen der Graph- bzw. Netzwerkanalyse fĂŒr die Bewertung des Zusammenhalts des gesamten Metadatenverbundes. Dabei wird im Rahmen der Arbeit die Analyse verwendeter Schema- bzw. Schemabestandteile sowie die Betrachtung verwendeter Individuenvokabulare im Zusammenspiel aller beteiligten Zentren in den Vordergrund gestellt

    Corpus oraux, Guide des bonnes pratiques 2006. Version allemande

    Get PDF
    International audienceViele Grundlagen- oder angewandte Forschungen beruhen zur Zeit auf der Auswertung von „Korpora der gesprochenen Sprache“ (geordneten Sammelwerken der Aufnahmen von mĂŒndlichen und multimodalen sprachlichen Produktionen). Dieses Handbuch der guten Praktiken entsteht aus der Erkenntnis von Sprachwissenschaftlern, die darauf bedacht sind, den Fortbestand der Quellen und einen verschiedenartigen Zugang zu den mĂŒndlichen von ihnen produzierten Produktionen zu sichern ; es schneidet zuerst die „Korpora der gesprochenen Sprache“ an, die von Sprachwissenschaftlern und fĂŒr sie geschaffen und verwendet wurden. Die durch die Erschaffung und die dokumentarische Auswertung dieser Korpora hervorgerufenen Fragen trifft man aber in vielen FĂ€chern : die Völkerkunde, die Anthropologie, die Soziologie, die Psychologie, die Demographie, die mĂŒndlich ĂŒberlieferte Geschichte gebrauchen vor allem die verbale Befragung, die Aussage, das Interview, die Lebensgeschichte. Dieses Handbuch beruft sich auf das Verfahren der Sprachwissenschaftler, es stimmt aber mit den BeschĂ€ftigungen anderer Forscher ĂŒberein, die Korpora der gesprochenen Sprache (z. B. in Sprachsynthese und -entzifferung) gebrauchen, auch wenn ihre spezifischen BedĂŒrfnisse im vorliegenden Dokument nicht systematisch angeschnitten werden

    Das Institut fĂŒr Deutsche Sprache im Jahr 2012 : Jahresbericht

    Get PDF
    • 

    corecore