437 research outputs found
Rechtsfragen bei der Nutzung und Weitergabe linguistischer Daten
Grundlage dieses Artikels* 1 ist das Verbundprojekt „Nachhaltigkeit linguistischer Daten“ der drei Sonderforschungsbereiche 441, 538 und 632, dessen Ziel es ist, Lösungen für die nachhaltige Verfügbarkeit der an den SFBs vorhandenen Korpora zu entwickeln. Ein zentraler Aspekt betrifft die Klärung der Rechtslage für die Nutzung und Weitergabe linguistischer Ressourcen, die durch das Urheber- sowie das Datenschutzrecht geschützt sind. Eine als indifferent wahrgenommene rechtliche Situation wird in der Praxis oft als das entscheidende Hindernis für die Weitergabe linguistischer Daten angeführt. Tatsächlich jedoch sind Nutzung und Weitergabe von Daten zu wissenschaftlichen Zwecken normativ geregelt. Problematisch ist oftmals die Einordnung der speziellen linguistischen Daten als Schutzgegenstand sowie die Tatsache, dass an linguistische Daten und Datensammlungen aufgrund ihrer komplexen und vielschichtigen Beschaffenheit durchaus mehrere Urheber Rechte besitzen können, die sich auf verschiedene Inhalte beziehen. Der Beitrag gibt einen Überblick über das geltende Recht sowie die juristischen und natürlichen Personen, die potentiell Rechte an linguistisch aufbereiteten Datenkollektionen besitzen. Es ist nicht Gegenstand dieses Artikels, rechtsverbindliche Aussagen zu treffen, die auf eine Nutzung und Weitergabe jedweder Daten angewandt werden. Der Artikel orientiert sich in seiner Struktur und thematischen Tiefe bewusst nicht an einem juristischen Publikum, sondern beschreibt die Problematik aus geisteswissenschaftlicher Perspektive. Zusammen mit einem Überblick über das vom Umgang mit linguistischen Datensammlungen betroffene Recht, das Urheberrechtsgesetz (Abschnitt 1) und das Bundesdatenschutzgesetz (Abschnitt 2), wird in den jeweiligen Abschnitten auch eine Klassifikation der Daten aus juristischer Sicht vorgenommen. Anschließend werden Lösungsansätze vorgestellt, die im Rahmen des o. g. Verbundprojektes erarbeitet werden (Abschnitt 3)
Masking Treebanks for the Free Distribution of Linguistic Resources and Other Applications
Proceedings of the Sixth International Workshop on Treebanks and
Linguistic Theories.
Editors: Koenraad De Smedt, Jan Hajič and Sandra Kübler.
NEALT Proceedings Series, Vol. 1 (2007), 127-138.
© 2007 The editors and contributors.
Published by
Northern European Association for Language
Technology (NEALT)
http://omilia.uio.no/nealt .
Electronically published at
Tartu University Library (Estonia)
http://hdl.handle.net/10062/4476
On the Lossless Transformation of Single-File, Multi-Layer Annotations into Multi-Rooted Trees
The Generalised Architecture for Sustainability (GENAU) provides a framework for the transformation of single-file, multi-layer annotations into multi-rooted trees. By employing constraints expressed in XCONCUR-CL, this procedure can be performed lossless, i.e., without losing information, especially with regard to the nesting of elements that belong to multiple annotation layers. This article describes how different types of linguistic corpora can be transformed using specialised tools, and how constraint rules can be applied to the resulting multi-rooted trees to add an additional level of validation
Plataforma web para el mantenimiento, exploración, visulización y búsqueda en corpus lingüísticos y en otros recursos
Presentamos SPLICR, una plataforma de sostenibilidad para corpus y
recursos lingüísticos basada en web. El sistema está destinado a personas que trabajan en el campo de la lingüística o de la lingüística computacional. Consiste en
una base de datos extensa para metadatos que puede ser explorada para buscar
recursos lingüísticos, que pudieran ser apropiados para las necesidades específicas
de una investigación. SPLICR también ofrece una interfaz gráfica, que permite a
los usuarios buscar y visualizar los corpus. El proyecto, en el que se ha desarollado
el sistema, aspira a archivar de modo sostenible aproximadamente sesenta recursos
lingüísticos, que han sido construidos mediante la colaboración de tres centros de
investigación. Nuestro proyecto tiene dos metas principales: (a) Procesar y archivar
recursos de forma sostenible, de manera que los recursos sigan siendo accesibles para
la comunidad científica dentro de cinco, diez, o incluso veinte años. (b) El permitir
a los investigadores buscar en los recursos tanto a nivel de metadatos como a nivel
de anotaciones lingüísticas. En términos más generales, nuestro objetivo es proporcionar soluciones que posibiliten la interoperabilidad, reutilización y sostenibilidad
de compilaciones heterogéneas de recursos de lenguaje.We present SPLICR, the Web-based Sustainability Platform for Linguistic Corpora and Resources. The system is aimed at people who work in Linguistics
or Computational Linguistics: a comprehensive database of metadata records can be
explored in order to find language resources that could be appropriate for one’s specific research needs. SPLICR also provides a graphical interface that enables users
to query and to visualise corpora. The project in which the system is developed aims
at sustainably archiving the ca. 60 language resources that have been constructed
in three collaborative research centres. Our project has two primary goals: (a) To
process and to archive sustainably the resources so that they are still available to
the research community in five, ten, or even 20 years time. (b) To enable researchers
to query the resources both on the level of their metadata as well as on the level of
linguistic annotations. In more general terms, our goal is to enable solutions that
leverage the interoperability, reusability, and sustainability of heterogeneous collections of language resources
Rechtsfragen bei der Nutzung und Weitergabe linguistischer Daten
Grundlage dieses Artikels* 1 ist das Verbundprojekt „Nachhaltigkeit linguistischer Daten“ der drei Sonderforschungsbereiche 441, 538 und 632, dessen Ziel es ist, Lösungen für die nachhaltige Verfügbarkeit der an den SFBs vorhandenen Korpora zu entwickeln. Ein zentraler Aspekt betrifft die Klärung der Rechtslage für die Nutzung und Weitergabe linguistischer Ressourcen, die durch das Urheber- sowie das Datenschutzrecht geschützt sind. Eine als indifferent wahrgenommene rechtliche Situation wird in der Praxis oft als das entscheidende Hindernis für die Weitergabe linguistischer Daten angeführt. Tatsächlich jedoch sind Nutzung und Weitergabe von Daten zu wissenschaftlichen Zwecken normativ geregelt. Problematisch ist oftmals die Einordnung der speziellen linguistischen Daten als Schutzgegenstand sowie die Tatsache, dass an linguistische Daten und Datensammlungen aufgrund ihrer komplexen und vielschichtigen Beschaffenheit durchaus mehrere Urheber Rechte besitzen können, die sich auf verschiedene Inhalte beziehen. Der Beitrag gibt einen Überblick über das geltende Recht sowie die juristischen und natürlichen Personen, die potentiell Rechte an linguistisch aufbereiteten Datenkollektionen besitzen. Es ist nicht Gegenstand dieses Artikels, rechtsverbindliche Aussagen zu treffen, die auf eine Nutzung und Weitergabe jedweder Daten angewandt werden. Der Artikel orientiert sich in seiner Struktur und thematischen Tiefe bewusst nicht an einem juristischen Publikum, sondern beschreibt die Problematik aus geisteswissenschaftlicher Perspektive. Zusammen mit einem Überblick über das vom Umgang mit linguistischen Datensammlungen betroffene Recht, das Urheberrechtsgesetz (Abschnitt 1) und das Bundesdatenschutzgesetz (Abschnitt 2), wird in den jeweiligen Abschnitten auch eine Klassifikation der Daten aus juristischer Sicht vorgenommen. Anschließend werden Lösungsansätze vorgestellt, die im Rahmen des o. g. Verbundprojektes erarbeitet werden (Abschnitt 3)
The Meta-data-Database of a Next Generation Sustainability Web-Platform for Language Resources
Our goal is to provide a web-based platform for the long-term preservation and distribution of a heterogeneous collection of linguistic resources. We discuss the corpus preprocessing and normalisation phase that results in sets of multi-rooted trees. At the same time we transform the original metadata records, just like the corpora annotated using different annotation approaches and exhibiting different levels of granularity, into the all-encompassing and highly flexible format eTEI for which we present editing and parsing tools. We also discuss the architecture of the sustainability platform. Its primary components are an XML database that contains corpus and metadata files and an SQL database that contains user accounts and access control lists. A staging area, whose structure, contents, and consistency can be checked using tools, is used to make sure that new resources about to be imported into the platform have the correct structure
Monitoring costs of result-based payments for biodiversity conservation: Will UAV-based remote sensing be the game-changer?
Paying landowners for conservation results rather than paying for the measures intended to provide such results is a promising approach for biodiversity conservation. However, a key roadblock for the widespread implementation of such result-based payment schemes are the frequent difficulties to monitor target species for whose presence a landowner is supposed to receive a remuneration. Until recently, the only conceivable monitoring approach would be conventional monitoring techniques, by which qualified experts investigate the presence of target species on-site. With the rise of remote sensing technologies, in particular increased capabilities and decreased costs of unmanned aerial vehicles (UAVs), technological monitoring opportunities enter the scene. We analyse the costs of monitoring an ecological target of a hypothetical result-based payments scheme and compare the monitoring cost between conventional monitoring and UAV-assisted monitoring. We identify the underlying cost structure and cost components of both monitoring approaches and use a scenario analysis to identify the influence of factors like UAV and analysis costs, area size, and monitoring frequency. We find that although conventional monitoring is the least-cost monitoring approach today, future cost developments are likely to render UAV-assisted monitoring more cost-effective
Recommended from our members
First of Their Kind : Solar Cells with a Dry-Processed Perovskite Absorber Layer via Powder Aerosol Deposition and Hot-Pressing
Preparing halide perovskite films by solvent-free, powder-based processing approaches currently attracts more and more attention. However, working solar cells employing dry, powder-based halide perovskite thin films, have not been demonstrated so far. Herein, perovskite solar cells are presented where the absorber layer is prepared by transferring readily synthesized perovskite powders into a compact thin film using a fully dry-powder-processing concept. Compact thin films are deposited via an optimized powder aerosol deposition (PAD) process. Pressing at 120 °C further improves the morphology and the optoelectronic film properties. Integrating the perovskite films in a solar cell configuration results in fully working devices, with champion power conversion efficiencies of >6%. While the (optoelectronic) properties of the PAD-processed films are found to be comparable with their solution-processed counterparts, investigations of the solar cell stack suggest deterioration of the electron-transport layer properties due to the PAD process, and the presence of hydrates at the perovskite surface to be important factors that contribute to the limited solar cell efficiency. Herein, perspectives to overcome the identified limitations are outlined, emphasizing the high potential and realizability of efficient perovskite solar cells based on dry-powder-processing approaches in the future
- …