21 research outputs found

    Englischsprachige Erweiterung des TIB|AV-Portals: Ein GND-DBpedia-Mapping zur Gewinnung eines englischen Begriffssystems

    Get PDF
    Die Videos des TIB|AV-Portals werden mit insgesamt 63.356 GND-Sachbegriffen aus Naturwissenschaft und Technik automatisch verschlagwortet. Neben den deutschsprachigen Videos verfügt das TIB|AV-Portal auch über zahlreiche englischsprachige Videos. Die GND enthält zu den in der TIB|AV-Portal-Wissensbasis verwendeten Sachbegriffen nur sehr wenige englische Bezeichner. Es fehlt demnach ein englisches Indexierungsvokabular, mit dem die englischsprachigen Videos automatisch verschlagwortet werden können. Die Lösung dieses Problems sieht wie folgt aus: Die englischen Bezeichner sollen über ein Mapping der GND-Sachbegriffe auf andere Datensätze gewonnen werden, die eine englische Übersetzung der Begriffe enthalten. Die verwendeten Mappingstrategien nutzen die DBpedia, LCSH, MACS-Ergebnisse sowie den WTI-Thesaurus. Am Ende haben 35.025 GND-Sachbegriffe (mindestens) einen englischen Bezeichner ermittelt bekommen. Diese englischen Bezeichner können für die automatische Verschlagwortung der englischsprachigen Videos unmittelbar herangezogen werden. 11.694 GND-Sachbegriffe konnten zwar nicht ins Englische „übersetzt“, aber immerhin mit einem Oberbegriff assoziiert werden, der eine englische Übersetzung hat. Diese Assoziation dient der Erweiterung der Suchergebnisse. The videos in the TIB|AV-Portal are automatically indexed with a total of 63,356 GND subject headings in the field of science and technology. Besides the German-language videos, the TIB|AVPortal also includes numerous English-language videos. However, the GND (Integrated Authority File) contains very few English labels for the subject headings used in the TIB|AV-Portal knowledge base. Thus, there is no English indexing vocabulary for the automatic indexing of English-language videos. The solution to this problem is as follows: English labels are determined by mapping the GND subject headings to other data sets which provide an English translation of these terms. The mapping strategies which have been applied make use of the DBpedia, LCSH, MACS results, and the WTI Thesaurus. As a result, (at least) one English label was determined for 35,025 GND subject headings. These English labels can be used directly for the automatic indexing of English-language videos. 11,694 GND subject headings could not be directly ‘translated’ into English, but at least it was possible to relate them to a broader term which has an English translation. This association helps to expand the search results

    Englischsprachige Erweiterung des TIB|AV-Portals: Ein GND-DBpedia-Mapping zur Gewinnung eines englischen Begriffssystems

    Get PDF
    Die Videos des TIB|AV-Portals werden mit insgesamt 63.356 GND-Sachbegriffen aus Naturwissenschaft und Technik automatisch verschlagwortet. Neben den deutschsprachigen Videos verfügt das TIB|AV-Portal auch über zahlreiche englischsprachige Videos. Die GND enthält zu den in der TIB|AV-Portal-Wissensbasis verwendeten Sachbegriffen nur sehr wenige englische Bezeichner. Es fehlt demnach ein englisches Indexierungsvokabular, mit dem die englischsprachigen Videos automatisch verschlagwortet werden können. Die Lösung dieses Problems sieht wie folgt aus: Die englischen Bezeichner sollen über ein Mapping der GND-Sachbegriffe auf andere Datensätze gewonnen werden, die eine englische Übersetzung der Begriffe enthalten. Die verwendeten Mappingstrategien nutzen die DBpedia, LCSH, MACS-Ergebnisse sowie den WTI-Thesaurus. Am Ende haben 35.025 GND-Sachbegriffe (mindestens) einen englischen Bezeichner ermittelt bekommen. Diese englischen Bezeichner können für die automatische Verschlagwortung der englischsprachigen Videos unmittelbar herangezogen werden. 11.694 GND-Sachbegriffe konnten zwar nicht ins Englische „übersetzt“, aber immerhin mit einem Oberbegriff assoziiert werden, der eine englische Übersetzung hat. Diese Assoziation dient der Erweiterung der Suchergebnisse.The videos in the TIB|AV-Portal are automatically indexed with a total of 63,356 GND subject headings in the field of science and technology. Besides the German-language videos, the TIB|AVPortal also includes numerous English-language videos. However, the GND (Integrated Authority File) contains very few English labels for the subject headings used in the TIB|AV-Portal knowledge base. Thus, there is no English indexing vocabulary for the automatic indexing of English-language videos. The solution to this problem is as follows: English labels are determined by mapping the GND subject headings to other data sets which provide an English translation of these terms. The mapping strategies which have been applied make use of the DBpedia, LCSH, MACS results, and the WTI Thesaurus. As a result, (at least) one English label was determined for 35,025 GND subject headings. These English labels can be used directly for the automatic indexing of English-language videos. 11,694 GND subject headings could not be directly ‘translated’ into English, but at least it was possible to relate them to a broader term which has an English translation. This association helps to expand the search results

    Text und Data Mining: Herausforderungen und Möglichkeiten für Bibliotheken

    Get PDF
    Text und Data Mining (TDM) gewinnt als wissenschaftliche Methode zunehmend an Bedeutung und stellt wissenschaftliche Bibliotheken damit vor neue Herausforderungen, bietet gleichzeitig aber auch neue Möglichkeiten. Der vorliegende Beitrag gibt einen Überblick über das Thema TDM aus bibliothekarischer Sicht. Hierzu wird der Begriff Text und Data Mining im Kontext verwandter Begriffe diskutiert sowie Ziele, Aufgaben und Methoden von TDM erläutert. Diese werden anhand beispielhafter TDM-Anwendungen in Wissenschaft und Forschung illustriert. Ferner werden technische und rechtliche Probleme und Hindernisse im TDM-Kontext dargelegt. Abschließend wird die Relevanz von TDM für Bibliotheken, sowohl in ihrer Rolle als Informationsvermittler und -anbieter als auch als Anwender von TDM-Methoden, aufgezeigt. Zudem wurde im Rahmen dieser Arbeit eine Befragung der Betreiber von Dokumentenservern an Bibliotheken in Deutschland zum aktuellen Umgang mit TDM durchgeführt, die zeigt, dass hier noch viel Ausbaupotential besteht

    Ontologiebasierte Indexierung und Kontextualisierung multimedialer Dokumente für das persönliche Wissensmanagement

    Get PDF
    Die Verwaltung persönlicher, multimedialer Dokumente kann mit Hilfe semantischer Technologien und Ontologien intelligent und effektiv unterstützt werden. Dies setzt jedoch Verfahren voraus, die den grundlegenden Annotations- und Bearbeitungsaufwand für den Anwender minimieren und dabei eine ausreichende Datenqualität und -konsistenz sicherstellen. Im Rahmen der Dissertation wurden notwendige Mechanismen zur semi-automatischen Modellierung und Wartung semantischer Dokumentenbeschreibungen spezifiziert. Diese bildeten die Grundlage für den Entwurf einer komponentenbasierten, anwendungsunabhängigen Architektur als Basis für die Entwicklung innovativer, semantikbasierter Lösungen zur persönlichen Dokumenten- und Wissensverwaltung.Personal multimedia document management benefits from Semantic Web technologies and the application of ontologies. However, an ontology-based document management system has to meet a number of challenges regarding flexibility, soundness, and controllability of the semantic data model. The first part of the dissertation proposes necessary mechanisms for the semi-automatic modeling and maintenance of semantic document descriptions. The second part introduces a component-based, application-independent architecture which forms the basis for the development of innovative, semantic-driven solutions for personal document and information management

    Grundlagen der Informationswissenschaft

    Get PDF

    “The Bard meets the Doctor” – Computergestützte Identifikation intertextueller Shakespearebezüge in der Science Fiction-Serie Dr. Who.

    Get PDF
    A single abstract from the DHd-2019 Book of Abstracts.Sofern eine editorische Arbeit an dieser Publikation stattgefunden hat, dann bestand diese aus der Eliminierung von Bindestrichen in Überschriften, die aufgrund fehlerhafter Silbentrennung entstanden sind, der Vereinheitlichung von Namen der Autor*innen in das Schema "Nachname, Vorname" und/oder der Trennung von Überschrift und Unterüberschrift durch die Setzung eines Punktes, sofern notwendig

    Digitale Infrastrukturen für die germanistische Forschung

    Get PDF
    Modern research in linguistics is increasingly reliant on digital infrastructure and information systems. This development began at the turn of the millennium and has since accelerated. The volume examines national and European infrastructure networks and the range of language resources in German linguistics that can be discovered, disclosed, and re-applied through digital infrastructure

    Digitale Infrastrukturen für die germanistische Forschung

    Get PDF

    Diskurse – digital

    Get PDF
    The aim of this publication is to expand the program and methodological inventory of discourse linguistics in two ways: firstly, by systematizing the specific descriptive categories and analytical tools available for discourses in digital media (e.g., hashtags). Secondly, it seeks to evaluate and develop digital methods and the methods and tools of corpus linguistics to meet the requirements of discourse linguistics

    Activity Tree Harvesting - Entdeckung, Analyse und Verwertung der Nutzungskontexte SCORM-konformer Lernobjekte

    Get PDF
    Der Erstellungsaufwand multimedialer Lernangebote kann durch die Wiederverwendung bestehender Materialien deutlich reduziert werden. Wie aber kann das Auffinden solcher wiederverwendbaren Lernressourcen unterstützt werden? Der Autor stellt ein Retrieval-Verfahren vor, das SCORM-basierte Informationen zu Lernobjekten und Kursstrukturen entdeckt, analysiert und verwertet. Auf Grundlage dieser Daten werden für Lehrende als auch Lernende hilfreiche Such- und Empfehlungsdienste angeboten
    corecore