16 research outputs found

    Möglichkeiten und Grenzen maschineller Indexierung in der Sacherschließung : Strategien für das Bibliothekssystem der Freien Universität Berlin

    Get PDF
    Automatische Indexierung wird zunehmend als sinnvolle Möglichkeit erkannt, Daten für Informationsretrievalsysteme zu erzeugen und somit die Auffindbarkeit von Dokumenten zu erhöhen. Die dafür geeigneten Methoden sind seit geraumer Zeit bekannt und umfassen statistische bzw. computerlinguistische Sprachanalysetechniken, die im Gegensatz zur gebräuchlichen Freitextinvertierung entscheidende Vor-teile hinsichtlich des Retrievals bieten. So bilden erst die Wortformenreduzierung und die semantische Zerlegung sowie die Gewichtung der ermittelten Indexterme die Grundlagen für die gezielte sachliche Suche im Online-Katalog. Entsprechende Verfahren, die sich für Bibliotheken eignen, stehen seit Mitte der neunziger Jahre auch für den praktischen Einsatz bereit und werden – nicht zuletzt aufgrund steigender Akzeptanz – ständig weiterentwickelt. Dabei geht es nicht nur um die Steigerung der allgemeinen Leistungsfähigkeit von maschinellen Indexierungssystemen, sondern auch um ihre Fähigkeit, die im Bibliothekswesen verfügbare, sehr heterogene Datengrundlage optimal zu nutzen. Wichtige Kriterien sind zudem eine vertretbare Fehlerquote, die Integrierbarkeit in die Geschäftsgänge und die Darstellbarkeit der anfallenden Datenmengen in entsprechenden Datenrepräsentationsmodellen. Im Fokus der Untersuchung stehen die allgemeine Betrachtung der Vor- und Nach-teile der beiden gängigen Indexierungssysteme MILOS und intelligentCAPTURE sowie die Möglichkeiten und Grenzen ihres Einsatzes im Bibliothekssystem der Freien Universität Berlin

    CTX - ein Verfahren zur computergestützten Texterschließung

    Get PDF
    Zusammen mit Edith Kroupa und Gerald Keil hat Zimmermann diesen Forschungsbericht für das BMFT, in dessen Mittelpunkt die Entwicklung des computergestützten Texterschließungssystems CTX steht, herausgegeben. Es wird zunächst ausführlich auf Methoden und Probleme des Information Retrieval eingegangen. Es folgt eine detaillierte Beschreibung der Grundlagen, Funktionen und Aufgaben von CTX. Der anwendungsbezogene Teil stellt eine Laboranwendung im Bereich "Datenschutz" mit Schwerpunkten auf den Themen Textsorte, Wörterbucharbeit und Deskriptorermittlung sowie einem Vergleich mit dem System PASSAT vor

    Informatik und Kultur:4. Münsteraner Workshop zur Schulinformatik

    Full text link
    Der Zugang zum elektronisch repräsentierten Wissen und die nutzbringende Verarbeitung von Information mit Hilfe von Informatiksystemen sind zu wichtigen Entwicklungsfaktoren unserer Gesellschaft geworden. Die Bedeutung der elektronischen Verarbeitung von Daten mit allgegenwärtigen Informationstechnologien drückt sich auch in der Bezeichnung „vierte Kulturtechnik“ aus (neben Lesen, Schreiben, Rechnen). Eine Kulturtechnik ist eine „durch Erziehung vermittelte Fähigkeit, die die Aneignung, Erhaltung u. Verbreitung von Kultur ermöglicht“ (Duden Deutsches Universalwörterbuch, 2007). In elf Artikeln von Experten aus Hamburg, Kiel, Berlin, Wuppertal, Jülich, Oldenburg, Paderborn, Münster und Groningen (Holland) wird der Beitrag des Informatikunterrichts zur Enkulturation der nachwachsenden Generation diskutiert

    Semantische Relationen in Dokumentationssprachen : vom Thesaurus zum semantischen Netz

    Get PDF
    Moderne Verfahren des Information Retrieval verlangen nach aussagekräftigen und detailliert relationierten Dokumentationssprachen. Der selektive Transfer einzelner Modellierungsstrategien aus dem Bereich semantischer Technologien für die Gestaltung und Relationierung bestehender Dokumentationssprachen wird diskutiert. Am Beispiel des Gegenstandsbereichs „Theater“ der Schlagwortnormdatei wird ein hierarchisch strukturiertes Relationeninventar definiert, welches sowohl hinreichend allgemeine als auch zahlreiche spezifische Relationstypen enthält, welche eine detaillierte und damit funktionale Relationierung des Vokabulars ermöglichen. Die Relationierung des Gegenstandsbereichs wird als Ontologie im OWL-Format modelliert. Im Gegensatz zu anderen Ansätzen und Überlegungen zur Schaffung von Relationeninventaren entwickelt der vorgestellte Vorschlag das Relationeninventar aus der Begriffsmenge eines bestehenden Gegenstandsbereichs heraus. Das entwickelte Inventar wird als eine hierarchisch strukturierte Taxonomie gestaltet, was einen Zugewinn an Übersichtlichkeit und Funktionalität bringt

    CTX - ein Verfahren zur computergestützten Texterschließung

    Get PDF
    Zusammen mit Edith Kroupa und Gerald Keil hat Zimmermann diesen Forschungsbericht für das BMFT, in dessen Mittelpunkt die Entwicklung des computergestützten Texterschließungssystems CTX steht, herausgegeben. Es wird zunächst ausführlich auf Methoden und Probleme des Information Retrieval eingegangen. Es folgt eine detaillierte Beschreibung der Grundlagen, Funktionen und Aufgaben von CTX. Der anwendungsbezogene Teil stellt eine Laboranwendung im Bereich "Datenschutz" mit Schwerpunkten auf den Themen Textsorte, Wörterbucharbeit und Deskriptorermittlung sowie einem Vergleich mit dem System PASSAT vor

    Das Institut für Deutsche Sprache im Jahr 2012 : Jahresbericht

    Get PDF

    Digitale Datenbanken: Eine Medientheorie im Zeitalter von Big Data

    Get PDF
    Wir leben längst nicht mehr nur im Informationszeitalter, sondern in der Ära von Big Data. In dieser steht die Datenbank gleichzeitig für die riesigen Erkenntnispotenziale von Informationssammlungen wie für die bedrohlichen Informationsexzesse der digitalen Medienkultur. Zudem bezeichnet der Begriff konkrete Technologien und Verfahren der Sammlung und Bereitstellung von digitalen Informationen. Zwischen diesen sehr unterschiedlichen Auffassungen gilt es, Datenbanken medientheoretisch zu verorten. Marcus Burkhardt zeichnet die Geschichte der Datenbanken nach und fragt, wie technische Verfahren der Verwaltung digitaler Informationen bedingen, was auf welche Weise in Datenbanken gefunden und durch sie gewusst werden kann.We have long moved on from a mere information age to the era of big data. Here, databases represent both the enormous potential for gaining knowledge of data collection and the alarming information excesses of digital culture. Furthermore, the term refers to concrete technologies and processes of gathering and accessing digital information. Media theory has to locate databases in between these very different conceptions. Marcus Burkhardt retraces the history of databases and asks how technical procedures of processing digital information determine what can be found how in databases and what knowledge can be gained through them

    Digitale Datenbanken

    Get PDF
    We have long moved on from a mere information age to the era of big data. Here, databases represent both the enormous potential for gaining knowledge of data collection and the alarming information excesses of digital culture. Furthermore, the term refers to concrete technologies and processes of gathering and accessing digital information. Media theory has to locate databases in between these very different conceptions. Marcus Burkhardt retraces the history of databases and asks how technical procedures of processing digital information determine what can be found how in databases and what knowledge can be gained through them

    Grundlagen der Informationswissenschaft

    Get PDF
    corecore