Universität Rostock, Lehrstuhl Datenbank- und Informationssysteme: Dbis Repository
Not a member yet
    907 research outputs found

    Flottenmanagement und dynamische kürzeste Pfade

    Get PDF
    In einem gerichteten und gewichteten Graphen wird das Single-Pair Shortest Path Problem im Kontext der maritimen Navigation unter Berücksichtigung dynamischer Aspekte untersucht. Dabei können verschiedene Faktoren betrachtet werden, die zu dynamischen Veränderungen im Graphen führen können. Insbesondere wird der Fokus auf Unwetterereignissen gelegt, da diese ein häufiges und schwerwiegendes Ereignis im maritimen Kontext darstellen. Zur Lösung des Problems werden vier verschiedene Ansätze vorgeschlagen und diskutiert. Diese umfassen die Suche nach einem alternativen Pfad, die Manipulation der Geschwindigkeit des Schiffs, die Anpassung der Abfahrtszeit sowie das Warten an einem oder mehreren Knoten. Jeder dieser Ansätze wird im Hinblick auf seine Anwendbarkeit analysiert und im Falle der Umsetzbarkeit werden dafür konkrete Algorithmen vorgestellt und getestet. Im Anschluss werden die resultierenden Algorithmen verglichen. Hierbei werden spezifische Bewertungskriterien wie die Länge der ermittelten kürzesten Pfade und die Wartezeit herangezogen. Ziel ist es nicht, den effizientesten Algorithmus zu finden, sondern denjenigen, der den kürzesten Weg findet. Die Ergebnisse dieser Arbeit leisten einen bedeutenden Beitrag zur Anwendung von Algorithmen im maritimen Kontext und bieten konkrete Handlungsempfehlungen für die Praxis. Insbesondere können die untersuchten Ansätze und Algorithmen dazu beitragen, die Leistungsfähigkeit und Sicherheit des Seeverkehrs zu erhöhen und damit langfristig sowohl ökonomische als auch ökologische Vorteile zu generieren

    Spatial analysis of graph data in the WossiDiA System

    No full text
    The ISEBEL project aims to build an international search engine that is able to harvest data from folktale databases. The initial project concentrates on belief legends [1] found in the three well known digital collections by Evald Tang Kristensen from Denmark (etkspace), Richard Wossidlo from Mecklenburg (wossidia) and several collectors and narrators from the Netherlands (verhaalenbank). Part of the project is on data and graph mining [2,3] for frequent patterns. Therefore, the XML story data is harvested using OAI-PMH and transformed into graph data. The WossiDiA system [4] itself as one of the databases harvested by ISEBEL uses typed, directed hypergraphs [5] for representing the collections by Richard Wossidlo. The content encompasses field notes [6], correspondences with scholars, contributors and informants as well as references to published work on the everyday life in the country Mecklenburg from late 19th century to the 30s of 20th century. Most of the field notes are annotated with localization [7]. To support the researchers in analyzing, browsing and visualizing certain aspects in the collected data using the graph paradigm and algorithms developed not only restricted to the WossiDiA graph data, the master thesis should aim at a combined spatial clustering [8] in conjunction with a graph based clustering [9,10] of property graph data [11] and provide different graph mining techniques on the resulting graph data, especially spatial distribution maps of motif clusters from story data but not restricted to that. Therefore, a general framework has to be developed for a spatial analysis of graph-based data from the Wossidlo archive [12,13,14]. It’s functionality has to be demonstrated by sample scenarios from the WossiDiA and ISEBEL project, i.e. from the narrative cultural heritage and folkloristics [15]

    WossiDiA

    No full text
    This article sheds light on the digital transformation of Richard Wossidlo’s regional ethnographic and linguistic collection into the research environment WossiDiA. The Digital Wossidlo Archive is based on making handwritten sources and their indexing visible to users. It has been implemented as a hypergraph database, whose abundance of node and hyperedge types is suitable for representing the diversity and delicate nature of the tradition archive. This paper will discuss how proprietary properties have been preserved in the transformation process and how the digital collection is compatible with big data scenarios. Follow-up projects have contributed to this. “Efficiency,” the necessity of resource-saving, will also be problematized. Finally, it will be shown how a sparse ethnographic fieldnote can be enriched into a complex hypergraph extract, a method which is reminiscent of dragnet detection

    k-Means-Clustering von Textdokumenten mit teilweise fixierten Clustermittelpunkten

    Get PDF
    von Techniken aus den Bereichen maschinelles Lernen und natürliche Sprachverarbeitung (Natural Language Processing, NLP) präsentiert. Die Arbeitsschritte der Textanalyse, von der Vorverarbeitung bis zur Merkmalsextraktion, wurden mit Schwerpunkt auf dem Einsatz des FCK-Means Clustering-Algorithmus detailliert beschrieben. Dieser Algorithmus ermöglicht die Gruppierung ähnlicher Textdokumente auf Basis hochdimensionaler,semantischer Darstellungen, die durch den Einsatz von TF-IDF und BERT-Einbettungen gewonnen werden. In der vorliegenden Arbeit wurde ein System entwickelt und implementiert, das auf Python und mehreren maschinellen Lern- und NLP-Bibliotheken, einschließlich Scikit-Learn, NLTK und Transformers, basiert. Der entwickelte Ansatz wurde auf verschiedenen Anwendungsfällen getestet. Weiterhin wurden praktische Herausforderungen, die bei der Implementierung des Systems auftraten, wie das Management großer Datenmengen und die Sicherstellung der Qualität der Eingabedaten, gründlich diskutiert und Lösungsansätze vorgeschlagen. Zusammenfassend bietet die Arbeit einen tiefgreifenden Einblick in die Methodik und Implementierung eines auf NLP und Clustering basierenden Textklassifikationssystems und unterstreicht dessen Potential in diversen Anwendungsgebieten

    Ein Beitrag zur Strukturanalyse von Wörterbüchern

    No full text

    The ISEBEL Project

    No full text
    ISEBEL is an online database for belief legends. The acronym stands for: Intelligent Search Engine for Belief Legends. The database contains more than 70,000 traditional legends in Dutch, Frisian, Danish and German, while another 6,000 Icelandic legends are currently being added. The initiative for this project was taken several years ago by the Meertens Institute in Amsterdam, the University of Rostock/the Wossidlo Research Center and UCLA/UC Berkeley. The ambition is to create a European database, with an intelligent search function and geographical visualizations. What makes the search engine ‘intelligent’ is that it can always be searched in English, thanks to high-quality automatic translations in the background. The legend material that is brought together can also form the basis of sophisticated graphs that network themes, motifs, narrators, repertoires, and places. This article includes examples of international legends about mermaids and werewolves

    Removal of Imperfections in Digital Scans using Generative Adversarial Networks

    Get PDF
    move towards a more digital workflow. However, scanned document images often suffer from damage caused by different real-life scenarios, which makes them difficult to read and use. In this thesis, we explore the use of generative adversarial networks (GANs) to enhance scanned images and remove imperfections, such as coffee stains and other distortion factors. The problem is formulated as an image-to-image translation task between two domains, and we compare the performance of two GAN types: Pix2Pix, a supervised image-to-image translation model that uses paired data, and CycleGAN, an unsupervised image-to-image translation model that uses unpaired data. To address this problem, we developed a data pipeline to generate appropriate data to train the aforementioned models. Furthermore, we developed a prototype that allows users to easily test out these models. The effectiveness of the proposed methods was evaluated in detail using various criteria, such as Peak Signal-to-Noise Ratio (PSNR), Structural Similarity Index Measure (SSIM), and Fréchet Inception Distance (FID). We also assessed the impact of these approaches on improving Optical Character Recognition (OCR) efficiency. The results showed that Pix2Pix can significantly improve the quality of scanned images and remove defects such as coffee stains, while CycleGAN performed averagely. Overall, this study provides a perspective on improving the digitization process by using GANs to address image imperfections. The data pipeline and prototype developed in this work can be used to improve the quality of scanned images and facilitate the transition to a more digital workflow. Future research could explore the possibility of further improving the performance of this method by incorporating other types of GANs or alternative approaches

    Extraktion textueller Informationen aus heterogenen PDF-Dokumenten

    Get PDF
    Diese Bachelorarbeit untersucht den Prozess der Extraktion von Text aus Absätzen, Überschriften und Tabellen, die in PDF-Dokumenten enthalten sind, mithilfe des Python-Moduls PDFMiner. In dieser Arbeit wird ein Überblick über viele Python-Bibliotheken sowie ein Vergleich ihrer Funktionen und Eigenschaften präsentiert, mit der Schlussfolgerung, dass PDFMiner die überlegene Option für das Ziel der Textextraktion ist. Die Verarbeitungs- und Implementierungsmethode von PDFMiner wird detailliert aufgeschlüsselt und die Ausgabeergebnisse der Textextraktion werden untersucht, bewertet und auf ihre Korrektheit und Verlässlichkeit geprüft. Die Arbeit schließt mit einigen Vorschlägen für weitere Forschungen in diesem Bereich sowie mit einigen möglichen Anwendungen von PDFMiner in anderen Studienbereichen. Generell zeigen die Ergebnisse der Studie, dass die effiziente Extraktion von Text aus PDF-Dateien das Potenzial hat, in einer Vielzahl von Bereichen wie Bildung, Forschung und Datenanalyse eingesetzt zu werden

    Computing Provenance Using the Negated Chase

    Get PDF
    Since different challenges of data processing are interconnected, we describe them in a unified manner using a classic algorithm of database theory: the Chase. Explaining the origin of query results is one of the challenges considered in this research project. Previously, the Chase has been used to calculate why-provenance of simple conjunctive queries. However, applying the Chase to more realistic scenarios requires an extension of the algorithm, for example with negation. This work reveals opportunities for the extended Chase by calculating both why- and why-not provenance of conjunctive queries with negation

    Inverse Anfragen in ProSA

    Get PDF
    Im Bereich des Forschungsdatenmangament wird eine Analyse, Archivierung und Verarbeitung von großen Mengen an Forschungsdaten durchgeführt. Für die Unterstützung dieser Auswertung, Archivierung und Analyse von Forschungsdaten wurde das Tool ProSA entwickelt. Dabei verfolgt das Tool ProSA das Ziel eine Rückverfolgung der Anfrageergebnisse zu realisieren. Um eine Rückverfolgbarkeit eines Anfrageergebnis zu gewährleisten, ist eine Berechnung einer minimalen Teildatenbank notwendig. Die minimale Teildatenbank beschreibt die Archivierung der verwendeten Daten, die für die Generierung des Anfrageergebnis benötigt werden. Für die Berechnung einer minimalen Teildatenbank wird eine invertierte Anfrage benötigt, um eine Rückabbildung vom Anfrageergebnis auf die verwendeten Originaldaten zu realisieren. Das Ziel der Masterarbeit: Inverse Anfragen in ProSA ist eine Invertierungsmethode, für die Generierung einer invertierten Anfrage, zu konstruieren. Diese Konstruktion wird basiert auf bestehende Invertierungsmethoden aufgebaut, die in vorherigen Arbeiten an der Universität Rostock entwickelt wurden und für die Invertierung von Anfragen entsprechend erweitert. Anschließend wird die Implementierung der entwickelten Invertierungsmethode für die Anwendung mit ProSA durchgeführt. Als weiteres Ziel dieser Masterarbeit dient die Definition der Darstellung der Anfragen als Menge von Abhängigkeiten und die Definition der Invertierung der Abhängigkeiten. Diesbezüglich werden unterschiedlichste SQL-Anfragen und dessen Darstellung als Abhängigkeiten betrachtet und auf Vollständigkeit untersucht

    235

    full texts

    907

    metadata records
    Updated in last 30 days.
    Universität Rostock, Lehrstuhl Datenbank- und Informationssysteme: Dbis Repository is based in Germany
    Access Repository Dashboard
    Do you manage Open Research Online? Become a CORE Member to access insider analytics, issue reports and manage access to outputs from your repository in the CORE Repository Dashboard! 👇