773 research outputs found

    Basiskomponenten von XML Datenbanksystemen

    Get PDF
    Für die Entwicklung von vielen kleinen und großen Softwaresystemen reichen herkömmliche (objekt-)relationale Datenbanksysteme nicht mehr aus. Viele interessante Daten sind in der Praxis nicht voll strukturiert und somit nicht effektiv mit einem Standarddatenbanksystem zu verwalten. Es werden deshalb neuartige standardisierte Systeme für unstrukturierte bzw. semi-strukturierte Daten benötigt. Diese Lücke wird nun von nativen XML Datenbanksystemen geschlossen, die als Datenformat das vom W3C standardisierte XML verwenden. XML Datenbanksysteme unterstützen außerdem viele weitere XML Standards, wie beispielsweise XSchema für Grammatiken, XPath und XQuery für die Anfrageverarbeitung, XSLT für Transformationen und DOM und SAX für die Applikationsanbindung. In dieser Arbeit werden Grundlagen von nativen XML Datenbanksystemen betrachtet, sowie neue Strukturen vorgeschlagen und alte Strukturen optimiert. Es wird auf eine solide Basis zum Testen von Algorithmen Wert gelegt. Hierzu wurde ein Testframework innerhalb der Java-Bibliothek XXL implementiert und anschließend verwendet. Die XXL Bibliothek enthielt bereits vor dieser Arbeit einige Komponenten, die für die Implementierung von Datenbanksystemen eingesetzt werden konnten, beispielsweise eine generische Anfrageverarbeitung und Indexstrukturen. Zusätzlich zu den vorhandenen Komponenten wurden nun neue hinzugefügt, so z.B. eine Komponente für den direkten Festplattenzugriff, ein frei konfigurierbarer Recordmanager, sowie ein Datenbank-Framework. Das zentrale Anliegen der Arbeit ist die Optimierung der Speicherungsebene von nativen XML Datenbanksystemen. Wichtig ist, dass bei der Abbildung von XML Dokumenten auf den Externspeicher die Baumstruktur erhalten bleibt und somit eine performante Anfragenverarbeitung mit wenigen Externspeicherzugriffen möglich wird. Ähnlich wie bei R-Bäumen, können für XML Speicherungsstrukturen verschiedene Splitalgorithmen angegeben werden, die gewisse Heuristiken verfolgen. Hier zeigte sich der neu entwickelte, so genannte OneCutSplit mit Scaffold als klar überlegen gegenüber den bisher bekannten Splitalgorithmen aus der Literatur. Für das Einfügen von Dokumenten wurde weiterhin ein Bulkloading Mechanismus implementiert. Es konnte gezeigt werden, dass die Speicherstruktur für die hiermit erzeugten Dokumente deutlich besser war als bei der Benutzung von Splitalgorithmen. Dies macht sich erheblich in den Antwortzeiten von Anfragen bemerkbar. Zur Beschleunigung der Anfrageverarbeitung sind in nativen XML Datenbanksystemen Indexstrukturen unverzichtbar. Zu diesem Zweck wurde ein neuartiger Signaturindex entwickelt und in die XML Speicherungsstruktur unter Verwendung von Aggregaten integriert. Die Evaluierung des Indexes zeigte einen deutlichen Vorteil bei der Auswertung von XPath-Ausdrücken. Weiterhin konnten erstmals durch die Benutzung des Datenbank-Frameworks von XXL native Speicherungsverfahren für XML mit solchen verglichen werden, die auf relationalen Datenbanksystemen aufsetzen. Hierbei zeigte sich, dass nativer XML Speicher auch bei einfachen XPath-Anfragen gute Leistungswerte besitzt. Bei Navigations- und Änderungsoperationen ist der native XML Speicher den relationalen Verfahren deutlich überlegen. In der Anfrageverarbeitung auf XML Daten spielen allerdings nicht nur XPath und XQuery eine Rolle. Für die Bearbeitung von großen Mengen von XML Dokumenten sind Operatoren sinnvoll, welche eine Verarbeitung durch Abbildung von XML Dokumenten auf neue XML Dokumente realisieren. Dies ist analog zur relationalen Algebra, in der allerdings der Grunddatentyp Tupel Verwendung findet. Im Vergleich zum relationalen Modell werden für XML jedoch viele verschiedene Operatoren benötigt, die nicht auf wenige Grundoperationen zurückgeführt werden können. In dieser Arbeit werden einige neue Operatoren vorgestellt, die nicht nur für die Anfrageverarbeitung innerhalb von XML Datenbanksystemen, sondern auch für Anfragen im Internet geeignet sind. Durch das entwickelte Framework soll es Anwendern in Zukunft auf einfache Art und Weise möglich sein, Internetquellen in eigene Anfragen einzubauen

    Metadatenverwaltung für Multimedia-Content-Management mit OLAP-Funktionalität

    Get PDF
    Der Hauptschwerpunkt bei der Entwicklung wireless-orientierter, multimedialer Content- Management-Systeme liegt auf der adäquaten Speicherung, Verwaltung und Recherche multimedialer Dokument-Strukturen sowie auf der anwendungsspezifischen Darstellung und Repräsentation dieser Dokumente auf verschiedenen Endgeräten. In diesem Kontext kann die Extensible Markup Language (XML) zur Verbesserung einer großen Bandbreite möglicher Anwendungen beitragen. Im Rahmen dieser Arbeit wird ein Ansatz für eine universelle Metadatenverwaltung zur Steuerung signifikanter Transformations - und Daten-Analyse-Prozesse entwickelt. Dabei wird eine möglichst enge Kopplung von Data Warehouse-Funktionalität (OLAP) mit einer ausgewählten XML-Framework-Architektur angestrebt. Ziel ist ein erweiterter Architektur-Vorschlag, der die Grundlage für zukünftige offene und erweiterbare Multimedia-Content-Management-Systeme bilden kann. Grundlage dieser Architektur ist ein Metadaten-Repository auf der Basis der Resource Description Framework Spezifikation (RDF)

    Datenbanksysteme 2

    Get PDF

    XML-basierte Sichtweise auf die einzelnen Phasen des Produktlebenszyklus von ambienten Beleuchtungssystemen

    Get PDF
    Ziel dieser Arbeit war es, eine XML-basierte Sichtweise auf die einzelnen Phasen des Produktlebenszyklus von ambienten Beleuchtungssystemen zu realisieren. Dies hat zu der Entwicklung des XML-Konverters geführt, der speziell für den Produktentwicklungsprozess von ambienten Beleuchtungssystemen entwickelt wurde. Ausgangspunkt waren die intelligente Datenbereitstellung, -aufbereitung, -weitergabe entlang des gesamten Produktlebenszyklus von ambienten Beleuchtungssystemen in einer gültigen XML-basierten Datenstruktur, die Organisation und Verwaltung der immensen Datenmengen, die in jeder Phase des Produktlebenszyklus von ambienten Beleuchtungssystemen auffallen, die Protokolle des Datenaustausches zwischen den Phasen des Produktlebenszyklus und für die verteilte Produktentwicklung, sowie die Automatisierung dieses Datenaustausches. Dieser Beitrag ist insbesondere wichtig, weil er der erste ist, der diese Thematik in ihrer Gesamtheit betrachtet, analysiert und behandelt. Er liefert eine konkrete Lösung der Problemstellung und somit stellt er die ersten Schritte in diese Thematik dar. Seit dem Anfang dieser Arbeit lag der Fokus immer auf der erweiterbaren Auszeichnungssprache XML, weil XML flexible Mechanismen für den Datenaustausch und die Aufbereitung von Inhalten für die unterschiedlichsten Zielmedien liefert und weil sie viele Potentiale zu versprechen scheint. Über die Trennung von Inhalt, Struktur und Erscheinungsbild gelingt es, im XML dies und mehr zu realisieren. Die Erweiterbarkeit von XML an bestehende Problemlösungen ist ein weiterer wichtiger Aspekt bei der Weiterentwicklung und Verbreitung von den XML-Dokumentenstrukturen. Im Laufe dieser Arbeit wird u.a. ganz klar, dass XML die Zukunft insbesondere im Bereich des Daten- und Dokumentenaustausch und der Präsentation von Daten nach aktuellem Stand der Technik gehört. Der hier vorgestellte XML-Konverter ist erst ein Einstieg in die Thematik und stellt somit die erste Lösung dieser Problematik dar. Für die weitere Entwicklung des XML-Konverters ist eine Verbesserung der inkrementellen Verarbeitung denkbar

    Integration von Inhalten aus Content-Managementsystemen in lokalen Suchmaschinen

    Get PDF
    Content-Managementsysteme haben eine wachsende Bedeutung bei der Verwal-tung digitaler Dokumente. Sie ermöglichen die zentrale Speicherung und den Zugriff auf mit Metadaten angereicherte Inhalte unterschiedlichsten Typs, wie semistrukturierte Texte, Multimedia- und Web-Daten. Die bestehenden Suchmaschinen haben den Nachteil, dass sie diese oft hochwertigen Daten nicht durchsuchen können. Ein Vorteil eines Content-Managementsystems ist die integrierte Retrievalkomponente, die umfangreiche Funktionen zur Volltextsuche und zur Anfrage an Metadaten bereitstellt. In dieser Diplomarbeit wurde eine Kopplungsarchitektur entwickelt, die bestehende Suchmaschinen und die von Content-Managementsystemen zur Verfügung gestellte Retrievalfunktionalität zu einem verteilten Retrievalsystem vereinigt

    Effizientere Nutzung bibliographischer Metadaten im wissenschaftlichen Bereich durch Verbesserung der Datenqualität

    Get PDF
    Diese Arbeit beschäftigt sich mit den bibliographischen Metadaten, wie sie in der wissenschaftlichen Praxis verwendet werden. Ausgehend von der Betrachtung bestehender Normen und Formate aus dem Bereich der wissenschaftlichen Bibliotheken und der Literaturverwaltungssoftware werden Verbesserungsvorschläge entwickelt, die in einen Entwurf eines neuen Datenschemas einfließen. Dieser Entwurf soll dem Wissenschaftler eine effizientere (multifunktionale) Nutzung dieser Daten ermöglichen, indem den folgenden Problemfeldern besondere Beachtung geschenkt wird: einfache und präzise Recherche im Datenbestand, persönliche Bewertung der Inhalte (Interpretation), verlustfreier Austausch der Daten (Portabilität, Persistenz), direkter Zugang zum Volltext der Werke, internationale Nutzung (Unabhängigkeit von Zeichensätzen und Sprachen), bedarfsgerechte Erweiterbarkeit sowie die Verarbeitung zu Quellenangaben. Abschließend wird der Entwurf definiert und auf seine Eignung hin untersucht. (Die Umsetzung in Form eines XML-Schemas wird mit einigen Verwendungsbeispielen im Anhang beigefügt.)The aim of the thesis is to present bibliographic metadata and the way they can be utilized by scientists. At first, it focuses on the existing norms and formats in academic libraries and in literature management software which, thoroughly analysed, influence the concept of the schema of such data. This concept should enable a more efficient (multifunctional) use of the data by concentrating on the following issues: easy and precise research in the database, individual assessment of the content (interpretation), data portability, direct access to full text, international use (independent of character encoding and language), extensibility of the model as required and citation processing. Finally, the concept is described and examined whether it can be applied in practice. (Definition of xml schema together with a set of examples is appended to the thesis.

    Generic e-learning platform for interactive educational simulations for use in university courses and individual studies online and offline

    Get PDF
    Dieckmann A. Generische E-Learning-Plattform für interaktive Lehrsimulationen zum Einsatz in Selbststudium und Präsenzlehre online und offline. Bielefeld (Germany): Bielefeld University; 2003.This doctoral thesis covers the design and implementation of an e-learning platform for interactive educational simulations. The simulations can be used in the context of university courses as well as for the purpose of individual studies. The data structures and storage mechanisms enable the use of any kind of multimedia contents, which can be classified and managed using arbitrary sets of metadata. Educational units are treated as configurations of a simulation software. The data format for those configuration files can be based on XML (but does not have to). They are stored as the content of Virtual Directories, which also contain the individual media files needed for the simulations in the form of Virtual Learning Objects. Each installation of the e-learning platform contains its own local database and is capable of interacting with other instances of the system via an XML-RPC communication mechanism. Hence the software can be used both online and offline. In online mode, new contents can be distributed or downloaded. It is also possible to integrate powerful communication functionalities like chats. The integrated user management makes it possible to personalize the software and to specify access rights for reading, creating and modifying objects contained in the system. The e-learning framework was implemented in a platform-independent way using the JAVA programming language. The software can be extended by new components if necessary. For this purpose it was made available to the public under the terms of an open-source license. (For details please see the homepage of the Monist project, http://www.monist.de, where the software can be downloaded. The contact address for any questions is [email protected].) The e-learning platform provides the necessary base technologies for a distributed e-learning system, especially powerful mechanisms for managing simulation data and metadata. But it is not meant to be a standalone e-learning system because the necessary simulation software and the specific contents of the particular field of study have to be integrated. The Monist system serves as a reference implementation of the e-learning platform. It covers the field of computational neuroscience. The project team created a configurable simulation software, programmed an editor for such configurations and prepared a large amount of educational content. The combination of these three components makes a system that can fully benefit from the services offered by the e-learning platform. For further use of the e-learning platform it is essential to create simulation software for other fields of study and to integrate it into the framework. The next step is the creation of a critical mass of specific content for the subject to make the system ready for educational use. To achieve a good level of user acceptance it is also necessary to hold courses using the e-learning system on a regular base and to create new contents from time to time. Both tasks require some efforts, but both are also supported by the e-learning platform.Mit der in der vorliegenden Arbeit entworfenen E-Learning-Plattform und ihrer parallel dazu erfolgten Implementierung in der Programmiersprache Java wurde eine technische Basis für die Verwendung interaktiver Lehrsimulationen geschaffen, die sowohl in der Präsenzlehre als auch im Selbststudium eingesetzt werden können. Die Datenstrukturen und Speichermechanismen ermöglichen das Einbringen von beliebigen, multimedialen Inhalten sowie deren Verwaltung durch den Gebrauch von frei definierbaren Metadaten. Einzelne Lehreinheiten können in Form von Konfigurationen der Simulationssoftware, beispielsweise in einem XML-basierten Datenformat, vorliegen und als Inhalt (content) von Virtuellen Verzeichnissen gespeichert werden, die außerdem die einzelnen Medien, die für die Zusammensetzung der betreffenden Simulation anhand der Konfigurationen erforderlich sind, in Form von Virtuellen Lernobjekten enthalten. Durch die in jede Installation des Systems integrierte Datenbank und den verwendeten XML-RPC-Kommunikationsmechanismus ist die Benutzung der E-Learning-Plattform sowohl online als auch offline möglich. Im Online-Betrieb können dabei jederzeit neue Inhalte verbreitet bzw. heruntergeladen werden, und die Möglichkeit zur Integration von umfangreichen Kommunikationsfunktionalitäten ist ebenfalls gegeben. Die Verwaltung von Benutzern und Zugriffsrechten ermöglicht sowohl die Personalisierung des Systems als auch die Festlegung von Berechtigungen für das Lesen, Anlegen und Verändern von im System enthaltenen Objekten. Die Software ist plattformunabhängig implementiert und kann bei Bedarf beliebig erweitert werden. Zu diesem Zweck wird sie im Rahmen einer Open-Source-Politik zur Verfügung gestellt. (Siehe hierzu die Homepage des Projektes Monist, http://www.monist.de, auf der ein Download des Monist-Systems und der E-Learning-Plattform möglich ist. Als Kontaktadresse und für Fragen steht die E-Mail-Adresse [email protected] zur Verfügung.) Die E-Learning-Plattform bietet die erforderlichen Basistechnologien für ein verteiltes E-Learning-System, ist jedoch für sich allein genommen noch kein derartiges System. Ohne die Integration der Lernsoftware sowie der fachlichen Inhalte würde sie nur eine leere Hülle darstellen, deren Funktionalität über die reine Datenverwaltung nicht hinaus ginge. Im Monist-System wurde eine konfigurierbare Simulationssoftware geschaffen, ein Editor für derartige Konfigurationen entwickelt und ein umfangreicher Grundstock an fachlichen Lerninhalten für das Gebiet der Neuro- und Kognitionswissenschaften angelegt. Durch das Zusammenwirken mit diesen drei Komponenten entsteht erst ein System, das den vollen Umfang der Funktionalitäten der E-Learning-Plattform nutzen kann und den beabsichtigten Einsatz in der universitären Lehre ermöglicht. Für eine weitergehende Nutzung der E-Learning-Plattform ist es daher erforderlich, für andere Fachbereiche die Entwicklung entsprechender Simulationsprogramme vorzunehmen, diese und eventuell bereits vorhandene Software ins System zu integrieren sowie eine kritische Masse an fachspezifischen Inhalten bereitzustellen. Damit das System von den Lernenden dauerhaft angenommen wird, empfiehlt sich darüber hinaus das regelmäßige Abhalten von Lehrveranstaltungen unter Verwendung der elektronischen Lehre sowie die fortgesetzte Erstellung neuer Inhalte. Dies erfordert beides einen gewissen Aufwand, wird aber auch beides durch die E-Learning-Plattform unterstützt

    Vom fortschrittlichen Prozess-Management-System zum intelligenten Enterprise-Content-Management-System

    Get PDF
    Das enorme Informationsaufkommen und die steigende Relevanz von Informationen, sowie das damit verbundene Wissen als Produktionsfaktor in heutigen Unternehmen verlangen nach einer effizienten Verwaltung von Inhalten. In den letzten Jahren ist mit Enterprise-Content-Management (ECM) ein neuer Begriff entstanden, hinter dem sich ein Konzept verbirgt, mit dem alle unstrukturiert vorhandenen Informationen, wie Texte, Bilder, Grafiken oder Dokumente unternehmensweit verwaltet werden. Dabei wird der gesamte Lebenszyklus von der Erfassung, Bearbeitung und Nutzung über die Speicherung und Archivierung hin zur lontrollierten Vernichtung berücksichtigt. Die unterschiedlichen Aspekte reichen dabei von der Nutzung der Informationen durch einzelne Benutzer über die gemeinsame Bearbeitung bis zur Einbindung in unternehmensweite Geschäftsprozesse, um alle Informationen zur richtigen Zeit den entsprechenden Bearbeitern zur Verfügung zu stellen. In dieser Arbeit wird das ECM-Konzept detailliert vorgestellt, um zu klären, welche Bereiche und Funktionen mit ECM adressiert werden. Da der Ansatz von ECM noch relativ jung ist, werden noch nicht alle Funktionen gleich gut von am Markt befindlichen Systemen unterstützt. Insbesondere ist die Prozessverwaltung häufig unausgereift. Um zu untersuchen, inwiefern dieser umfassende Ansatz von existierenden Systemen heutzutage realisiert wird, werden dazu einige verbreitete Dokumenten- und Content-Management-Systeme (DMS bzw. CMS) evaluiert
    corecore