31 research outputs found

    Overcoming Semantical Heterogeneity in Multiple Data Warehouse Systems

    Get PDF
    Der bedarfsorientierte Zugriff auf ein konsolidiertes Berichtswesen stellt für betriebliche Organisationen einen entscheidenden Erfolgsfaktor dar, um einen Informationsvorsprung gegenüber ihren Wettbewerbern erzielen zu können. Data-Warehouse-Systeme (DWH-Systeme) dienen dazu, Entscheidungsträgern die für ihre aktuelle Aufgabe relevanten Informationen rechtzeitig und in geeigneter Form zur Verfügung zu stellen. In der Praxis existieren jedoch multiple DWH-Systeme, die vor allem auf Ebene der Datenschemata sowie der zugrunde liegenden Terminologien eine starke Heterogenität aufweisen. Inkonsistenzen zwischen den generierten Berichten sowie eine divergente Interpretation der Berichtsergebnisse sind die Folge. Der Aufbau eines konsolidierten Berichtswesens ist daher nur mit nachträglichem, manuellem Abstimmungsaufwand möglich. Die vorliegende Arbeit widmet sich insbesondere dem durch multiple DWH-Systeme offerierten Informationsangebot. Mithilfe der im Semantic Web etablierten Technologie Resource Description Framework (RDF) und der Web Ontology Language (OWL) wird ein Rahmen zur semantisch reichhaltigen Beschreibung von DWH-Metadaten geschaffen. Derartig ausgezeichnete Metadaten unterschiedlicher DWH-Systeme werden anschließend in einer semantischen Homogenisierungsschicht (sHGS) zusammengeführt. Mit diesem Hilfsmittel können Beziehungen zwischen multiplen DWH-Systemen identifiziert und deren semantische Heterogenität überwunden werden.The demand-oriented access to consolidated reporting systems represents a critical success factor for operating organisations in order to achieve an informational advantage over their competitors. Data warehouse systems (DWH systems) provide decision-makers with information relevant to their current task in due time and form. In practice, however, a multitude of highly heterogeneous DWH systems exist which particularly vary in terms of applied data schemata and underlying terminologies. Inconsistencies between the generated reports of those systems as well as a diverging interpretation of the report results are therefore immediate consequences. As a result, the construction of a consolidated reporting system inevitably demands additional manual alignment effort. The thesis at hand is especially dedicated to information provided by multiple DWH systems. By means of the technologies of the Resource Description Framework (RDF) and the Web Ontology Language (OWL), which are established in the area of the semantic web, a framework is created to describe DWH metadata in a semantically comprehensive way. The metadata of different DWH systems marked in such a way are finally brought together in a semantic level of homogenisation (sHGS). With this tool, semantic relations between multiple DWH systems can be easily identified and their semantic heterogeneity can be overcome

    Semantic technologies for the domain specific and formal description of time series in databases

    Get PDF
    Messdaten werden zur effizienten Organisation und Weiterverarbeitung in relationalen Datenbanken gespeichert. Die in den letzten Jahren entstandenen Semantic Web Technologien bieten eine hervorragende Basis zur Wissensmodellierung und Beschreibung von Domäneninhalten in Form von Ontologien. Aufgrund der offenen Architektur dieses Ansatzes können leicht fremde Ontologien und Ressourcen mit eingebunden und berücksichtigt werden. Semantic Web Technologien stellen eine formale Modellierungsgrundlage dar. Mittels Reasoning kann deshalb aus Ontologien implizites Wissen abgeleitet werden. In dieser Arbeit werden semantische (Datenbank-) Annotationen und deren Interpretation fokussiert. Sie verknüpfen Datenbanken und das Semantic Web miteinander. Die Annotationen erlauben es, Inhalte von Datenbanken mit Semantic Web Technologien in verschiedenen Nutzungsszenarien zu beschreiben. Außerdem wird für die gemeinsame Behandlung und den Einsatz beider Technologien eine Architektur entwickelt. Auf dieser Basis werden Konzepte zur Visualisierung und Interaktion mit den Annotationen eingeführt. Weiterhin wird deren Einsatz zur formalen Modellierung von Ereignissen mittels Automaten betrachtet, sodass ein Reasoning zur Berechnung durchgeführt werden kann. Mittels einer Implementierung werden die eingeführten Konzepte demonstriert. Die Applikation Semantic Database Browser erlaubt die integrierte Verwendung von Messdaten und deren formaler Beschreibung. Modelle können ausgetauscht und wiederverwendet werden, sodass die Wiederverwendung von Wissen gefördert wird. Anhand des Beispiels von Ereignissen während Autofahrten wird demonstriert, wie auf Basis der formalen Beschreibung Schlussfolgerungen gezogen werden können. So können durch das Schlussfolgern ohne zusätzlichen Aufwand neue Erkenntnisse über auftretende Fahrmanöver generiert werden. Aufgrund des domänenunabhängigen Charakters der skizzierten Lösungsansätze wird gezeigt, dass diese sich leicht auf andere Anwendungsfälle anwenden lassen.Measurement data in form of time series of scientific experiments is stored in relational databases for efficient processing. Complementary, Semantic Web technologies have been developed in the last years for describing domain knowledge in form of ontologies. Due to their open architecture, foreign ontologies and resources can be easily referenced and integrated. Since Semantic Web technologies are based on predicate logic, they are suitable for formal modeling. Therefore, using reasoning implicit knowledge can be derived from ontologies. This work introduces semantic (database) annotations to link databases and ontologies to take advantage of both together by describing database contents with Semantic Web technologies. An architecture is developed for the combined handling and usage of these two technologies, which is designed in respect of scalability of large amounts of measurement data. Based on this architecture, concepts for visualizing and interacting with annotations are introduced. Furthermore, semantic annotations are used for formally modeling events in time series using finite state machines, which are computed using reasoning. An implementation is introduced to demonstrate the feasibility and advantages of the discussed concepts. The presented application Semantic Database Browser allows using semantic database annotations and interactively working with them for integrated handling of formally described measurement data. Formal models can be easily exchanged and reused to support reusability of knowledge and cooperation. By describing measurement data with models, data becomes much easier to understand. Using an example of events during driving, it is demonstrated how formal description can be used for automatic reasoning to generate additional knowledge about driving maneuvers without any additional effort. Because the presented approaches are domain independent, they can be easily adapted for other use cases

    ISLE: Konzeption und Realisierung eines verteilten XML-basierten Informationssystems

    Get PDF
    Die rasante Entwicklung von XML (eXtensible Markup Language) als neue Web-Sprache eröffnet weitreichende Möglichkeiten zur flexiblen Realisierung von verteilten Informationssystemen. Diese Diplomarbeit beschreibt den grundlegenden Aufbau und die Erfahrungen, die bei der Entwicklung eines universitären Informationssystems auf der Basis von XML gesammelt wurden. Das Resource Description Framework (RDF) wurde dabei als konzeptuelle Grundlage zur Datenmodellierung eingesetzt. Zur Manipulation von XML-Dokumenten wurde eine CORBA-basierte Schnittstelle verwendet. Durch eine zur Zeit noch kaum in der Praxis eingesetzte Technologie-Kombination konnten viele Schwierigkeiten heutiger Informationssysteme mit vergleichsweise geringem Aufwand umgangen werden. Das Datenmodell wird durch eine XML-basierte Speicherungsorganisation realisiert. Die Daten werden transparent im WWW verteilt, der Zugriff darauf erfolgt mittels des HTTP-Protokolls. Dadurch daß die in XML semantisch ausgezeichneten Informationsobjekte maschinell verarbeitet werden können, lassen sich aus dieser verteilten Datenstruktur alle benötigten Informationen extrahieren und für eine detaillierte Recherche aufbereiten. Weiterhin verfügen die Daten über einen hohen Grad der Wiederverwendbarkeit und lassen sich beispielsweise zur automatischen Generierung von Dokumenten und zur Archivierung in einer digitalen Bibliothek einsetzen. Für die Präsentation der Informationen ist ein Java-Modul zuständig, das die Interpretation und Formatierung der XML-Daten direkt vom Client-Rechner aus, entsprechend den benutzerspezifischen Präferenzen, ermöglicht, die ebenfalls in Form einer XML-Datei im lokalen Dateisystem des Nutzers gespeichert werden können. Durch die Verlagerung der Datenmanipulierung auf den Client wird die Server-Last minimiert. Ein ebenfalls in Java realisierter Server für XML-Dokumente ermöglicht die Client-basierte Bearbeitung von Dokumenten über eine CORBA-Schnittstelle. Mehrere Benutzer mit unterschiedlichen Zugriffsrechten können somit gemeinsam XML-Dokumente durch ein Web-Browser-Interface editieren. Die Diplomarbeit geht darauf ein, welche Vorteile und Probleme die Verwendung von XML und der verteilten Architektur aufgeworfen hat, und stellt die grundlegenden Prinzipien und Techniken vor, die dabei eingesetzt wurden

    Erschließung domänenübergreifender Informationsräume mit Multimodellen

    Get PDF
    Mit dem Übergang von bauwerksorientierter zu prozessorientierter Arbeitsweise erlangt die domänenübergreifende Bereitstellung von Informationen wachsende Bedeutung. Das betrifft bspw. die Erstellung von Controlling-Kennwerten, die Vorbereitung von Simulationen oder die Betrachtung neuer Aspekte wie Energieeffizienz. Aktuelle Datenformate und Erschließungsmethoden können diese Herausforderung jedoch nicht befriedigend bewältigen. Daher bedarf es einer Methode, welche interdisziplinäre Bauinformationsprozesse uneingeschränkt ermöglicht. Vorhandene Kommunikationsprozesse und Fachanwendungen sollen dabei beibehalten und weitergenutzt werden können. Mit der Multimodell-Methode wird ein Lösungsansatz für die strukturellen Probleme interdisziplinärer Bauinformationsprozesse vorgestellt. Multimodelle bündeln heterogene Fachmodelle unterschiedlicher Domänen und erlauben die Verbindung ihrer Elemente in externen, ID-basierten Linkmodellen. Da die Fachmodelle unberührt bleiben, wird auf diesem Weg eine lose und temporäre Kopplung ermöglicht. Durch den Verzicht auf ein führendes oder integrierendes Datenschema werden keine Transformationsprozesse benötigt, können etablierte und heute übliche Datenformate weitergenutzt und die verlinkten Fachmodelle neutral ausgetauscht werden. Die in Multimodellen verknüpften Daten bieten einen informationellen Mehrwert gegenüber alleinstehenden Fachmodellen. Zusammengehörende Informationen können über die persistenten Links automatisch ausgewertet werden, anstelle manuell vom Menschen immer wieder flüchtig neu zugeordnet werden zu müssen. Somit erscheint ein Multimodell gegenüber einem Benutzer wie ein einziger abgeschlossener Informationsraum. Um solche datenmodell-, datenformat- und domänenübergreifenden Informationsräume komfortabel erstellen und filtern zu können, wird die deklarative Multimodell-Abfragesprache MMQL eingeführt. Diese erlaubt einen generischen Zugriff auf die Originaldaten und bildet die Kernkonzepte der Multimodell-Erschließung - mehrwertige Linkerzeugung und strukturelle Linksemantik - ab. Ein zugehöriger Interpreter ermittelt den Lösungsweg für konkrete Anweisungen und führt diesen auf realen Daten aus. Die Umsetzung und Bereitstellung der Konzepte als IT-Komponenten auf verschiedenen Ebenen - von der Datenstruktur über Bibliotheken und Services bis hin zur alleinstehenden, universellen Multimodell-Software M2A2 - erlaubt die sofortige und direkte Anwendung der Multimodell-Methode in der Praxis.:1. Einleitung 1 1.1. Motivation 1 1.2. Ausgangspunkt 2 1.3. Zielsetzung 3 1.4. Lösungsansatz 5 1.5. Aufbau der Arbeit 7 2. Informationsräume im Bauwesen 9 2.1. Grundlagen der Datenmodelle 10 2.2. Baufachmodelle 17 2.3. Domänenübergreifende Bauinformationsräume 25 2.4. Resümee 39 3. Das Multimodellkonzept 41 3.1. Das Multimodell-Paradigma 42 3.2. Multimodellbasierte Arbeitsweise 48 3.3. Prinzip und Aufbau von Multimodellen 55 3.4. Anwendbare Fachmodelle 67 3.5. Multimodell-Spezialisierung 72 3.6. Multimodell-Operationen 78 3.7. Resümee 81 4. Die Multimodell-Abfragesprache MMQL 83 4.1. Konzeption 84 4.2. Zugriff auf Originaldaten 90 4.3. Multimodell-Filtern 102 4.4. Linkmanipulation 118 4.5. Resümee 124 5. Interpretation von MMQL-Anweisungen 127 5.1. Grundlagen der Ausführung der Sprache 128 5.2. Ermittlung von Multimodell-Views 134 5.3. Links erstellen 148 5.4. Links löschen 153 5.5. Diskussion und Resümee 153 6. Implementierung und Anwendung 159 6.1. Universelle Multimodell-Software M2A2 160 6.2. Multimodell-Spezialisierung für das Bauprojektmanagement 165 6.3. Multimodellbasierte Ermittlung von Zahlungsplänen 167 6.4. Bewertung und Resümee 174 7. Fazit 177 7.1. Zusammenfassung 177 7.2. Ergebnisdiskussion 178 7.3. Ausblick 183 A. Datenmodelle und Spezifikationen 185 A.1. Das Generische Multimodell 185 A.2. Fachmodell Dokumentencontainer 187 A.3. MMQL: Formale Sprachbeschreibung 188 B. Elementarmodell-Vokabulare 191 B.1. Domain 191 B.2. Phase 192 B.3. Level of Detail 196 B.4. Status 196 C. Implementierungsdetails 197 C.1. Liste der in M2A2 implementierten Baufachmodelle 197 C.2. Implementierte Erweiterungen der M2A2-Plattform 198 C.3. XML-Schema des Mefisto-Multimodell-Containers 199 Literaturverzeichnis 201With the transition of building-oriented to process-oriented work, the provision of cross-domain information gained growing importance - for example in the creation of controlling parameters, the preparation of simulations or when considering new aspects such as energy efficiency. However, current data formats and access methods cannot cope with this challenge satisfactory. Therefore, a method is required, that enables interdisciplinary construction information processes fully. Thereby existing communication processes and domain applications have to be retained and continued to be used as possible. With the multi-model method, an approach to structural problems of such interdisciplinary construction information processes is presented. Multi-models combine heterogeneous models of different domains and allow the connection of their elements in external ID-based link models. As the domain models remain unaffected, a loose and temporary coupling is possible in this way. By not using a leading or integrating data schema, no transformation processes are required, common established data formats can be retained and the linked domain models can be exchanged neutrally. The linked data in multi-models offer an additional value of information over single domain models. Information belonging together can be automatically evaluated by the persistent links - instead of being repeatedly reassigned by people in a volatile way. Thus, a multi-model appears to a user as a single self-contained information space. In order to create and filter such cross-format and cross-domain information spaces comfortably, the declarative multi-model query language MMQL is introduced. It allows for generic access to the original data and integrates the core concepts of the multi-model development - n-ary link generation and structural link semantics. An associated interpreter determines the approach for specific instructions and executes it on real data. The implementation and deployment of the concepts as IT components at various levels - from the data structure via libraries and services, to the universal multi-model software M2A2 - allows an immediate and direct application of the multi-model method in practice.:1. Einleitung 1 1.1. Motivation 1 1.2. Ausgangspunkt 2 1.3. Zielsetzung 3 1.4. Lösungsansatz 5 1.5. Aufbau der Arbeit 7 2. Informationsräume im Bauwesen 9 2.1. Grundlagen der Datenmodelle 10 2.2. Baufachmodelle 17 2.3. Domänenübergreifende Bauinformationsräume 25 2.4. Resümee 39 3. Das Multimodellkonzept 41 3.1. Das Multimodell-Paradigma 42 3.2. Multimodellbasierte Arbeitsweise 48 3.3. Prinzip und Aufbau von Multimodellen 55 3.4. Anwendbare Fachmodelle 67 3.5. Multimodell-Spezialisierung 72 3.6. Multimodell-Operationen 78 3.7. Resümee 81 4. Die Multimodell-Abfragesprache MMQL 83 4.1. Konzeption 84 4.2. Zugriff auf Originaldaten 90 4.3. Multimodell-Filtern 102 4.4. Linkmanipulation 118 4.5. Resümee 124 5. Interpretation von MMQL-Anweisungen 127 5.1. Grundlagen der Ausführung der Sprache 128 5.2. Ermittlung von Multimodell-Views 134 5.3. Links erstellen 148 5.4. Links löschen 153 5.5. Diskussion und Resümee 153 6. Implementierung und Anwendung 159 6.1. Universelle Multimodell-Software M2A2 160 6.2. Multimodell-Spezialisierung für das Bauprojektmanagement 165 6.3. Multimodellbasierte Ermittlung von Zahlungsplänen 167 6.4. Bewertung und Resümee 174 7. Fazit 177 7.1. Zusammenfassung 177 7.2. Ergebnisdiskussion 178 7.3. Ausblick 183 A. Datenmodelle und Spezifikationen 185 A.1. Das Generische Multimodell 185 A.2. Fachmodell Dokumentencontainer 187 A.3. MMQL: Formale Sprachbeschreibung 188 B. Elementarmodell-Vokabulare 191 B.1. Domain 191 B.2. Phase 192 B.3. Level of Detail 196 B.4. Status 196 C. Implementierungsdetails 197 C.1. Liste der in M2A2 implementierten Baufachmodelle 197 C.2. Implementierte Erweiterungen der M2A2-Plattform 198 C.3. XML-Schema des Mefisto-Multimodell-Containers 199 Literaturverzeichnis 20

    Digital Intelligence – Möglichkeiten und Umsetzung einer informatikgestützten Frühaufklärung: Digital Intelligence – opportunities and implementation of a data-driven foresight

    Get PDF
    Das Ziel der Digital Intelligence bzw. datengetriebenen Strategischen Frühaufklärung ist, die Zukunftsgestaltung auf Basis valider und fundierter digitaler Information mit vergleichsweise geringem Aufwand und enormer Zeit- und Kostenersparnis zu unterstützen. Hilfe bieten innovative Technologien der (halb)automatischen Sprach- und Datenverarbeitung wie z. B. das Information Retrieval, das (Temporal) Data, Text und Web Mining, die Informationsvisualisierung, konzeptuelle Strukturen sowie die Informetrie. Sie ermöglichen, Schlüsselthemen und latente Zusammenhänge aus einer nicht überschaubaren, verteilten und inhomogenen Datenmenge wie z. B. Patenten, wissenschaftlichen Publikationen, Pressedokumenten oder Webinhalten rechzeitig zu erkennen und schnell und zielgerichtet bereitzustellen. Die Digital Intelligence macht somit intuitiv erahnte Muster und Entwicklungen explizit und messbar. Die vorliegende Forschungsarbeit soll zum einen die Möglichkeiten der Informatik zur datengetriebenen Frühaufklärung aufzeigen und zum zweiten diese im pragmatischen Kontext umsetzen. Ihren Ausgangspunkt findet sie in der Einführung in die Disziplin der Strategischen Frühaufklärung und ihren datengetriebenen Zweig – die Digital Intelligence. Diskutiert und klassifiziert werden die theoretischen und insbesondere informatikbezogenen Grundlagen der Frühaufklärung – vor allem die Möglichkeiten der zeitorientierten Datenexploration. Konzipiert und entwickelt werden verschiedene Methoden und Software-Werkzeuge, die die zeitorientierte Exploration insbesondere unstrukturierter Textdaten (Temporal Text Mining) unterstützen. Dabei werden nur Verfahren in Betracht gezogen, die sich im Kontext einer großen Institution und den spezifischen Anforderungen der Strategischen Frühaufklärung pragmatisch nutzen lassen. Hervorzuheben sind eine Plattform zur kollektiven Suche sowie ein innovatives Verfahren zur Identifikation schwacher Signale. Vorgestellt und diskutiert wird eine Dienstleistung der Digital Intelligence, die auf dieser Basis in einem globalen technologieorientierten Konzern erfolgreich umgesetzt wurde und eine systematische Wettbewerbs-, Markt- und Technologie-Analyse auf Basis digitaler Spuren des Menschen ermöglicht.:Kurzzusammenfassung 2 Danksagung 3 Inhaltsverzeichnis 5 Tabellenverzeichnis 9 Abbildungsverzeichnis 10 A – EINLEITUNG 13 1 Hintergrund und Motivation 13 2 Beitrag und Aufbau der Arbeit 16 B – THEORIE 20 B0 – Digital Intelligence 20 3 Herleitung und Definition der Digital Intelligence 21 4 Abgrenzung zur Business Intelligence 23 5 Übersicht über unterschiedliche Textsorten 24 6 Informetrie: Bibliometrie, Szientometrie, Webometrie 29 7 Informationssysteme im Kontext der Digital Intelligence 31 B1 – Betriebswirtschaftliche Grundlagen der Digital Intelligence 36 8 Strategische Frühaufklärung 37 8.1 Facetten und historische Entwicklung 37 8.2 Methoden 41 8.3 Prozess 42 8.4 Bestimmung wiederkehrender Termini 44 8.5 Grundlagen der Innovations- und Diffusionsforschung 49 B2 – Informatik-Grundlagen der Digital Intelligence 57 9 Von Zeit, Daten, Text, Metadaten zu multidimensionalen zeitorientierten (Text)Daten 59 9.1 Zeit – eine Begriffsbestimmung 59 9.1.1 Zeitliche Grundelemente und Operatoren 59 9.1.2 Lineare, zyklische und verzweigte Entwicklungen 62 9.1.3 Zeitliche (Un)Bestimmtheit 62 9.1.4 Zeitliche Granularität 63 9.2 Text 63 9.2.1 Der Text und seine sprachlich-textuellen Ebenen 63 9.2.2 Von Signalen und Daten zu Information und Wissen 65 9.3 Daten 65 9.3.1 Herkunft 65 9.3.2 Datengröße 66 9.3.3 Datentyp und Wertebereich 66 9.3.4 Datenstruktur 67 9.3.5 Dimensionalität 68 9.4 Metadaten 69 9.5 Zusammenfassung und multidimensionale zeitorientierte Daten 70 10 Zeitorientierte Datenexplorationsmethoden 73 10.1 Zeitorientierte Datenbankabfragen und OLAP 76 10.2 Zeitorientiertes Information Retrieval 78 10.3 Data Mining und Temporal Data Mining 79 10.3.1 Repräsentationen zeitorientierter Daten 81 10.3.2 Aufgaben des Temporal Data Mining 86 10.4 Text Mining und Temporal Text Mining 91 10.4.1 Grundlagen des Text Mining 98 10.4.2 Entwickelte, genutzte und lizensierte Anwendungen des Text Mining 107 10.4.3 Formen des Temporal Text Mining 110 10.4.3.1 Entdeckung kausaler und zeitorientierter Regeln 110 10.4.3.2 Identifikation von Abweichungen und Volatilität 111 10.4.3.3 Identifikation und zeitorientierte Organisation von Themen 112 10.4.3.4 Zeitorientierte Analyse auf Basis konzeptueller Strukturen 116 10.4.3.5 Zeitorientierte Analyse von Frequenz, Vernetzung und Hierarchien 117 10.4.3.6 Halbautomatische Identifikation von Trends 121 10.4.3.7 Umgang mit dynamisch aktualisierten Daten 123 10.5 Web Mining und Temporal Web Mining 124 10.5.1 Web Content Mining 125 10.5.2 Web Structure Mining 126 10.5.3 Web Usage Mining 127 10.5.4 Temporal Web Mining 127 10.6 Informationsvisualisierung 128 10.6.1 Visualisierungstechniken 130 10.6.1.1 Visualisierungstechniken nach Datentypen 130 10.6.1.2 Visualisierungstechniken nach Darstellungsart 132 10.6.1.3 Visualisierungstechniken nach Art der Interaktion 137 10.6.1.4 Visualisierungstechniken nach Art der visuellen Aufgabe 139 10.6.1.5 Visualisierungstechniken nach Visualisierungsprozess 139 10.6.2 Zeitorientierte Visualisierungstechniken 140 10.6.2.1 Statische Repräsentationen 141 10.6.2.2 Dynamische Repräsentationen 145 10.6.2.3 Ereignisbasierte Repräsentationen 147 10.7 Zusammenfassung 152 11 Konzeptuelle Strukturen 154 12 Synopsis für die zeitorientierte Datenexploration 163 C – UMSETZUNG EINES DIGITAL-INTELLIGENCESYSTEMS 166 13 Bestimmung textbasierter Indikatoren 167 14 Anforderungen an ein Digital-Intelligence-System 171 15 Beschreibung der Umsetzung eines Digital-Intelligence-Systems 174 15.1 Konzept einer Dienstleistung der Digital Intelligence 175 15.1.1 Portalnutzung 177 15.1.2 Steckbriefe 178 15.1.3 Tiefenanalysen 180 15.1.4 Technologiescanning 185 15.2 Relevante Daten für die Digital Intelligence (Beispiel) 187 15.3 Frühaufklärungs-Plattform 188 15.4 WCTAnalyze und automatische Extraktion themenspezifischer Ereignisse 197 15.5 SemanticTalk 200 15.6 Halbautomatische Identifikation von Trends 204 15.6.1 Zeitreihenkorrelation 205 15.6.2 HD-SOM-Scanning 207 D – ZUSAMMENFASSUNG 217 Anhang A: Prozessbilder entwickelter Anwendungen des (Temporal) Text Mining 223 Anhang B: Synopsis der zeitorientierten Datenexploration 230 Literaturverzeichnis 231 Selbstständigkeitserklärung 285 Wissenschaftlicher Werdegang des Autors 286 Veröffentlichungen 28

    Integration heterogener Produktdaten in verteilten, komplexen Entwicklungsprozessen

    Get PDF
    Moderne Produkte, wie etwa Automobile oder Maschinen, werden infolge der zunehmenden Digitalisierung komplexer. Neben mechanischen Bauteilen umfassen sie zahlreiche mechatronische,elektronische und elektrische Bauteile. Um unterschiedliche Kundenbedürfnisse, länderspezifische Charakteristika oder gesetzliche Anforderungen bedienen zu können, muss für diese Produkte eine hohe Variabilität ermöglicht werden. Die Produktentwicklung erfolgt üblicherweise system- und komponentenorientiert und wird mit Methoden des Concurrent Engineering realisiert. Unterschiedliche Anforderungen und Aufgaben der Produktentwickler führen zu einer autonomen, heterogenen IT-Systemlandschaft, die sowohl aus etablierten Informationssystemen, etwa Produktdatenmanagement-Systemen, aber auch aus fachbereichsspezifischen Lösungen besteht. Während zwischen den etablierten Informationssystemen häufig Austauschschnittstellen existieren, erfolgt der Abgleich von Produktdaten aus diesen Systemen mit fachbereichsspezifischen Lösungen häufig manuell oder gar nicht. Zusätzlich ist die IT-Systemlandschaft der Produktentwicklung einem ständigem Wandel unterworfen, so dass Austauschschnittstellen kontinuierlich angepasst und erweitert werden müssen. Während die unabhängige Entwicklung von Systemen und Komponenten die Entwicklungszeit reduziert, wird es zu verschiedenen Zeitpunkten während der Produktentwicklung notwendig,die autonomen, heterogenen Produktdaten zu synchronisieren. Fehlerhafte und inkonsistente Produktdaten in späten Entwicklungsphasen führen zu erheblichen Kosten, so dass die Kontrolle der Vollständigkeit und Konsistenz von Produktdaten möglichst früh sichergestellt werden sollte, um eine hohe Produktqualität zu gewährleisten. Gegenstand dieser Arbeit ist das PROactive Consistency for E/E product Data management(PROCEED)-Framework, das die Integration autonomer, heterogener Produktdaten ermöglicht. PROCEED unterstützt den gesamten Lebenszyklus der Integration von Produktdaten, beginnend mit der initialen Integration, über die Steuerung und Überwachung des Integrationsprozesses sowie die Unterstützung von Schema- und Datenänderungen. Um die strukturelle Heterogenität von Produktdaten zu überwinden, werden Informationssysteme in sog. Produktontologien abstrahiert. Die Produktontologien werden anschließend mit Hilfe von Abbildungsregeln und -aktionen in eine gemeinsame Sicht überführt. Auf Basis dieses Modells werden Qualitätsmetriken der Integration, wie z.B. die Konsistenz und Vollständigkeit definiert. Zusätzlich wird das dynamische Verhalten bei Änderungen von Schema und Daten der Produktontologien erläutert. Schließlich wir das PROCEED-Rahmenwerk prototypisch realisiert und in einer Fallstudie angewandt

    Nutzung semantischer Informationen aus OSM zur Beschreibung des Nichtwohnnutzungsanteils in Gebäudebeständen

    Get PDF
    Im Bereich der städtebasierten siedlungsstrukturellen Analysen spielen Gebäudedaten mit Informationen zur Gebäudenutzung und dem Gebäudetyp eine wichtige Rolle. Auf diesen Daten basiert die Modellierung von demografischen und sozioökonomischen Kenngrößen, welche bei Aufgaben der Siedlungsentwicklung oder in der Infrastrukturplanung zum Einsatz kommen. Vonseiten der amtlichen Vermessungsanstalten stehen kleinräumige und flächendeckende Daten zur Gebäudenutzung nur in begrenztem Umfang zur Verfügung. Eine darauf aufbauende Bevölkerungsabschätzung ist aus diesem Grund nur eingeschränkt möglich. Das Ziel dieser Arbeit war es, die Integration von nutzergenerierten Geodaten aus dem OpenStreetMap (OSM) Projekt für den Einsatz zur Abschätzung gebäudebasierter Bevölkerungs- und Wohnungszahlen zu untersuchen. Der Fokus liegt dabei besonders auf der Abgrenzung von Wohn- und Nichtwohnnutzung innerhalb von Gebäuden. Diese Informationen sind in den amtlichen Geobasisdaten nicht zu finden, können jedoch aus OSM Punkt- und Polygondaten extrahiert werden. Hauptgegenstand der Untersuchung ist die Entwicklung eines Modells zur Integration der Nichtwohnnutzungsinformationen aus OSM, welches Gewerbeinformationen anhand der OSM-Tags analysiert. Dazu war neben einer geeigneten Typologie, die Festlegung von Regeln zur Verarbeitung mehrerer Gewerbe in einem amtlichen Gebäude notwendig. Über räumliche Verschneidungen der Datensätze erfolgt die eigentliche Datenintegration. Zur Umsetzung des Modells wurden drei Python-Skripte erarbeitet, welche alle notwendigen Vorverarbeitungsschritte und anschließenden Modellberechnungen automatisiert durchführen. Zusätzlich zur Bestimmung des Nichtwohnnutzungsanteiles in den Gebäuden, fand eine Wohnung- und Bevölkerungsabschätzung mittels gebäudetypischer Kenngrößen auf Gebäudebasis statt. Mittels der Abschätzungsergebnisse ohne und mit OSM-Gewerbeinformationen, konnte eine Bewertung dieser Methode erfolgen. Eine Beurteilung der Qualität des Modells im Vergleich zur Realität benötigt geeignete Validierungsdaten. Diese wurden in Form von baublockbezogenen statistischen Einwohner- und Wohnungszahlen von der Stadt Dresden bereitgestellt und zur Ergebnisdiskussion herangezogen. Regionale Unterschiede konnten anhand von Übersichts- und Detailkarten sowie statistischen Analysen herausgearbeitet werden.:Inhaltsverzeichnis ............................................................................. I Abkürzungsverzeichnis ..................................................................... V Abbildungsverzeichnis ...................................................................... VII Tabellenverzeichnis .......................................................................... IX 1 Einleitung ...................................................................................... 11 1.1 Motivation ................................................................................... 11 1.2 Zielstellung und Aufbau der Arbeit ............................................. 12 2 Theoretische und praktische Grundlagen ...................................... 15 2.1 Räumliche Modellierung der Siedlungsstruktur ........................... 15 2.1.1 Siedlungsstrukturelle Begriffe ................................................. 15 2.1.2 Räumliche Daten ..................................................................... 18 2.2 Semantische Integration ............................................................ 23 2.2.1 Interoperabilität ...................................................................... 24 2.2.2 Datenintegration ..................................................................... 25 2.3 Semantik in Geodaten ................................................................ 28 2.3.1 Attributierung in OpenStreetMap ............................................. 28 2.3.2 Nutzungsinformationen in amtlichen Geobasisdaten ............... 31 3 Modellierung sozioökonomischer Kenngrößen ............................... 33 3.1 Bedarf an kleinräumigen Nutzungsinformationen ....................... 33 3.2 Modellierungsansätze ................................................................. 35 3.2.1 Ableitung sozioökonomischer Daten aus der Fernerkundung .. 35 3.2.2 Modellierung mit Hilfe von Geobasisdaten ............................... 36 3.3 Vorteile und Mängel der vorgestellten Ansätze .......................... 40 3.4 Möglichkeiten von OSM zur Verbesserung der Modellierung ....... 42 4 Methodik ........................................................................................ 43 4.1 Herangehensweise ..................................................................... 43 4.2 Flächen- und Gebäudenutzungen in amtlichen und OSM-Daten .. 44 4.2.1 Typologie der Flächen- und Gebäudenutzung .......................... 44 4.2.2 Typologie der Flächenbeanspruchung von Gewerben .............. 47 4.3 Modell zur Abschätzung des Nichtwohnnutzungsanteils ............. 50 4.3.1 Gebäudetypische Kenngrößen ................................................. 51 4.3.2 Vorgehensweise ...................................................................... 52 5 Daten ............................................................................................. 55 5.1 Untersuchungsgebiet .................................................................. 55 5.2 OpenStreetMap ........................................................................... 56 5.3 Amtliche Geobasisdaten .............................................................. 57 6 Praktische Umsetzung .................................................................... 59 6.1 Datenmanagement ...................................................................... 59 6.1.1 Eingesetzte Software ............................................................... 59 6.1.2 OSM-Import .............................................................................. 60 6.1.3 Datenorganisation ................................................................... 64 6.2 Praktische Umsetzung des Modell zur Abschätzung des Nichtwohnnutzungsanteils ................................................................ 65 6.2.1 Vorverarbeitung ....................................................................... 65 6.2.2 Modellberechnungen und Bevölkerungsabschätzung .............. 74 6.3 Validierung des Modells .............................................................. 79 6.3.1 Validierungsdaten .................................................................... 79 6.3.2 Durchführung ........................................................................... 80 7 Ergebnisse ..................................................................................... 83 7.1 Untersuchung zur Vollständigkeit der semantischen Informationen anhand der Gewerbe POI .......................................................................................................... 83 7.1.1 Datengrundlagen ..................................................................... 84 7.1.2 Gewerbevergleich durch zufällige Straßenwahl ........................ 84 7.1.3 Gezielter Gewerbevergleich durch Ortsbegehung .................... 86 7.2 Charakterisierung des Ergebnisdatensatzes .............................. 88 7.3 Validierung .................................................................................. 91 7.4 Ergebnisvisualisierung ................................................................ 93 8 Ergebnisdiskussion ........................................................................ 97 8.1 Kleinräumige Betrachtung ........................................................... 97 8.2 Dateninkonsistenz ...................................................................... 101 8.3 Methodische Schwächen und Stärken ........................................ 103 8.4 Weitere Analysemöglichkeiten .................................................... 104 9 Zusammenfassung ........................................................................ 105 9.1 Fazit ........................................................................................... 105 9.2 Ausblick ...................................................................................... 106 Literaturverzeichnis .......................................................................... 109 A Anhang .......................................................................................... 115 Anhang 1: IÖR Flächenschema ......................................................... 115 Anhang 2: Flächen- und Gebäudenutzungstypologie........................ 116 Anhang 3: Klassifikationsschema nach (Burckhardt, 2012) .............. 118 Anhang 4: Skript-Auszug 1 - Datenverarbeitung in der OSM-Punktdatei ................................................................................ 120 Anhang 5: Skript-Auszug 2 - Die Funktion „calculateGWTotal“ .......... 121 Anhang 6: Karten - Untersuchungsgebiet Dresden in 1:100.000 ..... 122 Anhang 7: CD-Inhalt ......................................................................... 122Building data with information of building uses and building types play an important role for city-based settlement structure analyses. The estimation of demographic and socio-economic parameters is based on this data. They were used in the field of settlement development or in infrastructure planning. The availability of area-wide and small-scale data of building uses from surveying authorities is limited. For this reason, the estimation of population based on this data cannot be realised sufficiently. Therefore, it was the aim of this research paper to analyse the integration of user-generated geodata from OpenStreetMap (OSM)-project for estimating building-based population and housing units. The research focuses on the separation of residential and non-residential usage within buildings. Not being detected in official geodatasets, the information can be retrieved from OSM-point and polygondata. The development of a model for the integration of non-residential information from OSM is the main subject of this research. It contains the analyses of commercial information out of the OSM Tags. Besides an appropriate typology specifications are necessary to process multiple businesses within one official building. The actual data integration occurs with the help of spatial intersections between the datasets. The implementation of the model is based on three Python-scripts, executing all pre-processing and following calculation steps automatically. In addition to the identification of non-residential building-parts, an estimation of population and housing units per building, based on typical building parameters took place. By means of the estimation results with and without OSM-information it was possible to valuate this method. Validation data is necessary to measure the quality of the model in comparison to reality. This datasets was provided by the City of Dresden, consisting of statistical population and building unit numbers based on building blocks, and used for the discussion of the results. To describe regional differences, maps with overview and detailed scales as well as statistical schemata where used.:Inhaltsverzeichnis ............................................................................. I Abkürzungsverzeichnis ..................................................................... V Abbildungsverzeichnis ...................................................................... VII Tabellenverzeichnis .......................................................................... IX 1 Einleitung ...................................................................................... 11 1.1 Motivation ................................................................................... 11 1.2 Zielstellung und Aufbau der Arbeit ............................................. 12 2 Theoretische und praktische Grundlagen ...................................... 15 2.1 Räumliche Modellierung der Siedlungsstruktur ........................... 15 2.1.1 Siedlungsstrukturelle Begriffe ................................................. 15 2.1.2 Räumliche Daten ..................................................................... 18 2.2 Semantische Integration ............................................................ 23 2.2.1 Interoperabilität ...................................................................... 24 2.2.2 Datenintegration ..................................................................... 25 2.3 Semantik in Geodaten ................................................................ 28 2.3.1 Attributierung in OpenStreetMap ............................................. 28 2.3.2 Nutzungsinformationen in amtlichen Geobasisdaten ............... 31 3 Modellierung sozioökonomischer Kenngrößen ............................... 33 3.1 Bedarf an kleinräumigen Nutzungsinformationen ....................... 33 3.2 Modellierungsansätze ................................................................. 35 3.2.1 Ableitung sozioökonomischer Daten aus der Fernerkundung .. 35 3.2.2 Modellierung mit Hilfe von Geobasisdaten ............................... 36 3.3 Vorteile und Mängel der vorgestellten Ansätze .......................... 40 3.4 Möglichkeiten von OSM zur Verbesserung der Modellierung ....... 42 4 Methodik ........................................................................................ 43 4.1 Herangehensweise ..................................................................... 43 4.2 Flächen- und Gebäudenutzungen in amtlichen und OSM-Daten .. 44 4.2.1 Typologie der Flächen- und Gebäudenutzung .......................... 44 4.2.2 Typologie der Flächenbeanspruchung von Gewerben .............. 47 4.3 Modell zur Abschätzung des Nichtwohnnutzungsanteils ............. 50 4.3.1 Gebäudetypische Kenngrößen ................................................. 51 4.3.2 Vorgehensweise ...................................................................... 52 5 Daten ............................................................................................. 55 5.1 Untersuchungsgebiet .................................................................. 55 5.2 OpenStreetMap ........................................................................... 56 5.3 Amtliche Geobasisdaten .............................................................. 57 6 Praktische Umsetzung .................................................................... 59 6.1 Datenmanagement ...................................................................... 59 6.1.1 Eingesetzte Software ............................................................... 59 6.1.2 OSM-Import .............................................................................. 60 6.1.3 Datenorganisation ................................................................... 64 6.2 Praktische Umsetzung des Modell zur Abschätzung des Nichtwohnnutzungsanteils ................................................................ 65 6.2.1 Vorverarbeitung ....................................................................... 65 6.2.2 Modellberechnungen und Bevölkerungsabschätzung .............. 74 6.3 Validierung des Modells .............................................................. 79 6.3.1 Validierungsdaten .................................................................... 79 6.3.2 Durchführung ........................................................................... 80 7 Ergebnisse ..................................................................................... 83 7.1 Untersuchung zur Vollständigkeit der semantischen Informationen anhand der Gewerbe POI .......................................................................................................... 83 7.1.1 Datengrundlagen ..................................................................... 84 7.1.2 Gewerbevergleich durch zufällige Straßenwahl ........................ 84 7.1.3 Gezielter Gewerbevergleich durch Ortsbegehung .................... 86 7.2 Charakterisierung des Ergebnisdatensatzes .............................. 88 7.3 Validierung .................................................................................. 91 7.4 Ergebnisvisualisierung ................................................................ 93 8 Ergebnisdiskussion ........................................................................ 97 8.1 Kleinräumige Betrachtung ........................................................... 97 8.2 Dateninkonsistenz ...................................................................... 101 8.3 Methodische Schwächen und Stärken ........................................ 103 8.4 Weitere Analysemöglichkeiten .................................................... 104 9 Zusammenfassung ........................................................................ 105 9.1 Fazit ........................................................................................... 105 9.2 Ausblick ...................................................................................... 106 Literaturverzeichnis .......................................................................... 109 A Anhang .......................................................................................... 115 Anhang 1: IÖR Flächenschema ......................................................... 115 Anhang 2: Flächen- und Gebäudenutzungstypologie........................ 116 Anhang 3: Klassifikationsschema nach (Burckhardt, 2012) .............. 118 Anhang 4: Skript-Auszug 1 - Datenverarbeitung in der OSM-Punktdatei ................................................................................ 120 Anhang 5: Skript-Auszug 2 - Die Funktion „calculateGWTotal“ .......... 121 Anhang 6: Karten - Untersuchungsgebiet Dresden in 1:100.000 ..... 122 Anhang 7: CD-Inhalt ......................................................................... 12

    Gewinnung, Verwaltung und Anwendung von Performance-Daten zur UnterstĂĽtzung des autonomen Datenbank-Tuning

    Get PDF
    In den letzten Jahrzehnten ist die Komplexität und Heterogenität von Informationssystemen rapide gestiegen. Die Folge ist, dass viele moderne IT-Systeme aufgrund ihrer heterogenen Architektur- und Applikationsvielfalt sehr kostenintensiv in der Entwicklung, fehleranfällig in der Nutzung und schwierig durch Administratoren kontrollier- bzw. konfigurierbar sind. Initiativen wie das Autonomic Computing helfen, der steigenden Komplexität Herr zu werden, indem sie den „Problemfaktor Mensch“ entlasten und Technik nutzen, um Technik zu verwalten. Durch die Anpassung bzw. Erweiterung der System-Umgebung versuchen derartige Ansätze neben derzeitiger manueller, reaktiver Performance-Optimierung, eine automatisierte reaktive und proaktive Performance-Kontrolle zu gewährleisten. Zentrale Grundvoraussetzung für eine autonome Infrastruktur ist eine verlässliche, globale Daten- bzw. Wissensbasis. Wir erarbeiten, wie Performance-Daten über das Verhalten und den Zustand des Systems mit aus dem Data-Warehousing bekannten Techniken gesammelt, konsolidiert, verwaltet und zur Laufzeit ausgewertet werden können. Neben der Architektur und den funktionalen Komponenten eines solchen Performance Data Warehouse wird zudem dessen Datenmodell erläutert und die Anbindung an das vorausgehende Monitoring sowie die nachfolgende Analyse spezifiziert. Mit dem Ziel, die menschliche Vorgehensweise „nachzuahmen“ und somit die Administratoren bei ihren Routine-Tätigkeiten zu entlasten, widmen wir uns der Konzipierung und Beschreibung einer möglichen Infrastruktur zur Automatisierung typischer Tuning-Aufgaben. Wir erarbeiten allgemein und anhand von Beispielen, wie Tuning-Wissen und bewährte Praktiken von DBAs abgebildet, in Form von Workflows formalisiert und zur Laufzeit für die Problemlösung angewendet werden können

    Langzeitarchivierung von Forschungsdaten : eine Bestandsaufnahme

    Get PDF
    The relevance of research data today and for the future is well documented and discussed, in Germany as well as internationally. Ensuring that research data are accessible, sharable, and re-usable over time is increasingly becoming an essential task for researchers and research infrastructure institutions. Some reasons for this development include the following: - research data are documented and could therefore be validated - research data could be the basis for new research questions - research data could be re-analyzed by using innovative digital methods - research data could be used by other disciplines Therefore, it is essential that research data are curated, which means they are kept accessible and interpretable over time. In Germany, a baseline study was undertaken analyzing the situation in eleven research disciplines in 2012. The results were then published in a German-language edition. To address an international audience, the German-language edition of the study has been translated and abridged

    Grundlagen der Informationswissenschaft

    Get PDF
    corecore