195 research outputs found

    Suchalgorithmen auf SIMD-Rechnern – Weitere Ergebnisse zu Polyautomaten

    Get PDF

    Neue Indexingverfahren für die Ähnlichkeitssuche in metrischen Räumen über großen Datenmengen

    Get PDF
    Ein zunehmend wichtiges Thema in der Informatik ist der Umgang mit Ähnlichkeit in einer großen Anzahl unterschiedlicher Domänen. Derzeit existiert keine universell verwendbare Infrastruktur für die Ähnlichkeitssuche in allgemeinen metrischen Räumen. Ziel der Arbeit ist es, die Grundlage für eine derartige Infrastruktur zu legen, die in klassische Datenbankmanagementsysteme integriert werden könnte. Im Rahmen einer Analyse des State of the Art wird der M-Baum als am besten geeignete Basisstruktur identifiziert. Dieser wird anschließend zum EM-Baum erweitert, wobei strukturelle Kompatibilität mit dem M-Baum erhalten wird. Die Abfragealgorithmen werden im Hinblick auf eine Minimierung notwendiger Distanzberechnungen optimiert. Aufbauend auf einer mathematischen Analyse der Beziehung zwischen Baumstruktur und Abfrageaufwand werden Freiheitsgrade in Baumänderungsalgorithmen genutzt, um Bäume so zu konstruieren, dass Ähnlichkeitsanfragen mit einer minimalen Anzahl an Anfrageoperationen beantwortet werden können.A topic of growing importance in computer science is the handling of similarity in multiple heterogenous domains. Currently there is no common infrastructure to support this for the general metric space. The goal of this work is lay the foundation for such an infrastructure, which could be integrated into classical data base management systems. After some analysis of the state of the art the M-Tree is identified as most suitable base and enhanced in multiple ways to the EM-Tree retaining structural compatibility. The query algorithms are optimized to reduce the number of necessary distance calculations. On the basis of a mathematical analysis of the relation between the tree structure and the query performance degrees of freedom in the tree edit algorithms are used to build trees optimized for answering similarity queries using a minimal number of distance calculations

    Generierung von Grundriss-Layouts mithilfe von Evolutionären Algorithmen und K-dimensionalen Baumstrukturen

    Get PDF
    K-dimensionale Bäume, im Englischen verkürzt auch K-d Trees genannt, sind binäre Such- und Partitionierungsbäume, die eine Menge von n Punkten in einem multidimensionalen Raum repräsentieren. Ihren Einsatz finden K-d Tree Datenstrukturen vor allem bei der Suche nach den nächsten Nachbarn, der Nearest Neighbor Query, und in weiteren Suchalgorithmen für beispielsweise Datenbankapplikationen. Im Rahmen des Forschungsprojekts Kremlas wurde die Raumpartitionierung durch K-d Trees als eine Teillösung zur Generierung von Layouts bei der Entwicklung einer kreativen evolutionären Entwurfsmethode für Layoutprobleme in Architektur und Städtebau entwickelt. Der Entwurf und die Entwicklung von Layouts, d.h. die Anordnung von Räumen, Baukörpern und Gebäudekomplexen im architektonischen und städtischen Kontext stellt eine zentrale Aufgabe in Architektur und Stadtplanung dar. Sie erfordert von Architekten und Planern funktionale sowie kreative Problemlösungen. Das Forschungsprojekt beschäftigt sich folglich nicht nur mit der Optimierung von Grundrissen sondern bindet auch gestalterische Aspekte mit ein. In der entwickelten Teillösung dient der K-d Tree Algorithmus zunächst zur Unterteilung einer vorgegebenen Fläche, wobei die Schnittlinien möglichen Raumgrenzen entsprechen. Durch die Kombination des K-d Tree Algorithmus mit genetischen Algorithmen und evolutionären Strategien werden Layouts hinsichtlich der Kriterien Raumgröße und Nachbarschaften optimiert. Durch die Interaktion des Nutzers können die Lösungen dynamisch angepasst und zur Laufzeit nach gestalterischen Kriterien verändert werden. Das Ergebnis ist ein generativer Mechanismus, der bei der kreativen algorithmischen Lösung von Layoutaufgaben in Architektur und Städtebau eine vielversprechende Variante zu bereits bekannten Algorithmen darstellt

    Bioinformatische Methoden in der ernährungswissenschaftlichen Forschung

    Get PDF
    Die Bioinformatik ist eine der wichtigsten naturwissenschaftlichen Disziplinen und einer raschen Entwicklung unterworfen, der sich auch die ernährungswissenschaftliche Forschung nicht entziehen kann. In Zeiten wo die ernährungswissenschaftliche Forschung sich nicht mehr mit der Analyse von einzelnen Nährstoffen zufriedengibt und die Omics-Technologien das zentrale Thema sind, ist der Einsatz von bioinformatischen Methoden unerlässlich geworden. Durch die Weiterentwicklung von Analysemethoden und das Zusammenwachsen der unterschiedlichen naturwissenschaftlichen Disziplinen und die damit verbundenen neuen Einsatzmöglichkeiten der verschiedenen Analysemethoden auch in anderen Bereichen werden viele Untersuchungen schneller und effizienter. Eine Folge der Entwicklung der Analysen in der ernährungswissenschaftlichen Forschung und der Etablierung von Hochdurchsatzmethoden wie die Anwendung von Microarrays führen zu einem Zuwachs an Analysedaten, welche die Verwendung von Methoden der multivariaten Statistik notwendig macht. Ziel hierbei ist eine Dimensionsreduktion und eine Datenreduktion ohne die Aussagekraft, der in einer Studie gewonnenen Daten zu verringern. Dabei kommen Methoden wie die PCA, PLS, MDS, Faktorenanalyse oder Clusteranalysen zum Einsatz. Eine Vielzahl an unterschiedlichen Studien aus verschiedenen ernährungswissenschaftlich interessanten Bereichen (Stoffwechselerkrankungen, Biomarkerforschung, Lebensmittelsicherheit, Enzymforschung, Vitaminstatus, Lebensmittelallergien etc.) wurden bereits erfolgreich unter Verwendung von bioinformatischen Methoden und unter Verwendung von Datenreduktionsmaßnahmen durchgeführt.Bioinformatics is one of the major scientific disciplines and rapidly changing subject and the nutritional research can’t ignore this development. The Aim of nutritional research is no longer the analysis of single nutrients. The so called “omics”-Technologies are the central theme now. Therefore the use of computational methods has become essential. The development of analytical methods and the convergence of different scientific disciplines led to an expanded field of use of individual methods. New applications of analytical methods made nutritional studies faster. On the other hand the establishment of high throughput methods such as the use of microarrays in nutritional research caused more data that must be post-processed by multivariate statistics. The aim in this case is a dimension reduction and also a data reduction, without the loss of information. Methods such as PCA, PLS, MDS, factor analysis and cluster analysis are used for this post-processing. A variety of different studies from different nutritional interesting areas (metabolic diseases, biomarker research, food safety, enzyme research, vitamin status, food allergies, etc.) have already been successfully carried out using computational methods and using data reduction measures

    Potenzial Bayes'scher Netze zur Unterstützung der Produktionsplanung und -steuerung

    Get PDF
    Das Potenzial Bayes'scher Netze (BNe) zur Unterstützung der Produktionsplanung und -steuerung (PPS) wird identifiziert, untersucht und aufgezeigt - sowohl theoretisch als auch praktisch. Der theoretisch geprägte Teil stellt dar, dass sich BNe aufgrund ihrer Eigenschaften und Fähigkeiten besonders gut zur Lösung bestimmter Probleme der PPS eignen. Zudem stellt er BNe alternativen Verfahren zur Unterstützung der PPS gegenüber. Der praxisorientierte Teil untermauert die Erkenntnisse aus der Theorie. Ein Softwaresystem zur Wissensverarbeitung mittels BNe wird entworfen und implementiert. Es werden geeignete Probleme der PPS ausgewählt, konkretisiert und mittels des Softwaresystems gelöst. Die Auswertung und Interpretation der Ergebnisse der Experimente gipfelt in der Aussage, dass BNe ein Potenzial zur Unterstützung der PPS aufweisen und dass sich BNe sehr gut zur Lösung bestimmter Probleme der PPS eignen

    Biochemische, molekularbiologische und bioinformatische Untersuchungen zum DsrMKJOP-Komplex von <i>Allochromatium vinosum</i>

    Get PDF
    Für die Proteine DsrO und DsrJ konnte die Expression in Allochromatium vinosum, sowie die Lokalisation in der Membran nachgewiesen werden. Für DsrO konnte zudem gezeigt werden, dass das Signalpeptid des Proteins abgespalten wird. Die beiden wahrscheinlich periplasmatischen Proteine DsrO und DsrJ wurden gemeinsam mit dem cytoplasmatischen DsrK in Präparationen aus der Membranfraktion gefunden. Dies weist auf die Bildung eines integralen Membrankomplexes hin. Mit Hilfe von Deletionsmutanten wurde gezeigt, dass die Gene dsrMKJOP absolut essentiell für die Schwefeloxidation in A. vinosum sind. Andere Teilprozesse des Schwefelstoffwechsels, wie etwa die Sulfid- oder Thiosulfatoxidation sind nicht betroffen. Durch Komplementation der ?dsrJ-Mutante konnte zudem gezeigt werden, dass in diesem Fall der beobachtete Phänotyp ausschließlich auf die Deletion des dsrJ-Gens zurückzuführen war. Mit Hilfe von BLAST-Suchen in Sequenz-Datenbanken konnten weitere Organismen identifiziert werden, die über dsr-Gene verfügen. Alle diese Organismen verfügen über einen reduktiv- oder oxidativ-dissimilatorischen Schwefelstoffwechsel. Hinsichtlich des Genbestandes gibt es allerdings deutliche Unterschiede zwischen Organismen mit oxidativem und Organismen mit reduktivem Schwefelstoffwechsel. Während z.B. die Gene dsrD und dsrT (mit Ausnahme der Chlorobiaceae) auf Sulfat-/Sulfitreduzierer beschränkt sind, kommen die Gene dsrEFH und L ausschließlich bei Sulfidoxidierern vor. Die Gene dsrR und dsrR treten nur bei A. vinosum und Thiobacillus denitrificans auf. Mit den von diesen Genen abgeleiteten Proteinen wurden phylogenetische Analysen durchgeführt. Dabei zeigte sich, dass sich in der Regel die Sulfidoxidierer klar von den Sulfat-/Sulfitreduzierern absetzen lassen. Eine Ausnahme bilden allerdings die mutmaßlichen Proteine des DsrMKJOP-Komplexes, bei denen die Sequenzen aus den Chlorobiaceae immer und die Sequenzen aus Archaeoglobus fulgidus manchmal "falsch" eingruppiert werden. Wahrscheinlich ist dies auf horizontalen Gentransfer zurückzuführen. Mit Hilfe eines phylogenetischen Baumes für die mutmaßlichen DsrEFH-Proteine und weitere homologe Proteine konnten schließlich Zusammenhänge zwischen der Position der Proteine im Stammbaum und konservierten Cysteinresten festgestellt werden

    Effiziente Algorithmen und Datenstrukturen zur inhaltsbasierten Suche in Audio- und 3D-Moleküldaten

    Get PDF
    Gegenstand der vorgelegten Arbeit ist die inhaltsbasierte Suche in Audio- und Moleküldaten. Ausgangspunkt sind große Kollektionen von solchen multimedialen Dokumenten. Eine Grundaufgabe des inhaltsbasierten Retrievals besteht darin, ein möglicherweise verrauschtes oder deformiertes Fragment eines Dokuments in einer Kollektion zu lokalisieren und damit das Fragment zu identifizieren. Zur effizienten Lösung dieser und ähnlicher Retrievalaufgaben, wird ein Ansatz basierend auf sog. G-invertierten Listen zusammen mit dem Prinzip der Operation einer Gruppe auf einer Menge verwendet. Um diese Basistechnologie zur inhaltsbasierten Suche auf unterschiedlichste Arten von Dokumenten anwenden zu können, kommt der nicht trivialen Entwicklung sog. Merkmalsextraktoren eine Entscheidende Rolle zu. Um je nach Wahl der Gruppe G redundanzfreie G-invertierte Listen im Suchindex zu erhalten, sollten alle Stabilisatoren trivial sein. Die Trefferberechnung ergibt sich dann theoretisch als Berechnung des Durchschnitts von G-invertierten Listen. Im ersten Teil der Arbeit werden neue effiziente Suchalgorithmen vorgestellt, die es erlauben Retrievalsysteme zu entwickeln, die mit praxisrelevanten Datenmengen umgehen können. Besonders hervorzuheben ist dabei die Möglichkeit, Suchindexe mit unterschiedlichen Auflösungsstufen zu verwenden, um so die benötigte Zeit für die Bearbeitung einer Suchanfrage zu reduzieren. Es wird eine Übersicht über unterschiedliche Audio-Retrievalsysteme gegeben, die derzeit zum Teil kommerziell eingesetzt werden. Weiterhin werden unterschiedliche Merkmalsextraktoren für CD-Audiodaten vorgestellt, die es z.B. erlauben, einen Suchindex für viele tausend Musikstücke aufzubauen und dabei auch verlustbehaftet kodierte Audiodaten (z.B. MP3) als Anfragen zuzulassen. Im zweiten Teil der Arbeit spielen Dokumente eine Rolle, die dreidimensionale Ortskoordinaten von Atomen von biologischen Makromolekülen (Proteine, DNA-Sequenzen aus der Protein Data Bank, PDB) beinhalten. Ausgehend von den zuvor vorgestellten Algorithmen wird ein Retrievalsystem zur inhaltsbasierten Suche in dreidimensionalen Moleküldaten entwickelt. Zunächst geht es um die aus Anwendungssicht geeignete Modellierung der Elemente der euklidschen Bewegungsgruppe SE(3). Aufgrund des geringeren Speicheraufwands werden hierbei Quaternionen verwendet. Diese Gruppe stellt an die extrahierten Merkmale besonderen Anforderungen. Um bis auf pathologische Fälle stets triviale Stabilisatoren zu garantieren, werden jeweils drei benachbarte Atome zu einem Merkmal zusammengefasst. Bei der Indexerstellung werden alle möglichen Kombinationen bzgl. eines maximalen euklidschen Abstands zwischen zwei Atomen d betrachtet. Bei einer Anfrage hingegen, ist die minimale Anzahl von Merkmalen zu bestimmen, so dass dennoch alle Atome der Anfrage in mindestens einem Merkmal enthalten sind. Für allgemeine Graphen führt dies auf ein NP-vollständiges Überdeckungsproblem. Im Rahmen dieser Arbeit konnte jedoch gezeigt werden, dass für die speziellen Graphen basierend auf Moleküldaten ein Algorithmus existiert, der in Polynomialzeit eine fast-optimale Überdeckung berechnet. Dieses Ergebnis kann allgemein für die inhaltsbasierte Suche in attributierten 3D-Punktdaten genutzt werden. Anstelle der Suche auf atomarer Ebene bietet sich im Fall von Proteinen an, die Moleküle der jeweiligen Aminosäuren als Merkmale zu benutzen. Wie sich zeigt, führt dies zu einer deutlichen Reduktion des Indexierungsaufwands. Der höhere Semantikgehalt dieser Merkmale spiegelt sich auch in der Aussagekraft der Treffer wider. Außerdem kann die Sequenz einer angefragten Konstellation von Aminosäuren dazu benutzt werden, der inhaltsbasierten Suche bereits bestehende Sequenzalignmentalgorithmen vorzuschalten. Die Suchalgorithmen sind derart erweitert worden, dass die in den invertierten Listen abgespeicherten Elemente nur dann zur Suche herangezogen werden, wenn die jeweilige Dokumentennummer durch den vorgeschalteten Alignmentalgorithmus berechnet worden ist. Dieses Prinzip lässt sich auch auf die Verwendung anderer Metadaten übertragen

    Entwurf und Realisierung eines mobilen autonomen Systems variabler Intelligenz (MauSI)

    Get PDF
    Abstract Mobile autonomous robot systems are frequently subject of scientific investigations. Depending on the problem's aim the examined robots are made purely commercially, i.e. Khepera-Robot, or they are designed especially for the planned experiments. Resulting disadvantages are often either a bad adaption of commercial systems to the necessary experiment or the high costs of an own development. Especially the modification of customary systems causes big problems because of unknown hard- or software interfaces. The robot system "MauSI" has been designed to solve this dilemma. As an as cheap as possible experimental platform this system unites an open software architecture with a broad range of sensors and communication interfaces, like i.e. accelaration or picture sensor and wireless radio communication. On this basis formations of these robots can be controlled by a central steering (global intelligence). The robots' equipment with a powerful CPU allows among the necessary steering or control algorithms for sensors and actors the implementation of a local intelligence in the robot itself. This intelligence makes the robot system act partly autonomously, that means limited in time and/or way in a model environment that is as close to reality as possible. The degree of partly autonomy depends on the concrete environmental conditions. Next to the usage of simple infrared-based distance sensors the use of picture sensors (CMOS-camera) allows an increasing of the partly autonomy. Picture processing enables the robot to detect simple geometrical bodies and to pursue an aim in formation drive. The strategies of local partly autonomy are completed by coupling the local intelligencewith the global one depending on requirements. Unexpected deciding problems lead to a mission stop (giving up the local autonomy) and a new valuation of the situation by global intelligence.Mobile autonome Robotersysteme sind vielfach Gegenstand wissenschaftlicher Untersuchungen. Je nach dem Ziel der Aufgabenstellung stammen die untersuchten Roboter aus kommerzieller Fertigung, z.B. Khepera-Roboter, oder sind speziell für die geplanten Experimente konzipiert. Damit einhergehende Nachteile sind oft entweder eine schlechte Adaption kommerzieller Systeme an die notwendigen Experimente, bzw. die hohen Kosten einer Eigenentwicklung. Insbesondere die Modifikation handelsüblicher Systeme stößt wegen unbekannter Hard- oder Softwareschnittstellen auf große Probleme. Zur Lösung dieses Dilemmas wird das Robotersystem "MauSI" konzipiert. Als möglichst preiswerte Experimentalplattform vereint dieses System eine offene Software-Architektur mit einer breiten Auswahl von Sensoren und Kommunikationsschnittstellen, wie z.B. Beschleunigungs- bzw. Bildsensor und drahtlose Funkkommunikation. Auf dieser Basis können Formationen dieser Roboter von einer zentralen Steuerung (Globale Intelligenz) kontrolliert werden. Die Ausstattung der Roboter mit einer leistungsfähigen CPU gestattet neben den notwendigen Steuer- bzw. Regelalgorithmen für Sensoren und Aktoren, die Implementierung einer Lokalen Intelligenz im Roboter. Diese Intelligenz befähigt das Robotersystem teilautonom, d.h. zeit- und/oder wegbegrenzt in möglichst realitätsnahen Modellumgebungen, zu agieren. Das Maß der Teilautonomie hängt von den konkreten Umgebungsbedingungen ab. Neben der Nutzung einfacher infrarot-basierter Distanzsensoren, ermöglicht der Einsatz von Bildsensoren (CMOS-Kamera) eine Steigerung der Teilautonomie. Einfache Bildverarbeitung befähigt die Roboter zur Objektdetektion simpler geometrischer Körper und Zielverfolgung in Formationsfahrt. Die Strategien zur lokalen Teilautonomie werden ergänzt durch eine bedarfsabhängige Kopplung der Lokalen mit der Globalen Intelligenz, unerwartete Entscheidungsprobleme führen zum Missionsabbruch (Aufgabe der Teilautonomie) und neuen Situationsbewertung durch die Globale Intelligenz

    Vermitteln Suchmaschinen vollständige Bilder aktueller Themen? Untersuchung der Gewichtung inhaltlicher Aspekte von Suchmaschinenergebnissen in Deutschland und den USA

    Get PDF
    Objective — The goal was to identify potential search engine content bias by comparing pictures of selected current and international events, from Google and Bing across Germany and the US. Criteria were developed for (1) completeness, (2) coverage, and (3) weighting of the particular content aspects. Methods — Empirical analysis was conducted using a hybrid / cross-functional methodology taken from the social sciences (content analysis) and information science (retrieval tests). Results — Both Google and Bing (1) do not provide complete coverage in neither Germany nor the US, (2) both do not cover the three most important content aspects on the first three result positions, and (3) there do not seem to be significant differences regarding the weighting of the content aspects. However, these results are somewhat limited, due to the methodology and the evaluation. Conclusions — The findings indicate that search engine content bias indeed exists. This could have an effect on how public opinions are formed. The topic should be further analyzed, especially in the light of effort required for obtaining results of high quality
    corecore