3 research outputs found

    Computer aided DNA sequence design

    Get PDF
    In der Nanotechnologie werden "bottom-up"-Konstruktionsverfahren, bei der sich Bausteine mit Größe im Nanometerbereich durch lokale Wechselwirkungen zusammenfügen, zunehmend interessant, da sie einige Probleme von "top-down"-Verfahren, bei denen solche Bausteine mit meist weit größeren Werkzeugen manipuliert werden, vermeiden. Eine wichtige erforderliche Eigenschaft für ein erfolgreiches selbsttätiges Zusammenfügen (Self-Assembly) der Bausteine ist die Programmierbarkeit des Vorgangs, d. h. durch Wahl bestimmter Eigenschaften der Bausteine kann möglichst exakt vorherbestimmt werden, zu welchen Strukturen sich die Bausteine durch die lokalen Wechselwirkungen zusammenfügen. DNA, hier unabhängig von ihrer biologischen Rolle als Träger der Erbinformation betrachtet, ist ein äußerst geeigneter Baustoff für das programmierbare Self-Assembly, da durch die Wahl komplementärer Basensequenzen von DNA-Molekülen ihr Zusammenfügen (die Hybridisierung) in gewissem Maß vorherbestimmbar ist. Leider ist diese Programmierung aber nicht perfekt deterministisch, so daß es gilt, die Basensequenzen so zu wählen, daß die gewollten Hybridisierungen möglichst wahrscheinlich und die ungewollten möglichst unwahrscheinlich sind. Die Suche nach einer Menge solcher Sequenzen bildet das DNA-Sequenz-Design-Problem. Es läßt sich in zwei Teilprobleme zerlegen: Zum Einen muß ein möglichst realistisches Modell für die Wahrscheinlichkeit der Hybridisierung zweier DNA-Moleküle gefunden werden, das trotzdem einfach zu berechnen ist. Zum Anderen muß ein Algorithmus entwickelt werden, der eine Menge von DNA-Sequenzen findet, die gemäß dieses Modells die gewünschten Strukturen mit hoher und alle anderen mit möglichst geringer Wahrscheinlichkeit bilden. Je nach Anwendung des programmierbaren Self-Assembly können Zusätzliche Anforderungen wie z. B. Einschränkungen physikalischer oder chemischer Eigenschaften der Moleküle das Designproblem erschweren. Es stellt sich nicht nur in der Nanotechnologie, sondern auch im Bereich des DNA-Computing sowie für alltägliche Molekularbiologische Methode wie DNA-Microarrays oder der Polymerasekettenreaktion. Diese Arbeit untersucht Lösungen für die genannten zwei Teilprobleme und ihre Güte in einer Reihe von Experimenten, die sowohl im Rechner als auch im Labor durchgeführt wurden. Da ein erstes Experiment gezeigt hat, daß oft verwendete Stringdistanzmaße wie Hamming-Distanz oder Edit-Distanz für die Modellierung der Hybridisierungswahrscheinlichkeit eher ungeeignet sind, wurde als Lösung für das erste Teilproblem ein Sequenzunähnlichkeitskriterium gewählt, das auf dem einmaligen Vorkommen von Subsequenzen fixer Länge beruht. Das zweite Teilproblem wurde mit einem einfachen graphbasierten Algorithmus gelöst, der die Abbildung von unähnlichen Sequenzen auf knotendiskunkte Pfade durch einen bestimmten Graphen ausnutzt. Dieser konnte durch einfache Erweiterungen auch zusätzliche Anforderungen an die Moleküle realisieren. Die Experimente zeigen, daß der Algorithmus eine zufriedenstellende Ausbeute an Sequenzen erzielt, und daß das Modell durchaus sinnvoll gewählt ist und eine Einschränkung der Hybridisierungswahrscheinlichkeit von DNA-Molekülen zuläßt

    The Capacity of DNA for Information Encoding

    No full text
    Information encoding and processing in DNA has proved to be an important problem for biomolecular computing, including the well studied codeword design problem. A lower bound is established for the capacity of DNA to encode information using a combinatorial model of DNA homology given by the so-called h-distance. This bound decreases exponentially with a parameter τ that roughly codes for stringency in reaction conditions. We further introduce a new family of near-optimal codeword sets, so-called shuffle codes. This construction, which is optimal in terms of efficiency, can also be used to produce set of codewords with a given constant GC-content. These codes yield estimates of the capacity of DNA oligonucleotides to store abiotic information in DNA arrays as defined in [11]. Finally, we discuss the sensitivity of the corresponding DNA chip encodings to store and discriminate inputs, including the regions of maximum discrimination and uncertainty. © Springer-Verlag Berlin Heidelberg 2005
    corecore