
SAM Format - Representation and Mapping of DNA Sequences


Cílem této bakalářské práce je implementace programu převádějícího již namapované sekvence DNA do formátu SAM. Na vstupu programu budou sekvence DNA s již přiřazenými souřadnicemi. Tyto sekvence budou zarovnány algoritmem Needleman-Wunsch a ke každé z těchto sekvencí budou doplněny povinné atributy definované ve specifikaci formátu Sam. Především CIGAR řetězec a následně kvalita mapování.The aim of this thesis is to implement a program that converts already mapped DNA sequences into SAM format. At the input of the program there will be DNA sequences with already assigned coordinates. These sequences will be aligned by Needleman-Wunsch algorithm and the mandatory attributes defined in the SAM format specification will be added to each of these sequences. Especially CIGAR string and consequently mapping quality.

