Des spectres MS/MS à l'identification des protéines - Interprétation des données issues de l'analyse d'un mélange de protéines d'un organisme non séquencé

Abstract

Mass spectrometry is a general method used in proteomics to identify unknown proteins in a sample. The mass spectrometer measures the masses of several protein's fragments and provide spectra. A spectrum is a series of peaks that indicate the presence of those fragments. By studying these spectra, we aim at retrieving the analyzed protein in a reference databank. In this thesis, we propose a new method to study these spectra. However, our solution must be able to work on proteins coming from unsequenced species, which means that we can't find exactly the same proteins in the databank, only similar ones. At first, we propose a new spectra comparison algorithm: PacketSpectralAlignment. This algorithm allows to compare experimental spectra produced by a mass spectrometer to spectra created from the reference databank data in presence of modifications. This comparison allows to associate to each spectrum, a peptide from the databank. Then, we explain several preprocessing and filtering methods that enhance the results of our new algorithm. All of those methods are used in the SIFpackets framework. Finally, we validate PacketSpectralAlignment and SIFpackets results using several experimental datasets.La spectrométrie de masse est une technique utilisée en protéomique pour identifier des protéines inconnues dans un échantillon. Le spectromètre mesure la masse de fragments de la protéine et fournit ainsi des spectres expérimentaux qui sont des représentations, sous forme de séries de pics, de la présence de ces différents fragments. En étudiant ces spectres, nous espérons pouvoir identifier la protéine d'origine en la retrouvant dans une banque. L'objectif de cette thèse est de proposer de nouvelles méthodes permettant d'étudier ces spectres. Cependant, ces méthodes doivent fonctionner sur des organismes non séquencés. Dans ce cas particulier, nous ne retrouverons pas exactement ces protéines dans la banque, mais uniquement des protéines qui y ressemblent. Nous proposons tout d'abord un nouvel algorithme dit de comparaison de spectres : PacketSpectralAlignment. Cet algorithme permet de comparer des spectres expérimentaux à des spectres créés à partir des données contenues dans la banque, et ce, même en présence de modifications. Cette comparaison permet l'association de chacun des spectres à un peptide de cette banque. Ensuite, nous détaillerons différents prétraitements et filtrages permettant d'améliorer l'exploitation de notre nouvel algorithme. Tous ces éléments sont intégrés dans une plate-forme intitulé SIFpackets. Enfin, nous validons les résultats de PacketSpectralAlignment ainsi que de SIFpackets sur différents jeux de données réelles

Similar works

Full text

thumbnail-image
oai:HAL:tel-00625749v1Last time updated on 11/8/2016

This paper was published in Thèses en Ligne.

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.