Analyse statistique du catalogue de sources X cosmiques du satellite ESA XMM-Newton

Abstract

XMM Newton est un satellite de l'ESA lancé en 1999. Il observe le ciel dans le domaine des rayons X. Le Survey Science Center (SSC) d'XMM est en charge de l'exploitation scientifique du télescope spatial et a créé à partir de ses observation le plus grand catalogue de sources X à ce jour. La classification des sources de ce catalogue est une des tâches attribuées au SSC. C est dans ce cadre que s'insère ce travail de thèse. Nous avons développé et implémenté un algorithme de corrélation croisée permettant d'obtenir des informations multi-longueur d'onde pour un certain nombres de sources du catalogue 2XMMi. Cet algorithme utilise une approche Bayesienne pour fournir des probabiltés d'identification. Il utilise également une approche originale permettant de se passer de simulations de Monte Carlo pour l'estimation du nombre de fausses associations. Nous avons implémenté et utilisé une analyse en composantes principale (ACP) qui prend en compte les erreurs de mesure de chaque observations. Cette ACP nous a permis d'explorer l'espace des paramètres multi-longueur d'onde et de choisir un nombre restreint de dimensions en entrée d'algorithme de classification. Nous avons utilisé les données de l'ACDS et les résultats de la corrélation entre le 2XMMi et le SDSS DR7 pour créér un échantillon d'identification. Cette échantillon est utilisé pour la création d'échantillons d'apprentissage qui sont indispensables pour la classification supervisée. Nous avons classé les sources X de plusieurs échantillons : celui issu des résultats de la corrélation 2XMMi/SDSS DR7, celui issu de la corrélation 2XMMi/GSC2/2MASS et un échantillon de sources purement X. L'algorithme de classification a été choisi après avoir comparé différentes méthodes. Enfin, nos résultats ont été insérés dans la XCAT-DB pour une large diffusion.XMM Newton is a European satellite designed by ESA and launched in 1999. It scans the sky in the X-ray wavelengths. The XMM Survey Science Centre (SSC) is in charge of the scientific exploitation of the spatial telescope and has built from its observations the larger catalogue of X-ray sources ever published so far. The work presented here has been carried out in this framework. We designed and implemented a cross-correlation algorithm that allows to retrieve multi-wavelength data for a fraction of 2XMMi catalogue sources. This algorithm is based on a Bayesian approach providing probabilities of identification. It also uses a new way to compute the rates of spurious associations without resorting to Monte Carlo simulations. We implemented and applied a principal component analysis (PCA) taking into account the measurement errors of each source. That modified PCA has been used to explore the multi-wavelength parameter space and to restrict the number of dimensions in input of the classification algorithms. ACDS data has been used together with the results of the cross-correlation of the 2XMMi with the SDSS DR7 to build an identification sample. We derived learning samples from this sample. Learning samples are essential to perform supervised classification. X-ray sources of several samples have been classified. Those samples are the 2XMMi/SDSS DR7, coming from the cross-correlation of the two catalogues, the 2XMMi/GSC2/2MASS and one only containing XMM X-ray sources. The classification algorithm used has been chosen from the results of tests performed and several methods such as decision trees, Kohonen neural networks, meanshifts or kernel density classification. Finally, we put our results into the XCAT-DB so that they are available for the rest of astronomy community

    Similar works