DeepHMC : un algorithme Hamiltonian Monte Carlo utilisant un réseau de neurones profond pour l’inférence bayesienne des sources binaires compactes d’ondes gravitationnelles

Abstract

The first direct detection of gravitational waves by the LIGO interferometers in 2015, originating from a compact binary system of black holes, opened the path of gravitational wave astronomy. It was followed by numerous detections, in particular two years later the merger of two neutron stars (a BNS system), named GW170817, which allowed its electromagnetic counterpart observation on a wide spectrum. The many implications of these observations, in fields as diverse as cosmology, ultra-dense matter or modified gravity theories, opened a new era in multi-messenger astronomy and confirmed the importance of gravitational wave astronomy. To estimate the most likely values of the parameters defining the source of the wave (e.g. component masses, distance, angles in the sky) and the uncertainties surrounding our measurement, the LIGO-Virgo collaboration uses Bayesian inference of the posterior probability distribution of the parameters. At the moment algorithms such as Markov Chain Monte Carlo (MCMC) allow this inference by random walking in parameter space to sample the posterior distribution. However these algorithms require from weeks to months to converge when analyzing long duration signals, typically BNSs such as GW170817. As detectors are being improved, the rate of detections and duration of exploitable signal increase which create an important tension with the time required to perform each analysis. The next observation run indeed foresees as many as 70 BNSs over a year. To answer this challenge, we propose in this thesis a different algorithm, the Hamiltonian Monte Carlo (HMC), which replaces the random walk behaviour inherent to standard MCMCs by Hamiltonian trajectories which use the gradient of the posterior distribution to sample it efficiently. As no closed form solution exist to compute these gradient analytically at each step of a trajectory, the latter must be derived numerically which is computationally too expensive for the HMC to be competitive. To circumvent this, we have developed the algorithm DeepHMC which replaces numerical gradients with a deep neural network approximation a thousand times faster to compute. After training the network on a pre-generated set of numerical gradients, the neural network is able to predict accurately the gradient values at new positions in parameter space. Our algorithm was successfully tested on GW170817 in a 12 dimensional analysis were alignedspins and tidal deformabilities were included. We then performed an apples-to-apples comparison with the official MCMC algorithm of the collaboration and proved we obtain the same statistical estimates of the parameters in only about three days which translates into a factor 80 speed-up in CPU time. While successful on GW170817, DeepHMC’s performances will need to be tested on a larger set of signals before it might be used by the collaboration. Nonetheless, our results demonstrate that DeepHMC appears as a promising answer to the increasing rate of detections and signal durations. It would allow an accurate and fast inference of future gravitational wave signals to exploit fully the scientific potential offered by gravitational wave astronomy.En septembre 2015 a eu lieu la première détection directe d’une onde gravitationnelle par les interféromètres LIGO, mettant en évidence la coalescence d’un système binaire compact composé de deux trous noirs et ouvrant ainsi la voie de l’astronomie gravitationnelle. S’ensuivirent de nombreuses détections, notamment celle, deux ans plus tard, de la fusion de deux étoiles à neutrons(système dit BNS), nommée GW170817, qui a permis d’observer sa contre-partie électromagnétique dans une large gamme spectrale. Les multiples implications de ces observations dans des domaines aussi divers que la cosmologie, la matière ultra-dense ou les théories de gravité modifiée ont ouvert une nouvelle ère dans l’astronomie multi-messager et confirmé l’essor de l’astronomie gravitationnelle. L’estimation des valeurs les plus probables des paramètres qui définissent la source de l’onde (e.g. masses des deux composants, distance, angles dans le ciel) et des incertitudes entourant notre mesure est effectuée par inférence bayesienne de la distribution postérieure en probabilité des paramètres. À l’heure actuelle, des algorithmes de type Markov Chain Monte Carlo (MCMC) permettent ce travail en utilisant une marche aléatoire dans l’espace des paramètres qui échantillonne adéquatement la distribution postérieure. Cependant ces algorithmes nécessitent plusieurs semaines (mois) pour converger lorsqu’ils analysent des signaux gravitationnels de longue durée, typiquement des BNSs comme GW170817. À mesure que les détecteurs sont améliorés, non seulement la fréquences de détection augmente mais les signaux sont également observés sur des durées plus longues ce qui crée une tension croissante au vue de l’important temps de calcul nécessaire à l’estimation de leur paramètres. La prochaine campagne d’observation prévoie en effet jusqu’à 70 BNSs détectés sur une année. Pour répondre à cette problématique, nous proposons dans cette thèse un algorithme alternatif, le Hamiltonian Monte Carlo (HMC), qui remplace la marche aléatoire des algorithmes MCMC classiques par des trajectoires hamiltoniennes qui utilisent le gradient de la distribution pour l’échantillonner efficacement. N’existant pas de forme analytique permettant un calcul rapide des gradients en chaque point des trajectoires, ces derniers doivent être calculés numériquement ce qui est très coûteux en ressources informatiques, et, dans ces conditions, le HMC n’apparaît pas plus compétitif que ses homologues. Pour surmonter cet obstacle, nous avons développé l’algorithme DeepHMC qui permet de remplacer le calcul numérique des gradients par une approximation analytique un millier de fois plus rapide. Pour ce faire DeepHMC utilise un réseau de neurones profond qui, après avoir été entraîné sur un ensemble de gradients numériques initialement calculés, est capable de prédire les gradients en des points de l’espace des paramètres encore inexplorés. Notre algorithme a été calibré et testé avec succès sur le signal GW170817 dans un modèle à 12 paramètres qui inclut les composantes axiales des spins des étoiles à neutrons ainsi que leur paramètre de déformation. Une comparaison de DeepHMC avec l’algorithme MCMC de la collaboration LIGO-Virgo montre que nous obtenons les mêmes estimations de paramètres maisen un peu moins de trois jours, ce qui correspond à un facteur d’accélération d’environ 80 en temps CPU. Testé avec succès sur le signal GW170817, il faudra encore confirmer les performances de DeepHMC sur un panel plus large de signaux gravitationnels avant de pouvoir l’utiliser en complément des algorithmes actuels. Toutefois nos travaux démontrent que DeepHMC s’avère très prometteur pour répondre aux fréquences croissantes de détection, ce qui permettra une analyse fiable et rapide des futurs signaux pour exploiter pleinement tout le potentiel de l’astronomie gravitationnelle

    Similar works

    Full text

    thumbnail-image

    Available Versions

    Last time updated on 19/05/2022
    Last time updated on 19/05/2022
    Last time updated on 30/06/2022
    Last time updated on 19/05/2022