Nouveaux outils et nouvelles données pour la surveillance des maladies infectieuses

Abstract

Concerns about bioterrorism, emerging pathogens and pandemic influenza resulted, this last ten years, in a surge of development of new public health surveillance systems, often based on new data sources, designed to provide more timely detection of outbreaks of infectious diseases. The present thesis first focused on particular statistical methods used for outbreak detection from temporal surveillance data: the periodic regression models. We then evaluated two non clinical data sources potentially useful for the surveillance of infectious diseases in France (medication sales and web searches). Periodic regression models allow detecting and quantifying epidemics from temporal surveillance data, for diseases such as influenza or gastroenteritis, taking into account their seasonal pattern. We determined the key parameters of such models by reviewing the literature. A web site was developed for the users to create periodic regression models that fit their data by tuning these key parameters. Tools for model hierarchy and comparison were proposed. Thus, this website allows rapid hypothesis testing and model comparisons for implementation of a prospective surveillance, as well as retrospective assessment of epidemic burden. We then constructed and evaluated an indicator based on medication sales for the detection of gastroenteritis outbreaks. To select the most relevant therapeutic classes for this surveillance, a large database of drug sales was analysed by data mining. The constructed indicator allowed detecting with good sensitivity, specificity and timeliness the gastroenteritis epidemics signalled by the Sentinelles network, a surveillance system relying on sentinel general practitioners that based its alerts on acute diarrhoea incidence analysis. Finally, the number of queries searched online in the Google search engine, concerning three infectious diseases, was compared to clinical surveillance data from the Sentinelles network. High correlations were obtained between some queries and the incidence of influenza-like illness, acute diarrhoea and chickenpox, between 2004 and 2008. Multiple regression models based on these queries allowed accurate prediction of the incidences of these three diseases during this period. However, they gave erroneous prediction of influenza-like illness incidences during the 2009 A/H1N1 influenza pandemic.La menace du bioterrorisme, l'émergence de nouveaux pathogènes et la crainte d'une pandémie grippale ont favorisé, ces dix dernières années, la recherche de nouveaux outils et de nouvelles données pour la surveillance des maladies infectieuses. Dans cette thèse, ce problème est abordé d'une part avec des modèles statistiques pour la détection des épidémies à partir de données temporelles de surveillance (modèles de régression périodique), puis par l'évaluation de deux sources de données non cliniques (ventes de médicaments et recherches sur Internet) potentiellement intéressantes pour la surveillance des maladies infectieuses. Les modèles de régression périodique permettent la détection et la quantification des épidémies à partir de séries temporelles de surveillance, pour des maladies telles que la grippe ou la gastroentérite, où l'enjeu est d'extraire un signal en présence d'un niveau de base périodique. Nous avons déterminé les paramètres clés de ces modèles en effectuant une revue de la littérature. Une interface Internet autorisant la modification de ces paramètres clés a été construite pour permettre l'analyse de données temporelles et la comparaison de modèles. Ainsi, ce site Internet permet de tester rapidement des hypothèses d'analyse, de comparer des modèles et d'en choisir un, pour mettre en place une surveillance ou évaluer l'impact des épidémies. Nous avons ensuite construit et évalué un indicateur basé sur les ventes de médicaments pour la détection des épidémies de gastroentérite. Pour déterminer les classes thérapeutiques les plus informatives pour cette surveillance, une large base de ventes pharmaceutiques a été analysée par classification hiérarchique. L'indicateur obtenu a permis de détecter avec de très bonnes sensibilité, spécificité et rapidité, les épidémies de gastroentérite déclarées par le Réseau Sentinelles sur la base de la surveillance des diarrhées aiguës en médecine générale. Enfin, le nombre de requêtes effectuées sur le moteur de recherche Google au sujet de trois maladies infectieuses a été comparé aux données cliniques de surveillance fournies par le Réseau Sentinelles. Une corrélation élevée a été mise en évidence entre certaines requêtes et l'incidence des syndromes grippaux, des diarrhées aiguës et de la varicelle entre 2004 et 2008. Des modèles de régression multiple construits sur ces requêtes ont permis d'estimer, avec une bonne précision, les incidences de ces trois maladies sur cette période. Toutefois, ces mêmes modèles ont donné des prédictions erronées pour les syndromes grippaux durant la pandémie de grippe A/H1N1 de 2009

    Similar works

    Full text

    thumbnail-image

    Available Versions