29 research outputs found

    Risk of Drug-Drug Interactions in Out-Hospital Drug Dispensings in France: Results From the DRUG-Drug Interaction Prevalence Study

    Get PDF
    Introduction: Drug interactions could account for 1% of hospitalizations in the general population and 2–5% of hospital admissions in the elderly. However, few data are available on the drugs concerned and the potential severity of the interactions encountered. We thus first aimed to estimate the prevalence of dispensings including drugs Contraindicated or Discommended because of Interactions (CDI codispensings) and to identify the most frequently involved drug pairs. Second, we aimed to investigate whether the frequency of CDI codispensings appeared higher or lower than the expected for the drugs involved.Methods: We carried out a study using a random sample of all drugs dispensings registered in a database of the French Health Insurance System between 2010 and 2015. The distribution of the drugs involved was described considering active principles, detailing the 20 most frequent ones for both contraindicated or discommended codispensings (DCs). To investigate whether the frequency of CDI codispensings appeared higher or lower than the expected for the drugs involved, we developed a specific indicator, the Drug-drug interaction prevalence study-score (DIPS-score), that compares for each drug pair the observed frequency of codispensing to its expected probability. The latter is determined considering the frequencies of dispensings of the individual drugs constituting a pair of interest.Results: We analyzed 6,908,910 dispensings: 13,196 (0.2%) involved contraindicated codispensings (CCs), and 95,410 (1.4%) DCs. For CCS, the most frequently involved drug pair was “bisoprolol+flecainide” (n = 5,036); four out of five of the most represented pairs involved cardiovascular drugs. For DCS, the most frequently involved drug pair was “ramipril+spironolactone” (n = 4,741); all of the five most represented pairs involved cardiovascular drugs. The drug pair involved in the CC with the highest score value was “citalopram+hydroxyzine” (DIPS-score: 3.7; 2.9–4.6); that with the lowest score was “clarithromycin+simvastatin” (DIPS-score: 0.2; 0.2–0.3). DIPS-score median value was 0.4 for CCs and 0.6 for DCs.Conclusion: This high prevalence of CDI codispensings enforces the need for further risk-prevention actions regarding drug-drug interactions (DDIs), especially for arrhythmogenic or anti-arrhythmic drugs. In this perspective, the DIPS-score we develop could ease identifying the interactions that are poorly considered by clinicians/pharmacists and targeting interventions

    Détection automatique des œdèmes aigus pulmonaires de surcharge post-transfusionnels dans les dossiers patients informatisés

    Get PDF
    International audienceTransfusion-associated circulatory overload (TACO) is a serious adverse event following the transfusion of a labile blood product. Although these events must be reported, under-reporting is common. In this article, we describe the implementation of a semi-automated surveillance system based on automatic language processing of textual data from electronic health records. An algorithm detects the concepts of transfusion and pulmonary edema in the same sentence and generates an alert transmitted to the hemovigilance department. Several unreported cases of TACO were detected by this approach and confirmed after manual validation. This innovative approach is likely to help hemovigilance units detect and monitor post-transfusion adverse events.Les oedèmes aigus pulmonaires de surcharge post-transfusionnels (TACO) sont des évènements indésirables graves consécutifs à la transfusion d'un produit sanguin labile. Bien que ces évènements doivent être signalés, les sous-déclarations sont fréquentes. Dans cet article, nous décrivons l'implémentation d'un système de surveillance semi-automatisé basé sur le traitement automatique de la langue des données textuelles des dossiers patients informatisés. Un algorithme détecte les concepts de transfusion et d'oedème pulmonaire dans une même phrase et génère une alerte transmise aux hémovigilants. Plusieurs cas de TACO non signalés ont été détectés par cette approche puis confirmés après enquête d'hémovigilance. Cette approche innovante est susceptible d'aider les unités d'hémovigilance à détecter et surveiller des évènements indésirables post-transfusionnels dans les établissements

    Contributions à l'extraction d'information dans un entrepôt de données hospitalier : une aide pour la recherche clinique

    No full text
    The development of digital technologies has led to the digitization of medical information and the transformation of paper records into electronic health records (EHRs). The data generated in a hospital contains valuable information for medical research. Hospitals have set up clinical data warehouses (CDW) to facilitate the secondary use of the data. In a CDW, researchers need to identify eligible patients for a clinical study and return to an EHR to complete the electronic case report form of a study. The main difficulty is the unstructured nature of the free text medical information. Natural language processing methods are needed to structure the data to facilitate its interrogation and retrieval. The objective of this thesis was to develop tools and methods to help researchers conduct feasibility studies and find information in an EHR. The main contributions of this thesis are the following: A French drug terminology. Many studies are looking at the use, efficacy, and tolerance of medicines in daily life. Medicines can also help to identify some diseases. The lack of a standardized drug terminology has led to the construction of Romedi, a French drug terminology, which offers good performance in detecting and identifying drugs in hospital data. A scalable semantic annotator. Semantic annotation consists of linking sequences of words in a document to concepts of a terminology. It enables the detection and indexing of medical concepts. How to index millions of documents in a CDW with medical terminologies containing several hundred thousand terms? In this work, we propose a new algorithm, IAMsystem, which is scalable to the size of a data warehouse and whose complexity depends little on the size of a terminology. An inventory of French medical abbreviations. Abbreviations are widely used in medicine. They add complexity to natural language processing tasks and must be taken into account by a semantic annotator. This work presents two algorithms to automatically detect abbreviations from a corpus of medical documents and offers the first inventory of abbreviations extracted from French hospital data. Linking hospital records to death certificates. The vital status of individuals is of central importance for many epidemiological studies and feasibility studies need to know whether eligible patients are alive or dead. Large volumes of data require a strategy to reduce the number of comparisons. We show that a vector space model offers excellent results in reducing the number of comparisons and that it is possible to automatically generate a gold standard from hospital data for linking hospital data and death certificates by machine learning. A web application to support the review of EHRs An interface, SmartCRF, has been developed to quickly search for information in an EHR. It comprises a lifeline, a search engine, a document viewer, and a recommendation system. Compared to the hospital software, it reduces the time spent on checking the inclusion and exclusion criteria of a feasibility study and facilitates the completion of an electronic case report.Le développement des technologies numériques a conduit à la numérisation des informations médicales et à la dématérialisation des dossiers papiers en dossiers patients informatisés (DPI). Les données générées dans un hôpital contiennent des informations précieuses pour la recherche médicale. Les hôpitaux ont mis en place des entrepôts de données (EDS) pour faciliter l’utilisation secondaire des données. Dans un EDS, les chercheurs ont besoin d’identifier les patients éligibles à une étude clinique et de retourner au DPI pour remplir le cahier d’observation électronique d’une étude. La principale difficulté réside dans le caractère non structuré des informations médicales présentes sous forme de texte libre. Des méthodes de traitement automatique de la langue sont nécessaires pour structurer les données afin de faciliter leur interrogation et leur extraction. L’objectif de cette thèse était de développer des outils et des méthodes pour aider les chercheurs à mener des études de faisabilité et à trouver des informations dans un DPI. Les principales contributions de cette thèse sont les suivantes: une terminologie sur les médicaments en langue française. De nombreuses études s’intéressent à l’utilisation, l’efficacité et à la tolérance des médicaments en vie réelle. Les médicaments permettent aussi d’identifier certaines maladies. L’absence d’une terminologie normalisée du médicament a conduit à la construction de Romedi, référentiel ouvert du médicament, qui offre de bonnes performances pour détecter et identifier les médicaments dans les données hospitalières. Un annotateur sémantique scalable à un entrepôt de données. L’annotation sémantique consiste à relier des séquences de mots d’un document aux concepts d’une terminologie. Elle permet la détection et l’indexation de concepts médicaux. Comment indexer des millions de documents d’un EDS avec des terminologies médicales contenant plusieurs centaines de milliers de termes ? Dans ce travail, nous proposons un nouvel algorithme, IAMsystem, scalable à l’échelle d’un entrepôt de données et dont la complexité dépend peu de la taille d’une terminologie. Un inventaire de sens des abréviations médicales. Les abréviations sont largement utilisées en médecine. Elles ajoutent de la complexité aux tâches de traitement automatique de la langue et doivent être prises en compte par un annotateur sémantique. Ce travail présente deux algorithmes pour détecter automatiquement des abréviations à partir d’un corpus de documents médicaux et propose le premier inventaire d’abréviations issu de données hospitalières en langue française. Une stratégie d’appariements de données hospitalières avec les certificats de décès Le statut vital des individus est d’une importance capitale pour de nombreuses études épidémiologiques et les études de faisabilité ont besoin de connaître si les patients éligibles sont vivants ou décédés. Les grands volumes de données nécessitent de recourir à un stratagème pour diminuer le nombre de comparaisons. Nous montrons qu’un modèle d’espace vectoriel offre d’excellents résultats pour diminuer le nombre de comparaisons et qu’il est possible de générer automatiquement un gold standard à partir de données hospitalières pour apparier données hospitalières et certificats de décès par apprentissage automatique. Une interface pour la revue des DPI. Une interface, SmartCRF, a été développée pour rechercher rapidement des informations dans un DPI. Elle est constituée d’une ligne de vie, d’un moteur de recherche, d’une visionneuse de documents et d’un système de recommandation. Par rapport au logiciel métier, elle permet de diminuer le temps passé à vérifier les critères d’inclusion et d’exclusion d’une étude de faisabilité et elle facilite le remplissage d’un cahier d’observation électronique

    Contributions à l'extraction d'information dans un entrepôt de données hospitalier : une aide pour la recherche clinique

    No full text
    The development of digital technologies has led to the digitization of medical information and the transformation of paper records into electronic health records (EHRs). The data generated in a hospital contains valuable information for medical research. Hospitals have set up clinical data warehouses (CDW) to facilitate the secondary use of the data. In a CDW, researchers need to identify eligible patients for a clinical study and return to an EHR to complete the electronic case report form of a study. The main difficulty is the unstructured nature of the free text medical information. Natural language processing methods are needed to structure the data to facilitate its interrogation and retrieval. The objective of this thesis was to develop tools and methods to help researchers conduct feasibility studies and find information in an EHR. The main contributions of this thesis are the following: A French drug terminology. Many studies are looking at the use, efficacy, and tolerance of medicines in daily life. Medicines can also help to identify some diseases. The lack of a standardized drug terminology has led to the construction of Romedi, a French drug terminology, which offers good performance in detecting and identifying drugs in hospital data. A scalable semantic annotator. Semantic annotation consists of linking sequences of words in a document to concepts of a terminology. It enables the detection and indexing of medical concepts. How to index millions of documents in a CDW with medical terminologies containing several hundred thousand terms? In this work, we propose a new algorithm, IAMsystem, which is scalable to the size of a data warehouse and whose complexity depends little on the size of a terminology. An inventory of French medical abbreviations. Abbreviations are widely used in medicine. They add complexity to natural language processing tasks and must be taken into account by a semantic annotator. This work presents two algorithms to automatically detect abbreviations from a corpus of medical documents and offers the first inventory of abbreviations extracted from French hospital data. Linking hospital records to death certificates. The vital status of individuals is of central importance for many epidemiological studies and feasibility studies need to know whether eligible patients are alive or dead. Large volumes of data require a strategy to reduce the number of comparisons. We show that a vector space model offers excellent results in reducing the number of comparisons and that it is possible to automatically generate a gold standard from hospital data for linking hospital data and death certificates by machine learning. A web application to support the review of EHRs An interface, SmartCRF, has been developed to quickly search for information in an EHR. It comprises a lifeline, a search engine, a document viewer, and a recommendation system. Compared to the hospital software, it reduces the time spent on checking the inclusion and exclusion criteria of a feasibility study and facilitates the completion of an electronic case report.Le développement des technologies numériques a conduit à la numérisation des informations médicales et à la dématérialisation des dossiers papiers en dossiers patients informatisés (DPI). Les données générées dans un hôpital contiennent des informations précieuses pour la recherche médicale. Les hôpitaux ont mis en place des entrepôts de données (EDS) pour faciliter l’utilisation secondaire des données. Dans un EDS, les chercheurs ont besoin d’identifier les patients éligibles à une étude clinique et de retourner au DPI pour remplir le cahier d’observation électronique d’une étude. La principale difficulté réside dans le caractère non structuré des informations médicales présentes sous forme de texte libre. Des méthodes de traitement automatique de la langue sont nécessaires pour structurer les données afin de faciliter leur interrogation et leur extraction. L’objectif de cette thèse était de développer des outils et des méthodes pour aider les chercheurs à mener des études de faisabilité et à trouver des informations dans un DPI. Les principales contributions de cette thèse sont les suivantes: une terminologie sur les médicaments en langue française. De nombreuses études s’intéressent à l’utilisation, l’efficacité et à la tolérance des médicaments en vie réelle. Les médicaments permettent aussi d’identifier certaines maladies. L’absence d’une terminologie normalisée du médicament a conduit à la construction de Romedi, référentiel ouvert du médicament, qui offre de bonnes performances pour détecter et identifier les médicaments dans les données hospitalières. Un annotateur sémantique scalable à un entrepôt de données. L’annotation sémantique consiste à relier des séquences de mots d’un document aux concepts d’une terminologie. Elle permet la détection et l’indexation de concepts médicaux. Comment indexer des millions de documents d’un EDS avec des terminologies médicales contenant plusieurs centaines de milliers de termes ? Dans ce travail, nous proposons un nouvel algorithme, IAMsystem, scalable à l’échelle d’un entrepôt de données et dont la complexité dépend peu de la taille d’une terminologie. Un inventaire de sens des abréviations médicales. Les abréviations sont largement utilisées en médecine. Elles ajoutent de la complexité aux tâches de traitement automatique de la langue et doivent être prises en compte par un annotateur sémantique. Ce travail présente deux algorithmes pour détecter automatiquement des abréviations à partir d’un corpus de documents médicaux et propose le premier inventaire d’abréviations issu de données hospitalières en langue française. Une stratégie d’appariements de données hospitalières avec les certificats de décès Le statut vital des individus est d’une importance capitale pour de nombreuses études épidémiologiques et les études de faisabilité ont besoin de connaître si les patients éligibles sont vivants ou décédés. Les grands volumes de données nécessitent de recourir à un stratagème pour diminuer le nombre de comparaisons. Nous montrons qu’un modèle d’espace vectoriel offre d’excellents résultats pour diminuer le nombre de comparaisons et qu’il est possible de générer automatiquement un gold standard à partir de données hospitalières pour apparier données hospitalières et certificats de décès par apprentissage automatique. Une interface pour la revue des DPI. Une interface, SmartCRF, a été développée pour rechercher rapidement des informations dans un DPI. Elle est constituée d’une ligne de vie, d’un moteur de recherche, d’une visionneuse de documents et d’un système de recommandation. Par rapport au logiciel métier, elle permet de diminuer le temps passé à vérifier les critères d’inclusion et d’exclusion d’une étude de faisabilité et elle facilite le remplissage d’un cahier d’observation électronique

    Contributions to information extraction in a hospital data warehouse : an aid for clinical research

    No full text
    Le développement des technologies numériques a conduit à la numérisation des informations médicales et à la dématérialisation des dossiers papiers en dossiers patients informatisés (DPI). Les données générées dans un hôpital contiennent des informations précieuses pour la recherche médicale. Les hôpitaux ont mis en place des entrepôts de données (EDS) pour faciliter l’utilisation secondaire des données. Dans un EDS, les chercheurs ont besoin d’identifier les patients éligibles à une étude clinique et de retourner au DPI pour remplir le cahier d’observation électronique d’une étude. La principale difficulté réside dans le caractère non structuré des informations médicales présentes sous forme de texte libre. Des méthodes de traitement automatique de la langue sont nécessaires pour structurer les données afin de faciliter leur interrogation et leur extraction. L’objectif de cette thèse était de développer des outils et des méthodes pour aider les chercheurs à mener des études de faisabilité et à trouver des informations dans un DPI. Les principales contributions de cette thèse sont les suivantes: une terminologie sur les médicaments en langue française. De nombreuses études s’intéressent à l’utilisation, l’efficacité et à la tolérance des médicaments en vie réelle. Les médicaments permettent aussi d’identifier certaines maladies. L’absence d’une terminologie normalisée du médicament a conduit à la construction de Romedi, référentiel ouvert du médicament, qui offre de bonnes performances pour détecter et identifier les médicaments dans les données hospitalières. Un annotateur sémantique scalable à un entrepôt de données. L’annotation sémantique consiste à relier des séquences de mots d’un document aux concepts d’une terminologie. Elle permet la détection et l’indexation de concepts médicaux. Comment indexer des millions de documents d’un EDS avec des terminologies médicales contenant plusieurs centaines de milliers de termes ? Dans ce travail, nous proposons un nouvel algorithme, IAMsystem, scalable à l’échelle d’un entrepôt de données et dont la complexité dépend peu de la taille d’une terminologie. Un inventaire de sens des abréviations médicales. Les abréviations sont largement utilisées en médecine. Elles ajoutent de la complexité aux tâches de traitement automatique de la langue et doivent être prises en compte par un annotateur sémantique. Ce travail présente deux algorithmes pour détecter automatiquement des abréviations à partir d’un corpus de documents médicaux et propose le premier inventaire d’abréviations issu de données hospitalières en langue française. Une stratégie d’appariements de données hospitalières avec les certificats de décès Le statut vital des individus est d’une importance capitale pour de nombreuses études épidémiologiques et les études de faisabilité ont besoin de connaître si les patients éligibles sont vivants ou décédés. Les grands volumes de données nécessitent de recourir à un stratagème pour diminuer le nombre de comparaisons. Nous montrons qu’un modèle d’espace vectoriel offre d’excellents résultats pour diminuer le nombre de comparaisons et qu’il est possible de générer automatiquement un gold standard à partir de données hospitalières pour apparier données hospitalières et certificats de décès par apprentissage automatique. Une interface pour la revue des DPI. Une interface, SmartCRF, a été développée pour rechercher rapidement des informations dans un DPI. Elle est constituée d’une ligne de vie, d’un moteur de recherche, d’une visionneuse de documents et d’un système de recommandation. Par rapport au logiciel métier, elle permet de diminuer le temps passé à vérifier les critères d’inclusion et d’exclusion d’une étude de faisabilité et elle facilite le remplissage d’un cahier d’observation électronique.The development of digital technologies has led to the digitization of medical information and the transformation of paper records into electronic health records (EHRs). The data generated in a hospital contains valuable information for medical research. Hospitals have set up clinical data warehouses (CDW) to facilitate the secondary use of the data. In a CDW, researchers need to identify eligible patients for a clinical study and return to an EHR to complete the electronic case report form of a study. The main difficulty is the unstructured nature of the free text medical information. Natural language processing methods are needed to structure the data to facilitate its interrogation and retrieval. The objective of this thesis was to develop tools and methods to help researchers conduct feasibility studies and find information in an EHR. The main contributions of this thesis are the following: A French drug terminology. Many studies are looking at the use, efficacy, and tolerance of medicines in daily life. Medicines can also help to identify some diseases. The lack of a standardized drug terminology has led to the construction of Romedi, a French drug terminology, which offers good performance in detecting and identifying drugs in hospital data. A scalable semantic annotator. Semantic annotation consists of linking sequences of words in a document to concepts of a terminology. It enables the detection and indexing of medical concepts. How to index millions of documents in a CDW with medical terminologies containing several hundred thousand terms? In this work, we propose a new algorithm, IAMsystem, which is scalable to the size of a data warehouse and whose complexity depends little on the size of a terminology. An inventory of French medical abbreviations. Abbreviations are widely used in medicine. They add complexity to natural language processing tasks and must be taken into account by a semantic annotator. This work presents two algorithms to automatically detect abbreviations from a corpus of medical documents and offers the first inventory of abbreviations extracted from French hospital data. Linking hospital records to death certificates. The vital status of individuals is of central importance for many epidemiological studies and feasibility studies need to know whether eligible patients are alive or dead. Large volumes of data require a strategy to reduce the number of comparisons. We show that a vector space model offers excellent results in reducing the number of comparisons and that it is possible to automatically generate a gold standard from hospital data for linking hospital data and death certificates by machine learning. A web application to support the review of EHRs An interface, SmartCRF, has been developed to quickly search for information in an EHR. It comprises a lifeline, a search engine, a document viewer, and a recommendation system. Compared to the hospital software, it reduces the time spent on checking the inclusion and exclusion criteria of a feasibility study and facilitates the completion of an electronic case report

    Contributions to information extraction in a hospital data warehouse : an aid for clinical research

    No full text
    Le développement des technologies numériques a conduit à la numérisation des informations médicales et à la dématérialisation des dossiers papiers en dossiers patients informatisés (DPI). Les données générées dans un hôpital contiennent des informations précieuses pour la recherche médicale. Les hôpitaux ont mis en place des entrepôts de données (EDS) pour faciliter l’utilisation secondaire des données. Dans un EDS, les chercheurs ont besoin d’identifier les patients éligibles à une étude clinique et de retourner au DPI pour remplir le cahier d’observation électronique d’une étude. La principale difficulté réside dans le caractère non structuré des informations médicales présentes sous forme de texte libre. Des méthodes de traitement automatique de la langue sont nécessaires pour structurer les données afin de faciliter leur interrogation et leur extraction. L’objectif de cette thèse était de développer des outils et des méthodes pour aider les chercheurs à mener des études de faisabilité et à trouver des informations dans un DPI. Les principales contributions de cette thèse sont les suivantes: une terminologie sur les médicaments en langue française. De nombreuses études s’intéressent à l’utilisation, l’efficacité et à la tolérance des médicaments en vie réelle. Les médicaments permettent aussi d’identifier certaines maladies. L’absence d’une terminologie normalisée du médicament a conduit à la construction de Romedi, référentiel ouvert du médicament, qui offre de bonnes performances pour détecter et identifier les médicaments dans les données hospitalières. Un annotateur sémantique scalable à un entrepôt de données. L’annotation sémantique consiste à relier des séquences de mots d’un document aux concepts d’une terminologie. Elle permet la détection et l’indexation de concepts médicaux. Comment indexer des millions de documents d’un EDS avec des terminologies médicales contenant plusieurs centaines de milliers de termes ? Dans ce travail, nous proposons un nouvel algorithme, IAMsystem, scalable à l’échelle d’un entrepôt de données et dont la complexité dépend peu de la taille d’une terminologie. Un inventaire de sens des abréviations médicales. Les abréviations sont largement utilisées en médecine. Elles ajoutent de la complexité aux tâches de traitement automatique de la langue et doivent être prises en compte par un annotateur sémantique. Ce travail présente deux algorithmes pour détecter automatiquement des abréviations à partir d’un corpus de documents médicaux et propose le premier inventaire d’abréviations issu de données hospitalières en langue française. Une stratégie d’appariements de données hospitalières avec les certificats de décès Le statut vital des individus est d’une importance capitale pour de nombreuses études épidémiologiques et les études de faisabilité ont besoin de connaître si les patients éligibles sont vivants ou décédés. Les grands volumes de données nécessitent de recourir à un stratagème pour diminuer le nombre de comparaisons. Nous montrons qu’un modèle d’espace vectoriel offre d’excellents résultats pour diminuer le nombre de comparaisons et qu’il est possible de générer automatiquement un gold standard à partir de données hospitalières pour apparier données hospitalières et certificats de décès par apprentissage automatique. Une interface pour la revue des DPI. Une interface, SmartCRF, a été développée pour rechercher rapidement des informations dans un DPI. Elle est constituée d’une ligne de vie, d’un moteur de recherche, d’une visionneuse de documents et d’un système de recommandation. Par rapport au logiciel métier, elle permet de diminuer le temps passé à vérifier les critères d’inclusion et d’exclusion d’une étude de faisabilité et elle facilite le remplissage d’un cahier d’observation électronique.The development of digital technologies has led to the digitization of medical information and the transformation of paper records into electronic health records (EHRs). The data generated in a hospital contains valuable information for medical research. Hospitals have set up clinical data warehouses (CDW) to facilitate the secondary use of the data. In a CDW, researchers need to identify eligible patients for a clinical study and return to an EHR to complete the electronic case report form of a study. The main difficulty is the unstructured nature of the free text medical information. Natural language processing methods are needed to structure the data to facilitate its interrogation and retrieval. The objective of this thesis was to develop tools and methods to help researchers conduct feasibility studies and find information in an EHR. The main contributions of this thesis are the following: A French drug terminology. Many studies are looking at the use, efficacy, and tolerance of medicines in daily life. Medicines can also help to identify some diseases. The lack of a standardized drug terminology has led to the construction of Romedi, a French drug terminology, which offers good performance in detecting and identifying drugs in hospital data. A scalable semantic annotator. Semantic annotation consists of linking sequences of words in a document to concepts of a terminology. It enables the detection and indexing of medical concepts. How to index millions of documents in a CDW with medical terminologies containing several hundred thousand terms? In this work, we propose a new algorithm, IAMsystem, which is scalable to the size of a data warehouse and whose complexity depends little on the size of a terminology. An inventory of French medical abbreviations. Abbreviations are widely used in medicine. They add complexity to natural language processing tasks and must be taken into account by a semantic annotator. This work presents two algorithms to automatically detect abbreviations from a corpus of medical documents and offers the first inventory of abbreviations extracted from French hospital data. Linking hospital records to death certificates. The vital status of individuals is of central importance for many epidemiological studies and feasibility studies need to know whether eligible patients are alive or dead. Large volumes of data require a strategy to reduce the number of comparisons. We show that a vector space model offers excellent results in reducing the number of comparisons and that it is possible to automatically generate a gold standard from hospital data for linking hospital data and death certificates by machine learning. A web application to support the review of EHRs An interface, SmartCRF, has been developed to quickly search for information in an EHR. It comprises a lifeline, a search engine, a document viewer, and a recommendation system. Compared to the hospital software, it reduces the time spent on checking the inclusion and exclusion criteria of a feasibility study and facilitates the completion of an electronic case report

    Wikipedia: a tool to monitor seasonal diseases trends?

    Get PDF
    ObjectiveTo explore the interest of Wikipedia as a data source to monitorseasonal diseases trends in metropolitan France.IntroductionToday, Internet, especially Wikipedia, is an important part ofeveryday life. People can notably use this popular free onlineencyclopedia to search health-related information. Recent studiesshowed that Wikipedia data can be used to monitor and to forecastinfluenza-like illnesses in near real time in the United States [1,2].We carried out a study to explore whether French Wikipedia dataallow to monitor the trends of five seasonal diseases in metropolitanFrance: influenza-like illness, gastroenteritis, bronchiolitis,chickenpox and asthma.MethodsTo collect Wikipedia data, we used two free web applications(https://stats.grok.se and https://tools.wmflabs.org/pageviews), whichaggregate daily views for each French entry of the encyclopedia.As some articles have several entries (redirects), we collectedview statistics for all the article entries and added them to make timeseries from January 1st, 2009 to June 30, 2016 (Figure 1). Then, wecompared these data to those of OSCOUR®network, which is a robustnational surveillance system based on the emergency departments.For each disease, we modelized daily variations in Wikipedia viewsaccording to daily visits in ED using Poisson regression modelsallowing for overdispersion. The following adjustment variables wereincluded in the model: long-term trend, seasonality, day of the week.We tested several lags (day-7 to day+7) in order to explore whetherone of the two indicators (Wikipedia view or ED visits) varied earlierthan the other.ResultsThe mean number of daily views was 764 [16-8271] for influenza-like illness, 202 [6-1660] for bronchiolitis, 1228 [59-10030] forgastroenteritis, 475 [21-2729] for asthma and 879 [25-4081] forchickenpox. Times series analyses showed a positive associationbetween page views and ED visits for each seasonal disease (Figure 2).For each increase in 100 Wikipedia views, the number of ED visitsthe same day increased by 2.9% (95% CI=[2.5-3.3]) for influenza,1.8 (95% CI=[1.4-2.2]) for bronchiolitis, 2.4% (95% CI=[2.2-2.7])for gastroenteritis, 1.4% (95% CI=[1.0-1.7]) for asthma and 2.9%(95% CI=[1.7-4.1]) for chickenpox. Globally, the highest relativerisks were observed for lag-1 (day-1) to lag0.ConclusionsThis study allowed to show that French Wikipedia data canbe useful to monitor the trends of seasonal diseases. Indeed, theywere significantly associated with data from a robust surveillancesystem, with a maximum lag of one day. Wikipedia can thereforebe considered as an interesting complementary data source, notablywhen traditional surveillance systems are not available in real time.Further works will be necessary to elaborate forecasting models forthese seasonal diseases.Figure1. Daily number of page views and ED visits for seasonal dieases,January 1st, 2009 to June 30, 2016Figure2. Relative risk between Wikipedia page views and ED visits forseasonal diseases by several lag

    Wikipedia: a tool to monitor seasonal diseases trends?

    No full text
    ObjectiveTo explore the interest of Wikipedia as a data source to monitorseasonal diseases trends in metropolitan France.IntroductionToday, Internet, especially Wikipedia, is an important part ofeveryday life. People can notably use this popular free onlineencyclopedia to search health-related information. Recent studiesshowed that Wikipedia data can be used to monitor and to forecastinfluenza-like illnesses in near real time in the United States [1,2].We carried out a study to explore whether French Wikipedia dataallow to monitor the trends of five seasonal diseases in metropolitanFrance: influenza-like illness, gastroenteritis, bronchiolitis,chickenpox and asthma.MethodsTo collect Wikipedia data, we used two free web applications(https://stats.grok.se and https://tools.wmflabs.org/pageviews), whichaggregate daily views for each French entry of the encyclopedia.As some articles have several entries (redirects), we collectedview statistics for all the article entries and added them to make timeseries from January 1st, 2009 to June 30, 2016 (Figure 1). Then, wecompared these data to those of OSCOUR®network, which is a robustnational surveillance system based on the emergency departments.For each disease, we modelized daily variations in Wikipedia viewsaccording to daily visits in ED using Poisson regression modelsallowing for overdispersion. The following adjustment variables wereincluded in the model: long-term trend, seasonality, day of the week.We tested several lags (day-7 to day+7) in order to explore whetherone of the two indicators (Wikipedia view or ED visits) varied earlierthan the other.ResultsThe mean number of daily views was 764 [16-8271] for influenza-like illness, 202 [6-1660] for bronchiolitis, 1228 [59-10030] forgastroenteritis, 475 [21-2729] for asthma and 879 [25-4081] forchickenpox. Times series analyses showed a positive associationbetween page views and ED visits for each seasonal disease (Figure 2).For each increase in 100 Wikipedia views, the number of ED visitsthe same day increased by 2.9% (95% CI=[2.5-3.3]) for influenza,1.8 (95% CI=[1.4-2.2]) for bronchiolitis, 2.4% (95% CI=[2.2-2.7])for gastroenteritis, 1.4% (95% CI=[1.0-1.7]) for asthma and 2.9%(95% CI=[1.7-4.1]) for chickenpox. Globally, the highest relativerisks were observed for lag-1 (day-1) to lag0.ConclusionsThis study allowed to show that French Wikipedia data canbe useful to monitor the trends of seasonal diseases. Indeed, theywere significantly associated with data from a robust surveillancesystem, with a maximum lag of one day. Wikipedia can thereforebe considered as an interesting complementary data source, notablywhen traditional surveillance systems are not available in real time.Further works will be necessary to elaborate forecasting models forthese seasonal diseases.Figure1. Daily number of page views and ED visits for seasonal dieases,January 1st, 2009 to June 30, 2016Figure2. Relative risk between Wikipedia page views and ED visits forseasonal diseases by several lag
    corecore