13 research outputs found

    Une infrastructure générique basée sur les apports du Web Sémantique pour l’analyse des bases médico-administratives

    Get PDF
    International audienceSuite aux difficultés de gestion et d'exploration de données issues des bases médico-administratives françaises, une méthode basée sur les technologies du Web Sémantique a été mise en place. L'objectif est d'être en mesure de gérer et d'explorer des données de parcours de soins de ville et d'hôpital, de manière pertinente et efficace, pour faciliter l'analyse statistique. Dans le cadre de cette étude, l'analyse porte sur la description et la prévention des évènements indésirables suite à une opération chirurgicale prise en charge en ambulatoire. A terme une infrastructure profitant à toute étude statistique portant sur une analyse de ce genre de données sera proposée

    Care trajectory analysis using medico-administrative data : contribution of a knowledge-based enrichment from the Linked Data

    No full text
    Pour la recherche en santé publique, réutiliser les bases médicoadministratives est pertinent et ouvre de nouvelles perspectives. En pharmacoépidémiologie, ces données permettent d’étudier à grande échelle l’état de santé, les maladies ainsi que la consommation et le recours aux soins d’une population. Le traitement de ces données est cependant limité par des complexités inhérentes à la nature comptable des données. Cette thèse porte sur l’utilisation conjointe de bases de données médicoadministratives et de connaissances biomédicales pour l’étude des trajectoires de soin. Cela recouvre à la fois (1) l’exploration et l’identification des trajectoires de soins pertinentes dans des flux volumineux au moyen de requêtes et (2) l’analyse des trajectoires retenues. Les technologies du Web Sémantique et les ontologies du Web des données ont permis d’explorer efficacement les données médicoadministratives, en identifiant dans des trajectoires de soins des interactions, ou encore des contre-indications. Nous avons également développé le package R queryMed afin de rendre plus accessible les ontologies médicales aux chercheurs en santé publique. Après avoir permis d’identifier les trajectoires intéressantes, les connaissances relatives aux nomenclatures médicales de ces bases de données ont permis d’enrichir des méthodes d’analyse de trajectoires de soins pour mieux prendre en compte leurs complexités. Cela s’est notamment traduit par l’intégration de similarités sémantiques entre concepts médicaux. Les technologies du Web Sémantique ont également été utilisées pour explorer les résultats obtenus.Reusing healthcare administrative databases for public health research is relevant and opens new perspectives. In pharmacoepidemiology, it allows to study large scale diseases as well as care consumption for a population. Nevertheless, reusing these information systems that were initially designed for accounting purposes and whose interoperability is limited raises new challenges in terms of representation, integration, exploration and analysis. This thesis deals with the joint use of healthcare administrative databases and biomedical knowledge for the study of patient care trajectories. This includes both (1) exploration and identification through queries of relevant care pathways in voluminous flows, and (2) analysis of retained trajectories. Semantic Web technologies and biomedical ontologies from the Linked Data allowed to identify care trajectories containing a drug interaction or a potential contraindication between a prescribed drug and the patient’s state of health. In addition, we have developed the R queryMed package to enable public health researchers to carry out such studies by overcoming the difficulties of using Semantic Web technologies and ontologies. After identifying potentially interesting trajectories, knowledge from biomedical nomenclatures and ontologies has also enriched existing methods of analysing care trajectories to better take into account the complexity of data. This resulted notably in the integration of semantic similarities between medical concepts. Semantic Web technologies have also been used to explore obtained results

    Analyse de trajectoires de soins à partir de bases de données médico-administratives : apport d'un enrichissement par des connaissances biomédicales issues du Web des données

    No full text
    Reusing healthcare administrative databases for public health research is relevant and opens new perspectives. In pharmacoepidemiology, it allows to study large scale diseases as well as care consumption for a population. Nevertheless, reusing these information systems that were initially designed for accounting purposes and whose interoperability is limited raises new challenges in terms of representation, integration, exploration and analysis. This thesis deals with the joint use of healthcare administrative databases and biomedical knowledge for the study of patient care trajectories. This includes both (1) exploration and identification through queries of relevant care pathways in voluminous flows, and (2) analysis of retained trajectories. Semantic Web technologies and biomedical ontologies from the Linked Data allowed to identify care trajectories containing a drug interaction or a potential contraindication between a prescribed drug and the patient’s state of health. In addition, we have developed the R queryMed package to enable public health researchers to carry out such studies by overcoming the difficulties of using Semantic Web technologies and ontologies. After identifying potentially interesting trajectories, knowledge from biomedical nomenclatures and ontologies has also enriched existing methods of analysing care trajectories to better take into account the complexity of data. This resulted notably in the integration of semantic similarities between medical concepts. Semantic Web technologies have also been used to explore obtained results.Pour la recherche en santé publique, réutiliser les bases médicoadministratives est pertinent et ouvre de nouvelles perspectives. En pharmacoépidémiologie, ces données permettent d’étudier à grande échelle l’état de santé, les maladies ainsi que la consommation et le recours aux soins d’une population. Le traitement de ces données est cependant limité par des complexités inhérentes à la nature comptable des données. Cette thèse porte sur l’utilisation conjointe de bases de données médicoadministratives et de connaissances biomédicales pour l’étude des trajectoires de soin. Cela recouvre à la fois (1) l’exploration et l’identification des trajectoires de soins pertinentes dans des flux volumineux au moyen de requêtes et (2) l’analyse des trajectoires retenues. Les technologies du Web Sémantique et les ontologies du Web des données ont permis d’explorer efficacement les données médicoadministratives, en identifiant dans des trajectoires de soins des interactions, ou encore des contre-indications. Nous avons également développé le package R queryMed afin de rendre plus accessible les ontologies médicales aux chercheurs en santé publique. Après avoir permis d’identifier les trajectoires intéressantes, les connaissances relatives aux nomenclatures médicales de ces bases de données ont permis d’enrichir des méthodes d’analyse de trajectoires de soins pour mieux prendre en compte leurs complexités. Cela s’est notamment traduit par l’intégration de similarités sémantiques entre concepts médicaux. Les technologies du Web Sémantique ont également été utilisées pour explorer les résultats obtenus

    A Similarity Measure Based on Care Trajectories as Sequences of Sets

    Get PDF
    International audienceComparing care trajectories helps improve health services. Medico-administrative databases are useful for automatically reconstructing the patients’ history of care. Care trajectories can be compared by determining their overlapping parts. This comparison relies on both semantically-rich representation formalism for care trajectories and an adequate similarity measure. The longest common subsequence (LCS) approach could have been appropriate if representing complex care trajectories as simple sequences was expressive enough. Furthermore, by failing to take into account similarities between different but semantically close medical events, the LCS overestimates differences. We propose a generalization of the LCS to a more expressive representation of care trajectories as sequences of sets. A set represents a medical episode composed by one or several medical events, such as diagnosis, drug prescription or medical procedures. Moreover, we propose to take events’ semantic similarity into account for comparing medical episodes. To assess our approach, we applied the method on a care trajectories’ sample from patients who underwent a surgical act among three kinds of acts. The formalism reduced calculation time, and introducing semantic similarity made the three groups more homogeneous

    Une infrastructure générique basée sur les apports du Web Sémantique pour l’analyse des bases médico-administratives

    Get PDF
    International audienceSuite aux difficultés de gestion et d'exploration de données issues des bases médico-administratives françaises, une méthode basée sur les technologies du Web Sémantique a été mise en place. L'objectif est d'être en mesure de gérer et d'explorer des données de parcours de soins de ville et d'hôpital, de manière pertinente et efficace, pour faciliter l'analyse statistique. Dans le cadre de cette étude, l'analyse porte sur la description et la prévention des évènements indésirables suite à une opération chirurgicale prise en charge en ambulatoire. A terme une infrastructure profitant à toute étude statistique portant sur une analyse de ce genre de données sera proposée

    queryMed: Semantic Web functions for linking pharmacological and medical knowledge to data

    Get PDF
    International audienceSummary - In public health research and more precisely in the reuse of electronic health data, selecting patients, identifying specific events and interpreting results typically requires biomedical knowledge. The queryMed R package aims to facilitate the integration of medical and pharmacological knowledge stored in formats compliant with the Linked Data paradigm (e.g. OWL ontologies and RDF datasets) into the R statistical programming environment. We show how it allowed us to identify all the drugs prescribed for critical limb ischemia (CLI) and also to detect one contraindicated prescription for one patient by linking a medical database of 1003 CLI patients to ontologies. Availability and implementation - queryMed is readily usable for medical data mappings and enrichment. Sources, R vignettes and test data are available on GitHub (https://github.com/yannrivault/queryMed) and are archived on Zenodo (https://doi.org/10.5281/zenodo.1323481)

    Mesures de similarité entre trajectoires de soins issues de bases de données médico-administratives

    Get PDF
    National audienceBien que l’information dans les bases de données médico-administratives Françaises soit recueillie à des fins de gestion, elles contribuent aujourd’hui à la recherche en santé publique, par exemple pour l’analyse des parcours de soins et la surveillance du bon usage des produits de santé. Si le fait que ces données couvrent une très grande majorité de la population Française est leur principal atout, elles sont cependant d’une grande complexité. L’utilisation statistique de ces données massives nécessite une adaptation des méthodes d’analyse, notamment pour la comparaison des trajectoires de soins.Ainsi de nombreuses méthodes statistiques de comparaison ont été utilisées pour déterminer quels critères différenciaient des groupes de patients. La majorité de ces comparaisons sont faites sur des critères sociodémographiques, et lorsqu’elles sont faites sur des critères relevant de l’historique de soins et des diagnostics des patients, elles ne sont que rarement exhaustives. Dans l’objectif de mieux comprendre ce qui différencie un patient d’un autre, il est un atout de pouvoir déterminer la part commune de leur historique de soins, et ce en considérant la dimension temporelle des données.Si on voit les trajectoires de soins comme des séquences ponctuées d’événements, de nombreuses méthodes en informatique sont alors envisageables pour les comparer. Dans ce travail on se concentre sur la plus grande sous-séquence commune à deux trajectoires de soins, principe qui trouve déjà des applications dans des domaines variés allant de la correction d’orthographe à la biologie moléculaire.Du fait de la complexité des données, notamment la simultanéité ou l’incertitude quant à l’ordre entre certains événements, il est plus approprié de considérer un formalisme de séquences d’ensembles plutôt que celui des séquences simples. Nous avons donc généralisé la méthode à ce formalisme, en reconstituant les trajectoires de soins à partir des actes médicaux, diagnostics et délivrances de médicaments. Nous avons enrichi la méthode en prenant en compte des mesures de ressemblances entre événements, basées sur les structures hiérarchiques des vocabulaires contrôlés associés à ces événements médicaux.Une similarité fondée sur cette méthode peut alors être calculée entre deux trajectoires. Étant donné un échantillon de patients, il est alors possible de calculer toutes les similarités deux à deux entre trajectoires pour avoir une idée de leur part commune. Ces similarités peuvent également être utilisées à des fins statistiques dans des méthodes de classifications par exemple, dans le but de regrouper certaines trajectoires, et donc certains patients, par groupes homogènes

    La gestion de données médico-administratives grâce aux outils du Web sémantique

    Get PDF
    National audienceLes bases de données médico-administratives regorgent d'informations médicales pouvant s'avérer très utiles en santé publique et en épidémiologie.Cette étude pilote vise à élaborer et à évaluer une méthode de gestion et d'exploration de ces données, basée sur l'utilisation des standards du Web Sémantique, en amont à leur analyse statistique
    corecore