18 research outputs found

    A modular approach to knowledge graphs and FAIR data in healthcare

    Get PDF
    In healthcare, and more specifically cancer treatment, data sharing is essential yet difficult. 1 in 5 people diagnosed with cancer have a rare type of cancer, which means considerable time is needed to collect sufficient data for research. Combining data from multiple centres is therefore vital, unfortunately, linking this data is not straightforward. There are various ways healthcare centres store their data, due to for instance differences in treatment protocols and clinical systems. This means different variables and annotations are used. Consequently before we can solve any medical problems, we first need to solve this data integration challenge

    A Knowledge graph representation of baseline characteristics for the Dutch proton therapy research registry

    Get PDF
    Cancer registries collect multisource data and provide valuable information that can lead to unique research opportunities. In the Netherlands, a registry and model-based approach (MBA) are used for the selection of patients that are eligible for proton therapy. We collected baseline characteristics including demographic, clinical, tumour and treatment information. These data were transformed into a machine readable format using the FAIR (Findable, Accessible, Interoperable, Reusable) data principles and resulted in a knowledge graph with baseline characteristics of proton therapy patients. With this approach, we enable the possibility of linking external data sources and optimal flexibility to easily adapt the data structure of the existing knowledge graph to the needs of the clinic

    External validation of a prognostic model incorporating quantitative PET image features in esophageal cancer

    Get PDF
    Aim Enhanced prognostic models are required to improve risk stratification of patients with oesophageal cancer so treatment decisions can be optimised. The primary aim was to externally validate a published prognostic model incorporating PET image features. Transferability of the model was compared using only clinical variables. Methods This was a Transparent Reporting of a multivariate prediction model for Individual Prognosis Or Diagnosis (TRIPOD) type 3 study. The model was validated against patients treated with neoadjuvant chemoradiotherapy according to the Neoadjuvant chemoradiotherapy plus surgery versus surgery alone for oesophageal or junctional cancer (CROSS) trial regimen using pre- and post-harmonised image features. The Kaplan–Meier method with log-rank significance tests assessed risk strata discrimination. A Cox proportional hazards model assessed model calibration. Primary outcome was overall survival (OS). Results Between 2010 and 2015, 449 patients were included in the development (n = 302), internal validation (n = 101) and external validation (n = 46) cohorts. No statistically significant difference in OS between patient quartiles was demonstrated in prognostic models incorporating PET image features (X2 = 1.42, df = 3, p = 0.70) or exclusively clinical variables (age, disease stage and treatment; X2 = 1.19, df = 3, p = 0.75). The calibration slope β of both models was not significantly different from unity (p = 0.29 and 0.29, respectively). Risk groups defined using only clinical variables suggested differences in OS, although these were not statistically significant (X2 = 0.71, df = 2, p = 0.70). Conclusion The prognostic model did not enable significant discrimination between the validation risk groups, but a second model with exclusively clinical variables suggested some transferable prognostic ability. PET harmonisation did not significantly change the results of model validation

    Εφαρμογές τεχνητής νοημοσύνης στην ακτινοθεραπεία: ο ρόλος των FAIR δεδομένων

    No full text
    In recent years, research on artificial intelligence (AI) in the radiotherapy (RT) domain has begun to monopolise the interest of different clinicians and researchers.This will likely make routine RT clinical procedures more reliable and effective with a direct benefit to the patients. However, the clinical integration of these AI-based applications is still lacking as several steps still need to be included in the AI clinical implementation roadmap starting from the research stage and ending up to the clinical integration. One of these crucial steps is the adoption of the FAIR (Findable, Accessible, Interoperable, Reusable) data prin-ciples among the different data structure/archive systems of the radiotherapy centres. The FAIR principles can establish an interoperability framework for the reusability of RT multi-source data that can potentially decrypt valuable information for prognostic or diagnostic research and clinical purposes.This thesis focuses on the introduction of AI techniques and the FAIR data principles in four RT subdomains: i) medical imaging, ii) prediction modelling or RT related outcomes, iii) quality assurance (QA) of RT treatment planning and iv) the implementation of the FAIR data principles.Medical imagingIn the first part of the thesis we focused on the medical imaging domain. We investigated how RT can be transformed into a personalised treatment modality using imaging derived features that can decrypt valuable information that is not visible by the human eyes using machine learning (ML) techniques (ie. radiomics). Specifically, in chapter 2 we provided a roadmap for the clinical implementation of radiomics-based prediction models in the clin-ic, identifying the pitfalls and uncertainties encountered in the radiomics methodolo-gy/pipeline followed by the researchers. Furthermore, based on the pitfalls and uncertain-ties we presented, we proposed a standardisation framework with all the necessary tech-nical aspects that should be taken into account in the design/development of a radiomics study.One main take-away from chapter 2 is that the reproducibility of radiomics stud-ies/findings is one the main requirements for the standardisation and implementation of the radiomics concept in the clinic. Therefore, in chapter 3 we provided a publicly available dataset consisting of Computer Tomography (CT) phantoms (suitable for radiomics stud-ies) scans from three different Dutch RT centres, having as a goal to promote the repro-ducibility and interoperability of radiomics studies. Prediction modelling or RT related outcomesIn the second part of the thesis we focused on the prediction modelling of RT outcomes using AI algorithms. Taking into account the patients data privacy regulations, in chapter 5, we implemented a radiomics-based federated decentralised multicentre study, using tNon Small Cell Lung Cancer (NSCLC) patients. Having as a base the FAIR transformed clini-cal and radiomics features-based data, we validated a radiomics signature that predicts the 2-years overall survival of NSCLC patients without the exchange of patients data, com-paring the results of the centralised analysis. The study showed that the performance of the radiomics signature of the decentralised approach was not significantly different than the centralised one. Furthermore, with this study, the significance of the FAIR transfor-mation of data for federated learning radiomics studies is underlined, implementing a privacy preserving infrastructure without the data exchange of patients.In chapter 6, we performed an independent validation of the logistic regression-based Normal Tissue Complication Probability (NTCP) model that predicts the six months ≥ 2nd grade dysphagia for head and neck cancer patients. This model is part of the Dutch Na-tional Indication Protocol for Proton therapy (NIPP) for the selection of patients candidates for proton therapy (PT). In this study, we showed that logistic regression models need a specific validation approach in independent cohorts, examining the potential update of the different components of the logistic regression models (intercept, slope and predictor coefficients) through the AI-based approach of the closed testing procedure (CTP). The CTP in combination with the graphical assessment of the calibration curves of the different updated models, indicated that the original dysphagia NIPP model needed an update and a new updated calibrated model was selected. However, it is important to perform a fed-erated privacy preserving multicentre study using FAIR transformed datasets in the dif-ferent Dutch PT centres that can robust the results of the CTP.Quality assuranceThe RT treatment planning is a complicated procedure that requires the coordinated ef-forts of clinical and technical RT professionals. For the third part of the thesis, In chapter 7 we focused on the quality assurance (QA) of the RT treatment planning procedure by ex-ternally validating an AI-based method developed in the United States (US) using a Dutch independent patients cohort. This AI method using Bayesian Networks (BNs) has as a goal to early detect errors encountered in the verification phase of RT treatment planning and alert humans for possible erroneous variables included on it. The external validation using an independent Dutch patients cohort was not successful, due to the different technical characteristics of the treatment machines and software used in the different RT centres possibly. According to this study, further steps are required for the generalisability and reusability of AI-based systems focusing on the automatic error detection among different centres such as data preprocessing and the inclusion of more variables included in the treatment planning such as imaging-based data.Implementation of FAIR principlesIn chapter 4, expanding the work of chapter 3, we provided a set of four publicly available datasets that were used in a breakthrough publication in the radiomics community in 2014 in a machine-readable format. Specifically, using radiation oncology related ontolo-gies and semantic web technologies, we transformed multisource (clinical, radiomics fea-ture-based, and imaging) data in a FAIR format for enabling the automation of data pro-cessing by the machines with minimal human intervention.For the last part of the thesis, we focused on the implementation of the FAIR principles in the RT domain. In chapter 8, having as a goal to introduce the FAIR concept in the RT community, we provided an overview of the action points required from the different RT stakeholders for the introduction and adoption of the FAIR principles in the different data archive systems of the hospitals. Some of the advantages that a FAIR data transformation offers are the flexibility to adapt databases and the ability of machines to “read” the dif-ferent data for automated AI-based studies. In chapters 9-10, we provided FAIR data models structured in knowledge graphs using the data elements used for the Dutch na-tional registry of patients candidates for PT. Using publicly available ontologies and se-mantic web technologies we underline the significance of the flexibility and interoperabil-ity of the FAIR format using routine clinical data.Τα τελευταία χρόνια, η έρευνα για την τεχνητή νοημοσύνη (AI) στον τομέα της ακτινοθεραπείας (RT) έχει αρχίσει να μονοπωλεί το ενδιαφέρον διαφορετικών κλινικών γιατρών και ερευνητών. Αυτό πιθανότατα θα καταστήσει τις κλινικές διαδικασίες ρουτίνας RT πιο αξιόπιστες και αποτελεσματικές με άμεσο όφελος για τους ασθενείς. Ωστόσο, η κλινική ενοποίηση αυτών των εφαρμογών που βασίζονται σε τεχνητή νοημοσύνη εξακολουθεί να λείπει, καθώς πολλά βήματα πρέπει να συμπεριληφθούν στον οδικό χάρτη κλινικής εφαρμογής της τεχνητής νοημοσύνης, ξεκινώντας από το ερευνητικό στάδιο και καταλήγοντας στην κλινική ενοποίηση. Ένα από αυτά τα κρίσιμα βήματα είναι η υιοθέτηση των αρχών δεδομένων FAIR (Εύρεση, Προσβάσιμο, Διαλειτουργικό, Επαναχρησιμοποιήσιμο) μεταξύ των διαφορετικών συστημάτων δομής δεδομένων/αρχειοθέτησης των κέντρων ακτινοθεραπείας. Οι αρχές FAIR μπορούν να δημιουργήσουν ένα πλαίσιο διαλειτουργικότητας για την επαναχρησιμοποίηση δεδομένων πολλαπλών πηγών RT που μπορεί ενδεχομένως να αποκρυπτογραφήσει πολύτιμες πληροφορίες για προγνωστικούς ή διαγνωστικούς ερευνητικούς και κλινικούς σκοπούς.Αυτή η διατριβή εστιάζει στην εισαγωγή τεχνικών AI και των αρχών FAIR δεδομένων σε τέσσερις υποτομείς RT: i) ιατρική απεικόνιση, ii) μοντελοποίηση πρόβλεψης ή αποτελέσματα που σχετίζονται με RT, iii) διασφάλιση ποιότητας (QA) του σχεδιασμού θεραπείας RT και iv) η εφαρμογή των αρχών δεδομένων FAIR.Ιατρική απεικόνισηΣτο πρώτο μέρος της διατριβής επικεντρωθήκαμε στον τομέα της ιατρικής απεικόνισης. Ερευνήσαμε πώς η RT μπορεί να μετατραπεί σε μια εξατομικευμένη μέθοδο θεραπείας χρησιμοποιώντας χαρακτηριστικά που προέρχονται από την απεικόνιση που μπορούν να αποκρυπτογραφήσουν πολύτιμες πληροφορίες που δεν είναι ορατές από τα ανθρώπινα μάτια χρησιμοποιώντας τεχνικές μηχανικής μάθησης (ML) (π.χ. ραδιενεργά). Συγκεκριμένα, στο κεφάλαιο 2 παρείχαμε έναν οδικό χάρτη για την κλινική εφαρμογή μοντέλων πρόβλεψης βασισμένων σε ραδιενέργεια στην κλινική, εντοπίζοντας τις παγίδες και τις αβεβαιότητες που συναντώνται στη μεθοδολογία/αγωγός ραδιοϊατρικής που ακολούθησαν οι ερευνητές. Επιπλέον, με βάση τις παγίδες και τις αβεβαιότητες που παρουσιάσαμε, προτείναμε ένα πλαίσιο τυποποίησης με όλες τις απαραίτητες τεχνικές-τεχνικές πτυχές που θα πρέπει να ληφθούν υπόψη στον σχεδιασμό/ανάπτυξη μιας μελέτης ραδιοϊατρικής.Ένα βασικό στοιχείο από το κεφάλαιο 2 είναι ότι η αναπαραγωγιμότητα των ραδιομικών μελετών/ευρημάτων είναι μία από τις κύριες απαιτήσεις για την τυποποίηση και την εφαρμογή της έννοιας της ραδιομικής στην κλινική. Ως εκ τούτου, στο κεφάλαιο 3 παρείχαμε ένα δημοσίως διαθέσιμο σύνολο δεδομένων που αποτελείται από σαρώσεις τομογραφίας υπολογιστή (CT) (κατάλληλες για ραδιοφωνικές μελέτες) από τρία διαφορετικά ολλανδικά κέντρα RT, με στόχο την προώθηση της αναπαραγωγιμότητας και της διαλειτουργικότητας των μελετών ραδιενέργειας .Μοντελοποίηση πρόβλεψης ή σχετιζόμενα με RT αποτελέσματαΣτο δεύτερο μέρος της διατριβής εστιάσαμε στη μοντελοποίηση πρόβλεψης των αποτελεσμάτων RT χρησιμοποιώντας αλγόριθμους AI. Λαμβάνοντας υπόψη τους κανονισμούς περί απορρήτου των δεδομένων των ασθενών, στο κεφάλαιο 5, υλοποιήσαμε μια ομοσπονδιακή αποκεντρωμένη πολυκεντρική μελέτη βασισμένη σε ραδιενεργά, χρησιμοποιώντας tΜη μικροκυτταρικούς ασθενείς με καρκίνο του πνεύμονα (NSCLC). Έχοντας ως βάση τα δεδομένα που βασίζονται σε κλινικά και ραδιομικά χαρακτηριστικά μετασχηματισμένα FAIR, επικυρώσαμε μια υπογραφή ραδιενεργών που προβλέπει τη 2ετή συνολική επιβίωση ασθενών με NSCLC χωρίς ανταλλαγή δεδομένων ασθενών, συγκρίνοντας τα αποτελέσματα της κεντρικής ανάλυσης. Η μελέτη έδειξε ότι η απόδοση της ραδιοφωνικής υπογραφής της αποκεντρωμένης προσέγγισης δεν ήταν σημαντικά διαφορετική από την κεντρική. Επιπλέον, με αυτή τη μελέτη, υπογραμμίζεται η σημασία του Δίκαιου μετασχηματισμού των δεδομένων για μελέτες ομόσπονδης εκμάθησης ραδιοφωνικής, εφαρμόζοντας μια υποδομή διατήρησης της ιδιωτικής ζωής χωρίς την ανταλλαγή δεδομένων ασθενών.Στο κεφάλαιο 6, πραγματοποιήσαμε μια ανεξάρτητη επικύρωση του μοντέλου Πιθανότητας Επιπλοκών Φυσιολογικών Επιπλοκών (NTCP) που βασίζεται σε λογιστική παλινδρόμηση που προβλέπει τη δυσφαγία έξι μηνών ≥ 2ου βαθμού για ασθενείς με καρκίνο κεφαλής και τραχήλου. Αυτό το μοντέλο αποτελεί μέρος του Ολλανδικού Εθνικού Πρωτοκόλλου Ενδείξεων για Θεραπεία με Πρωτόνια (NIPP) για την επιλογή ασθενών υποψηφίων για θεραπεία με πρωτόνια (PT). Σε αυτή τη μελέτη, δείξαμε ότι τα μοντέλα λογιστικής παλινδρόμησης χρειάζονται μια συγκεκριμένη προσέγγιση επικύρωσης σε ανεξάρτητες κοόρτες, εξετάζοντας την πιθανή ενημέρωση των διαφορετικών συνιστωσών των μοντέλων λογιστικής παλινδρόμησης (συντελεστές τομής, κλίσης και πρόβλεψης) μέσω της προσέγγισης που βασίζεται σε AI της κλειστής δοκιμής διαδικασία (CTP). Το CTP σε συνδυασμό με τη γραφική αξιολόγηση των καμπυλών βαθμονόμησης των διαφορετικών ενημερωμένων μοντέλων, έδειξε ότι το αρχικό μοντέλο NIPP δυσφαγίας χρειαζόταν ενημέρωση και επιλέχθηκε ένα νέο ενημερωμένο βαθμονομημένο μοντέλο. Ωστόσο, είναι σημαντικό να πραγματοποιηθεί μια πολυκεντρική μελέτη διατήρησης απορρήτου με τροφοδοσία χρησιμοποιώντας σύνολα δεδομένων μετασχηματισμένα FAIR στα διαφορετικά ολλανδικά κέντρα PT που μπορούν να ενισχύσουν τα αποτελέσματα του CTP.Διασφάλιση ποιότηταςΟ σχεδιασμός θεραπείας RT είναι μια περίπλοκη διαδικασία που απαιτεί συντονισμένες προσπάθειες κλινικών και τεχνικών επαγγελματιών RT. Για το τρίτο μέρος της διατριβής, στο κεφάλαιο 7 επικεντρωθήκαμε στη διασφάλιση ποιότητας (QA) της διαδικασίας σχεδιασμού θεραπείας RT μέσω εξωτερικής επικύρωσης μιας μεθόδου βασισμένης σε AI που αναπτύχθηκε στις Ηνωμένες Πολιτείες (ΗΠΑ) χρησιμοποιώντας μια ολλανδική κοόρτη ανεξάρτητων ασθενών . Αυτή η μέθοδος τεχνητής νοημοσύνης που χρησιμοποιεί Bayesian Networks (BNs) έχει ως στόχο τον έγκαιρο εντοπισμό σφαλμάτων που παρουσιάζονται στη φάση επαλήθευσης του σχεδιασμού θεραπείας RT και να προειδοποιεί τους ανθρώπους για πιθανές λανθασμένες μεταβλητές που περιλαμβάνονται σε αυτήν. Η εξωτερική επικύρωση χρησιμοποιώντας μια ανεξάρτητη κοόρτη ασθενών από την Ολλανδία δεν ήταν επιτυχής, λόγω των διαφορετικών τεχνικών χαρακτηριστικών των μηχανημάτων θεραπείας και του λογισμικού που χρησιμοποιούνται στα διάφορα κέντρα RT πιθανώς. Σύμφωνα με αυτή τη μελέτη, απαιτούνται περαιτέρω βήματα για τη γενίκευση και επαναχρησιμοποίηση συστημάτων που βασίζονται σε τεχνητή νοημοσύνη, εστιάζοντας στον αυτόματο εντοπισμό σφαλμάτων μεταξύ διαφορετικών κέντρων, όπως η προεπεξεργασία δεδομένων και η συμπερίληψη περισσότερων μεταβλητών που περιλαμβάνονται στον σχεδιασμό θεραπείας, όπως δεδομένα που βασίζονται στην απεικόνιση.Εφαρμογή των αρχών FAIRΣτο κεφάλαιο 4, επεκτείνοντας την εργασία του κεφαλαίου 3, παρείχαμε ένα σύνολο τεσσάρων δημοσίως διαθέσιμων συνόλων δεδομένων που χρησιμοποιήθηκαν σε μια πρωτοποριακή δημοσίευση στην κοινότητα ραδιενεργών το 2014 σε μορφή αναγνώσιμη από μηχανή. Συγκεκριμένα, χρησιμοποιώντας οντολογίες που σχετίζονται με την ογκολογία ακτινοβολίας και τεχνολογίες σημασιολογικού ιστού, μετασχηματίσαμε δεδομένα πολλαπλών πηγών (κλινικών, βασισμένων σε χαρακτηριστικά ραδιενέργειας και απεικόνισης) σε μορφή FAIR για να επιτρέψουμε την αυτοματοποίηση της επεξεργασίας δεδομένων από μηχανήματα με ελάχιστο ανθρώπινο παρέμβαση.Στο τελευταίο μέρος της διατριβής, εστιάσαμε στην εφαρμογή των αρχών FAIR στον τομέα της RT. Στο κεφάλαιο 8, έχοντας ως στόχο να εισαγάγουμε την έννοια FAIR στην κοινότητα RT, δώσαμε μια επισκόπηση των σημείων δράσης που απαιτούνται από τα διάφορα ενδιαφερόμενα μέρη της RT για την εισαγωγή και υιοθέτηση των αρχών FAIR στα διαφορετικά συστήματα αρχείων δεδομένων των νοσοκομείων. . Μερικά από τα πλεονεκτήματα που προσφέρει ένας μετασχηματισμός δεδομένων FAIR είναι η ευελιξία στην προσαρμογή βάσεων δεδομένων και η ικανότητα των μηχανών να «διαβάζουν» τα διαφορετικά δεδομένα για αυτοματοποιημένες μελέτες που βασίζονται σε AI. Στα κεφάλαια 9-10, παρείχαμε μοντέλα δεδομένων FAIR δομημένα σε γραφήματα γνώσης χρησιμοποιώντας τα στοιχεία δεδομένων που χρησιμοποιούνται για το εθνικό μητρώο ασθενών υποψηφίων για PT της Ολλανδίας. Χρησιμοποιώντας δημόσια διαθέσιμες οντολογίες και σημασιολογικές τεχνολογίες Ιστού, υπογραμμίζουμε τη σημασία της ευελιξίας και της διαλειτουργικότητας της μορφής FAIR χρησιμοποιώντας κλινικά δεδομένα ρουτίνας

    Hands-on federated analysis of semantic data using the Personal Health Train

    No full text
    The Semantic Web was built for interoperability; for combining and sharing data. The reality is unfortunately that not all data can be shared as-is. Healthcare data is an obvious example due to its privacy-sensitive nature, but other organisations and individuals in general are becoming more aware of the sensitivity and practical problems of sharing data. Additionally the amount of data is increasing exponentially and we need help analysing and unlocking the potential of these data, which will allow for a lot of knowledge and insights to be discovered. The combination of semantic data with Federated Analysis (FA) as described in the Personal Health Train manifesto, will enable machine actionability and re-use of data; the main goal of the FAIR principles. FA techniques (e.g. federated learning, multiparty computation) are rapidly becoming more and more proficient in solving this problem by expanding the ways we can share insights and models without having to share sensitive data. FA is showing a way towards secure and ethical big data analytics, where sensitive data does not need to travel, but allows models to learn from data sets without compromising on privacy and security. Now you know the why, let’s explain the how: In this 4 hour crash course, we will present an open source federated analysis architecture and a real world usecase. This practical application of the Personal Health Train concept will show how federated data analysis can benefit patients, clinicians and researchers. And hopefully also you

    External validation of a prediction model for timely implementation of innovations in radiotherapy

    No full text
    Background and purpose: The aim of this study was to externally validate a model that predicts timely innovation implementation, which can support radiotherapy professionals to be more successful in innovation implementation. Materials and methods: A multivariate prediction model was built based on the TRIPOD (Transparent Reporting of a multivariate prediction model for Individual Prognosis Or Diagnosis) criteria for a type 4 study (1). The previously built internally validated model had an AUC of 0.82, and was now validated using a completely new multicentre dataset. Innovation projects that took place between 2017–2019 were included in this study. Semi-structured interviews were performed to retrieve the prognostic variables of the previously built model. Projects were categorized according to the size of the project; the success of the project and the presence of pre-defined success factors were analysed. Results: Of the 80 included innovation projects (32.5% technological, 35% organisational and 32.5% treatment innovations), 55% were successfully implemented within the planned timeframe. Comparing the outcome predictions with the observed outcomes of all innovations resulted in an AUC of the external validation of the prediction model of 0.72 (0.60–0.84, 95% CI). Factors related to successful implementation included in the model are sufficient and competent employees, desirability and feasibility, clear goals and processes and the complexity of a project. Conclusion: For the first time, a prediction model focusing on the timely implementation of innovations has been successfully built and externally validated. This model can now be widely used to enable more successful innovation in radiotherapy
    corecore