3 research outputs found

    Enhancing Parkinson’s Disease Prediction Using Machine Learning and Feature Selection Methods

    Get PDF
    Several millions of people suffer from Parkinson’s disease globally. Parkinson’s affects about 1% of people over 60 and its symptoms increase with age. The voice may be affected and patients experience abnormalities in speech that might not be noticed by listeners, but which could be analyzed using recorded speech signals. With the huge advancements of technology, the medical data has increased dramatically, and therefore, there is a need to apply data mining and machine learning methods to extract new knowledge from this data. Several classification methods were used to analyze medical data sets and diagnostic problems, such as Parkinson’s Disease (PD). In addition, to improve the performance of classification, feature selection methods have been extensively used in many fields. This paper aims to propose a comprehensive approach to enhance the prediction of PD using several machine learning methods with different feature selection methods such as filter-based and wrapper-based. The dataset includes 240 recodes with 46 acoustic features extracted from 3 voice recording replications for 80 patients. The experimental results showed improvements when wrapper-based features selection method was used with KNN classifier with accuracy of 88.33%. The best obtained results were compared with other studies and it was found that this study provides comparable and superior results

    Longitudinal clustering analysis and prediction of Parkinson\u27s disease progression using radiomics and hybrid machine learning

    Get PDF
    Background: We employed machine learning approaches to (I) determine distinct progression trajectories in Parkinson\u27s disease (PD) (unsupervised clustering task), and (II) predict progression trajectories (supervised prediction task), from early (years 0 and 1) data, making use of clinical and imaging features. Methods: We studied PD-subjects derived from longitudinal datasets (years 0, 1, 2 & 4; Parkinson\u27s Progressive Marker Initiative). We extracted and analyzed 981 features, including motor, non-motor, and radiomics features extracted for each region-of-interest (ROIs: left/right caudate and putamen) using our standardized standardized environment for radiomics analysis (SERA) radiomics software. Segmentation of ROIs on dopamine transposer - single photon emission computed tomography (DAT SPECT) images were performed via magnetic resonance images (MRI). After performing cross-sectional clustering on 885 subjects (original dataset) to identify disease subtypes, we identified optimal longitudinal trajectories using hybrid machine learning systems (HMLS), including principal component analysis (PCA) + K-Means algorithms (KMA) followed by Bayesian information criterion (BIC), Calinski-Harabatz criterion (CHC), and elbow criterion (EC). Subsequently, prediction of the identified trajectories from early year data was performed using multiple HMLSs including 16 Dimension Reduction Algorithms (DRA) and 10 classification algorithms. Results: We identified 3 distinct progression trajectories. Hotelling\u27s t squared test (HTST) showed that the identified trajectories were distinct. The trajectories included those with (I, II) disease escalation (2 trajectories, 27% and 38% of patients) and (III) stable disease (1 trajectory, 35% of patients). For trajectory prediction from early year data, HMLSs including the stochastic neighbor embedding algorithm (SNEA, as a DRA) as well as locally linear embedding algorithm (LLEA, as a DRA), linked with the new probabilistic neural network classifier (NPNNC, as a classifier), resulted in accuracies of 78.4% and 79.2% respectively, while other HMLSs such as SNEA + Lib_SVM (library for support vector machines) and t_SNE (t-distributed stochastic neighbor embedding) + NPNNC resulted in 76.5% and 76.1% respectively. Conclusions: This study moves beyond cross-sectional PD subtyping to clustering of longitudinal disease trajectories. We conclude that combining medical information with SPECT-based radiomics features, and optimal utilization of HMLSs, can identify distinct disease trajectories in PD patients, and enable effective prediction of disease trajectories from early year data

    Utilisation de l’intelligence artificielle pour identifier les marqueurs de la démence dans le trouble comportemental en sommeil paradoxal

    Full text link
    La démence à corps de Lewy (DCL) et la maladie de Parkinson (MP) sont des maladies neurodégénératives touchant des milliers de Canadiens et leur prévalence croît avec l’âge. La MP et la DCL partagent la même pathophysiologie, mais se distinguent par l’ordre de manifestation des symptômes : la DCL se caractérise d’abord par l’apparition d’un trouble neurocognitif majeur (démence), tandis que la MP se manifeste initialement par un parkinsonisme. De plus, jusqu’à 80% des patients avec la MP développeront une démence (MPD). Il est désormais établi que le trouble comportemental en sommeil paradoxal idiopathique (TCSPi) constitue un puissant prédicteur de la DCL et la MP. En effet, cette parasomnie, marquée par des comportements indésirables durant le sommeil, est considérée comme un stade prodromal des synucléinopathies, telles que la MP, la DCL et l'atrophie multisystémique (AMS). Ainsi, la majorité des patients atteints d’un TCSPi développeront une synucléinopathie. Malgré les avancées scientifiques, les causes du TCSPi, de la MP et de la DCL demeurent inconnues et aucun traitement ne parvient à freiner ou à arrêter la neurodégénérescence. De plus, ces pathologies présentent une grande hétérogénéité dans l’apparition et la progression des divers symptômes. Face à ces défis, la recherche vise à mieux cerner les phases précoces/initiales et les trajectoires évolutives de ces maladies neurodégénératives afin d’intervenir le plus précocement possible dans leur développement. C’est pourquoi le TCSPi suscite un intérêt majeur en tant que fenêtre d'opportunités pour tester l’efficacité des thérapies neuroprotectrices contre les synucléinopathies, permettant d'agir avant que la perte neuronale ne devienne irréversible. Le TCSPi offre ainsi une occasion unique d'améliorer la détection de la démence et le suivi des individus à haut risque de déclin cognitif. D'où l'importance cruciale de pouvoir généraliser les résultats issus de la recherche sur de petites cohortes à l'ensemble de la population. Sur le plan de la cognition, les études longitudinales sur le TCSPi ont montré que les atteintes des fonctions exécutives, de la mémoire verbale et de l'attention sont les plus discriminantes pour différencier les individus qui développeront une démence de ceux qui resteront idiopathiques. De plus, un grand nombre de patients TCSPi souffrent d’un trouble neurocognitif mineur ou trouble cognitif léger (TCL), généralement considéré comme un stade précurseur de la démence. Les recherches actuelles sur les données cognitives chez cette population offrent des perspectives prometteuses, mais reposent sur des approches statistiques classiques qui limitent leur validation et généralisation. Bien qu'elles offrent une précision élevée (80 à 85%) pour détecter les patients à risque de déclin cognitif, une amélioration est nécessaire pour étendre l'utilisation de ces marqueurs à une plus large échelle. Depuis les années 2000, l'accroissement de la puissance de calcul et l'accès à davantage de ressources de mémoire ont suscité un intérêt accru pour les algorithmes d'apprentissage machine (AM). Ces derniers visent à généraliser les résultats à une population plus vaste en entraînant des modèles sur une partie des données et en les testant sur une autre, validant ainsi leur application clinique. Jusqu'à présent, aucune étude n'a évalué les apports de l'AM pour la prédiction de l'évolution des synucléinopathies en se penchant sur le potentiel de généralisation, et donc d'application clinique, à travers l'usage d'outils non invasifs et accessibles ainsi que de techniques de validation de modèles (model validation). De plus, aucune étude n'a exploré l'utilisation de l'AM associée à des méthodes de généralisation sur des données neuropsychologiques longitudinales pour élaborer un modèle prédictif de la progression des déficits cognitifs dans le TCSPi. L’objectif général de cette thèse est d’étudier l’apport de l’AM pour analyser l’évolution du profil cognitif de patients atteints d’un TCSPi. Le premier chapitre de cette thèse présente le cadre théorique qui a guidé l’élaboration des objectifs et hypothèses de recherche. Le deuxième chapitre est à deux volets (articles). Le premier vise à fournir une vue d'ensemble de la littérature des études ayant utilisé l'AM (avec des méthodes de généralisation) pour prédire l'évolution des synucléinopathies vers une démence, ainsi que les lacunes à combler. Le deuxième volet vise à explorer et utiliser pour la première fois l'AM sur des données cliniques et cognitifs pour prédire la progression vers la démence dans le TCSPi, dans un devis longitudinal. Enfin, le dernier chapitre de la thèse présente une discussion et une conclusion générale, comprenant un résumé des deux articles, ainsi que les implications théoriques, les forces, les limites et les orientations futures.Lewy body dementia (LBD) and Parkinson's disease (PD) are neurodegenerative diseases affecting thousands of Canadians, and their prevalence increases with age. PD and DLB share the same pathophysiology, but differ in the order of symptom manifestation: DLB is characterized first by the onset of a major neurocognitive disorder (dementia), whereas PD initially manifests as parkinsonism. Moreover, up to 80% of PD patients will go on to develop dementia (PDD). It is established that idiopathic REM sleep behavior disorder (iRBD) is a powerful predictor of DLB and PD. Indeed, this parasomnia, marked by undesirable behaviors during sleep, is considered a prodromal stage of synucleinopathies, such as PD, DLB and multisystem atrophy (MSA). Therefore, the majority of patients with iRBD will develop synucleinopathy. Despite scientific advancements, the causes of iRBD, PD, and DLB remain unknown and no treatment has been able to slow or halt neurodegeneration. Furthermore, these pathologies display great heterogeneity in the onset and progression of various symptoms. Faced with these challenges, research aims to better understand the early/initial stages and the progressive trajectories of these neurodegenerative diseases in order to intervene as early as possible in their development. This is why iRBD garners major interest as a window of opportunities to test the effectiveness of neuroprotective therapies against synucleinopathies, enabling action to be taken before neuronal loss becomes irreversible. iRBD thus provides a unique opportunity to improve dementia detection and monitoring of individuals at high risk of cognitive decline. Hence the crucial importance of being able to generalize results of research on small cohorts to the entire population. In terms of cognition, longitudinal studies on iRBD have shown that impairments in executive functions, verbal memory, and attention are the most discriminating in differencing between individuals who will develop dementia from those who will remain idiopathic. In addition, many iRBD patients suffer from a mild neurocognitive disorder or mild cognitive impairment (MCI), generally considered as a precursor stage of dementia. Current research on cognitive data in this population offers promising prospects, but relies on traditional statistical approaches that limit their validation and generalizability. While they provide high accuracy (80 to 85%) for detecting patients at risk of cognitive decline, improvement is needed to extend the use of these markers to a larger scale. Since the 2000s, increased computational power and access to more memory resources have sparked growing interest in machine learning (ML) algorithms. These aim to generalize results to a broader population by training models on a subset of data and testing them on another, thus validating their clinical application. To date, no study has assessed the contributions of ML for predicting the progression of synucleinopathies, focusing on the potential for generalization, and hence clinical application, through the use of non-invasive, accessible tools and model validation techniques. Moreover, no study has explored the use of ML in conjunction with generalization methods on longitudinal neuropsychological data to develop a predictive model of cognitive deficit progression in iRBD. The general objective of this thesis is to study the contribution of ML in analyzing the evolution of the cognitive profile of patients with iRBD. The first chapter of this thesis presents the theoretical framework that guided the formulation of the research objectives and hypotheses. The second chapter is in two parts (articles). The first aims to provide an overview of the literature of studies that have used ML (with generalization methods) to predict the progression of synucleinopathies to dementia, as well as the gaps that need to be filled. The second part aims to explore and use for the first time ML on clinical and cognitive data to predict progression to dementia in iRBD, in a longitudinal design. Finally, the last chapter of the thesis presents a discussion and a general conclusion, including a summary of the two articles, as well as theoretical implications, strengths, limitations, and future directions
    corecore