22 research outputs found

    Les Forêts Aléatoires en Apprentissage Semi-Supervisé (Co-forest) pour la segmentation des images rétiniennes

    Get PDF
    Nous proposons une approche qui permet la reconnaissance automatique des régions Disques et Cups pour la mesure du rapport CDR (Cup/Disc Ratio) par apprentissage semi-supervisé. Une étude comparative de plusieurs techniques est proposée. Le principe repose sur une croissance de région en classifiant les pixels voisins à partir des pixels d'intérêt de l'image par apprentissage semi-supervisé. Les points d'intérêt sont détectés par l'algorithme Fuzzy C-means (FCM)

    Statistical Comparisons of the Top 10 Algorithms in Data Mining for Classification Task

    Get PDF
    This work is builds on the study of the 10 top data mining algorithms identified by the IEEE International Conference on Data Mining (ICDM) community in December 2006. We address the same study, but with the application of statistical tests to establish, a more appropriate and justified ranking classifier for classification tasks. Current studies and practices on theoretical and empirical comparison of several methods, approaches, advocated tests that are more appropriate. Thereby, recent studies recommend a set of simple and robust non-parametric tests for statistical comparisons classifiers. In this paper, we propose to perform non-parametric statistical tests by the Friedman test with post-hoc tests corresponding to the comparison of several classifiers on multiple data sets. The tests provide a better judge for the relevance of these algorithms

    Improving Healthcare Communication: AI-Driven Emotion Classification in Imbalanced Patient Text Data with Explainable Models

    Get PDF
    Sentiment analysis is crucial in healthcare to understand patients’ emotions, automatically identifying the feelings of patients suffering from serious illnesses (cancer, AIDS, or Ebola) with an artificial intelligence model that constitutes a major challenge to help health professionals. This study presents a comparative study on different machine learning (logistic regression, naive Bayes, and LightGBM) and deep learning models: long short-term memory (LSTM) and bidirectional encoder representations from transformers (BERT) for classify health feelings thanks to textual data related to patients with serious illnesses. Considering the class imbalance of the dataset, various resampling techniques are investigated. The approach is complemented by an explainable model, LIME, to understand the shortcomings of the classification results. The results highlight the superior performance of the BERT and LSTM models with an F1-score of 89%

    Renforcement de l'Apprentissage Structurel pour la reconnaissance du Diabète

    No full text
    Interpretability represents the most important driving force behind the implementation of fuzzy-based classifiers for medical application problems. The expert should be able to understand the classifier and to evaluate its results. Fuzzy rule based models are especially suitable, because they consist of simple linguistically interpretable rules. The majority of classifiers based on an adaptive neuro-fuzzy inference system (ANFIS) used in literature do not provide enough explanation of how their inference results have been obtained. This Magister thesis discusses the possibility to increase the interpretability of ANFIS classifier by the hybridation with the clustering method Fuzzy C means. It is shown how a readable neuro-fuzzy classifier can be obtained by a learning process and how fuzzy rules extracted can enhance its interpretability. Experimental results show that the proposed fuzzy classifier can achieve a good tradeoff between the accuracy and interpretability. Also the basic structure of the fuzzy rules which were automatically extracted from the UCI Machine learning database shows strong similarities to the rules applied by human experts. Results are compared to other approaches in the literature. The proposed approach gives more compact, interpretable and accurate classifier.L'intelligibilité représente la force motrice la plus importante derrière la mise en œuvre des classifieurs à base flous pour les problèmes d'application médicale. L'expert devrait être capable de comprendre le classifieur et d'évaluer ses résultats. Les modèles à base de règles floues sont particulièrement adaptés, car ils sont constitués de simples règles linguistiques interprétables. Dans la littérature, la majorité des algorithmes basés sur un système d'inférence neuro-flous adaptatifs (ANFIS) ne fournissent pas suffisamment d'explications sur la façon d'obtenir les résultats d'inférence. Ce mémoire de Magister traite la possibilité d'augmenter l'interprétabilité du classifieur ANFIS avec l'apport de la méthode de clustering Fuzzy C-Means . Il montre comment un classifieur neuro-flou interprétable peut être obtenu par un processus d'apprentissage et comment les règles floues extraites peuvent améliorer son interprétation. Les résultats expérimentaux appliqués sur la base de données du diabète (UCI Machine Learning) montrent de fortes similitudes avec les règles appliquées par les experts. Les résultats sont comparés à d'autres travaux dans la littérature. L'approche proposée est simple et efficace pour clarifier la décision finale du classifieur, tout en préservant sa précision à un niveau satisfaisant

    Autopsie Médicale : étude de la mortalité et causes de décès au niveau CHU Tlemcen, Algérie

    No full text
    In the last decade, more and more epidemiological and demographic studies have been carried out to discover the risk factors of diseases as well as the causes of death of a population and the classification of these causes, especially the cases of suspicious deaths which are increasing rapidly. In this research project, we focused on the study of the causes of death in the wilaya of Tlemcen by building a database collected at the level of the forensic medicine service of the University Hospital of Tlemcen, Algeria. This research report presents the context of work as well as the various medical concepts associated with it, then we describe the collected database and the various parameters characterizing it, we end with our objectives in the future which concerns the automatic classification of autopsy reports using artificial learning methods.Cette dernière décennie de plus en plus d'études épidémiologiques et démographiques ont été menées pour la découverte des facteurs de risques des maladies ainsi que les causes de décès d'une population et la classification de ces causes, plus particulièrement les cas de morts suspects qui sont en hausse fulgurante. Dans ce projet de recherche, nous nous sommes focalisé sur l'étude des causes du décès dans la wilaya de Tlemcen en construisant une base de données collectée au niveau du service de médecine légale de l'Hôpital Universitaire de Tlemcen, Algérie. Ce rapport de recherche présente le contexte de travail ainsi que les différents concepts médicaux associés a ce dernier, par la suite, nous décrivons la base de données collectée et les différents paramètres la caractérisant, nous terminons par nos objectifs dans le futur qui concerne la classification automatique des rapports des autopsie en utilisant les méthodes d'apprentissage artificiel

    A new feature selection approach based on ensemble methods in semi-supervised classification

    No full text
    International audienc

    Amélioration de l'environnement d'apprentissage dans le cadre de la classification multi-labels des données médicales

    No full text
    Over the last few years, Multi-label Learning (MLL) has attracted the attention of a large community of researchers in many fields. Initially, it was applied for text categorization in which the annotation of a document that belongs to multiple categories require specific approaches. Thereafter, MLL is being increasingly required in other many real-world applications.In our work, we considered MLL for the medical aid diagnosis, our first research goal was the investigation of the advantages of using committee of learners to improve a Multilabel algorithm that adapts K-Nearest-Neighbors (KNN) to Multi-label problem called MLKNN using Bagging and Boosting.- Secondly, we gathered a medical Multi-label dataset that concerns Ambulatory Blood Pressure Monitoring (ABPM) which currently occupies a central place in the diagnosis and follow-up of hypertensive patients. We also proposed, an intelligent analysis of ABPM records using Multi-label Classification algorithms allowing the expert to analyze them more quickly and efficiently. In addition, it could help to investigate label dependenciesand provide interesting insights.The satisfactory findings and interpretations of this work, conducted us to investigate more about the advantages of using Decision Trees (DT) to extract new and implicit correlations between different labels and features in a given dataset. For that, we reviewed recent works addressing Label dependencies based on several Multi-label algorithms based on DT. We presented also the main differences between the two defined types of Label correlation named Conditional and Unconditional (Marginal) Label dependence. Finally, we conducted a comparative study of six well-known algorithms in the literature, and we discussed the benefits of considering Label dependence using DT algorithm as a base classifierfor both Transformation and Adaptation algorithms.Finally, potential further works and future directions of our thesis were highlighted.Au cours des dernières années, l’apprentissage Multi-labels a attiré l’ attention d’une large communauté de chercheurs de plusieurs domaines. La catégorisation du texte était parmi les premières applications de ce type d’apprentissage dans laquelle un document peut être annoté par plusieurs labels à la fois. Par la suite, ce domaine de recherche a été étendu vers d’autres applications du monde réel.Dans notre thèse, nous nous sommes intéressés à l’ application de la Classification Multi-labels pour l’aide au diagnostic médical. Notre première piste de recherche a été consacrée à l’ étude des avantages de l’utilisation d’ un comité de modèles d’apprentissages à la place d’ un seul apprenant. L’ approche qui a été étudiée adapte l’algorithme du k-plus-proches-voisins au Multi-labels [1]. Deux stratégies de méthodes d’ Ensembles Homogènes ont été étudiées y compris le Bagging [2] et le Boosting [3].La seconde contribution de notre travail concerne une collecte d’une nouvelle base de données médicale de la Mesure Ambulatoire de la Pression Artérielle (MAPA) [4], qui constitue un outil très puissant et largement sollicité par les cardiologues pour une meilleure prise en charge des patients hypertendus. Dans le même travail, nous avons proposé l’utilisation des méthodes Multi-labels pour une analyse automatique des données MAPA [5]. Une première étude de corrélation entre les six labels de cette base de données a été également réalisée et ce qui nous a permis de déduire l’importance d’étendre notre étude de dépendance de labels en utilisant des techniques plus spécialisées.La dernière partie de notre thèse a été consacrée à l’étude de ce concept en détails. Nous avons présenté une revue de la littérature des algorithmes étudiant également cette problématique, et nous avons appliqué six algorithmes Multi-labels issus des deux grandes familles de méthodes de Transformation et d’ Adaptation, basées sur les arbres de décision pour une meilleure interprétabilité des résultats. A la fin, les résultats retrouvés ont été discutés et plusieurs pistes de recherches pour le futur ont été proposées

    Reconnaissance par Neuro-Floue du Diabète

    No full text
    Ce rapport de recherche fait parti du projet fin d'étude d'ingénieur d'état en Génie BioMédicalCe rapport concerne la réalisation d'un système informatique d'aide aux médecins pour la reconnaissance du diabète. Dans ce système, nous avons utilisé la base de données médicale réelle PIMA pour la conception et l'implémentation d'un classifieur neuro-flou. Nous avons comparé nos résultats obtenus avec un classifieur neuronal combiné avec des méthodes de réduction des paramètres comme : l'ACP (Analyse en Composantes Principales) et l'ACI (Analyse en Composantes Indépendantes). Grâce à sa base de règles (base de connaissances), le modèle neuro-flou a facilité la compréhension et la justification de l'échec ou du succès du classifieur
    corecore