19 research outputs found

    Les Forêts Aléatoires en Apprentissage Semi-Supervisé (Co-forest) pour la segmentation des images rétiniennes

    Get PDF
    Nous proposons une approche qui permet la reconnaissance automatique des régions Disques et Cups pour la mesure du rapport CDR (Cup/Disc Ratio) par apprentissage semi-supervisé. Une étude comparative de plusieurs techniques est proposée. Le principe repose sur une croissance de région en classifiant les pixels voisins à partir des pixels d'intérêt de l'image par apprentissage semi-supervisé. Les points d'intérêt sont détectés par l'algorithme Fuzzy C-means (FCM)

    Statistical Comparisons of the Top 10 Algorithms in Data Mining for Classification Task

    Get PDF
    This work is builds on the study of the 10 top data mining algorithms identified by the IEEE International Conference on Data Mining (ICDM) community in December 2006. We address the same study, but with the application of statistical tests to establish, a more appropriate and justified ranking classifier for classification tasks. Current studies and practices on theoretical and empirical comparison of several methods, approaches, advocated tests that are more appropriate. Thereby, recent studies recommend a set of simple and robust non-parametric tests for statistical comparisons classifiers. In this paper, we propose to perform non-parametric statistical tests by the Friedman test with post-hoc tests corresponding to the comparison of several classifiers on multiple data sets. The tests provide a better judge for the relevance of these algorithms

    Renforcement de l'Apprentissage Structurel pour la reconnaissance du Diabète

    No full text
    Interpretability represents the most important driving force behind the implementation of fuzzy-based classifiers for medical application problems. The expert should be able to understand the classifier and to evaluate its results. Fuzzy rule based models are especially suitable, because they consist of simple linguistically interpretable rules. The majority of classifiers based on an adaptive neuro-fuzzy inference system (ANFIS) used in literature do not provide enough explanation of how their inference results have been obtained. This Magister thesis discusses the possibility to increase the interpretability of ANFIS classifier by the hybridation with the clustering method Fuzzy C means. It is shown how a readable neuro-fuzzy classifier can be obtained by a learning process and how fuzzy rules extracted can enhance its interpretability. Experimental results show that the proposed fuzzy classifier can achieve a good tradeoff between the accuracy and interpretability. Also the basic structure of the fuzzy rules which were automatically extracted from the UCI Machine learning database shows strong similarities to the rules applied by human experts. Results are compared to other approaches in the literature. The proposed approach gives more compact, interpretable and accurate classifier.L'intelligibilité représente la force motrice la plus importante derrière la mise en œuvre des classifieurs à base flous pour les problèmes d'application médicale. L'expert devrait être capable de comprendre le classifieur et d'évaluer ses résultats. Les modèles à base de règles floues sont particulièrement adaptés, car ils sont constitués de simples règles linguistiques interprétables. Dans la littérature, la majorité des algorithmes basés sur un système d'inférence neuro-flous adaptatifs (ANFIS) ne fournissent pas suffisamment d'explications sur la façon d'obtenir les résultats d'inférence. Ce mémoire de Magister traite la possibilité d'augmenter l'interprétabilité du classifieur ANFIS avec l'apport de la méthode de clustering Fuzzy C-Means . Il montre comment un classifieur neuro-flou interprétable peut être obtenu par un processus d'apprentissage et comment les règles floues extraites peuvent améliorer son interprétation. Les résultats expérimentaux appliqués sur la base de données du diabète (UCI Machine Learning) montrent de fortes similitudes avec les règles appliquées par les experts. Les résultats sont comparés à d'autres travaux dans la littérature. L'approche proposée est simple et efficace pour clarifier la décision finale du classifieur, tout en préservant sa précision à un niveau satisfaisant

    A new feature selection approach based on ensemble methods in semi-supervised classification

    No full text
    International audienc

    Reconnaissance par Neuro-Floue du Diabète

    No full text
    Ce rapport de recherche fait parti du projet fin d'étude d'ingénieur d'état en Génie BioMédicalCe rapport concerne la réalisation d'un système informatique d'aide aux médecins pour la reconnaissance du diabète. Dans ce système, nous avons utilisé la base de données médicale réelle PIMA pour la conception et l'implémentation d'un classifieur neuro-flou. Nous avons comparé nos résultats obtenus avec un classifieur neuronal combiné avec des méthodes de réduction des paramètres comme : l'ACP (Analyse en Composantes Principales) et l'ACI (Analyse en Composantes Indépendantes). Grâce à sa base de règles (base de connaissances), le modèle neuro-flou a facilité la compréhension et la justification de l'échec ou du succès du classifieur

    Amélioration de l'environnement d'apprentissage dans le cadre de la classification multi-labels des données médicales

    No full text
    Over the last few years, Multi-label Learning (MLL) has attracted the attention of a large community of researchers in many fields. Initially, it was applied for text categorization in which the annotation of a document that belongs to multiple categories require specific approaches. Thereafter, MLL is being increasingly required in other many real-world applications.In our work, we considered MLL for the medical aid diagnosis, our first research goal was the investigation of the advantages of using committee of learners to improve a Multilabel algorithm that adapts K-Nearest-Neighbors (KNN) to Multi-label problem called MLKNN using Bagging and Boosting.- Secondly, we gathered a medical Multi-label dataset that concerns Ambulatory Blood Pressure Monitoring (ABPM) which currently occupies a central place in the diagnosis and follow-up of hypertensive patients. We also proposed, an intelligent analysis of ABPM records using Multi-label Classification algorithms allowing the expert to analyze them more quickly and efficiently. In addition, it could help to investigate label dependenciesand provide interesting insights.The satisfactory findings and interpretations of this work, conducted us to investigate more about the advantages of using Decision Trees (DT) to extract new and implicit correlations between different labels and features in a given dataset. For that, we reviewed recent works addressing Label dependencies based on several Multi-label algorithms based on DT. We presented also the main differences between the two defined types of Label correlation named Conditional and Unconditional (Marginal) Label dependence. Finally, we conducted a comparative study of six well-known algorithms in the literature, and we discussed the benefits of considering Label dependence using DT algorithm as a base classifierfor both Transformation and Adaptation algorithms.Finally, potential further works and future directions of our thesis were highlighted.Au cours des dernières années, l’apprentissage Multi-labels a attiré l’ attention d’une large communauté de chercheurs de plusieurs domaines. La catégorisation du texte était parmi les premières applications de ce type d’apprentissage dans laquelle un document peut être annoté par plusieurs labels à la fois. Par la suite, ce domaine de recherche a été étendu vers d’autres applications du monde réel.Dans notre thèse, nous nous sommes intéressés à l’ application de la Classification Multi-labels pour l’aide au diagnostic médical. Notre première piste de recherche a été consacrée à l’ étude des avantages de l’utilisation d’ un comité de modèles d’apprentissages à la place d’ un seul apprenant. L’ approche qui a été étudiée adapte l’algorithme du k-plus-proches-voisins au Multi-labels [1]. Deux stratégies de méthodes d’ Ensembles Homogènes ont été étudiées y compris le Bagging [2] et le Boosting [3].La seconde contribution de notre travail concerne une collecte d’une nouvelle base de données médicale de la Mesure Ambulatoire de la Pression Artérielle (MAPA) [4], qui constitue un outil très puissant et largement sollicité par les cardiologues pour une meilleure prise en charge des patients hypertendus. Dans le même travail, nous avons proposé l’utilisation des méthodes Multi-labels pour une analyse automatique des données MAPA [5]. Une première étude de corrélation entre les six labels de cette base de données a été également réalisée et ce qui nous a permis de déduire l’importance d’étendre notre étude de dépendance de labels en utilisant des techniques plus spécialisées.La dernière partie de notre thèse a été consacrée à l’étude de ce concept en détails. Nous avons présenté une revue de la littérature des algorithmes étudiant également cette problématique, et nous avons appliqué six algorithmes Multi-labels issus des deux grandes familles de méthodes de Transformation et d’ Adaptation, basées sur les arbres de décision pour une meilleure interprétabilité des résultats. A la fin, les résultats retrouvés ont été discutés et plusieurs pistes de recherches pour le futur ont été proposées

    Identifying regions of interest in whole slide images of renal cell carcinoma

    No full text
    International audiencePurpose: The histopathological images contain a huge amount of information, which can make diagnosis an extremely time-consuming and tedioustask. In this study, we developed a completely automated system to detect regions-of-interest (ROIs) in Whole Slide Images (WSI) of Renal Cell Carcinoma (RCC), to reduce time analysis and assist pathologists in making more accurate decisions.Methods: For this purpose, the WSIs are divided into patches at high resolution and a method is proposed to classify the patches into a tumor andhealthy tissue. The proposed approach is based on an e cient texture descriptor named Dominant Rotated Local Binary Pattern (DRLBP) and colortransformation (H and V channels) to reveal and exploit the immense texture variability at the microscopic high magni cations level. Thereby, the DRLBPs retain the structural information and utilize the magnitude values in a local neighborhood for more discriminative power. For the classication of the relevant ROIs, feature extraction of WSIs patches was performed on the color channels separately to form the histograms. Next, we used the most frequently occurring patterns as a feature selection step to discard non-informative features. The performances of di erent classi ers (k-NN, SVM and RF) on a set of 1800 kidney cancer patches originating from 12 whole slide images, were compared and evaluated. Furthermore, the small size of the image dataset allows to investigate deep learning approach based on transfer learning for image patches classi cation by using deep features (VGG-16) and  ne-tuning (ResNet-50) methods.Results: High recognition accuracy was obtained and the classi ers are efficient, the best precision result was 99.17% achieved with SVM. Moreover, transfer learning models perform well with comparable performance, and the highest precision using ResNet-50 reached 98.50%. The proposed approach results revealed a very e cient image classi cation and demonstrated e cacy in identifying ROIs.Conclusion: This study presents an automatic system to detect regions of interest relevant to the diagnosis of kidney cancer in whole-slide histopathology images
    corecore