31 research outputs found

    Gene-Based Multiclass Cancer Diagnosis with Class-Selective Rejections

    Get PDF
    Supervised learning of microarray data is receiving much attention in recent years. Multiclass cancer diagnosis, based on selected gene profiles, are used as adjunct of clinical diagnosis. However, supervised diagnosis may hinder patient care, add expense or confound a result. To avoid this misleading, a multiclass cancer diagnosis with class-selective rejection is proposed. It rejects some patients from one, some, or all classes in order to ensure a higher reliability while reducing time and expense costs. Moreover, this classifier takes into account asymmetric penalties dependant on each class and on each wrong or partially correct decision. It is based on ν-1-SVM coupled with its regularization path and minimizes a general loss function defined in the class-selective rejection scheme. The state of art multiclass algorithms can be considered as a particular case of the proposed algorithm where the number of decisions is given by the classes and the loss function is defined by the Bayesian risk. Two experiments are carried out in the Bayesian and the class selective rejection frameworks. Five genes selected datasets are used to assess the performance of the proposed method. Results are discussed and accuracies are compared with those computed by the Naive Bayes, Nearest Neighbor, Linear Perceptron, Multilayer Perceptron, and Support Vector Machines classifiers

    Extraction d'attributs discriminants par optimisation de fonctions paramétrées

    Get PDF
    Une méthode est proposée pour extraire automatiquement des attributs discriminants dans le cas d'un processus décrit à l'aide d'une base d'exemples étiquetés. Les attributs sont sélectionnés, à l'aide de familles de fonctions paramétrées, en déterminant les paramètres optimaux par rapport à un critère de séparabilité des classes. Les fonctions paramétrées choisies mesurent des caractéristiques correspondant aux moments d'ordre 0 ou 1 d'une représentation uni- ou bi-dimensionnelle pondérée. L'aspect continu des fonctions paramétrées permet d'explorer un ensemble infini d'attributs et d'éviter de traiter un problème de complexité combinatoire. Le critère mesurant la séparabilité des classes est basé sur les matrices de dispersion, et permet la sélection conjointe d'attributs. L'élaboration d'un classifieur linéaire, adapté aux attributs extraits est proposé. La méthode est appliquée à des signaux simulés décrits par leur représentation temporelle

    Classification basée sur l'extraction conjointe d'attributs dans le plan temps-fréquence selon un critère d'information mutuelle

    Get PDF
    - La méthode proposée concerne la classification de signaux basée sur une extraction automatique et conjointe d'attributs, dans le cas de processus non stationnaires uniquement décrits à l'aide d'une base d'exemples étiquetés. Les attributs sont définis par le résultat de transformations appliquées à la distribution du Wigner-Ville du signal à classer. Chaque transformation est sélectionnée au sein d'une famille de transformations paramétrées. Les valeurs des paramètres sont optimisées afin de maximiser l'information discriminante portée conjointement par les attributs, compte tenu d'une base d'apprentissage. L'information discriminante est mesurée à l'aide d'un critère d'information mutuelle, basé sur l'estimation des lois de distribution conjointes des attributs. Afin de prendre en compte toute l'information portée par les attributs et d'assurer une cohérence avec la phase d'extraction, le classifieur utilise également l'estimation des lois de probabilités. Le principe obtenu présente l'intérêt de ne faire aucune hypothèse sur les lois suivies par les attributs conditionnellement à chacune des classes. La méthode a été appliquée à un problème de classification de signaux de l'électroencéphalogramme du sommeil. De bonnes performances ont été obtenues à partir de l'extraction conjointe de deux attributs

    Classification avec contraintes : problématique et apprentissage d'une règle de décision par SVM

    Get PDF
    Le travail présenté porte sur la détermination d'une règle de décision pour un problème avec deux classes et deux contraintes qui fixent des bornes supérieures pour les probabilités d'erreur conditionnelles aux classes. Dans le cas où il existe des règles de décision satisfaisant conjointement les contraintes, la règle choisie sera celle qui minimise un coût combinant les probabilités de décision conditionnelles. Dans le cas contraire, il est nécessaire de définir une règle qui ajoute une classe de rejet. La règle optimale recherchée est alors est celle qui minimise la probabilité de rejet. Dans un premier temps, la règle de décision est définie lorsque les densités de probabilités de chacune des classes sont connues : elle consiste à comparer le rapport de vraisemblance à un ou deux seuils selon que du rejet est nécessaire ou pas. Dans un second temps, une méthode basée sur les SVM est proposée pour élaborer une règle de décision lorsque le processus est uniquement décrit par un ensemble d'apprentissage. La règle consiste à comparer la sortie du SVM avec un ou deux seuils. Ceux-ci sont déterminés à partir des sorties du SVM pour un ensemble d'apprentissage, soit directement avec les valeurs de sortie, soit à partir d'estimation des densités de probabilités. Le biais et la variance des probabilités de rejet et d'erreurs conditionnelles inhérents à la taille de l'ensemble d'apprentissage sont étudiés

    Classification supervisée avec option de rejet partiel et contraintes de performance basée sur l'estimation des densités de probabilité

    Get PDF
    Cette communication traite les problèmes de classification avec option de rejet partiel et contraintes de performances. L'objectif est d'étudier la possibilité d'exploiter la solution obtenue dans le cadre des tests d'hypothèses statistiques en y introduisant des densités de probabilité conditionnelles estimées. Deux estimateurs de densités sont utilisés et deux modalités d'optimisation des estimateurs sont comparées et analysées

    Batch-adaptive rejection threshold estimation with application to OCR post-processing

    Full text link
    An OCR process is often followed by the application of a language model to find the best transformation of an OCR hypothesis into a string compatible with the constraints of the document, field or item under consideration. The cost of this transformation can be taken as a confidence value and compared to a threshold to decide if a string is accepted as correct or rejected in order to satisfy the need for bounding the error rate of the system. Widespread tools like ROC, precision-recall, or error-reject curves, are commonly used along with fixed thresholding in order to achieve that goal. However, those methodologies fail when a test sample has a confidence distribution that differs from the one of the sample used to train the system, which is a very frequent case in post-processed OCR strings (e.g., string batches showing particularly careful handwriting styles in contrast to free styles). In this paper, we propose an adaptive method for the automatic estimation of the rejection threshold that overcomes this drawback, allowing the operator to define an expected error rate within the set of accepted (non-rejected) strings of a complete batch of documents (as opposed to trying to establish or control the probability of error of a single string), regardless of its confidence distribution. The operator (expert) is assumed to know the error rate that can be acceptable to the user of the resulting data. The proposed system transforms that knowledge into a suitable rejection threshold. The approach is based on the estimation of an expected error vs. transformation cost distribution. First, a model predicting the probability of a cost to arise from an erroneously transcribed string is computed from a sample of supervised OCR hypotheses. Then, given a test sample, a cumulative error vs. cost curve is computed and used to automatically set the appropriate threshold that meets the user-defined error rate on the overall sample. The results of experiments on batches coming from different writing styles show very accurate error rate estimations where fixed thresholding clearly fails. An original procedure to generate distorted strings from a given language is also proposed and tested, which allows the use of the presented method in tasks where no real supervised OCR hypotheses are available to train the system.Navarro Cerdan, JR.; Arlandis Navarro, JF.; Llobet Azpitarte, R.; Perez-Cortes, J. (2015). Batch-adaptive rejection threshold estimation with application to OCR post-processing. Expert Systems with Applications. 42(21):8111-8122. doi:10.1016/j.eswa.2015.06.022S81118122422

    Spatial stochastic process clustering using a local a posteriori probability

    No full text
    International audienceThis paper addresses the problem of spatial stochastic process clustering in a model-based framework. A data set is used, in which each realization has two components : a non-uniform time series, which describes the process evolution with independent increments and a set of additional attributes which describes the system characteristics. It is assumed that realizations with similar additional attributes tend to have the same cluster label. The aim is to find out the unknown cluster labels and the parameters of the statistical model characterizing the processes. Thus this is a kind of a problem of spatial clustering with a time component. The proposed method is based on an EM procedure and takes into account the proximity of the additional attributes using a local a posteriori probability. The importance of the neighborhood influence is tuned thanks to a parameter. The method is illustrated using simulated data

    Continuité de l'exploitation d'un réseau de bus, en période de travaux liés à l'arrivée d'un tramway. L'amélioration de l'information "déviation" chez Keolis Tours

    No full text
    A bus network meets disruptions, more or less pronounced, all along the year. In the city of Tours, France, road works relating to the arrival of a new tramway will last 3 years. The problem is that road words will take place in the most used points of the network, in the biggest bus stops. The years 'schedule is unstable, so it may well complicate matters. The creation and diffusion of a special information about detours (to urban transports 'users or to bus drivers) have to change to be captured better. The internship's task is to find answers to develop this special information. It can be: to give more landmarks, to make this information more visible, legible, and intelligible, and also at disposal. Work instruments and ways to proceed have to be developed. Actions concern many fields in the company: Marketing, Running operating System, Management and of course, Communication.Un réseau de bus connaît des perturbations tout au long de l'année. Ces perturbations sont plus ou moins fortes. À Tours, de gros travaux liés à l'arrivée d'un tramway vont durer plusieurs années. Ces travaux vont toucher des points forts du réseau. Les rues impactées et les durées vont être mouvantes, ce qui complique la création et la diffusion de l'information à destination des clients, mais aussi des conducteurs. La mission proposée est de trouver des pistes d'amélioration de cette information « déviation ». Pour cela, il faut donner plus de repères pour être guidé correctement et ne pas se perdre, faire en sorte que l'information soit toujours visible, lisible, compréhensible et à disposition rapidement. Les outils de travail vont évoluer, les procédures également. Les actions proposées agissent sur tous les services de l'entreprise, qu'il s'agisse du Marketing, de la Production, du Management et bien sûr de la Communication

    Use of the Kolmogorov–Smirnov test for gamma process

    No full text
    International audienceThis article deals with the use of the Kolmogorov–Smirnov test for comparing an observed gamma process with a reference process or for comparing two observed gamma processes. In the case of observed processes with periodic inspections, the Kolmogorov–Smirnov test can be applied directly. It is pointed out that, from the power of test point of view, the length of monitoring is more important than the number of observations. In the case of observed processes with aperiodic inspections, a method for building an empirical cumulative distribution required for the test is proposed. It consists of generating equal time increment observations from the original sample thanks to the gamma bridge. A sort of the original observations for improving the power of the test is proposed. Simulations have proved the feasibility of the approach and shown that when the variance of the time increments increases, the power of the test decreases only a little. An illustrative example showing the interest of such a test for maintenance is described

    Optimal Decision Rule with Class-Selective Rejection and Performance Constraints

    No full text
    International audienceThe problem of defining a decision rule which takes into account performance constraints and class-selective rejection is formalized in a general framework. In the proposed formulation, the problem is defined using three kinds of criteria. The first is the cost to be minimized, which defines the objective function, the second are the decision options, determined by the admissible assignment classes or subsets of classes, and the third are the performance constraints. The optimal decision rule within the statistical decision theory framework is obtained by solving the stated optimization problem. Two examples are provided to illustrate the formulation and the decision rule is obtained
    corecore