11 research outputs found

    Multiple instance learning for sequence data with across bag dependencies

    Full text link
    In Multiple Instance Learning (MIL) problem for sequence data, the instances inside the bags are sequences. In some real world applications such as bioinformatics, comparing a random couple of sequences makes no sense. In fact, each instance may have structural and/or functional relations with instances of other bags. Thus, the classification task should take into account this across bag relation. In this work, we present two novel MIL approaches for sequence data classification named ABClass and ABSim. ABClass extracts motifs from related instances and use them to encode sequences. A discriminative classifier is then applied to compute a partial classification result for each set of related sequences. ABSim uses a similarity measure to discriminate the related instances and to compute a scores matrix. For both approaches, an aggregation method is applied in order to generate the final classification result. We applied both approaches to solve the problem of bacterial Ionizing Radiation Resistance prediction. The experimental results of the presented approaches are satisfactory

    L’ansa pancreatica: une cause rare de pancréatite aigue

    Get PDF
    L’ansa pancréatica est une voie de communication accessoire entre le canal de Wirsung et un conduit pancréatique accessoire ne présentant pas de jonction normale avec le premier. L’association entre cette variante anatomique et la pancréatite aigue dite idiopathique reste hypothétique. Nous rapportons l’observation d’un patient présentant des poussées de pancréatites récidivantes qui serait en rapport avec une Ansa pancréatica.Pan African Medical Journal 2012; 13:3

    Apprentissage multi-instance des données de séquences : Application à la prédiction de la radio- résistance chez les bactéries

    No full text
    In Multiple Instance Learning (MIL) problem for sequence data, the instances inside the bags aresequences. In some real world applications such as bioinformatics, comparing a random couple ofsequences makes no sense. In fact, each instance may have structural and/or functional relationshipwith instances of other bags. Thus, the classification task should take into account this across bagrelationship. In this thesis, we present two novel MIL approaches for sequence data classificationnamed ABClass and ABSim. ABClass extracts motifs from related instances and use them to encodesequences. A discriminative classifier is then applied to compute a partial classification result for eachset of related sequences. ABSim uses a similarity measure to discriminate the related instances andto compute a scores matrix. For both approaches, an aggregation method is applied in order togenerate the final classification result. We applied both approaches to the problem of bacterialionizing radiation resistance prediction. The experimental results were satisfactory.Dans l’apprentissage multi-instances (MI) pour les séquences, les données d’apprentissage consistent en un ensemble de sacs où chaque sac contient un ensemble d’instances/séquences. Dans certaines applications du monde réel, comme la bioinformatique, comparer un couple aléatoire de séquences n’a aucun sens. En fait, chaque instance de chaque sac peut avoir une relation structurelle et/ou fonctionnelle avec d’autres instances dans d’autres sacs. Ainsi, la tâche de classification doit prendre en compte la relation entre les instances sémantiquement liées à travers les sacs. Dans cette thèse, nous présentons deux approches de classification MI des séquences nommées ABClass et ABSim. ABClass extrait les motifs à partir des instances reliées et les utilise pour encoder les séquences. Un classifieur discriminant est ensuite appliqué pour calculer un résultat de classification partiel pour chaque ensemble de séquences liées. ABSim utilise une mesure de similarité pour discriminer les instances reliées et calcule une matrice de scores. Pour les deux approches, une méthode d’agrégation est appliquée afin de générer le résultat final de la classification. Nous appliquons les deux approches au problème de prédiction de la résistance aux rayonnements ionisants chez les bactéries.Les résultats expérimentaux sont satisfaisants

    A Structure Based Multiple Instance Learning Approach for Bacterial Ionizing Radiation Resistance Prediction

    Get PDF
    International audienceIonizing-radiation-resistant bacteria (IRRB) could be used for bioremediation of radioactive wastes and in the therapeutic industry. Limited computational works are available for the prediction of bacterial ionizing radiation resistance (IRR). In this work, we present ABClass, an in silico approach that predicts if an unknown bacterium belongs to IRRB or ionizing-radiation-sensitive bacteria (IRSB). This approach is based on a multiple instance learning (MIL) formulation of the IRR prediction problem. It takes into account the relation between semantically related instances across bags. In ABClass, a preprocessing step is performed in order to extract substructures/motifs from each set of related sequences. These motifs are then used as attributes to construct a vector representation for each set of sequences. In order to compute partial prediction results, a discriminative classifier is applied to each sequence of the unknown bag and its correspondent related sequences in the learning dataset. Finally, an aggregation method is applied to generate the final result. The algorithm provides good overall accuracy rates. ABClass can be downloaded at the following link: http://homepages.loria.fr/SAridhi/software/MIL/

    ABClass : Une approche d'apprentissage multi-instances pour les séquences

    Get PDF
    National audienceIn Multiple Instance Learning (MIL) problem for sequence data, the learning data consist of a set of bags where each bag contains a set of instances/sequences. In some real world applications such as bioinformatics comparing a random couple of sequences makes no sense. In fact, each instance of each bag may have structural and/or functional relationship with other instances in other bags. Thus, the classification task should take into account the relation between semantically related instances across bags. In this paper, we present ABClass, a novel MIL approach for sequence data classification. Each sequence is represented by one vector of attributes extracted from the set of related instances. For each sequence of the unknown bag, a discriminative classifier is applied in order to compute a partial classification result. Then, an aggregation method is applied in order to generate the final result. We applied ABClass to solve the problem of bacterial Ionizing Radiation Resistance (IRR) prediction. The experimental results were satisfactory.Dans le cas du problème de l'apprentissage multi-instances (MI) pour les séquences, les données d'apprentissage consistent en un ensemble de sacs où chaque sac contient un ensemble d'instances/séquences. Dans certaines applications du monde réel, comme la bioinformatique, comparer un couple aléatoire de séquences n'a aucun sens. En fait, chaque instance de chaque sac peut avoir une relation structurelle et/ou fonctionnelle avec d'autres instances dans d'autres sacs. Ainsi, la tâche de classification doit prendre en compte la relation entre les instances sémantiquement liées à travers les sacs. Dans cet article, nous présentons ABClass, une nouvelle approche de classification MI des séquences. Chaque séquence est représentée par un vecteur d'attributs extraits à partir de l'en-semble des instances qui lui sont liées. Pour chaque séquence du sac à prédire, un classifieur discriminant est appliqué afin de calculer un résultat de classification partiel. Ensuite, une méthode d'agrégation est appliquée afin de générer le résultat final. Nous avons appliqué ABClass pour résoudre le problème de la prédiction de la résistance aux rayonnements ionisants (RRI) chez les bactéries. Les résultats expérimentaux sont satisfaisants

    An Overview of in Silico Methods for the Prediction of Ionizing Radiation Resistance in Bacteria

    Get PDF
    International audienceIonizing-radiation-resistant bacteria (IRRB) could be used for biore-mediation of radioactive wastes and in the therapeutic industry. Limited computational works are available for the prediction of bacterial ionizing radiation resistance (IRR). In this chapter, we present some works that study the causes of the high resistance of IRRB to ionizing radiation. Then we focus on presenting in silico approaches that use protein sequences of bacteria in order to predict if an unknown bacterium belongs to IRRB or ionizing-radiation-sensitive bacteria (IRSB). These approaches formulate the problem of predicting bacterial IRR as a multiple instance learning (MIL) problem where bacteria represent the bags and * Corresponding Author: [email protected]. 2 Manel Zoghlami, Sabeur Aridhi, Mondher Maddouri et al. primary structure of basal DNA repair proteins of each bacterium represent the instances inside the bags. We also present a formulation of the problem of MIL in sequence data and explain how it could be used to solve the problem of IRR prediction in bacteria. A brief comparison of the presented approaches is provided
    corecore