Search CORE

213 research outputs found

Résolution des problèmes d'optimisation combinatoire avec une stratégie de retour-arrière basée sur l'apprentissage par renforcement

Author: Bachiri Ilyess
Publication venue: Bibliotheque de l' Universite Laval
Publication date: 01/01/2015
Field of study

Les problèmes d’optimisation combinatoire (Constraint Optimization Problems – COP) sont souvent difficiles à résoudre et le choix de la stratégie de recherche a une influence importante sur la performance du solveur. Pour de résoudre un problème d’optimisation combinatoire en explorant un arbre de recherche, il faut choisir une heuristique de choix de variable (qui définit l’ordre dans lequel les variables vont être instanciées), une heuristique de choix de valeur (qui spécifie l’ordre dans lequel les valeurs seront essayées), et une stratégie de retour-arrière (qui détermine vers quel noeud effectuer les retours-arrière lorsqu’une feuille de l’arbre est rencontrée). Pour les stratégies de retour-arrière, il y a celles dont les retours-arrière sont totalement déterministes (e.g. Depth-First Search – DFS) et d’autres qui s’appuient sur des mécanismes d’évaluation de noeuds plus dynamiques (e.g. Best-First Search). Certaines (e.g. Limited Discrepancy Search – LDS) peuvent être implémentées soit comme un algorithme itératif déterministe ou un évaluateur de noeud. Une stratégie est dite adaptative quand elle s’adapte dynamiquement à la structure du problème et identifie les zones de l’espace de recherche qui contiennent les “bonnes” solutions. Dans ce contexte, des stratégies de branchement adaptatives ont été proposées (e.g. Impact-Based Search – IBS) ainsi qu’une stratégie de retour-arrière adaptative (e.g. Adaptive Discrepancy Search – ADS), proposée pour les problèmes d’optimisation distribués. À notre connaissance, aucune stratégie adaptative qui utilise l’apprentissage par renforcement (Reinforcement Learning – RL) pour supporter son mécanisme d’apprentissage n’a été proposée dans la littérature. Nous pensons que les techniques de RL permettront un apprentissage plus efficace et qu’une stratégie de retour-arrière munie de ces techniques aura le potentiel de résoudre les problèmes d’optimisation combinatoire plus rapidement. Dans ce mémoire, nous proposons un algorithme (RLBS) qui “apprend” à faire des retours-arrière de manière efficace lors de l’exploration d’arbres non-binaires. Plus précisément, il s’agit une stratégie de retour-arrière qui se base sur l’apprentissage automatique pour améliorer la performance du solveur. En fait, nous utilisons l’apprentissage par renforcement pour identifier les zones de l’espace de recherche qui contiennent les bonnes solutions. Cette approche a été développée pour les problèmes d’optimisation combinatoire dont l’espace de recherche est encodé dans un arbre non-binaire. Comme les arbres sont non-binaires, on a l’occasion d’effectuer plusieurs retours-arrière vers chaque noeud durant l’exploration. Ceci permet d’apprendre quels noeuds mènent vers les meilleures récompenses en général (c’est-à-dire, vers les feuilles les plus intéressantes). Le branchement est effectué en utilisant une stratégie de choix de variable/valeur quelconque. Toutefois, quand un retour-arrière est nécessaire, la sélection du noeud cible s’appuie sur l’apprentissage par renforcement. RLBS est évalué sur cinq instances industrielles du problème de la planification des opérations du rabotage du bois et a été comparé à ADS et à LDS sur cette même application. RLBS dépasse LDS et ADS, en termes de temps de calcul nécessaire à la résolution, sur chacune de ces instances-là et trouve la solution optimale plus rapidement. Les expérimentations ont montré que RLBS est en moyenne 4 fois plus rapide que ADS, et 6 fois plus rapide que LDS. RLBS a aussi été évalué sur une instance jouet du même problème et a été comparé à IBS. RLBS surpasse largement IBS. Il est capable de trouver une solution optimale en explorant beaucoup moins de noeuds que le nombre nécessaire à IBS pour trouver une telle solution.Combinatorial optimization problems are often very difficult to solve and the choice of a search strategy has a tremendous influence over the solver’s performance. To solve a problem using search, one needs to choose a variable selection strategy (defining the order in which variables will be instantiated), a value selection strategy (that specifies the sequence in which we will try the variable possible values) and a backtracking strategy (that determines to which node we should backtrack/backjump, when a leaf is reached or a dead-end is encountered). When it comes to backtracking strategies, there are some that are encoded into full deterministic algorithms (e.g. Depth-First Search – DFS), and others that rely on more dynamic node evaluator mechanisms (e.g. Best-First Search). Others (e.g. Limited Discrepancy Search – LDS) can be implemented as a deterministic iterative algorithm or as a node evaluator. A strategy is said to be adaptive when it dynamically adapts to the structure of the problem and identifies the areas of the search space that contain good solutions. Some have proposed adaptive branching strategies (e.g. Impact-based Search – IBS) or a backtracking strategy (e.g. Adaptive Discrepancy Search – ADS) proposed for distributed optimization problems. To our current knowledge, no adaptive backtracking strategy that relies on Reinforcement Learning (RL) has been proposed yet. We believe that RL techniques could allow a more efficient learning process and that, provided with these techniques, a backtracking strategy has a great potential of solving combinatorial optimization problems in a faster way. In this thesis, we introduce an algorithm (RLBS) that learns to efficiently backtrack when searching non-binary trees. We consider a machine learning approach which improves the performance of the solver. More specifically, we use reinforcement learning to identify the areas of the search space that contain good solutions. The approach was developed for optimization problems for which the search space is encoded as a non-binary tree. Since the trees are non-binary, we have the opportunity to backtrack multiple times to each node during the search. This allows learning which nodes generally lead to the best rewards (that is, to the most interesting leaves). Branching can be carried on using any variable/value selection strategy. However, when backtracking is needed, the selection of the target node involves reinforcement learning. RLBS is evaluated on five instances of the lumber planing problem using real idustrial data, and it is compared to LDS and ADS. It outperforms classic (non-adaptive) search strategies (DFS, LDS), an adaptive branching strategy (IBS), and an adaptive backtracking strategy (ADS) on every instance of this problem. Experiments have shown that RLBS is on average 4 times faster than ADS, and 6 times faster than LDS. RLBS is also evaluated on a toy instance of the lumber planing problem and compared to IBS. RLBS substantially outperforms IBS by solving the problem to optimality much faster

CorpusUL

L’appropriation de français écrit par des élèves arabophones du secondaire : une comparaison en fonction du gendre

Author: Ahmed Doaa M.H
Charron Annie
Montésinos-Gelet Isabelle
Publication venue: Comité canadien des étudiants diplômés en éducation
Publication date: 24/05/2018
Field of study

Cette étude vise à décrire les différentes caractéristiques qui distinguent l’appropriation de l’écrit des élèves filles et garçons arabophones qui apprennent le français comme langue étrangère en Égypte. À cet effet, un groupe des 20 filles et un autre des 18 garçons de première année du secondaire sont soumis à une tâche d’orthographes approchées, dans laquelle les deux groupes ont été invités à écrire certains mots et une phrase. Ceci a été individuellement réalisé à quatre reprises à partir d’une rencontre semi-structurée et filmée. L’analyse des données recueillies a révélé que le genre des élèves peut avoir un impact sur certains aspects – la production des phonèmes, la combinaison des syllabes et la production des lettres dérivables et muettes –; qu’il n’avait pas d’impact sur certains autres – la mise en compte des aspects visuographiques des mots écrits et le recours au transfert langagier –; et qu’il peut avoir une influence sur les stratégies mobilisées durant les situations d’orthographes approchées.----The aim of this study is to describe the different characteristics that distinguish girls and boys – all first year Arabic-speaking pupils of the Secondary Schools who learn French as a foreign language in Egypt - in their appropriation of French spelling. To achieve this goal, a group of 20 girls and another of 18 boys were asked (on an individual basis) to produce some words and one sentence. This was done individually four times from a semi-structured encounter. The results of these tests raised that the gender of the students can have an impact on some aspects – the production of phonemes, the combination of syllables and the production of the derivable and dumb letters -; it doesn’t have an impact on others - consideration of the visuographic aspects of words and the production of the linguistic transfer; and it can have a little influence on the strategies used during the situations of the invented spelling

University of Calgary Journal Hosting

Étude de l’appropriation de l’orthographe française langue seconde/étrangère d’élèves arabophones du secondaire en Égypte

Author: Ahmed Doaa M. H.
Publication venue
Publication date: 01/01/2013
Field of study

La présente recherche vise à décrire le développement orthographique des élèves arabophones de 1re année du secondaire en Égypte au début de l’apprentissage du français langue étrangère. Les recherches égyptiennes qui concernent le français écrit se sont préoccupées des erreurs grammaticales commises par les élèves. À notre connaissance, il n’existe pas d’études relatives à l’appropriation de l’orthographe française menée auprès de ces élèves. Afin de combler ce vide, nous avons souhaité apporter un éclairage sur les compétences orthographiques des élèves en essayant d’éclairer la documentation de ces compétences en français écrit par la mise en relation avec celle de jeunes enfants arabophones qui apprennent le français L2 au préscolaire lors de leur séjour au Québec. Afin d’atteindre nos objectifs, nous avons soumis 30 élèves arabophones du secondaire à une épreuve d’orthographes approchées à quatre reprises. Celle-ci s’est déroulée dans le cadre d’un entretien semi-structuré individuel dans lequel les élèves ont été invités à produire des mots et une phrase. L’analyse descriptive et statistique de la production écrite des sujets a permis d’observer trois types de préoccupations écrites : visuographiques, phonologiques et orthographiques. D’autre part, leurs écrits ont témoigné d’un transfert langagier de l’arabe L1 et de l’anglais LE, qui était parfois positif, d’autres fois négatif. Les résultats ont, enfin, révélé que les élèves ont utilisé trois stratégies, lexicale, phonologique et analogique, lors de leurs productions. En outre, une étude de cas multiples exploratoire avec quatre enfants arabophones du préscolaire au Québec a été effectuée. Ces derniers ont été individuellement invités à produire des mots et une phrase en français et en arabe. De manière exploratoire, nous avons mis en relation l’appropriation de l’écrit des élèves du secondaire et celle des enfants du préscolaire en français et en arabe, ce qui nous a permis de vérifier l’effet de l’âge sur le développement orthographique et sur le transfert langagier chez les apprenants. Les résultats obtenus indiquent que la performance écrite des élèves du secondaire était significativement plus réussie que celle des enfants du préscolaire et que les premiers étaient les plus susceptibles de produire un transfert langagier. Ainsi, l’âge de l’apprenant peut avoir un impact sur l’appropriation de l’écrit ainsi que sur le transfert langagier en français langue seconde/étrangère. Finalement, au-delà de son apport scientifique et pratique, la présente recherche propose des pistes de recherches futures.The aim of this research was to assess French language-spelling development for the first year Arabic language-speaking students of the Secondary Schools in Egypt. These students were studying “French” as a foreign language. Previous studies performed in Egypt addressed the grammatical errors committed by these students in the field of “written French language”. To date, and to the best of our knowledge, there are no available studies addressing the issue of “French language-spelling development”. To fill this gab in literature, we examined the spelling competence of the students. We evaluated the features of the French language - spelling development for the first year Arabic language - speaking students in Secondary schools in Egypt. Also, we examined the relationships between these features and corresponding features in French and Arabic language development for preschool Arabic language-speaking children in Quebec. To achieve our goals, 30 students of the first year Arabic language-speaking students in Secondary schools in Egypt underwent a test of invented spelling, through semi-structured interview. The test was repeated four times on different occasions. During the test, the students were asked (on individual basis) to produce some writings (French language). The results of these tests raised three writing features, namely: visuographic, phonological and orthographic concerns. Moreover, their writings showed a language transfer produced from both Arabic as a mother language and English as a foreign language. Our findings revealed that, during writing, students have employed three strategies: lexical, phonological and orthographic. In addition, a multiple case study exploratory was conducted with four Arabic language-speaking preschool children in Quebec. Each child was asked to produce some writings in French and in Arabic languages. The French language-spelling development of the students the Secondary Schools was made comparable to that of the preschool children in French. Such strategy allowed us to test the effect of age on the spelling development and on language transfer. We found that the written performance of the students from Secondary Schools was significantly more advanced as compared to that of the preschool children. Also the students from Secondary Schools were more able to produce language transfer. These findings indicated that the learner’s age had a significant impact not only on the French language - spelling development but also on the language transfer in second/foreign language. Finally, the scientific and practical ramifications open avenues for further investigations in these fields

Dépôt Institutionnel Numérique

Développement d'une technique d'acquisition de contraintes basée sur le nombre de solutions

Author: Coulombe Christopher
Publication venue
Publication date
Field of study

Plusieurs paradigmes de programmation existent pour aider à résoudre des problèmes d'optimisation combinatoire, l'un d'entre eux étant la programmation par contraintes. L'idée de ce paradigme consiste à modéliser le problème à résoudre à l'aide de contraintes, c'est-à-dire des déclarations qui forcent les variables du problème à respecter une relation mathématique. Les contraintes des problèmes ont habituellement des paramètres qui permettent de préciser la relation mathématique à respecter et des variables de décision qui représentent les variables pour lesquelles la relation mathématique doit s'appliquer. Bien qu'intéressant en soi, la programmation par contraintes peut également s'étendre sur d'autres concepts, notamment la modélisation automatique. L'acquisition ou apprentissage de contraintes consiste à apprendre les différentes contraintes, incluant les valeurs des paramètres, qui peuvent expliquer un ensemble d'exemples fournis. L'apprentissage de contraintes peut être utile dans plusieurs situations, comme l'apprentissage de structures d'horaires d'hôpitaux à l'aide d'anciens exemples d'horaires. L'apprentissage de contraintes est encore un domaine nouveau pour lequel les stratégies doivent encore être adaptées ou développées. Les techniques d'acquisition existantes varient en genre, incluant des méthodes qui créent des solutions artificielles pour interagir avec un utilisateur ou des approches qui se basent sur des analyses mathématiques rigoureuses de solutions pour faire des choix sans jamais communiquer avec l'utilisateur. Dans ce mémoire, nous explorons une nouvelle méthode pour performer l'acquisition de contraintes. Le critère principal de la méthode développée est basé sur le nombre de solutions du modèle considéré et utilise des outils de dénombrement. Notre technique performe bien sur les problèmes essayés et ouvre la porte à une nouvelle manière d'apprivoiser les problèmes d'acquisition de contraintes.Several programming paradigms exist to help solve combinatorial optimization problems, one of them being constraint programming. The idea of this paradigm is to model the problems to solve using constraints, i.e. statements that force the variables of the problem to respect a mathematical relation. The constraints of a problem usually have parameters that allow to specify the mathematical relationship to be respected and decision variables that represent the variables on which the mathematical relationship must be applied. Although interesting in itself, constraint programming can also expand on other concepts, such as the automatisation of the modeling process. Constraints acquisition consists in learning the different constraints, including parameter values, which can explain a set of examples provided. Constraint acquisition can be useful in multiple situations, such as learning structures in schedules for hospitals using old schedules. Constraint learning is still a new area for which strategies still need to be adapted or developed. The existing techniques of acquisition varies widely in style, including methods that create artificial solutions to interact with a user or approaches which are based on complex mathematical analyzes of real solutions to make choices without ever communicating with the user. In this thesis, we explore a new method to perform the acquisition of constraints. The main criterion of the developed method is based on the number of solutions of the considered model and uses tools of model counting. Our technique works well on proven problems and opens the door to a new way of approaching acquisition constraint problems

CorpusUL

Apprendre à jouer aux jeux à deux joueurs à information parfaite sans connaissance

Author: Cohen-Solal Quentin
Publication venue: HAL CCSD
Publication date: 01/07/2019
Field of study

International audienceIn this paper, several techniques for learning game states evaluation functions by reinforcement are proposed. The first is to learn the values of the game tree instead of restricting oneself to the value of the root. The second is to replace the classic gain of a game (+1 / −1) with a heuris-tic favoring quick wins and slow defeats. The third corrects some evaluation functions taking into account the resolution of states. The fourth is a new action selection distribution. Finally, the fifth is a modification of the minimax with unbounded depth extending the best sequences of actions to the terminal states. In addition, we propose another variant of the unbounded minimax, which plays the safest action instead of playing the best action. The experiments conducted suggest that this improves the level of play during confrontations. Finally, we apply these different techniques to design a program-player to the Hex game (size 11) reaching the level of Mohex 2.0 with reinforcement learning from self-play without knowledge.Dans cet article, plusieurs techniques pour l'apprentissage par renforcement de fonctions d'évaluation d'états de jeu sont proposées. La première consiste à apprendre les va-leurs de l'arbre de jeu au lieu de se restreindre à la va-leur de la racine. La seconde consiste à remplacer le gain classique d'un jeu (+1 / −1) par une heuristique favo-risant les victoires rapides et les défaites lentes. La troi-sième permet de corriger certaines fonctions d'évaluation en tenant compte de la résolution des états. La quatrième est une nouvelle distribution de sélection d'actions. Enfin, la cinquième est une modification du minimax à profon-deur non bornée étendant les meilleures séquences d'ac-tions jusqu'aux états terminaux. En outre, nous proposons une autre variante du minimax non borné, qui joue l'ac-tion la plus sure au lieu de jouer la meilleure action. Les expériences menées suggèrent que cela améliore le niveau de jeux lors des confrontations. Enfin, nous appliquons ces différentes techniques pour concevoir un programme-joueur au jeu de Hex (taille 11) atteignant le niveau de Mohex 2.0 à la suite d'un apprentissage par renforcement contre soi-même sans utilisation de connaissance

Méta-enseignement : génération active d’exemples par apprentissage par renforcement

Author: Larocque Stéphanie
Publication venue
Publication date: 01/05/2020
Field of study

Le problème d’intérêt est un problème d’optimisation discrète dont on tente d’approximer les solutions des instances particulières à l’aide de réseaux de neurones. Un obstacle à résoudre ce problème par apprentissage automatique réside dans le coût d’étiquettage élevé (et variable) des différentes instances, rendant coûteuse et difficile la génération d’un ensemble de données étiquettées. On propose une architecture d’apprentissage actif, qu’on nomme architecture de méta-enseignement, dans le but de pallier à ce problème. On montre comment on combine plusieurs modèles afin de résoudre ce problème d’apprentissage actif, formulé comme un problème de méta-apprentissage, en utilisant un agent d’apprentissage par renforcement pour la génération active d’exemples. Ainsi, on utilise des concepts de plusieurs domaines de l’apprentissage automatique dont des notions d’apprentissage supervisé, d’apprentissage actif, d’apprentissage par renforcement, ainsi que des réseaux récurrents. Dans ce travail exploratoire, on évalue notre méthodologie sur un problème simple, soit celui de classifier des mains de poker en 10 classes pré-établies. On teste notre architecture sur ce problème jouet dans le but de simplifier l’analyse. Malheureusement, l’avantage d’utiliser l’architecture de génération active n’est pas significatif. On expose ensuite plusieurs pistes de réflexion sur certaines observations à approfondir dans de futurs travaux, comme la définition de la fonction de récompense. Dans de futurs projets, il serait également intéressant d’utiliser un problème plus similaire au problème d’optimisation initial qui comporterait, entre autres, des coûts d’étiquettage variables.The motivating application behind this architecture is a discrete optimisation problem whose solution we aim to predict using neural networks. A main challenge of solving this problem by machine learning lies in the high (and variable) labelling cost associated to the various instances, which leads to an expensive and difficult dataset generation. We propose an active learning architecture, called meta-teaching, to address this problem. We show how we combine several models to solve the active learning problem, formulated as a metalearning problem, by using a reinforcement learning agent to actively generate new instances. Therefore, we use concepts from various areas of machine learning, including supervised learning, active learning, reinforcement learning and recurrent networks. In this exploratory work, we evaluate our method on a simpler problem, which is to classify poker hands in 10 predefined classes. We test our architecture on this toy dataset in order to simplify the analysis. Unfortunately, we do not achieve a significant advantage using our active generation architecture on this dataset. We outline avenues for further reflections, including the definition of the reward function. In future projects, using a more similar problem to our problem of interest having, among others, a variable labelling cost, would be interesting

Dépôt Institutionnel Numérique

Assistance à la construction et à la comparaison de techniques de diagnostic des connaissances

Author: Lallé Sébastien
Publication venue: HAL CCSD
Publication date: 11/12/2013
Field of study

Comparing and building knowledge diagnostic is a challenge in the field of Technology Enhanced Learning (TEL) systems. Knowledge diagnostic aims to infer the knowledge mastered or not by a student in a given learning domain (like mathematics for high school) using student traces recorded by the TEL system. Knowledge diagnostics are widely used, but they strongly depend on the learning domain and are not well formalized. Thus, there exists no method or tool to build, compare and evaluate different diagnostics applied on a given learning domain. Similarly, using a diagnostic in two different domain usually imply to implementing almost both from scratch. Yet, comparing and reusing knowledge diagnostics can lead to reduce the engineering cost, to reinforce the evaluation and finally help knowledge diagnostic designers to choose a diagnostic. We propose a method, refine in a first platform, to assist knowledge diagnostic designers to build and compare knowledge diagnostics, using a new formalization of the diagnostic and student traces. To help building diagnostics, we used a semi-automatic machine learning algorithm, guided by an ontology of the traces and the knowledge designed by the designer. To help comparing diagnostics, we use a set of comparison criteria (either statistical or specific to the field of TEL systems) applied on the results of each diagnostic on a given set of traces. The main contribution is that our method is generic over diagnostics, meaning that very different diagnostics can be built and compared, unlike previous work on this topic. We evaluated our work though three experiments. The first one was about applying our method on three different domains and set of traces (namely geometry, reading and surgery) to build and compare five different knowledge diagnostics in cross validation. The second experiment was about designing and implementing a new comparison criteria specific to TEL systems: the impact of knowledge diagnostic on a pedagogical decision, the choice of a type of help to give to a student. The last experiment was about designing and adding in our platform a new diagnostic, in collaboration with an expert in didactic.Cette thèse aborde la thématique de la comparaison et de la construction de diagnostics des connaissances dans les Environnements Informatiques pour l'Apprentissage Humain (EIAH). Ces diagnostics sont utilisés pour déterminer si les apprenants maîtrisent ou non les connaissances ou conceptions du domaine d'apprentissage (par exemple math au collège) à partir des traces collectées par l'EIAH. Bien que ces diagnostics soient récurrents dans les EIAH, ils sont fortement liés au domaine et ne sont que peu formalisés, si bien qu'il n'existe pas de méthode de comparaison pour les positionner entre eux et les valider. Pour la même raison, utiliser un diagnostic dans deux domaines différents implique souvent de le redévelopper en partie ou en totalité, sans réelle réutilisation. Pourtant, pouvoir comparer et réutiliser des diagnostics apporterait aux concepteurs d'EIAH plus de rigueur pour le choix, l'évaluation et le développement de ces diagnostics. Nous proposons une méthode d'assistance à la construction et à la comparaison de diagnostics des connaissances, réifiée dans une première plateforme, en se basant sur une formalisation du diagnostic des connaissances en EIAH que nous avons défini et sur l'utilisation de traces d'apprenant. L'assistance à la construction se fait via un algorithme d'apprentissage semi-automatique, guidé par le concepteur du diagnostic grâce à une ontologie décrivant les traces et les connaissances du domaine d'apprentissage. L'assistance à la comparaison se fait par application d'un ensemble de critères de comparaison (statistiques ou spécifiques aux EIAH) sur les résultats des différents diagnostics construits. La principale contribution au domaine est la généricité de notre méthode, applicable à un ensemble de diagnostics différents pour tout domaine d'apprentissage. Nous évaluons notre travail à travers trois expérimentations. La première porte sur l'application de la méthode à trois domaines différents (géométrie, lecture, chirurgie) en utilisant des jeux de traces en validation croisée pour construire et appliquer les critères de comparaison sur cinq diagnostics différents. La seconde expérimentation porte sur la spécification et l'implémentation d'un nouveau critère de comparaison spécifique aux EIAH : la comparaison des diagnostics en fonction de leur impact sur une prise de décision de l'EIAH, le choix d'un type d'aide à donner à l'apprenant. La troisième expérimentation traite de la spécification et de l'ajout d'un nouveau diagnostic dans notre plateforme, en collaborant avec une didacticienne

Thèses en Ligne

Hal - Université Grenoble Alpes

HAL Descartes

Amélioration des techniques d'optimisation combinatoire par retour d'expérience dans le cadre de la sélection de scénarios de Produit/Projet

Author: Pitiot Paul
Publication venue: Institut National Polytechnique de Toulouse
Publication date: 25/05/2009
Field of study

La définition et l’utilisation d'un modèle couplant la conception de produit et la conduite du projet dès les phases amont de l’étude d’un système correspondent à une forte demande industrielle. Ce modèle permet la prise en compte simultanée de décisions issues des deux environnements produit/projet mais il représente une augmentation conséquente de la dimension de l'espace de recherche à explorer pour le système d'aide à la décision, notamment lorsque il s'agit d'une optimisation multiobjectif. Les méthodes de type métaheuristique tel que les algorithmes évolutionnaires, sont une alternative intéressante pour la résolution de ce problème fortement combinatoire. Ce problème présente néanmoins une particularité intéressante et inexploitée : Il est en effet courant de réutiliser, en les adaptant, des composants ou des procédures précédemment mis en œuvre dans les produits/projets antérieurs. L'idée mise en avant dans ce travail consiste à utiliser ces connaissances « a priori » disponibles afin de guider la recherche de nouvelles solutions par l'algorithme évolutionnaire. Le formalisme des réseaux bayésiens a été retenu pour la modélisation interactive des connaissances expertes. De nouveaux opérateurs évolutionnaires ont été définis afin d'utiliser les connaissances contenues dans le réseau. De plus, le système a été complété par un processus d'apprentissage paramétrique en cours d'optimisation permettant d'adapter le modèle si le guidage ne donne pas de bons résultats. La méthode proposée assure à la fois une optimisation plus rapide et efficace, mais elle permet également de fournir au décideur un modèle de connaissances graphique et interactif associé au projet étudié. Une plateforme expérimentale a été réalisée pour valider notre approche. ABSTRACT : The definition and use of a model coupling product design and project management in the earliest phase of the study of a system correspond to a keen industrial demand. This model allows simultaneous to take into account decisions resulting from the two environments (product and project) but it represents a consequent increase of the search space dimension for the decision-making system, in particular when it concerns a multiobjective optimization. Metaheuristics methods such as evolutionary algorithm are an interesting way to solve this strongly combinative problem. Nevertheless, this problem presents an interesting and unexploited characteristic: It is indeed current to re-use, by adapting them, the components or the procedures previously implemented in pasted product or project. The idea proposed in this work consists in using this “a priori” knowledge available in order to guide the search for new solutions by the evolutionary algorithm. Bayesian network was retained for the interactive modeling of expert knowledge. New evolutionary operators were defined in order to use knowledge contained in the network. Moreover, the system is completed by a process of parametric learning during optimization witch make it possible to adapt the model if guidance does not give good results. The method suggested ensures both a faster and effective optimization, but it also makes it possible to provide to the decision maker a graphic and interactive model of knowledge linked to studied project. An experimental platform was carried out to validate our approach

Open Archive Toulouse Archive Ouverte

Institut National Polytechnique de Toulouse (Theses)

Algorithmes d'apprentissage automatique pour la conception de composés pharmaceutiques et de vaccins

Author: Giguère Sébastien
Publication venue: Bibliotheque de l' Universite Laval
Publication date: 01/01/2015
Field of study

La découverte de composés pharmaceutiques est actuellement trop longue et trop coûteuse, et le taux d’échec, trop élevé. Les bases de données biochimiques et génomiques ne cessent de grossir et il est maintenant impraticable d’interpréter ces données. Un changement radical est nécessaire ; certaines étapes de ce processus doivent être automatisées. Les peptides jouent un rôle important dans le système immunitaire et dans la signalisation cellulaire. Leurs propriétés favorables en font des candidats de choix pour initier la conception de nouveaux médicaments et assister la production de nouveaux vaccins. De plus, les techniques de synthèse modernes permettent de rapidement synthétiser ces molécules à faible coût. Les algorithmes d’apprentissage statistique sont particulièrement bien adaptés pour apprendre de façon automatisée des modèles, possiblement biochimiques, à partir des données existantes. Ces méthodes et les peptides offrent donc une solution de choix aux défis auxquels fait face la recherche pharmaceutique. Nous proposons un noyau permettant l’apprentissage de modèles statistiques de phénomènes biochimiques impliquant des peptides. Celui-ci permet, entre autres, l’apprentissage d’un modèle universel pouvant raisonnablement quantifier l’énergie de liaison entre toute séquence peptidique et tout site de liaison d’une protéine cristallisée. De plus, il unifie la théorie de plusieurs noyaux existants tout en conservant une faible complexité algorithmique. Ce noyau s’avère particulièrement adapté pour quantifier l’interaction entre les antigènes et les complexes majeurs d’histocompatibilité. Nous proposons un outil pour prédire les peptides qui survivront au processus de présentation antigénique. Cet outil a gagné une compétition internationale et aura plusieurs applications en immunologie, dont la conception de vaccins. Ultimement, un peptide doit maximiser l’interaction avec une protéine cible ou maximiser la bioactivité chez l’hôte. Nous formalisons ce problème comme un problème de prédiction de structures. Puis, nous proposons un algorithme exploitant les plus longs chemins dans un graphe pour déterminer les peptides maximisant la bioactivité prédite par un modèle préalablement appris. Nous validons cette nouvelle approche en laboratoire par la découverte de peptides antimicrobiens. Finalement, nous fournissons des garanties de performance de type PAC-Bayes pour deux algorithmes de prédiction de structure dont un est nouveau.The discovery of pharmaceutical compounds is currently too time-consuming, too expensive, and the failure rate is too high. Biochemical and genomic databases continue to grow and it is now impracticable to interpret these data. A radical change is needed; some steps in this process must be automated. Peptides are molecules that play an important role in the immune system and in cell signaling. Their favorable properties make them prime candidates for initiating the design of new drugs and assist in the design of vaccines. In addition, modern synthesis techniques can quickly generate these molecules at low cost. Statistical learning algorithms are well suited to manage large amount of data and to learn models in an automated fashion. These methods and peptides thus offer a solution of choice to the challenges facing pharmaceutical research. We propose a kernel for learning statistical models of biochemical phenomena involving peptides. This allows, among other things, to learn a universal model that can reasonably quantify the binding energy between any peptide sequence and any binding site of a protein. In addition, it unifies the theory of many existing string kernels while maintaining a low computational complexity. This kernel is particularly suitable for quantifying the interaction between antigens and proteins of the major histocompatibility complex. We provide a tool to predict peptides that are likely to be processed by the antigen presentation pathway. This tool has won an international competition and has several applications in immunology, including vaccine design. Ultimately, a peptide should maximize the interaction with a target protein or maximize bioactivity in the host. We formalize this problem as a structured prediction problem. Then, we propose an algorithm exploiting the longest paths in a graph to identify peptides maximizing the predicted bioactivity of a previously learned model. We validate this new approach in the laboratory with the discovery of new antimicrobial peptides. Finally, we provide PAC-Bayes bound for two structured prediction algorithms, one of which is new

CorpusUL