213 research outputs found

    Résolution des problÚmes d'optimisation combinatoire avec une stratégie de retour-arriÚre basée sur l'apprentissage par renforcement

    Get PDF
    Les problĂšmes d’optimisation combinatoire (Constraint Optimization Problems – COP) sont souvent difficiles Ă  rĂ©soudre et le choix de la stratĂ©gie de recherche a une influence importante sur la performance du solveur. Pour de rĂ©soudre un problĂšme d’optimisation combinatoire en explorant un arbre de recherche, il faut choisir une heuristique de choix de variable (qui dĂ©finit l’ordre dans lequel les variables vont ĂȘtre instanciĂ©es), une heuristique de choix de valeur (qui spĂ©cifie l’ordre dans lequel les valeurs seront essayĂ©es), et une stratĂ©gie de retour-arriĂšre (qui dĂ©termine vers quel noeud effectuer les retours-arriĂšre lorsqu’une feuille de l’arbre est rencontrĂ©e). Pour les stratĂ©gies de retour-arriĂšre, il y a celles dont les retours-arriĂšre sont totalement dĂ©terministes (e.g. Depth-First Search – DFS) et d’autres qui s’appuient sur des mĂ©canismes d’évaluation de noeuds plus dynamiques (e.g. Best-First Search). Certaines (e.g. Limited Discrepancy Search – LDS) peuvent ĂȘtre implĂ©mentĂ©es soit comme un algorithme itĂ©ratif dĂ©terministe ou un Ă©valuateur de noeud. Une stratĂ©gie est dite adaptative quand elle s’adapte dynamiquement Ă  la structure du problĂšme et identifie les zones de l’espace de recherche qui contiennent les “bonnes” solutions. Dans ce contexte, des stratĂ©gies de branchement adaptatives ont Ă©tĂ© proposĂ©es (e.g. Impact-Based Search – IBS) ainsi qu’une stratĂ©gie de retour-arriĂšre adaptative (e.g. Adaptive Discrepancy Search – ADS), proposĂ©e pour les problĂšmes d’optimisation distribuĂ©s. À notre connaissance, aucune stratĂ©gie adaptative qui utilise l’apprentissage par renforcement (Reinforcement Learning – RL) pour supporter son mĂ©canisme d’apprentissage n’a Ă©tĂ© proposĂ©e dans la littĂ©rature. Nous pensons que les techniques de RL permettront un apprentissage plus efficace et qu’une stratĂ©gie de retour-arriĂšre munie de ces techniques aura le potentiel de rĂ©soudre les problĂšmes d’optimisation combinatoire plus rapidement. Dans ce mĂ©moire, nous proposons un algorithme (RLBS) qui “apprend” Ă  faire des retours-arriĂšre de maniĂšre efficace lors de l’exploration d’arbres non-binaires. Plus prĂ©cisĂ©ment, il s’agit une stratĂ©gie de retour-arriĂšre qui se base sur l’apprentissage automatique pour amĂ©liorer la performance du solveur. En fait, nous utilisons l’apprentissage par renforcement pour identifier les zones de l’espace de recherche qui contiennent les bonnes solutions. Cette approche a Ă©tĂ© dĂ©veloppĂ©e pour les problĂšmes d’optimisation combinatoire dont l’espace de recherche est encodĂ© dans un arbre non-binaire. Comme les arbres sont non-binaires, on a l’occasion d’effectuer plusieurs retours-arriĂšre vers chaque noeud durant l’exploration. Ceci permet d’apprendre quels noeuds mĂšnent vers les meilleures rĂ©compenses en gĂ©nĂ©ral (c’est-Ă -dire, vers les feuilles les plus intĂ©ressantes). Le branchement est effectuĂ© en utilisant une stratĂ©gie de choix de variable/valeur quelconque. Toutefois, quand un retour-arriĂšre est nĂ©cessaire, la sĂ©lection du noeud cible s’appuie sur l’apprentissage par renforcement. RLBS est Ă©valuĂ© sur cinq instances industrielles du problĂšme de la planification des opĂ©rations du rabotage du bois et a Ă©tĂ© comparĂ© Ă  ADS et Ă  LDS sur cette mĂȘme application. RLBS dĂ©passe LDS et ADS, en termes de temps de calcul nĂ©cessaire Ă  la rĂ©solution, sur chacune de ces instances-lĂ  et trouve la solution optimale plus rapidement. Les expĂ©rimentations ont montrĂ© que RLBS est en moyenne 4 fois plus rapide que ADS, et 6 fois plus rapide que LDS. RLBS a aussi Ă©tĂ© Ă©valuĂ© sur une instance jouet du mĂȘme problĂšme et a Ă©tĂ© comparĂ© Ă  IBS. RLBS surpasse largement IBS. Il est capable de trouver une solution optimale en explorant beaucoup moins de noeuds que le nombre nĂ©cessaire Ă  IBS pour trouver une telle solution.Combinatorial optimization problems are often very difficult to solve and the choice of a search strategy has a tremendous influence over the solver’s performance. To solve a problem using search, one needs to choose a variable selection strategy (defining the order in which variables will be instantiated), a value selection strategy (that specifies the sequence in which we will try the variable possible values) and a backtracking strategy (that determines to which node we should backtrack/backjump, when a leaf is reached or a dead-end is encountered). When it comes to backtracking strategies, there are some that are encoded into full deterministic algorithms (e.g. Depth-First Search – DFS), and others that rely on more dynamic node evaluator mechanisms (e.g. Best-First Search). Others (e.g. Limited Discrepancy Search – LDS) can be implemented as a deterministic iterative algorithm or as a node evaluator. A strategy is said to be adaptive when it dynamically adapts to the structure of the problem and identifies the areas of the search space that contain good solutions. Some have proposed adaptive branching strategies (e.g. Impact-based Search – IBS) or a backtracking strategy (e.g. Adaptive Discrepancy Search – ADS) proposed for distributed optimization problems. To our current knowledge, no adaptive backtracking strategy that relies on Reinforcement Learning (RL) has been proposed yet. We believe that RL techniques could allow a more efficient learning process and that, provided with these techniques, a backtracking strategy has a great potential of solving combinatorial optimization problems in a faster way. In this thesis, we introduce an algorithm (RLBS) that learns to efficiently backtrack when searching non-binary trees. We consider a machine learning approach which improves the performance of the solver. More specifically, we use reinforcement learning to identify the areas of the search space that contain good solutions. The approach was developed for optimization problems for which the search space is encoded as a non-binary tree. Since the trees are non-binary, we have the opportunity to backtrack multiple times to each node during the search. This allows learning which nodes generally lead to the best rewards (that is, to the most interesting leaves). Branching can be carried on using any variable/value selection strategy. However, when backtracking is needed, the selection of the target node involves reinforcement learning. RLBS is evaluated on five instances of the lumber planing problem using real idustrial data, and it is compared to LDS and ADS. It outperforms classic (non-adaptive) search strategies (DFS, LDS), an adaptive branching strategy (IBS), and an adaptive backtracking strategy (ADS) on every instance of this problem. Experiments have shown that RLBS is on average 4 times faster than ADS, and 6 times faster than LDS. RLBS is also evaluated on a toy instance of the lumber planing problem and compared to IBS. RLBS substantially outperforms IBS by solving the problem to optimality much faster

    L’appropriation de français Ă©crit par des Ă©lĂšves arabophones du secondaire : une comparaison en fonction du gendre

    Get PDF
    Cette Ă©tude vise Ă  dĂ©crire les diffĂ©rentes caractĂ©ristiques qui distinguent l’appropriation de l’écrit des Ă©lĂšves filles et garçons arabophones qui apprennent le français comme langue Ă©trangĂšre en Égypte. À cet effet, un groupe des 20 filles et un autre des 18 garçons de premiĂšre annĂ©e du secondaire sont soumis Ă  une tĂąche d’orthographes approchĂ©es, dans laquelle les deux groupes ont Ă©tĂ© invitĂ©s Ă  Ă©crire certains mots et une phrase. Ceci a Ă©tĂ© individuellement rĂ©alisĂ© Ă  quatre reprises Ă  partir d’une rencontre semi-structurĂ©e et filmĂ©e. L’analyse des donnĂ©es recueillies a rĂ©vĂ©lĂ© que le genre des Ă©lĂšves peut avoir un impact sur certains aspects – la production des phonĂšmes, la combinaison des syllabes et la production des lettres dĂ©rivables et muettes –; qu’il n’avait pas d’impact sur certains autres – la mise en compte des aspects visuographiques des mots Ă©crits et le recours au transfert langagier –; et qu’il peut avoir une influence sur les stratĂ©gies mobilisĂ©es durant les situations d’orthographes approchĂ©es.----The aim of this study is to describe the different characteristics that distinguish girls and boys – all first year Arabic-speaking pupils of the Secondary Schools who learn French as a foreign language in Egypt - in their appropriation of French spelling. To achieve this goal, a group of 20 girls and another of 18 boys were asked (on an individual basis) to produce some words and one sentence. This was done individually four times from a semi-structured encounter. The results of these tests raised that the gender of the students can have an impact on some aspects – the production of phonemes, the combination of syllables and the production of the derivable and dumb letters -; it doesn’t have an impact on others - consideration of the visuographic aspects of words and the production of the linguistic transfer; and it can have a little influence on the strategies used during the situations of the invented spelling

    Étude de l’appropriation de l’orthographe française langue seconde/Ă©trangĂšre d’élĂšves arabophones du secondaire en Égypte

    Full text link
    La prĂ©sente recherche vise Ă  dĂ©crire le dĂ©veloppement orthographique des Ă©lĂšves arabophones de 1re annĂ©e du secondaire en Égypte au dĂ©but de l’apprentissage du français langue Ă©trangĂšre. Les recherches Ă©gyptiennes qui concernent le français Ă©crit se sont prĂ©occupĂ©es des erreurs grammaticales commises par les Ă©lĂšves. À notre connaissance, il n’existe pas d’études relatives Ă  l’appropriation de l’orthographe française menĂ©e auprĂšs de ces Ă©lĂšves. Afin de combler ce vide, nous avons souhaitĂ© apporter un Ă©clairage sur les compĂ©tences orthographiques des Ă©lĂšves en essayant d’éclairer la documentation de ces compĂ©tences en français Ă©crit par la mise en relation avec celle de jeunes enfants arabophones qui apprennent le français L2 au prĂ©scolaire lors de leur sĂ©jour au QuĂ©bec. Afin d’atteindre nos objectifs, nous avons soumis 30 Ă©lĂšves arabophones du secondaire Ă  une Ă©preuve d’orthographes approchĂ©es Ă  quatre reprises. Celle-ci s’est dĂ©roulĂ©e dans le cadre d’un entretien semi-structurĂ© individuel dans lequel les Ă©lĂšves ont Ă©tĂ© invitĂ©s Ă  produire des mots et une phrase. L’analyse descriptive et statistique de la production Ă©crite des sujets a permis d’observer trois types de prĂ©occupations Ă©crites : visuographiques, phonologiques et orthographiques. D’autre part, leurs Ă©crits ont tĂ©moignĂ© d’un transfert langagier de l’arabe L1 et de l’anglais LE, qui Ă©tait parfois positif, d’autres fois nĂ©gatif. Les rĂ©sultats ont, enfin, rĂ©vĂ©lĂ© que les Ă©lĂšves ont utilisĂ© trois stratĂ©gies, lexicale, phonologique et analogique, lors de leurs productions. En outre, une Ă©tude de cas multiples exploratoire avec quatre enfants arabophones du prĂ©scolaire au QuĂ©bec a Ă©tĂ© effectuĂ©e. Ces derniers ont Ă©tĂ© individuellement invitĂ©s Ă  produire des mots et une phrase en français et en arabe. De maniĂšre exploratoire, nous avons mis en relation l’appropriation de l’écrit des Ă©lĂšves du secondaire et celle des enfants du prĂ©scolaire en français et en arabe, ce qui nous a permis de vĂ©rifier l’effet de l’ñge sur le dĂ©veloppement orthographique et sur le transfert langagier chez les apprenants. Les rĂ©sultats obtenus indiquent que la performance Ă©crite des Ă©lĂšves du secondaire Ă©tait significativement plus rĂ©ussie que celle des enfants du prĂ©scolaire et que les premiers Ă©taient les plus susceptibles de produire un transfert langagier. Ainsi, l’ñge de l’apprenant peut avoir un impact sur l’appropriation de l’écrit ainsi que sur le transfert langagier en français langue seconde/Ă©trangĂšre. Finalement, au-delĂ  de son apport scientifique et pratique, la prĂ©sente recherche propose des pistes de recherches futures.The aim of this research was to assess French language-spelling development for the first year Arabic language-speaking students of the Secondary Schools in Egypt. These students were studying “French” as a foreign language. Previous studies performed in Egypt addressed the grammatical errors committed by these students in the field of “written French language”. To date, and to the best of our knowledge, there are no available studies addressing the issue of “French language-spelling development”. To fill this gab in literature, we examined the spelling competence of the students. We evaluated the features of the French language - spelling development for the first year Arabic language - speaking students in Secondary schools in Egypt. Also, we examined the relationships between these features and corresponding features in French and Arabic language development for preschool Arabic language-speaking children in Quebec. To achieve our goals, 30 students of the first year Arabic language-speaking students in Secondary schools in Egypt underwent a test of invented spelling, through semi-structured interview. The test was repeated four times on different occasions. During the test, the students were asked (on individual basis) to produce some writings (French language). The results of these tests raised three writing features, namely: visuographic, phonological and orthographic concerns. Moreover, their writings showed a language transfer produced from both Arabic as a mother language and English as a foreign language. Our findings revealed that, during writing, students have employed three strategies: lexical, phonological and orthographic. In addition, a multiple case study exploratory was conducted with four Arabic language-speaking preschool children in Quebec. Each child was asked to produce some writings in French and in Arabic languages. The French language-spelling development of the students the Secondary Schools was made comparable to that of the preschool children in French. Such strategy allowed us to test the effect of age on the spelling development and on language transfer. We found that the written performance of the students from Secondary Schools was significantly more advanced as compared to that of the preschool children. Also the students from Secondary Schools were more able to produce language transfer. These findings indicated that the learner’s age had a significant impact not only on the French language - spelling development but also on the language transfer in second/foreign language. Finally, the scientific and practical ramifications open avenues for further investigations in these fields

    Développement d'une technique d'acquisition de contraintes basée sur le nombre de solutions

    Get PDF
    Plusieurs paradigmes de programmation existent pour aider Ă  rĂ©soudre des problĂšmes d'optimisation combinatoire, l'un d'entre eux Ă©tant la programmation par contraintes. L'idĂ©e de ce paradigme consiste Ă  modĂ©liser le problĂšme Ă  rĂ©soudre Ă  l'aide de contraintes, c'est-Ă -dire des dĂ©clarations qui forcent les variables du problĂšme Ă  respecter une relation mathĂ©matique. Les contraintes des problĂšmes ont habituellement des paramĂštres qui permettent de prĂ©ciser la relation mathĂ©matique Ă  respecter et des variables de dĂ©cision qui reprĂ©sentent les variables pour lesquelles la relation mathĂ©matique doit s'appliquer. Bien qu'intĂ©ressant en soi, la programmation par contraintes peut Ă©galement s'Ă©tendre sur d'autres concepts, notamment la modĂ©lisation automatique. L'acquisition ou apprentissage de contraintes consiste Ă  apprendre les diffĂ©rentes contraintes, incluant les valeurs des paramĂštres, qui peuvent expliquer un ensemble d'exemples fournis. L'apprentissage de contraintes peut ĂȘtre utile dans plusieurs situations, comme l'apprentissage de structures d'horaires d'hĂŽpitaux Ă  l'aide d'anciens exemples d'horaires. L'apprentissage de contraintes est encore un domaine nouveau pour lequel les stratĂ©gies doivent encore ĂȘtre adaptĂ©es ou dĂ©veloppĂ©es. Les techniques d'acquisition existantes varient en genre, incluant des mĂ©thodes qui crĂ©ent des solutions artificielles pour interagir avec un utilisateur ou des approches qui se basent sur des analyses mathĂ©matiques rigoureuses de solutions pour faire des choix sans jamais communiquer avec l'utilisateur. Dans ce mĂ©moire, nous explorons une nouvelle mĂ©thode pour performer l'acquisition de contraintes. Le critĂšre principal de la mĂ©thode dĂ©veloppĂ©e est basĂ© sur le nombre de solutions du modĂšle considĂ©rĂ© et utilise des outils de dĂ©nombrement. Notre technique performe bien sur les problĂšmes essayĂ©s et ouvre la porte Ă  une nouvelle maniĂšre d'apprivoiser les problĂšmes d'acquisition de contraintes.Several programming paradigms exist to help solve combinatorial optimization problems, one of them being constraint programming. The idea of this paradigm is to model the problems to solve using constraints, i.e. statements that force the variables of the problem to respect a mathematical relation. The constraints of a problem usually have parameters that allow to specify the mathematical relationship to be respected and decision variables that represent the variables on which the mathematical relationship must be applied. Although interesting in itself, constraint programming can also expand on other concepts, such as the automatisation of the modeling process. Constraints acquisition consists in learning the different constraints, including parameter values, which can explain a set of examples provided. Constraint acquisition can be useful in multiple situations, such as learning structures in schedules for hospitals using old schedules. Constraint learning is still a new area for which strategies still need to be adapted or developed. The existing techniques of acquisition varies widely in style, including methods that create artificial solutions to interact with a user or approaches which are based on complex mathematical analyzes of real solutions to make choices without ever communicating with the user. In this thesis, we explore a new method to perform the acquisition of constraints. The main criterion of the developed method is based on the number of solutions of the considered model and uses tools of model counting. Our technique works well on proven problems and opens the door to a new way of approaching acquisition constraint problems

    Apprendre Ă  jouer aux jeux Ă  deux joueurs Ă  information parfaite sans connaissance

    Get PDF
    International audienceIn this paper, several techniques for learning game states evaluation functions by reinforcement are proposed. The first is to learn the values of the game tree instead of restricting oneself to the value of the root. The second is to replace the classic gain of a game (+1 / −1) with a heuris-tic favoring quick wins and slow defeats. The third corrects some evaluation functions taking into account the resolution of states. The fourth is a new action selection distribution. Finally, the fifth is a modification of the minimax with unbounded depth extending the best sequences of actions to the terminal states. In addition, we propose another variant of the unbounded minimax, which plays the safest action instead of playing the best action. The experiments conducted suggest that this improves the level of play during confrontations. Finally, we apply these different techniques to design a program-player to the Hex game (size 11) reaching the level of Mohex 2.0 with reinforcement learning from self-play without knowledge.Dans cet article, plusieurs techniques pour l'apprentissage par renforcement de fonctions d'Ă©valuation d'Ă©tats de jeu sont proposĂ©es. La premiĂšre consiste Ă  apprendre les va-leurs de l'arbre de jeu au lieu de se restreindre Ă  la va-leur de la racine. La seconde consiste Ă  remplacer le gain classique d'un jeu (+1 / −1) par une heuristique favo-risant les victoires rapides et les dĂ©faites lentes. La troi-siĂšme permet de corriger certaines fonctions d'Ă©valuation en tenant compte de la rĂ©solution des Ă©tats. La quatriĂšme est une nouvelle distribution de sĂ©lection d'actions. Enfin, la cinquiĂšme est une modification du minimax Ă  profon-deur non bornĂ©e Ă©tendant les meilleures sĂ©quences d'ac-tions jusqu'aux Ă©tats terminaux. En outre, nous proposons une autre variante du minimax non bornĂ©, qui joue l'ac-tion la plus sure au lieu de jouer la meilleure action. Les expĂ©riences menĂ©es suggĂšrent que cela amĂ©liore le niveau de jeux lors des confrontations. Enfin, nous appliquons ces diffĂ©rentes techniques pour concevoir un programme-joueur au jeu de Hex (taille 11) atteignant le niveau de Mohex 2.0 Ă  la suite d'un apprentissage par renforcement contre soi-mĂȘme sans utilisation de connaissance

    MĂ©ta-enseignement : gĂ©nĂ©ration active d’exemples par apprentissage par renforcement

    Full text link
    Le problĂšme d’intĂ©rĂȘt est un problĂšme d’optimisation discrĂšte dont on tente d’approximer les solutions des instances particuliĂšres Ă  l’aide de rĂ©seaux de neurones. Un obstacle Ă  rĂ©soudre ce problĂšme par apprentissage automatique rĂ©side dans le coĂ»t d’étiquettage Ă©levĂ© (et variable) des diffĂ©rentes instances, rendant coĂ»teuse et difficile la gĂ©nĂ©ration d’un ensemble de donnĂ©es Ă©tiquettĂ©es. On propose une architecture d’apprentissage actif, qu’on nomme architecture de mĂ©ta-enseignement, dans le but de pallier Ă  ce problĂšme. On montre comment on combine plusieurs modĂšles afin de rĂ©soudre ce problĂšme d’apprentissage actif, formulĂ© comme un problĂšme de mĂ©ta-apprentissage, en utilisant un agent d’apprentissage par renforcement pour la gĂ©nĂ©ration active d’exemples. Ainsi, on utilise des concepts de plusieurs domaines de l’apprentissage automatique dont des notions d’apprentissage supervisĂ©, d’apprentissage actif, d’apprentissage par renforcement, ainsi que des rĂ©seaux rĂ©currents. Dans ce travail exploratoire, on Ă©value notre mĂ©thodologie sur un problĂšme simple, soit celui de classifier des mains de poker en 10 classes prĂ©-Ă©tablies. On teste notre architecture sur ce problĂšme jouet dans le but de simplifier l’analyse. Malheureusement, l’avantage d’utiliser l’architecture de gĂ©nĂ©ration active n’est pas significatif. On expose ensuite plusieurs pistes de rĂ©flexion sur certaines observations Ă  approfondir dans de futurs travaux, comme la dĂ©finition de la fonction de rĂ©compense. Dans de futurs projets, il serait Ă©galement intĂ©ressant d’utiliser un problĂšme plus similaire au problĂšme d’optimisation initial qui comporterait, entre autres, des coĂ»ts d’étiquettage variables.The motivating application behind this architecture is a discrete optimisation problem whose solution we aim to predict using neural networks. A main challenge of solving this problem by machine learning lies in the high (and variable) labelling cost associated to the various instances, which leads to an expensive and difficult dataset generation. We propose an active learning architecture, called meta-teaching, to address this problem. We show how we combine several models to solve the active learning problem, formulated as a metalearning problem, by using a reinforcement learning agent to actively generate new instances. Therefore, we use concepts from various areas of machine learning, including supervised learning, active learning, reinforcement learning and recurrent networks. In this exploratory work, we evaluate our method on a simpler problem, which is to classify poker hands in 10 predefined classes. We test our architecture on this toy dataset in order to simplify the analysis. Unfortunately, we do not achieve a significant advantage using our active generation architecture on this dataset. We outline avenues for further reflections, including the definition of the reward function. In future projects, using a more similar problem to our problem of interest having, among others, a variable labelling cost, would be interesting

    Assistance Ă  la construction et Ă  la comparaison de techniques de diagnostic des connaissances

    Get PDF
    Comparing and building knowledge diagnostic is a challenge in the field of Technology Enhanced Learning (TEL) systems. Knowledge diagnostic aims to infer the knowledge mastered or not by a student in a given learning domain (like mathematics for high school) using student traces recorded by the TEL system. Knowledge diagnostics are widely used, but they strongly depend on the learning domain and are not well formalized. Thus, there exists no method or tool to build, compare and evaluate different diagnostics applied on a given learning domain. Similarly, using a diagnostic in two different domain usually imply to implementing almost both from scratch. Yet, comparing and reusing knowledge diagnostics can lead to reduce the engineering cost, to reinforce the evaluation and finally help knowledge diagnostic designers to choose a diagnostic. We propose a method, refine in a first platform, to assist knowledge diagnostic designers to build and compare knowledge diagnostics, using a new formalization of the diagnostic and student traces. To help building diagnostics, we used a semi-automatic machine learning algorithm, guided by an ontology of the traces and the knowledge designed by the designer. To help comparing diagnostics, we use a set of comparison criteria (either statistical or specific to the field of TEL systems) applied on the results of each diagnostic on a given set of traces. The main contribution is that our method is generic over diagnostics, meaning that very different diagnostics can be built and compared, unlike previous work on this topic. We evaluated our work though three experiments. The first one was about applying our method on three different domains and set of traces (namely geometry, reading and surgery) to build and compare five different knowledge diagnostics in cross validation. The second experiment was about designing and implementing a new comparison criteria specific to TEL systems: the impact of knowledge diagnostic on a pedagogical decision, the choice of a type of help to give to a student. The last experiment was about designing and adding in our platform a new diagnostic, in collaboration with an expert in didactic.Cette thĂšse aborde la thĂ©matique de la comparaison et de la construction de diagnostics des connaissances dans les Environnements Informatiques pour l'Apprentissage Humain (EIAH). Ces diagnostics sont utilisĂ©s pour dĂ©terminer si les apprenants maĂźtrisent ou non les connaissances ou conceptions du domaine d'apprentissage (par exemple math au collĂšge) Ă  partir des traces collectĂ©es par l'EIAH. Bien que ces diagnostics soient rĂ©currents dans les EIAH, ils sont fortement liĂ©s au domaine et ne sont que peu formalisĂ©s, si bien qu'il n'existe pas de mĂ©thode de comparaison pour les positionner entre eux et les valider. Pour la mĂȘme raison, utiliser un diagnostic dans deux domaines diffĂ©rents implique souvent de le redĂ©velopper en partie ou en totalitĂ©, sans rĂ©elle rĂ©utilisation. Pourtant, pouvoir comparer et rĂ©utiliser des diagnostics apporterait aux concepteurs d'EIAH plus de rigueur pour le choix, l'Ă©valuation et le dĂ©veloppement de ces diagnostics. Nous proposons une mĂ©thode d'assistance Ă  la construction et Ă  la comparaison de diagnostics des connaissances, rĂ©ifiĂ©e dans une premiĂšre plateforme, en se basant sur une formalisation du diagnostic des connaissances en EIAH que nous avons dĂ©fini et sur l'utilisation de traces d'apprenant. L'assistance Ă  la construction se fait via un algorithme d'apprentissage semi-automatique, guidĂ© par le concepteur du diagnostic grĂące Ă  une ontologie dĂ©crivant les traces et les connaissances du domaine d'apprentissage. L'assistance Ă  la comparaison se fait par application d'un ensemble de critĂšres de comparaison (statistiques ou spĂ©cifiques aux EIAH) sur les rĂ©sultats des diffĂ©rents diagnostics construits. La principale contribution au domaine est la gĂ©nĂ©ricitĂ© de notre mĂ©thode, applicable Ă  un ensemble de diagnostics diffĂ©rents pour tout domaine d'apprentissage. Nous Ă©valuons notre travail Ă  travers trois expĂ©rimentations. La premiĂšre porte sur l'application de la mĂ©thode Ă  trois domaines diffĂ©rents (gĂ©omĂ©trie, lecture, chirurgie) en utilisant des jeux de traces en validation croisĂ©e pour construire et appliquer les critĂšres de comparaison sur cinq diagnostics diffĂ©rents. La seconde expĂ©rimentation porte sur la spĂ©cification et l'implĂ©mentation d'un nouveau critĂšre de comparaison spĂ©cifique aux EIAH : la comparaison des diagnostics en fonction de leur impact sur une prise de dĂ©cision de l'EIAH, le choix d'un type d'aide Ă  donner Ă  l'apprenant. La troisiĂšme expĂ©rimentation traite de la spĂ©cification et de l'ajout d'un nouveau diagnostic dans notre plateforme, en collaborant avec une didacticienne

    Amélioration des techniques d'optimisation combinatoire par retour d'expérience dans le cadre de la sélection de scénarios de Produit/Projet

    Get PDF
    La dĂ©finition et l’utilisation d'un modĂšle couplant la conception de produit et la conduite du projet dĂšs les phases amont de l’étude d’un systĂšme correspondent Ă  une forte demande industrielle. Ce modĂšle permet la prise en compte simultanĂ©e de dĂ©cisions issues des deux environnements produit/projet mais il reprĂ©sente une augmentation consĂ©quente de la dimension de l'espace de recherche Ă  explorer pour le systĂšme d'aide Ă  la dĂ©cision, notamment lorsque il s'agit d'une optimisation multiobjectif. Les mĂ©thodes de type mĂ©taheuristique tel que les algorithmes Ă©volutionnaires, sont une alternative intĂ©ressante pour la rĂ©solution de ce problĂšme fortement combinatoire. Ce problĂšme prĂ©sente nĂ©anmoins une particularitĂ© intĂ©ressante et inexploitĂ©e : Il est en effet courant de rĂ©utiliser, en les adaptant, des composants ou des procĂ©dures prĂ©cĂ©demment mis en Ɠuvre dans les produits/projets antĂ©rieurs. L'idĂ©e mise en avant dans ce travail consiste Ă  utiliser ces connaissances « a priori » disponibles afin de guider la recherche de nouvelles solutions par l'algorithme Ă©volutionnaire. Le formalisme des rĂ©seaux bayĂ©siens a Ă©tĂ© retenu pour la modĂ©lisation interactive des connaissances expertes. De nouveaux opĂ©rateurs Ă©volutionnaires ont Ă©tĂ© dĂ©finis afin d'utiliser les connaissances contenues dans le rĂ©seau. De plus, le systĂšme a Ă©tĂ© complĂ©tĂ© par un processus d'apprentissage paramĂ©trique en cours d'optimisation permettant d'adapter le modĂšle si le guidage ne donne pas de bons rĂ©sultats. La mĂ©thode proposĂ©e assure Ă  la fois une optimisation plus rapide et efficace, mais elle permet Ă©galement de fournir au dĂ©cideur un modĂšle de connaissances graphique et interactif associĂ© au projet Ă©tudiĂ©. Une plateforme expĂ©rimentale a Ă©tĂ© rĂ©alisĂ©e pour valider notre approche. ABSTRACT : The definition and use of a model coupling product design and project management in the earliest phase of the study of a system correspond to a keen industrial demand. This model allows simultaneous to take into account decisions resulting from the two environments (product and project) but it represents a consequent increase of the search space dimension for the decision-making system, in particular when it concerns a multiobjective optimization. Metaheuristics methods such as evolutionary algorithm are an interesting way to solve this strongly combinative problem. Nevertheless, this problem presents an interesting and unexploited characteristic: It is indeed current to re-use, by adapting them, the components or the procedures previously implemented in pasted product or project. The idea proposed in this work consists in using this “a priori” knowledge available in order to guide the search for new solutions by the evolutionary algorithm. Bayesian network was retained for the interactive modeling of expert knowledge. New evolutionary operators were defined in order to use knowledge contained in the network. Moreover, the system is completed by a process of parametric learning during optimization witch make it possible to adapt the model if guidance does not give good results. The method suggested ensures both a faster and effective optimization, but it also makes it possible to provide to the decision maker a graphic and interactive model of knowledge linked to studied project. An experimental platform was carried out to validate our approach

    Algorithmes d'apprentissage automatique pour la conception de composés pharmaceutiques et de vaccins

    Get PDF
    La dĂ©couverte de composĂ©s pharmaceutiques est actuellement trop longue et trop coĂ»teuse, et le taux d’échec, trop Ă©levĂ©. Les bases de donnĂ©es biochimiques et gĂ©nomiques ne cessent de grossir et il est maintenant impraticable d’interprĂ©ter ces donnĂ©es. Un changement radical est nĂ©cessaire ; certaines Ă©tapes de ce processus doivent ĂȘtre automatisĂ©es. Les peptides jouent un rĂŽle important dans le systĂšme immunitaire et dans la signalisation cellulaire. Leurs propriĂ©tĂ©s favorables en font des candidats de choix pour initier la conception de nouveaux mĂ©dicaments et assister la production de nouveaux vaccins. De plus, les techniques de synthĂšse modernes permettent de rapidement synthĂ©tiser ces molĂ©cules Ă  faible coĂ»t. Les algorithmes d’apprentissage statistique sont particuliĂšrement bien adaptĂ©s pour apprendre de façon automatisĂ©e des modĂšles, possiblement biochimiques, Ă  partir des donnĂ©es existantes. Ces mĂ©thodes et les peptides offrent donc une solution de choix aux dĂ©fis auxquels fait face la recherche pharmaceutique. Nous proposons un noyau permettant l’apprentissage de modĂšles statistiques de phĂ©nomĂšnes biochimiques impliquant des peptides. Celui-ci permet, entre autres, l’apprentissage d’un modĂšle universel pouvant raisonnablement quantifier l’énergie de liaison entre toute sĂ©quence peptidique et tout site de liaison d’une protĂ©ine cristallisĂ©e. De plus, il unifie la thĂ©orie de plusieurs noyaux existants tout en conservant une faible complexitĂ© algorithmique. Ce noyau s’avĂšre particuliĂšrement adaptĂ© pour quantifier l’interaction entre les antigĂšnes et les complexes majeurs d’histocompatibilitĂ©. Nous proposons un outil pour prĂ©dire les peptides qui survivront au processus de prĂ©sentation antigĂ©nique. Cet outil a gagnĂ© une compĂ©tition internationale et aura plusieurs applications en immunologie, dont la conception de vaccins. Ultimement, un peptide doit maximiser l’interaction avec une protĂ©ine cible ou maximiser la bioactivitĂ© chez l’hĂŽte. Nous formalisons ce problĂšme comme un problĂšme de prĂ©diction de structures. Puis, nous proposons un algorithme exploitant les plus longs chemins dans un graphe pour dĂ©terminer les peptides maximisant la bioactivitĂ© prĂ©dite par un modĂšle prĂ©alablement appris. Nous validons cette nouvelle approche en laboratoire par la dĂ©couverte de peptides antimicrobiens. Finalement, nous fournissons des garanties de performance de type PAC-Bayes pour deux algorithmes de prĂ©diction de structure dont un est nouveau.The discovery of pharmaceutical compounds is currently too time-consuming, too expensive, and the failure rate is too high. Biochemical and genomic databases continue to grow and it is now impracticable to interpret these data. A radical change is needed; some steps in this process must be automated. Peptides are molecules that play an important role in the immune system and in cell signaling. Their favorable properties make them prime candidates for initiating the design of new drugs and assist in the design of vaccines. In addition, modern synthesis techniques can quickly generate these molecules at low cost. Statistical learning algorithms are well suited to manage large amount of data and to learn models in an automated fashion. These methods and peptides thus offer a solution of choice to the challenges facing pharmaceutical research. We propose a kernel for learning statistical models of biochemical phenomena involving peptides. This allows, among other things, to learn a universal model that can reasonably quantify the binding energy between any peptide sequence and any binding site of a protein. In addition, it unifies the theory of many existing string kernels while maintaining a low computational complexity. This kernel is particularly suitable for quantifying the interaction between antigens and proteins of the major histocompatibility complex. We provide a tool to predict peptides that are likely to be processed by the antigen presentation pathway. This tool has won an international competition and has several applications in immunology, including vaccine design. Ultimately, a peptide should maximize the interaction with a target protein or maximize bioactivity in the host. We formalize this problem as a structured prediction problem. Then, we propose an algorithm exploiting the longest paths in a graph to identify peptides maximizing the predicted bioactivity of a previously learned model. We validate this new approach in the laboratory with the discovery of new antimicrobial peptides. Finally, we provide PAC-Bayes bound for two structured prediction algorithms, one of which is new
    • 

    corecore