3 research outputs found

    MĂ©thodes d'apprentissage de la coordination multiagent : application au transport intelligent

    Get PDF
    Les problĂšmes de prise de dĂ©cisions sĂ©quentielles multiagents sont difficiles Ă  rĂ©soudre surtout lorsque les agents n'observent pas parfaitement l'Ă©tat de Y environnement. Les approches existantes pour rĂ©soudre ces problĂšmes utilisent souvent des approximations de la fonction de valeur ou se basent sur la structure pour simplifier la rĂ©solution. Dans cette thĂšse, nous proposons d'approximer un problĂšme de dĂ©cisions sĂ©quentielles multiagent Ă  observation limitĂ©e, modĂ©lisĂ© par un processus dĂ©cisionnel markovien dĂ©centralisĂ© (DEC-MDP) en utilisant deux hypothĂšses sur la structure du problĂšme. La premiĂšre hypothĂšse porte sur la structure de comportement optimal et suppose qu'il est possible d'approximer la politique optimale d'un agent en connaissant seulement les actions optimales au niveau d'un petit nombre de situations auxquelles l'agent peut faire face dans son environnement. La seconde hypothĂšse porte, quant Ă  elle, sur la structure organisationnelle des agents et suppose que plus les agents sont Ă©loignĂ©s les uns des autres, moins ils ont besoin de se coordonner. Ces deux hypothĂšses nous amĂšnent Ă  proposer deux approches d'approximation. La premiĂšre approche, nommĂ©e Supervised Policy Reinforcement Learning, combine l'apprentissage par renforcement et l'apprentissage supervisĂ© pour gĂ©nĂ©raliser la politique optimale d'un agent. La second approche se base, quant Ă  elle, sur la structure organisationnelle des agents pour apprendre une politique multiagent dans des problĂšmes oĂč l'observation est limitĂ©e. Pour cela, nous prĂ©sentons un modĂšle, le D O F - D E C - M DP (Distance-Observable Factored Decentralized Markov DĂ©cision Process) qui dĂ©finit une distance d'observation pour les agents. A partir de ce modĂšle, nous proposons des bornes sur le gain de rĂ©compense que permet l'augmentation de la distance d'observation. Les rĂ©sultats empiriques obtenus sur des problĂšmes classiques d'apprentissage par renforcement monoagents et multiagents montrent que nos approches d'approximation sont capables d'apprendre des politiques proches de l'optimale. Enfin, nous avons testĂ© nos approches sur un problĂšme de coordination de vĂ©hicules en proposant une mĂ©thode de synchronisation d'agents via la communication dans un cadre Ă  observation limitĂ©e

    L'intelligence artificielle : une certaine intelligence du social

    Full text link
    Sociologie des techniquesDu point de vue d’une sociologie de la connaissance, la recherche contemporaine en intelligence artificielle tire son originalitĂ© de l’intĂ©rĂȘt portĂ© Ă  la modĂ©lisation de la connaissance ordinaire, ce savoir engagĂ© dans la vie de tous les jours (ex. aller l’épicerie, prendre son petit dĂ©jeuner). Les entreprises Facebook ou Google, le fameux GAFAM ainsi que les services de musique et de vidĂ©os en ligne capturent et modĂ©lisent les faits et gestes du quidam afin de remettre les rĂ©sultats de leurs calculs en jeu dans cette mĂȘme vie courante. La recherche en IA porte Ă©galement sur la mise en forme de savoirs savants et professionnels tout comme durant les annĂ©es 1960 et 1970, mais cette thĂšse ne s’y intĂ©ressera pas. Dans le cadre d’une sociologie des sciences et des techniques, je me questionne sur ce que nous, en tant que civilisation occidentale, faisons du dĂ©veloppement technologique, du monde que nous construisons Ă  l’aide des diverses techniques. Ma prĂ©occupation ne porte pas sur les choix des objets privilĂ©giĂ©s par la recherche des laboratoires publics et privĂ©s, mais sur les usages, les dĂ©bouchĂ©s selon la question trĂšs gĂ©nĂ©rale : en quoi telle technique modifie-t-elle ou non notre façon de vivre ? Or, cette question relĂšve d’un exercice de prospective dans la mesure oĂč bien souvent nous ne possĂ©dons pas assez de recul sur ces techniques. Elle demeure malgrĂ© tout une prĂ©occupation d’arriĂšre-plan de mes questions de recherche. En effet, ces modĂšles d’apprentissage machine, trouveraient-ils leur place au sein d’une civilisation qui n’accorderait pas autant d’importance Ă  l’efficacitĂ©, Ă  la productivitĂ©, Ă  la rentabilitĂ©, Ă  la science ou encore au travail ? Aussi, viennent-ils entĂ©riner l’ordre Ă©tabli ou bien offrent-ils de nouvelles possibilitĂ©s d’existence ? Comprendre minimalement l’artefact d’un point de vue technique et saisir du point de vue de la sociologie la façon dont les chercheurs pensent leurs objets nous Ă©claire sur les catĂ©gories de pensĂ©es principales qui orientent ces usages et le cas Ă©chĂ©ant sur les Ă©ventuels effets sociĂ©taux. En l’occurrence, l’idĂ©e de modĂ©liser de nombreuses activitĂ©s de la vie quotidienne repose sur une reprĂ©sentation Ă  priori de celle-ci de la part de chercheurs localisĂ©s socialement par leur profession et plus gĂ©nĂ©ralement leurs relations sociales diverses. Quelle est cette reprĂ©sentation et comment est-elle opĂ©rationnalisĂ©e dans les modĂšles ? PosĂ©e autrement, de quels rapports au monde tĂ©moignent ingĂ©nieurs et informaticiens par l’intermĂ©diaire de leurs connaissances professionnelles, savantes et ordinaires ? Ainsi, dans cette thĂšse, mon travail se ramĂšne Ă  informer de la dimension sociale propre Ă  la technique Ă©tudiĂ©e. À partir d’entretiens auprĂšs de chercheurs en IA, la question de recherche est la suivante : quels sont les savoirs et raisonnements chez les chercheurs au fondement de l’élaboration des algorithmes relevant de l’intelligence artificielle contemporaine et qui construisent une reprĂ©sentation opĂ©ratoire particuliĂšre de la vie sociale ? ExprimĂ©e en terme sociologique, cette question devient : en quoi les modĂšles d'apprentissage sont-ils un nouveau « modĂšle concret de connaissance » pour les usagers et informaticiens selon le concept dĂ©veloppĂ© par le sociologue Gilles Houles ? Les modĂšles dits d’apprentissage sous-tendent une conception relationnelle de la constitution de la connaissance humaine et d’un rapport Ă  la rĂ©alitĂ© mĂ©diĂ© par l’action comme moyen d’actualisation de cette connaissance. RĂ©sumĂ© simplement, le concept sociologique de « modĂšle concret de connaissance » objective les deux modalitĂ©s d’existence de la vie humaine que nous retrouvons empiriquement sous deux concepts informatiques : symbolique (leur modĂšle mathĂ©matique) et l’action ou « l’agent informatique » ou « celui qui agit », que ce concept soit mobilisĂ© ou non par les chercheurs. En somme, ces modĂšles en relation les uns avec les autres et matĂ©rialisĂ©s dans les objets dits connectĂ©s ou « smart » (ex. tĂ©lĂ©phones, Ă©lectromĂ©nagers) forment un schĂ©ma opĂ©ratoire organisateur de la vie sociale. Ce cĂŽtĂ© opĂ©ratoire repose sur la position de « tiers mĂ©diateur » ou de « mĂ©moire sociale technicisĂ©e » dans les relations humains-humains via machines. Je m'appuierai sur le concept de mĂ©moire sociale et de morphologie sociale dĂ©veloppĂ©e par le sociologue Maurice Halbwachs. Autrement dit, ce rĂ©seau d’objets connectĂ©s et d’ĂȘtres humains se ramĂšne Ă  l’instauration d’un cadre cognitif collectif particulier, issu des reprĂ©sentations sociales de groupes professionnels prĂ©cis, mais mises en jeu dans la vie courante de tous, soit une institutionnalisation en cours. En effet, la diffusion et l’adoption des modĂšles dĂ©coulent d’un processus de reconnaissance publique de savoirs sous-jacents et dĂ©jĂ  institutionnalisĂ©s, pour l'essentiel, les mathĂ©matiques et l’ingĂ©nierie, le savoir implicite des « sciences de la gestion » et un savoir dit « scientifique » par les chercheurs. Plus prĂ©cisĂ©ment, le processus en cours consiste en l’institution d’ĂȘtres humains et de machines apprenantes en liens permanents via les objets connectĂ©s (« Internet of Things »). Au final, elle consiste en une mise en rĂ©seau des « rĂ©gularitĂ©s sociales » obtenues par classifications et rĂ©gressions effectuĂ©es par les dĂ©tenteurs des donnĂ©es. Je parlerai d'une « morphologie sociotechnique » ou d’une « configuration sociotechnique ». À la figure du robot polyvalent anthropomorphique censĂ© condenser toute la mise en pratique du savoir sur l’IA, se substitue celle de relations sociales informatisĂ©es comme lieux du maintien des liens entre ĂȘtres humains par un concentrĂ© de savoirs et idĂ©es hĂ©tĂ©rogĂšnes tels qu'un ĂȘtre humain ayant besoin d'aide ou la nĂ©cessitĂ© de la crĂ©ativitĂ© par exemple. À l’usage, s’établit un type de lien social entre ĂȘtres humains via les machines pris entre la rĂ©duction propre Ă  tout modĂšle de l’objet sur lequel il porte, la flexibilitĂ© qu’offre la possibilitĂ© d’ajustement (le cĂŽtĂ© « learning ») et le sens donnĂ© Ă  l’action par l’utilisateur lambda. L’idĂ©ologie comme « mode de connaissance » du rĂ©seau sociotechnique est partie prenante de cette institutionnalisation en cours. Elle offre un cadre cognitif qui remet en cause la diversitĂ© produite par la division habituelle du travail sĂ©mantique au sein des ensembles sociaux en fournissant un modĂšle de lĂ©gitimitĂ©, soit le discours du « partage ». L’accent mis par cette thĂšse sur les « sciences de la gestion » et la notion de rĂ©seau l’inscrit dans le prolongement des Ă©tudes des trente derniĂšres annĂ©es sur cette « sociĂ©tĂ© informationnelle » de Manuel Castells, une « nouvelle reprĂ©sentation gĂ©nĂ©rale des sociĂ©tĂ©s » en rĂ©seau en suivant Luc Boltanski ou encore « l’esprit gestionnaire » qui s’empara des fonctionnaires d’État selon le sociologue Albert Ogien.From the point of view of a sociology of knowledge, contemporary research in Artificial Intelligence (AI) draws its originality by its interest in the modeling of ordinary knowledge, that knowledge engaged in everyday life. The companies Facebook or Google, the so-called GAFAM, as well as online music and video services, capture and model the facts and gestures of the average person in order to put the results of their calculations back into play in its very everyday life. The research in AI also deals with academic and professional knowledge as it did in the 1960s and 1970s, but this thesis will not focus on it. Within the framework of a sociology of science and technology, I question what We, as the Western civilization, do with technological development, about the world we build with the help of various techniques. My concern is not with the choice of research objects privileged by public and private laboratories, but with the uses, the outlets according to the very general question: In what way does such a technique modify or not our way of living? Now, this question is an exercise in foresight insofar as we often do not have enough hindsight on these techniques. Nevertheless, it remains a background concern of my research. Indeed, would these machine learning models find their place in a civilization that would not give as much importance to efficiency, productivity, profitability, science or work? Also, do they endorse the established social organization, or do they offer new possibilities of existence? Understanding the artifact minimally from a technical perspective and grasping from a sociological point of view the way in which researchers think about their objects sheds light on the main categories of thought that guide these uses and, if applicable, on the possible societal effects. In this case, the idea of modeling many activities of daily life is based on an a priori representation of it by researchers who are socially situated by their profession. What is this representation and how is it operationalized in the models? Put differently, what relationships to the world do engineers and computer scientists have through their professional, academic and ordinary knowledge? Thus, in this thesis, my work comes down to informing the social dimension specific to the studied technique. Based on interviews with AI researchers, the question is as follows: What is the knowledge and reasoning of the researchers at the core of the algorithms of contemporary artificial intelligence and which build a specific operational representation of social life? Expressed in sociological terms, this question becomes: In what way are learning models a new "concrete model of knowledge" for users et researchers according to the concept developed by the sociologist Gilles Houles? The so-called learning models underlie a relational constitution of human knowledge and of a relation to reality mediated by actions as a means of actualization of this knowledge. Summarized simply, the sociological concept of "concrete model of knowledge" objectifies the two modalities of existence of the human life that we find empirically under two computing concepts: symbolic (their mathematical model) and the “action” as "the computing agent" or "the one who acts", whether this concept is used or not by the researchers. In sum, these models in relation to each other and materialized in the notorious connected or "smart" objects (e.g. telephones, household appliances) turn social life into a sociotechnical network. Its operational side relies on the position of "third-party intermediary" or "technical social memory" in human-human relations via machines. I will draw upon the concept of "social memory" and "social morphology" developed by the sociologist Maurice Halbwachs. In other words, this network of connected objects and human beings comes down to the establishment of a particular collective cognitive framework, stemming from the social representations of specific professional groups, but put into play in the everyday life of all, that is to say an institutionalization in progress. Indeed, the diffusion and adoption of the models stem from a process of public recognition of underlying and already institutionalized knowledge, essentially mathematics and engineering, the implicit knowledge of the "management sciences" and a knowledge called "scientific" by researchers. More precisely, the process underway consists in the institution of human beings and learning machines in permanent links via connected objects ("Internet of Things"). In the end, it consists in the networking of "social regularities" obtained by classifications and regressions carried out by the data's owners. I will speak of a "sociotechnical morphology" or a "sociotechnical configuration". The figure of the anthropomorphic multipurpose robot, which is supposed to condense all the practical application of knowledge on AI, is replaced by that of computerized social relations as places where links between human beings are maintained by a concentration of heterogeneous knowledge and ideas, such as a human being in need of help or the need for creativity, for example. In use, a type of social link between human beings via the machines is established, caught between the reduction proper to any modelling of the object on which it concerns, the flexibility offered by the possibility of adjustment (the "learning" side) and the meaning given to the action by the lambda user. Ideology as a "mode of knowledge" of the socio-technical network is part of this ongoing institutionalization. It offers a cognitive framework that challenges the diversity produced by the usual division of semantic labor within social groups by providing a model of legitimacy, namely the discourse of "sharing". The emphasis placed by this thesis on the "management sciences" and the notion of network places it in the continuity of the studies of the last thirty years on this "informational society" of Manuel Castells, a "new general representation of societies" into a network according to Luc Boltanski, or the "managerial spirit" which took hold of the State civil servants according to the sociologist Albert Ogie
    corecore