8 research outputs found

    Approche Conceptuelle et Algorithmique des Equilibres de Nash Robustes Incitatifs

    Get PDF
    On propose une analyse de la robustesse des équilibres de Nash dans le cadre d’un mécanisme Bayésien incitatif. On met en valeur une contrainte de robustesse comme élément de réponse au problème de rationalité individuelle (intermédiaire) selon 1) une approche conceptuelle des propriétés de la solution d’équilibre et 2) une approche algorithmique du protocole et des étapes calculatoires.

    Complexité des dynamiques de jeux

    Get PDF
    La th eorie de la complexit e permet de classi er les problemes en fonction de leur di cult e. Le cadre classique dans lequel elle s applique est celui d un algorithme centralis e qui dispose de toutes les informations. Avec l essor des r eseaux et des architectures d ecentralis ees, l algo- rithmique distribu ee a et e etudi ee. Dans un grand nombre de problemes, en optimisation et en economie, les d ecisions et les calculs sont e ectu es par des agents ind ependants qui suivent des objectifs di erents dont la r ealisation d epend des d ecisions des autres agents. La th eorie des jeux est un cadre naturel pour analyser les solutions de tels problemes. Elle propose des concepts de stabilit e, le plus classique etant l equilibre de Nash.Une maniere naturelle de calculer de telles solutions est de faire r eagir les agents ; si un agent voit quelles sont les d ecisions des autres joueurs ou plus g en eralement un etat du jeu , il peut d ecider de changer sa d ecision pour atteindre son objectif faisant ainsi evoluer l etat du jeu. On dit que ces algorithmes sont des dynamiques .On sait que certaines dynamiques convergent vers un concept de solution. On s int eresse a la vitesse de convergence des dynamiques. Certains concepts de solutions sont m eme complets pour certaines classes de complexit e ce qui rend peu vraisemblable l existence de dynamiques simples qui convergent rapidement vers ces solutions. On a utilis e alors trois approches pour obtenir une convergence rapide : am eliorer la dynamique (en utilisant par exemple des bits al eatoires), restreindre la structure du probleme, et rechercher une solution approch ee.Sur les jeux de congestion, on a etendu les r esultats de convergence rapide vers un equilibre de Nash approch e aux jeux n egatifs. Cependant, on a montr e que sur les jeux sans contrainte de signe, calculer un equilibre de Nash approch e est PLS-complet. Sur les jeux d appariement, on a etudi e la vitesse de dynamiques concurrentes lorsque les joueurs ont une information partielle param etr ee par un r eseau social. En particulier, on a am elior e des dynamiques naturelles a n qu elles atteignent un equilibre enO(log(n)) tours (avec n le nombre de joueurs).Complexity theory allows to classify problems by their algorithmic hardness. The classical framework in which it applies is the one of a centralized algorithm that knows every informa- tion. With the development of networks and decentralized architectures, distributed dynamics was studied. In many problems, in optimization or economy, actions and computations are made by independant agents that don t share the same objective whose realization depends on the actions of other agents. Game theory is a natural framework to study solutions of this kind of problem. It provides solution concepts such as the Nash equilibrium.A natural way to compute these solutions is to make the agents react ; if an agent sees the actions of the other player, or more generally the state of the game, he can decide to change his decision to reach his objective and updates the state of the game. We call dynamics this kind of algorithms.We know some dynamics converges to a stable solution. We are interested by the speed of convergence of these dynamics. Some solution concepts are even complete for some complexity classes which make unrealistic the existence of fast converging dynamics. We used three ways to obtain a fast convergence : improving dynamics (using random bits), nding simple subcases, and nding an approximate solution.We extent fast convergence results to an approximate Nash equilibria in negative congestion games. However, we proved that nding an approximate Nash equilibrium in a congestion games without sign restriction is PLS-complete. On matching game, we studied the speed of concurrent dynamics when players have partial information that depends on a social network. Especially, we improved natural dynamics for them to reach an equilibrium inO(log(n)) rounds (with n is the number of players).PARIS11-SCD-Bib. Ă©lectronique (914719901) / SudocSudocFranceF

    Using or Hiding Private Information ? An Experimental Study of Zero-Sum Repeated Games with Incomplete Information

    Get PDF
    This paper studies experimentally the value of private information in strictly competitive interactions with asymmetric information. We implement in the laboratory three examples from the class of zero-sum repeated games with incomplete information on one side and perfect monitoring. The stage games share the same simple structure, but differ markedly on how information should be optimally used once they are repeated. Despite the complexity of the optimal strategies, the empirical value of information coincides with the theoretical prediction in most instances. In particular, it is never negative, it decreases with the number of repetitions, and it is nicely bounded below by the value of the infinitely repeated game and above by the value of the one-shot game. Subjects are unable to completely ignore their information when it is optimal to do so, but the use of information in the lab reacts qualitatively well to the type and length of the game being played.Concavification, laboratory experiments, incomplete information, value of information, zero-sum repeated games.

    Cadre global pour la coopération dans les réseaux ad hoc impliquant les fournisseurs de services

    Get PDF
    Introduction -- La coopération et les réseaux mobiles AD HOC -- Modèle de coopération et protocole de routage proposés -- Implémentation et résultats -- Effet de la mobilité sur la coopération dans les réseaux mobiles AD HOC -- Conclusion

    Ellsberg games and the strategic use of ambiguity in normal and extensive form games

    Get PDF
    Sass L. Ellsberg games and the strategic use of ambiguity in normal and extensive form games. Bielefeld: Universität Bielefeld; 2013.In this thesis I propose a framework for normal and extensive form games where players can use Knightian uncertainty strategically. In such Ellsberg games, ambiguity-averse players may render their actions objectively ambiguous by using devices such as Ellsberg urns, in addition to the standard mixed strategies. This simple change in the foundations leads to a number of interesting phenomena. While Nash equilibria remain equilibria in the extended game, there arise new Ellsberg equilibria with distinct outcomes. This happens especially in games with an information structure in which a player has the possibility to threaten his opponents. I illustrate this with the example of a negotiation game with three players. This mediated peace negotiation does not have a Nash equilibrium with peace outcome, but does have a peace equilibrium when ambiguity is a possible strategy. That a game with more than two players can have interesting non-Nash Ellsberg equilibria is traced back to results on subjective equilibria. Ellsberg equilibria are mathematically characterized by the Principle of Indifference in Distributions. In an Ellsberg equilibrium, players are indifferent between all mixed strategies contained in the Ellsberg equilibrium strategy. Furthermore, I observe that in two-player games players can immunize against strategic ambiguity by playing their maximin strategy (if a completely mixed Nash equilibrium exists). I analyze Ellsberg equilibria in two-person games with common and conflicting interests. I provide a number of examples and general results how to determine the Ellsberg equilibria of these games. The equilibria of conflicting interest games (modified Matching Pennies) turn out to be consistent with experimental deviations from Nash equilibrium play. Finally, I define extensive form Ellsberg games. Under the assumption of dynamically consistent (rectangular) Ellsberg strategies, I prove a result analog to Kuhn’s theorem: rectangular Ellsberg strategies and Ellsberg behavior strategies are equivalent

    Multi-player games in the era of machine learning

    Full text link
    Parmi tous les jeux de société joués par les humains au cours de l’histoire, le jeu de go était considéré comme l’un des plus difficiles à maîtriser par un programme informatique [Van Den Herik et al., 2002]; Jusqu’à ce que ce ne soit plus le cas [Silveret al., 2016]. Cette percée révolutionnaire [Müller, 2002, Van Den Herik et al., 2002] fût le fruit d’une combinaison sophistiquée de Recherche arborescente Monte-Carlo et de techniques d’apprentissage automatique pour évaluer les positions du jeu, mettant en lumière le grand potentiel de l’apprentissage automatique pour résoudre des jeux. L’apprentissage antagoniste, un cas particulier de l’optimisation multiobjective, est un outil de plus en plus utile dans l’apprentissage automatique. Par exemple, les jeux à deux joueurs et à somme nulle sont importants dans le domain des réseaux génératifs antagonistes [Goodfellow et al., 2014] ainsi que pour maîtriser des jeux comme le Go ou le Poker en s’entraînant contre lui-même [Silver et al., 2017, Brown andSandholm, 2017]. Un résultat classique de la théorie des jeux indique que les jeux convexes-concaves ont toujours un équilibre [Neumann, 1928]. Étonnamment, les praticiens en apprentissage automatique entrainent avec succès une seule paire de réseaux de neurones dont l’objectif est un problème de minimax non-convexe et non-concave alors que pour une telle fonction de gain, l’existence d’un équilibre de Nash n’est pas garantie en général. Ce travail est une tentative d'établir une solide base théorique pour l’apprentissage dans les jeux. La première contribution explore le théorème minimax pour une classe particulière de jeux non-convexes et non-concaves qui englobe les réseaux génératifs antagonistes. Cette classe correspond à un ensemble de jeux à deux joueurs et a somme nulle joués avec des réseaux de neurones. Les deuxième et troisième contributions étudient l’optimisation des problèmes minimax, et plus généralement, les inégalités variationnelles dans le cadre de l’apprentissage automatique. Bien que la méthode standard de descente de gradient ne parvienne pas à converger vers l’équilibre de Nash de jeux convexes-concaves simples, il existe des moyens d’utiliser des gradients pour obtenir des méthodes qui convergent. Nous étudierons plusieurs techniques telles que l’extrapolation, la moyenne et la quantité de mouvement à paramètre négatif. La quatrième contribution fournit une étude empirique du comportement pratique des réseaux génératifs antagonistes. Dans les deuxième et troisième contributions, nous diagnostiquons que la méthode du gradient échoue lorsque le champ de vecteur du jeu est fortement rotatif. Cependant, une telle situation peut décrire un pire des cas qui ne se produit pas dans la pratique. Nous fournissons de nouveaux outils de visualisation afin d’évaluer si nous pouvons détecter des rotations dans comportement pratique des réseaux génératifs antagonistes.Among all the historical board games played by humans, the game of go was considered one of the most difficult to master by a computer program [Van Den Heriket al., 2002]; Until it was not [Silver et al., 2016]. This odds-breaking break-through [Müller, 2002, Van Den Herik et al., 2002] came from a sophisticated combination of Monte Carlo tree search and machine learning techniques to evaluate positions, shedding light upon the high potential of machine learning to solve games. Adversarial training, a special case of multiobjective optimization, is an increasingly useful tool in machine learning. For example, two-player zero-sum games are important for generative modeling (GANs) [Goodfellow et al., 2014] and mastering games like Go or Poker via self-play [Silver et al., 2017, Brown and Sandholm,2017]. A classic result in Game Theory states that convex-concave games always have an equilibrium [Neumann, 1928]. Surprisingly, machine learning practitioners successfully train a single pair of neural networks whose objective is a nonconvex-nonconcave minimax problem while for such a payoff function, the existence of a Nash equilibrium is not guaranteed in general. This work is an attempt to put learning in games on a firm theoretical foundation. The first contribution explores minimax theorems for a particular class of nonconvex-nonconcave games that encompasses generative adversarial networks. The proposed result is an approximate minimax theorem for two-player zero-sum games played with neural networks, including WGAN, StarCrat II, and Blotto game. Our findings rely on the fact that despite being nonconcave-nonconvex with respect to the neural networks parameters, the payoff of these games are concave-convex with respect to the actual functions (or distributions) parametrized by these neural networks. The second and third contributions study the optimization of minimax problems, and more generally, variational inequalities in the context of machine learning. While the standard gradient descent-ascent method fails to converge to the Nash equilibrium of simple convex-concave games, there exist ways to use gradients to obtain methods that converge. We investigate several techniques such as extrapolation, averaging and negative momentum. We explore these techniques experimentally by proposing a state-of-the-art (at the time of publication) optimizer for GANs called ExtraAdam. We also prove new convergence results for Extrapolation from the past, originally proposed by Popov [1980], as well as for gradient method with negative momentum. The fourth contribution provides an empirical study of the practical landscape of GANs. In the second and third contributions, we diagnose that the gradient method breaks when the game’s vector field is highly rotational. However, such a situation may describe a worst-case that does not occur in practice. We provide new visualization tools in order to exhibit rotations in practical GAN landscapes. In this contribution, we show empirically that the training of GANs exhibits significant rotations around Local Stable Stationary Points (LSSP), and we provide empirical evidence that GAN training converges to a stable stationary point, which is a saddle point for the generator loss, not a minimum, while still achieving excellent performance

    Jeux différentiels stochastiques à information incomplète

    Get PDF
    L'objectif de cette thèse est l'étude des jeux différentiels stochastiques à information incomplète. Nous considérons un jeu à deux joueurs adverses qui contrôlent une diffusion afin de minimiser, respectivement de maximiser un paiement spécifique. Pour modéliser l'incomplétude des informations, nous suivrons la célèbre approche d'Aumann et Maschler. Nous supposons qu'il existe des états de la nature différents dans laquelle le jeu peut avoir lieu. Avant que le jeu commence, l'état est choisi au hasard. L'information est ensuite transmise à un joueur alors que le second ne connaît que les probabilités respectives pour chaque état.Dans cette thèse nous établissons une représentationduale pour les jeux différentiels stochastiques à information incomplète. Ici, nous utilisons largement la théorie des équations différentielles stochastiques rétrogrades (EDSRs), qui se révèle être un outilindispensable dans cette étude. En outre, nous montrons comment, sous certaines restrictions, cette représentation permetde construire des stratégies optimales pour le joueur informé. Ensuite, nous donnons, en utilisant la représentation duale, une preuve particulièrement simple de la semiconvexité de la fonction valeur des jeux différentiels à information incomplète.Un autre partie de la thèse est consacré à des schémas numériques pour les jeux différentiels stochastiques à informationincomplète. Dans la dernière partie nous étudions des jeux d'arrêt optimal en temps continue, appelés jeux de Dynkin, à information incomplète. Nous établissons également une représentation duale, qui est utilisé pour déterminer des stratégies optimales pour le joueur informé dans ce cas.The objective of this thesis is the study of stochastic differential games with incomplete information. We consider a game with two opponent players who control a diffusion in order to minimize, respectively maximize a certain payoff. To model the information incompleteness we will follow the famous ansatz of Aumann and Maschler. We assume that there are different states of nature in which the game can take place. Before the game starts the state is chosen randomly. The information is then transmitted to one player while the second one only knows the respective probabilities for each state. In this thesis we establish a dual representation for stochastic differential games with incomplete information. Therein we make a vast use of the theory of backward stochastic differential equations (BSDEs), which turns out to be an indispensable tool in this study. Moreover we show how under some restrictions that this representation allows to construct optimal strategies for the informed player.Morover we give - using the dual representation - a strikingly simple proof for semiconvexity of the value function of differential games with incomplete information. Another part of this thesis is devoted to numerical schemes for stochastic differential games with incomplete information. In the last part we investigate continuous time optimal stopping games, so called Dynkin games, with information incompleteness. We show that these games have a value and a unique characterization by a fully non-linear variational PDE for which we provide a comparison principle. Also we establish a dual representation for Dynkin games with incomplete information.BREST-SCD-Bib. electronique (290199901) / SudocSudocFranceF

    Modélisation et analyse des organisations sociales : propriétés structurelles, régulation des comportements et évolution

    Get PDF
    The work presented in this dissertation is part of the SocLab project which proposes a formalisation of the Sociology of Organised Action (SOA). This formalisation is based on the use of a meta-model of the structure of social organisations, which enables an analytical study of an organisation's attributes as well as the simulation of the behaviours the organisation's actors might potentially adopt. This in turn allows an organisational diagnostic, which, though less rich than in a discursive expression of the SOA, gains in rigour and objecti cation. According to this approach, an organisation is seen as a system which, as a result of the actors' behaviour towards each other, procures for them a greater or lesser level of action capacity for reaching their own individual goals. Two regulation feedbacks run through this system : the rst, which can be de ned as functional, where actors adjust their behaviours towards one another so as to obtain a satisfactory level of action capacity ; and the second, which appertains to the endogenous evolution of the organisation, whereby the actors look to modify to their advantage the very structure of said organisation. Use of the meta-model leads to the representation of an organisation's structure as a particular mathematical construct composed of sets, functions and relations. By marshalling diverse mathematical tools, we have studied the influence of an organisation's structure on both of these regulation feedbacks. We can for example, regarding functional regulation, explain why actors behave as they do as well as detect real or potential coalitions ; also it is possible to detect in what ways an actor may attempt to modify the organisation's structure. In a more general sense, the mathematical study of the structure of an organisation will allow us to de ne a great number of indicators which will then be interpreted, with the help of the concepts of organisational sociology, as properties of the studied organisation.Le travail présenté dans ce mémoire s'inscrit dans le cadre du projet SocLab, qui propose une formalisation de la sociologie de l'action organisée (SAO). Cette formalisation repose sur un méta-modèle de la structure des organisations sociales, à partir duquel il est possible de développer une étude analytique des propriétés d'une organisation et de calculer, par simulation, les comportements que les acteurs sont susceptibles d'adopter. On est alors en mesure de réaliser un diagnostique organisationnel qui, s'il est moins riche que dans l'expression discursive de la SAO, gagne en objectivation et en rigueur. Selon cette approche, une organisation est vue comme un système qui, en fonction du comportement des acteurs les uns vis à vis des autres, procure à chacun d'eux une certaine capacité d'action pour atteindre ses objectifs, sans distinguer ceux qui relèvent de son rôle et ceux qui lui sont propres. Un tel système est parcouru par deux boucles de régulation : une première, que l'on peut qualifier de fonctionnelle, selon laquelle les acteurs adaptent leurs comportements les uns aux autres afin d'obtenir une capacité d'action qui les satisfassent ; une seconde, qui relève de l'évolution endogène de l'organisation, selon laquelle les acteurs cherchent à modifier à leur avantage la structure même de l'organisation. L'utilisation du méta-modèle donne lieu à la représentation de la structure d'une organisation sous la forme d'une structure mathématique, constituée d'ensembles, de fonctions (différentiables) et de relations. En mobilisant divers outils mathématiques, nous étudions l'influence de la structure d'une organisation sur chacune de ces deux boucles de régulation. On pourra par exemple, s'agissant de la régulation fonctionnelle, expliquer pourquoi les acteurs se comportent comme ils le font et détecter des coalitions, avérées ou potentielles, ou bien avoir une idée des directions dans lesquelles un acteur pourrait tenter de modifier la structure de l'organisation. Plus généralement, l'étude mathématique de la structure d'une organisation nous permet de définir une grande variété d'indicateurs qui s'interprètent, à l'aide des concepts de la sociologie des organisations, comme autant de propriétés de l'organisation considérée
    corecore