Search CORE

270 research outputs found

Beating Price of Anarchy and Gradient Descent without Regret in Potential Games

Author: Leonardos Stefanos
Overman Will
Panageas Ioannis
Piliouras Georgios
Sakos Joseph
Stavroulakis Stelios
Publication venue
Publication date: 01/05/2024
Field of study

Gradient Descent Only Converges to Minimizers: Non-Isolated Critical Points and Invariant Regions

Author: Panageas Ioannis
Piliouras Georgios
Publication venue
Publication date: 07/06/2016
Field of study

Given a non-convex twice differentiable cost function f, we prove that the set of initial conditions so that gradient descent converges to saddle points where \nabla^2 f has at least one strictly negative eigenvalue has (Lebesgue) measure zero, even for cost functions f with non-isolated critical points, answering an open question in [Lee, Simchowitz, Jordan, Recht, COLT2016]. Moreover, this result extends to forward-invariant convex subspaces, allowing for weak (non-globally Lipschitz) smoothness assumptions. Finally, we produce an upper bound on the allowable step-size.Comment: 2 figure

arXiv.org e-Print Archive

Dagstuhl Research Online Publication Server

Exploration-Exploitation in Multi-Agent Learning: Catastrophe Theory Meets Game Theory

Author: Leonardos Stefanos
Piliouras Georgios
Publication venue
Publication date: 15/12/2020
Field of study

Exploration-exploitation is a powerful and practical tool in multi-agent learning (MAL), however, its effects are far from understood. To make progress in this direction, we study a smooth analogue of Q-learning. We start by showing that our learning model has strong theoretical justification as an optimal model for studying exploration-exploitation. Specifically, we prove that smooth Q-learning has bounded regret in arbitrary games for a cost model that explicitly captures the balance between game and exploration costs and that it always converges to the set of quantal-response equilibria (QRE), the standard solution concept for games under bounded rationality, in weighted potential games with heterogeneous learning agents. In our main task, we then turn to measure the effect of exploration in collective system performance. We characterize the geometry of the QRE surface in low-dimensional MAL systems and link our findings with catastrophe (bifurcation) theory. In particular, as the exploration hyperparameter evolves over-time, the system undergoes phase transitions where the number and stability of equilibria can change radically given an infinitesimal change to the exploration parameter. Based on this, we provide a formal theoretical treatment of how tuning the exploration parameter can provably lead to equilibrium selection with both positive as well as negative (and potentially unbounded) effects to system performance.Comment: Appears in the 35th AAAI Conference on Artificial Intelligenc

arXiv.org e-Print Archive

King's Research Portal

Association for the Advancement of Artificial Intelligence: AAAI Publications

On stochastic imitation dynamics in large-scale networks

Author: Como Giacomo
Fagnani Fabio
Zino Lorenzo
Publication venue: 'Institute of Electrical and Electronics Engineers (IEEE)'
Publication date: 01/01/2018
Field of study

We consider a broad class of stochastic imitation dynamics over networks, encompassing several well known learning models such as the replicator dynamics. In the considered models, players have no global information about the game structure: they only know their own current utility and the one of neighbor players contacted through pairwise interactions in a network. In response to this information, players update their state according to some stochastic rules. For potential population games and complete interaction networks, we prove convergence and long-lasting permanence close to the evolutionary stable strategies of the game. These results refine and extend the ones known for deterministic imitation dynamics as they account for new emerging behaviors including meta-stability of the equilibria. Finally, we discuss extensions of our results beyond the fully mixed case, studying imitation dynamics where agents interact on complex communication networks.Comment: Extended version of conference paper accepted at ECC 201

arXiv.org e-Print Archive

Lund University Publications

PORTO@iris (Publications Open Repository TOrino - Politecnico di Torino)

The role of population games in the design of optimization-based controllers: a large-scale insight

Author: Barreiro Gómez Julián
Publication venue: Universitat Politècnica de Catalunya
Publication date: 17/05/2017
Field of study

Cotutela Universitat Politècnica de Catalunya i Universidad de los AndesPremi CEA Springer Award 2017, a la millor tesi d'enginyeria de control a EspanyaEuropean PhD Award on Control for Complex and Heterogeneous Systems, atorgat pel European Embedded Control InstituteThis thesis is mainly devoted to the study of the role of evolutionary-game theory in the design of distributed optimization-based controllers. Game theoretical approaches have been used in several engineering fields, e.g., drainage wastewater systems, bandwidth allocation, wireless networks, cyber security, congestion games, wind turbines, temperature control, among others. On the other hand, a specific class of games, known as population games, have been mainly used in the design of controllers to manage a limited resource. This game approach is suitable for resource allocation problems since, under the framework of full-potential games, the population games can satisfy a unique coupled constraint while maximizing a potential function. First, this thesis discusses how the classical approach of the population games can contribute and complement the design of optimization-based controllers. Therefore, this dissertation assigns special interest on how the features of the population-game approach can be exploited extending their capabilities in the solution of distributed optimization problems. In addition, density games are studied in order to consider multiple coupled constraints and preserving the non-centralized information requirements. Furthermore, it is established a close relationship between the possible interactions among agents in a population with the constrained information sharing among different local controllers. On the other hand, coalitional games are discussed focusing on the Shapley power index. This power index has been used to assign an appropriate rewarding to players in function of their contributions to all possible coalitions. Even though this power index is quite useful in the engineering context, since it involves notions of fairness and/or relevance (how important players are), the main difficulty of the implementation of the Shapley value in engineering applications is related to the high computational burden. Therefore, this dissertation studies the Shapley value in order to propose an alternative manner to compute it reducing computational time, and a different way to find it by using distributed communication structures is presented. The studied game theoretical approaches are suitable for the modeling of rational agents involved in a strategic constrained interaction, following local rules and making local decisions in order to achieve a global objective. Making an analogy, distributed optimization-based controllers are composed of local controllers that compute optimal inputs based on local information (constrained interactions with other local controllers) in order to achieve a global control objective. In addition to this analogy, the features that relate the Nash equilibrium with the Karush-Kuhn-Tucker conditions for a constrained optimization problem are exploited for the design of optimization-based controllers, more specifically, for the design of model predictive controller. Moreover, the design of non-centralized controllers is directly related to the partitioning of a system, i.e., it is necessary to represent the whole system as the composition of multiple sub-systems. This task is not a trivial procedure since several considerations should be taken into account, e.g., availability of information, dynamical coupling in the system, regularity in the amount of variables for each sub-system, among others. Then, this doctoral dissertation also discusses the partitioning problem for large-scale systems and the role that this procedure plays in the design of distributed optimization-based controllers. Finally, dynamical partitioning strategies are presented with distributed population-games-based controllers. Some engineering applications are presented to illustrate and test the performance of all the proposed control strategies, e.g., the Barcelona water supply network, multiple continuous stirred tank reactors, system of multiple unmanned aerial vehicles.Esta tesis doctoral consiste principalmente en el estudio del rol que desempeña la teoría de juegos evolutiva en el diseño de controladores distribuidos basados en optimización. Diversos enfoques de la teoría de juegos han sido usados en múltiples campos de la ingeniera, por ejemplo, en sistemas de drenaje urbano, para la asignación de anchos de banda, en redes inalámbricas, en ciber-seguridad, en juegos de congestión, turbinas eólicas, control de temperatura, entre otros. Por otra parte, una clase especifica de juegos, conocidos como juegos poblacionales, se han usado principalmente en el diseño de controladores encargados de determinar la apropiada asignación de recursos. Esta clase de juegos es apropiada para problemas de distribución dinámica de recursos dado que, en el contexto de juegos poblacionales, los juegos poblacionales pueden ser usados para maximizar una función potencial mientras se satisface una restricción acoplada. Primero, esta tesis doctoral presenta como el enfoque clásico de los juegos poblacionales pueden contribuir y complementar en el diseño de controladores basados en optimización. Posteriormente, esta disertación concentra su atención en cómo las características de los juegos poblacionales pueden ser aprovechadas y extendidas para dar solución a problemas de optimización de forma distribuida. Adicionalmente, los juegos con dependencia de densidad son estudiados con el fin de considerar múltiples restricciones mientras se preservan las características no centralizadas de los requerimientos de información. Finalmente, se establece una estrecha relación entre las posibles interacciones de los agentes en una población y las restricciones de intercambio de información entre diversos controladores locales. También, se desarrolla una discusión sobre los juegos cooperativos y el índice de poder conocido como el valor de Shapley. Este índice de poder ha sido usado para la apropiada asignación de beneficios para un jugador en función de sus contribuciones a todas las posibles coaliciones que pueden formarse. Aunque este índice de poder es de gran utilidad en el contexto ingenieril, ya que involucra nociones de justicia y/o relevancia, la principal dificultad para implementar el valor de Shapley en aplicaciones de ingeniería está asociado a los altos costos computacionales para encontrarlo. En consecuencia, esta disertación doctoral estudia el valor de Shapley con el fin de ofrecer una alternativa para calcular este índice de poder reduciendo los costos computacionales e incluso contemplando estructuras distribuidas de comunicación. Los enfoques de la teoría de juegos estudiados son apropiados para el modelamiento de agentes racionales involucrados en una interacción estratégica con restricciones, siguiendo reglas locales y tomando decisiones locales para alcanzar un objetivo global. Realizando una analogía, los controladores distribuidos basados en optimización están compuestos por controladores locales que calculan acciones óptimas basados en información local (considerando interacciones restringidas con otros controladores locales) con el fin de alcanzar un objetivo global. Adicional a esta analogía, las características que relacionan el equilibrio de Nash con las condiciones de Karush-Kuhn-Tucker en un problema de optimizaciones con restricciones son aprovechadas para el diseño de controladores basados en optimización, más específicamente, para el diseño de controladores predictivos. Por otra parte, el diseño de controladores no centralizados está directamente relacionado con el particionado de un sistema, es decir, es necesario representar el sistema en su totalidad por medio del conjunto de varios sub-sistemas. Esta tarea no es un procedimiento trivial puesto que es necesario tener en cuenta varias consideraciones, por ejemplo, la disponibilidad de información, el acople dinámico en el sistema, la regularidad en cuanto a la cantidad de variables en cada sub-sistema, entre otras. Por lo tanto, esta disertación doctoral también desarrolla una discusión alrededor del problema de particionado para sistemas de gran escala y respecto al rol que este procedimiento de particionado juega en el diseño de controladores distribuidos basados en optimización. Finalmente, se presentan estrategias de particionado dinámico junto con controladores basados en juegos poblacionales. Algunas aplicaciones en ingeniería son usadas para ilustrar y probar los controladores diseñados por medio de las contribuciones novedosas basadas en teoría de juegos, estas son, la red de agua potable de Barcelona, múltiples reactores, sistema compuesto por varios vehículos aéreos no tripulados y un sistema de distribución de agua.Aquesta tesi doctoral consisteix principalment en l'estudi del paper que exerceix la teoria de jocs evolutiva en el disseny de controladors distribuïts basats en optimització. Diversos enfocaments de la teoria de jocs han estat usats en múltiples camps de l'enginyeria, per exemple, en sistemes de drenatge urbà, per a l’assignació d'amples de banda, en xarxes sense fils, a ciber-seguretat, en jocs de congestió, turbines eòliques, control de temperatura, entre altres. D'altra banda, una classe especifica de jocs, coneguts com jocs poblacionals, s'han fet servir principalment en el disseny de controladors encarregats de determinar l'apropiada assignació de recursos. Aquesta classe de jocs és apropiada per a problemes de distribució dinàmica de recursos atès que, en el context de jocs poblacionals, aquests poden ser usats per a maximitzar una funció potencial mentre es satisfà una restricció acoblada. Primer, aquesta tesi doctoral presenta com l'enfocament clàssic dels jocs poblacionals poden contribuir i complementar en el disseny de controladors basats en optimització. Posteriorment, aquesta dissertació concentra la seva atenció en com les característiques dels jocs poblacionals poden ser aprofitades i esteses per donar solució a problemes d’optimització de forma distribuïda. Addicionalment, els jocs amb dependència de densitat són estudiats amb la _finalitat de considerar múltiples restriccions mentre es preserven les característiques no centralitzades dels requeriments d’informació. Finalment, s'estableix una estreta relació entre les possibles interaccions dels agents en una població i les restriccions d'intercanvi d’informació entre diversos controladors locals. També, es desenvolupa una discussió sobre els jocs cooperatius i l’índex de poder conegut com el valor de Shapley. Aquest índex de poder ha estat usat per l'apropiada assignació de beneficis per a un jugador en funció de les seves contribucions a totes les possibles coalicions que poden formar-se. Encara que aquest índex de poder es de gran utilitat en el context de l'enginyeria, ja que involucra nocions de justícia i/o rellevància, la principal dificultat per implementar el valor de Shapley en aplicacions d'enginyeria està associat als alts costos computacionals per trobar-lo. En conseqüència, aquesta dissertació doctoral estudia el valor de Shapley per tal d'oferir una alternativa per calcular aquest índex de poder reduint els costos computacionals i fins i tot contemplant estructures distribuïdes de comunicació. Els enfocaments de la teoria de jocs estudiats són apropiats per al modelatge d'agents racionals involucrats en una interacció estratègica amb restriccions, seguint regles locals i prenent decisions locals per assolir un objectiu global. Realitzant una analogia, els controladors distribuïts basats en optimització estan compostos per controladors locals que calculen accions optimes basats en informació local (considerant interaccions restringides amb altres controladors locals) per tal d'assolir un objectiu global. Addicional a aquesta analogia, les característiques que relacionen l'equilibri de Nash amb les condicions de Karush-Kuhn-Tucker en un problema d’optimització amb restriccions són aprofitades per al disseny de controladors basats en optimització, més específicament, per al disseny de controladors predictius. D'altra banda, el disseny de controladors no centralitzats està directament relacionat amb la partició d'un sistema, és a dir, cal representar el sistema en la seva totalitat per mitjà del conjunt de diversos sub-sistemes. Aquesta tasca no és un procés trivial, ja que cal tenir en compte diverses consideracions, per exemple, la disponibilitat d’informació, l'acoblament dinàmic en el sistema, i la regularitat pel que fa a la quantitat de variables en cada sub-sistema, entre d'altres. Per tant, aquesta dissertació doctoral també desenvolupa una discussió al voltant del problema de partició per a sistemes de gran escala i respecte al paper que aquest procediment de partició juga en el disseny de controladors distribuïts basats en optimització. Finalment, es presenten estratègies de partició dinàmic juntament amb controladors basats en jocs poblacionals. Algunes aplicacions en enginyeria són usades per il·lustrar i provar els controladors dissenyats per mitjà de les contribucions noves basades en teoria de jocs, aquestes són: la xarxa d'aigua potable de Barcelona, múltiples reactors, sistema compost per diversos vehicles aeris no tripulats i un sistema de distribució d'aigua.Award-winningPostprint (published version

UPCommons. Portal del coneixement obert de la UPC

Mutation, Sexual Reproduction and Survival in Dynamic Environments

Author: Mehta Ruta
Panageas Ioannis
Piliouras Georgios
Tetali Prasad
Vazirani Vijay V.
Publication venue: LIPIcs - Leibniz International Proceedings in Informatics. 8th Innovations in Theoretical Computer Science Conference (ITCS 2017)
Publication date: 22/04/2016
Field of study

A new approach to understanding evolution [Valiant, JACM 2009], namely viewing it through the lens of computation, has already started yielding new insights, e.g., natural selection under sexual reproduction can be interpreted as the Multiplicative Weight Update (MWU) Algorithm in coordination games played among genes [Chastain, Livnat, Papadimitriou, Vazirani, PNAS 2014]. Using this machinery, we study the role of mutation in changing environments in the presence of sexual reproduction. Following [Wolf, Vazirani, Arkin, J. Theor. Biology], we model changing environments via a Markov chain, with the states representing environments, each with its own fitness matrix. In this setting, we show that in the absence of mutation, the population goes extinct, but in the presence of mutation, the population survives with positive probability. On the way to proving the above theorem, we need to establish some facts about dynamics in games. We provide the first, to our knowledge, polynomial convergence bound for noisy MWU in a coordination game. Finally, we also show that in static environments, sexual evolution with mutation converges, for any level of mutation

arXiv.org e-Print Archive

Dagstuhl Research Online Publication Server