118 research outputs found

    Mixed Leadership Stochastic Differential Game in Feedback Information Pattern with Applications

    Full text link
    This paper is devoted to a high-dimensional mixed leadership stochastic differential game on a finite horizon in feedback information mode, where the control variables enter into the diffusion term of state equation. A verification theorem for the feedback Stackelberg-Nash equilibrium is obtained by using a system of coupled and fully nonlinear parabolic partial differential equations. We apply the verification theorem to deal with a dynamic innovation and pricing decision problem where the buyer acts as the leader in the pricing decisions and the dynamic model is stochastic. Via the solutions of coupled Riccati equations, we explicitly express the feedback equilibrium strategies of innovation and pricing. And by analysis, the local existence and uniqueness of the solutions of the coupled Riccati equations is derived. We also conduct some numerical analyses to discuss the effects of model parameters on the feedback equilibrium strategies.Comment: 26 pages, 16 figure

    Differential Games For Multi-agent Systems Under Distributed Information

    Get PDF
    In this dissertation, we consider differential games for multi-agent systems under distributed information where every agent is only able to acquire information about the others according to a directed information graph of local communication/sensor networks. Such games arise naturally from many applications including mobile robot coordination, power system optimization, multiplayer pursuit-evasion games, etc. Since the admissible strategy of each agent has to conform to the information graph constraint, the conventional game strategy design approaches based upon Riccati equation(s) are not applicable because all the agents are required to have the information of the entire system. Accordingly, the game strategy design under distributed information is commonly known to be challenging. Toward this end, we propose novel open-loop and feedback game strategy design approaches for Nash equilibrium and noninferior solutions with a focus on linear quadratic differential games. For the open-loop design, approximate Nash/noninferior game strategies are proposed by integrating distributed state estimation into the open-loop global-information Nash/noninferior strategies such that, without global information, the distributed game strategies can be made arbitrarily close to and asymptotically converge over time to the global-information strategies. For the feedback design, we propose the best achievable performance indices based approach under which the distributed strategies form a Nash equilibrium or noninferior solution with respect to a set of performance indices that are the closest to the original indices. This approach overcomes two issues in the classical optimal output feedback approach: the simultaneous optimization and initial state dependence. The proposed open-loop and feedback design approaches are applied to an unmanned aerial vehicle formation control problem and a multi-pursuer single-evader differential game problem, respectively. Simulation results of several scenarios are presented for illustration

    Inverse Dynamic Game Methods for Identification of Cooperative System Behavior

    Get PDF
    Die dynamische Spieltheorie hat sich als ein effektiver Ansatz zur Modellierung und Analyse der Interaktion zwischen mehreren Akteuren oder Spielern in dynamischen Prozessen erwiesen. Um diese Theorie in realen Anwendungen umzusetzen, ist jedoch die Möglichkeit einer schnellen Identifikation der Ziele jedes Spielers entscheidend. Dieses Identifikationsproblem wird als inverses dynamisches Spiel bezeichnet. Hierfür präsentiert diese Dissertation Lösungen, die auf Beobachtungen der Spieleraktionen und der resultierenden Zustandstrajektorie basieren, welche die Entwicklung des Spiels über die Zeit beschreibt. Es werden zwei Arten von Methoden zur Lösung von inversen dynamischen Spielen entwickelt. Die erste besteht in der Anwendung von regelungstechnischen Methoden. Für die weitverbreitete Klasse der linear-quadratischen dynamischen Spiele werden zusätzlich explizite Mengen formuliert, die alle möglichen Lösungen des inversen Problems beschreiben. Der zweiten Methode liegen Verfahren des Inverse Reinforcement Learnings aus der Informatik zugrunde. Für beide Arten von Methoden werden mathematische Bedingungen formuliert, unter denen eine erfolgreiche Schätzung der Ziele aller Spieler garantiert ist. Ein simulativer Vergleich mit einem Verfahren aus dem Stand der Technik zeigt die höhere Effizienz der vorgestellten neuen Ansätze. Darüber hinaus werden die Methoden für die Identifikation von kooperativem menschlichen Verhalten in einem Lenkmanöver angewendet. Die entwickelten Ansätze für inverse dynamische Spiele ermöglichen die effiziente Identifikation von Spielerzielen und können in zahlreichen Anwendungsfeldern wie beispielsweise der Mensch-Maschine-Interaktion und der Verhaltensbeschreibung biologischer Systeme eingesetzt werden
    • …
    corecore