3 research outputs found

    Deep Reinforcement Learning and its application to games

    Get PDF
    The following project aims is to review the main concepts of Reinforcement Learning and combine them with the tools of Deep Learning, studying in depth the application of these methodologies, the Deep Reinforcement Learning algorithms, that are having such an impact today being applied to numerous fields such as autonomous driving, robot control, gaming and many more. In order to do this, first, in chapter 1, we will give a general overview of Deep Reinforcement Learning as a introduction, as well as which is motivation to study this topic. Then, in chapter 2, since it will be fundamental to achieve our goal, we give a brief review of Deep Learning. We get into details with chapter 3, where we define Reinforcement Learning mathematically, formalizing the concepts in order to build the classic solution algorithms in chapter 4. As an application of these techniques, the implementation of the algorithms for the game of Blackjack is presented in chapter 5. Finally, in chapter 6, we reach our initial objective by building the algorithm that hides behind the Deep Q-Networks and we apply it to the Gridworld games in chapter 7. A conclusions and improvements section for the project culminates the text.El siguiente proyecto tiene como objetivo revisar los principales conceptos del Aprendizaje con Refuerzo y combinarlo con las herramientas del Aprendizaje Profundo, estudiando con detalle la aplicación de estas metodologías, Aprendizaje con Refuerzo Profundo, que están teniendo tanto impacto en la actualidad siendo aplicados a numerosos campos como la conducción autónoma, el control de robots, juegos y muchos más. Para ello, en primer lugar, en el capítulo 1, situaremos al Aprendizaje con Refuerzo Profundo a modo de introducción, motivando el estudio de este campo. Acto seguido, en el capítulo 2, ya que será fundamental para lograr nuestro objetivo, se realiza una breve revisión del Aprendizaje Profundo. Entraremos en detalles con el capítulo 3, donde definiremos matemáticamente que se entiende Aprendizaje con Refuerzo, formalizando los conceptos con el fin de construir los algoritmos de solución clásicos en el capítulo 4. Como aplicación de estas técnicas, en el capítulo 5 se presenta la implementación de los algoritmos para el juego del Blackjack. Finalmente, en el capítulo 5, alcanzaremos nuestro objetivo inicial construyendo el algoritmo detrás de las Deep Q-Networks y lo aplicamos a los juegos Gridworld en capítulo 7. Una sección de conclusiones y mejoras para el proyecto culmina el texto.Universidad de Sevilla. Grado en Matemáticas y Estadístic

    An extended version of the Ordered Median Tree Location Problem including appendices and detailed computational results

    Full text link
    In this paper, we propose the Ordered Median Tree Location Problem (OMT). The OMT is a single-allocation facility location problem where p facilities must be placed on a network connected by a non-directed tree. The objective is to minimize the sum of the ordered weighted averaged allocation costs plus the sum of the costs of connecting the facilities in the tree. We present different MILP formulations for the OMT based on properties of the minimum spanning tree problem and the ordered median optimization. Given that ordered median hub location problems are rather difficult to solve we have improved the OMT solution performance by introducing covering variables in a valid reformulation plus developing two pre-processing phases to reduce the size of this formulations. In addition, we propose a Benders decomposition algorithm to approach the OMT. We establish an empirical comparison between these new formulations and we also provide enhancements that together with a proper formulation allow to solve medium size instances on general random graphs.Comment: 112 pages, 4 figures, extended version of 'The Ordered Median Location Problem

    Teoría de Juegos

    No full text
    El siguiente trabajo tiene como objetivo el estudio de los diversos modelos de la Teoría de Juegos. Comienza con la definición (capítulo 1 ) de los términos más relevantes en el trascurso del texto seguido de la clasificación (capítulo 2 ) donde se muestran los criterios esenciales para la distinción de las diferentes clases de juegos. Tras los apartados introductorios, el texto entra en materia examinando los principales resultados sobre juegos no cooperativos: juegos estratégicos (capítulo 3 ), juegos dinámicos (capítulo 4 ) y juegos repetidos (capítulo 6 ), para terminar describiendo los juegos cooperativos (capítulo 7 ). Además se presenta un ejemplo, VNM-Póker (capítulo 5 ), que ayuda a la comprensión de los capítulos de juegos estratégicos y dinámicos.The following project aims to study the several models in Game Theory. It begins with the definition (chapter 1 ) of the most relevant terms in the course of the text followed by the classification (chapter 2 ) in which the essential criteria for the distinction of the games are shown. After the introductory sections, the text comes into question examining the main results of non-cooperative games: strategic games (chapter 3 ), dynamic games (chapter 4 ) and repeated games (chapter 6 ), to finish describing the cooperative games (chapter 7 ). In addition, an example is presented, VNM-Poker (chapter 5 ), which helps to understand the chapters of strategic and dynamic games.Universidad de Sevilla. Doble Grado en Matemáticas y Estadístic
    corecore