Search CORE

3 research outputs found

Complementary Layered Learning

Author: Mondesire Sean
Publication venue: 'Information Bulletin on Variable Stars (IBVS)'
Publication date: 01/01/2014
Field of study

Layered learning is a machine learning paradigm used to develop autonomous robotic-based agents by decomposing a complex task into simpler subtasks and learns each sequentially. Although the paradigm continues to have success in multiple domains, performance can be unexpectedly unsatisfactory. Using Boolean-logic problems and autonomous agent navigation, we show poor performance is due to the learner forgetting how to perform earlier learned subtasks too quickly (favoring plasticity) or having difficulty learning new things (favoring stability). We demonstrate that this imbalance can hinder learning so that task performance is no better than that of a suboptimal learning technique, monolithic learning, which does not use decomposition. Through the resulting analyses, we have identified factors that can lead to imbalance and their negative effects, providing a deeper understanding of stability and plasticity in decomposition-based approaches, such as layered learning. To combat the negative effects of the imbalance, a complementary learning system is applied to layered learning. The new technique augments the original learning approach with dual storage region policies to preserve useful information from being removed from an agent’s policy prematurely. Through multi-agent experiments, a 28% task performance increase is obtained with the proposed augmentations over the original technique

University of Central Florida (UCF): STARS (Showcase of Text, Archives, Research & Scholarship)

Arquitectura de Comportamientos Reactivos para Agentes Robóticos basada en CBR

Author: Herrero-Reder Ignacio
Publication venue: Servicio de Publicaciones y Divulgación Científica
Publication date: 01/01/2015
Field of study

En los últimos tiempos se ha demostrado la importancia del aprendizaje en la Inteligencia humana, tanto en su vertiente de aprendizaje por observación como a través de la experiencia, como medio de identificar situaciones y predecir acciones o respuestas a partir de la información adquirida. Dado este esquema general de la Inteligencia Humana, parece razonable imitar su estructura y características en un intento por diseñar una arquitectura general de inteligencia aplicada a la Robótica. En este trabajo, inspirados por las teorías de Hawkins en su obra On Intelligence, hemos propuesto una arquitectura jerárquica de inteligencia en el que los diversos módulos se implementan a partir de Razonamiento basado en Casos ¿Case Based Reasoning (CBR)¿, una herramienta de IA especialmente apta para la adquisición de conocimiento a través del aprendizaje y para la predicción basada en similitud de información. Dentro de esta arquitectura la presente tesis se centra en las capas inferiores, las de tipo reactivo, expresadas en forma de comportamientos básicos, que implementan conductas sencillas pero indispensables para el funcionamiento de un robot. Estos comportamientos han sido tradicionalmente diseñados de forma algorítmica, con la dificultad que esto entraña en muchos casos por el desconocimiento de sus aspectos intrínsecos. Además, carecen de la capacidad de adaptarse ante nuevas situaciones no previstas y adquirir nuevos conocimientos a través del funcionamiento del robot, algo indispensable si se pretende que éste se desenvuelva en ambientes dinámicos y no estructurados. El trabajo de esta tesis considera la implementación de comportamientos reactivos con capacidad de aprendizaje, como forma de superar los inconvenientes anteriormente mencionados consiguiendo al mismo tiempo una mejor integración en la arquitectura general de Inteligencia considerada, en la cual el aprendizaje ocupa el papel principal. Así, se proponen y analizan diversas alternativas de diseño de comportamientos reactivos, construidos a través de sistemas CBR con capacidad de aprendizaje. En particular se estudia i) la problemática de selección, organización, y representación de la información como recipiente del conocimiento de los comportamientos;ii) los problemas asociados a la escalabilidad de esta información; iii) los aspectos que acompañan al proceso de predicción mediante la recuperación de la respuesta de experiencias previas similares a la presentada; iv) la identificación de la respuesta no solo con la acción a tomar por parte del comportamiento sino con un concepto que represente la situación presentada; y v) la adaptación y evaluación de la respuesta para incorporar nuevas situaciones como nuevo conocimiento del sistema. También se analiza la organización de comportamientos básicos que permite obtener, a través de sus interacciones, comportamientos emergentes de nivel superior aún dentro de un alcance reactivo. Todo ello se prueba con un robot real y con un simulador, en una variante de un escenario de aplicación clásico en Robótica, como es la competición Robocup. La elaboración de esta tesis ha supuesto, además de los aspectos puramente investigadores, un esfuerzo adicional en el desarrollo de las herramientas y metodología de pruebas necesarias para su realización. En este sentido, se ha programado un primer prototipo de marco de implementación de comportamientos reactivos con aprendizaje, basados en CBR, para la plataforma de desarrollo robótico Tekkotsu

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

Repositorio Institucional Universidad de Málaga