3 research outputs found

    Complementary Layered Learning

    Get PDF
    Layered learning is a machine learning paradigm used to develop autonomous robotic-based agents by decomposing a complex task into simpler subtasks and learns each sequentially. Although the paradigm continues to have success in multiple domains, performance can be unexpectedly unsatisfactory. Using Boolean-logic problems and autonomous agent navigation, we show poor performance is due to the learner forgetting how to perform earlier learned subtasks too quickly (favoring plasticity) or having difficulty learning new things (favoring stability). We demonstrate that this imbalance can hinder learning so that task performance is no better than that of a suboptimal learning technique, monolithic learning, which does not use decomposition. Through the resulting analyses, we have identified factors that can lead to imbalance and their negative effects, providing a deeper understanding of stability and plasticity in decomposition-based approaches, such as layered learning. To combat the negative effects of the imbalance, a complementary learning system is applied to layered learning. The new technique augments the original learning approach with dual storage region policies to preserve useful information from being removed from an agent鈥檚 policy prematurely. Through multi-agent experiments, a 28% task performance increase is obtained with the proposed augmentations over the original technique

    Arquitectura de Comportamientos Reactivos para Agentes Rob贸ticos basada en CBR

    Get PDF
    En los 煤ltimos tiempos se ha demostrado la importancia del aprendizaje en la Inteligencia humana, tanto en su vertiente de aprendizaje por observaci贸n como a trav茅s de la experiencia, como medio de identificar situaciones y predecir acciones o respuestas a partir de la informaci贸n adquirida. Dado este esquema general de la Inteligencia Humana, parece razonable imitar su estructura y caracter铆sticas en un intento por dise帽ar una arquitectura general de inteligencia aplicada a la Rob贸tica. En este trabajo, inspirados por las teor铆as de Hawkins en su obra On Intelligence, hemos propuesto una arquitectura jer谩rquica de inteligencia en el que los diversos m贸dulos se implementan a partir de Razonamiento basado en Casos 驴Case Based Reasoning (CBR)驴, una herramienta de IA especialmente apta para la adquisici贸n de conocimiento a trav茅s del aprendizaje y para la predicci贸n basada en similitud de informaci贸n. Dentro de esta arquitectura la presente tesis se centra en las capas inferiores, las de tipo reactivo, expresadas en forma de comportamientos b谩sicos, que implementan conductas sencillas pero indispensables para el funcionamiento de un robot. Estos comportamientos han sido tradicionalmente dise帽ados de forma algor铆tmica, con la dificultad que esto entra帽a en muchos casos por el desconocimiento de sus aspectos intr铆nsecos. Adem谩s, carecen de la capacidad de adaptarse ante nuevas situaciones no previstas y adquirir nuevos conocimientos a trav茅s del funcionamiento del robot, algo indispensable si se pretende que 茅ste se desenvuelva en ambientes din谩micos y no estructurados. El trabajo de esta tesis considera la implementaci贸n de comportamientos reactivos con capacidad de aprendizaje, como forma de superar los inconvenientes anteriormente mencionados consiguiendo al mismo tiempo una mejor integraci贸n en la arquitectura general de Inteligencia considerada, en la cual el aprendizaje ocupa el papel principal. As铆, se proponen y analizan diversas alternativas de dise帽o de comportamientos reactivos, construidos a trav茅s de sistemas CBR con capacidad de aprendizaje. En particular se estudia i) la problem谩tica de selecci贸n, organizaci贸n, y representaci贸n de la informaci贸n como recipiente del conocimiento de los comportamientos;ii) los problemas asociados a la escalabilidad de esta informaci贸n; iii) los aspectos que acompa帽an al proceso de predicci贸n mediante la recuperaci贸n de la respuesta de experiencias previas similares a la presentada; iv) la identificaci贸n de la respuesta no solo con la acci贸n a tomar por parte del comportamiento sino con un concepto que represente la situaci贸n presentada; y v) la adaptaci贸n y evaluaci贸n de la respuesta para incorporar nuevas situaciones como nuevo conocimiento del sistema. Tambi茅n se analiza la organizaci贸n de comportamientos b谩sicos que permite obtener, a trav茅s de sus interacciones, comportamientos emergentes de nivel superior a煤n dentro de un alcance reactivo. Todo ello se prueba con un robot real y con un simulador, en una variante de un escenario de aplicaci贸n cl谩sico en Rob贸tica, como es la competici贸n Robocup. La elaboraci贸n de esta tesis ha supuesto, adem谩s de los aspectos puramente investigadores, un esfuerzo adicional en el desarrollo de las herramientas y metodolog铆a de pruebas necesarias para su realizaci贸n. En este sentido, se ha programado un primer prototipo de marco de implementaci贸n de comportamientos reactivos con aprendizaje, basados en CBR, para la plataforma de desarrollo rob贸tico Tekkotsu
    corecore