33 research outputs found

    SOaN : un algorithme pour la coordination d'agents apprenants et non communicants.

    No full text
    National audienceL'apprentissage par renforcement dans les systèmes multi-agents est un domaine de recherche très actif, comme en témoignent les états de l'art récents [Busoniu et al., 2008, Sandholm, 2007, Bab & Brafman, 2008, Vlassis, 2007]. Lauer et Riedmiller ont notamment montré que, sous certaines hypothèses, il est possible à des agents apprenants simultanément de coordonner leurs actions sans aucune communication et sans qu'ils perçoivent les actions de leurs congénères [Lauer & Riedmiller, 2000]. Cette propriété est particulièrement intéressante pour trouver des stratégies de coopération dans les systèmes multi-agents de grande taille

    Desarrollo de algoritmos para la coordinación de un sistema multirrobot cooperativo para tareas de búsqueda de fuentes de calor en entornos dinámicos

    Get PDF
    El desarrollo de tareas complejas en el ámbito de la robótica tiende a ser muy complicado con la implementación de un solo robot o un solo sistema; esto describe una dinámica idéntica a lo que sucede en la vida real con los equipos humanos. Es por tal razón que el auge de los equipos multirrobot ha venido tomando fuerza tanto en el ámbito académico como en el campo laboral. Existen varios enfoques que dan solución a este tipo de desarrollos. En esta ocasión el desarrollo e implementación de un equipo multirrobot enfocado en las tareas de búsqueda y localización de fuentes de calor se llevará a cabo con el diseño de un sistema reactivo basado en comportamientos siguiendo los lineamientos de Brooks y el paradigma reactivo. El artículo está orientado al diseño de una arquitectura basada en comportamientos para la posterior implementación de un equipo de búsqueda y localización de fuentes de calor

    Tutela Ética e Jurídica dos Danos e da Responsabilidade da Inteligência Artificial

    Get PDF
    The research problem of this article is the following: what should be the ethical and legal protection of damage caused by an artificially intelligent entity? The aim is to verify the sufficiency of the ethical guidelines and the Brazilian legal system of civil liability regarding the acts caused under analysis. The liability regimes are contrasted: subjective; objective; trans-subjective; and preventive. The ontology of artificial intelligence is identified and its ownership of the duty to indemnify is ruled out. Furthermore, etymological, statistical, and legal reflections on the concept of risk are presented, verifying that this legal conception is restricted to the capacity to cause damage. Thus, it is analyzed whether activities involving the programming of artificially intelligent entities are considered risky. The conclusion is that, given the uncertainty and randomness inherent in the programming, execution, and development of artificially intelligent entities, the most appropriate legal protection is subjective due to the potential for damage. Furthermore, it is concluded that ethical protection can be seen as an exclusion of liability as a mechanism for breaking the causal link since it is exercised when the autonomous system is developed by programming abstentions from potentially damaging actions. The integrated research method is used, as well as case study techniques and bibliographical researchEste artigo tem como problema de pesquisa o seguinte questionamento: como deve ser a tutela ética e jurídica dos danos causados por um ente artificialmente inteligente? Objetiva-se verificar a suficiência das diretrizes éticas e do sistema jurídico de responsabilidade civil brasileiro frente aos atos causados em análise. Contrapõe-se os regimes de responsabilização: subjetivo; objetivo; transubjetivo; e preventivo. Identifica-se a ontologia da inteligência artificial e afasta-se sua titularidade do dever de indenizar. No mais, apresentam-se reflexões etimológicas, estatísticas e jurídicas sobre o conceito de risco, verificando-se que essa a concepção jurídica se restringe à capacidade de causar dano. Assim, analisa-se se as atividades envolvendo programação de entes inteligentes artificialmente são consideradas de risco. Conclui-se que, diante da incerteza e da aleatoriedade inerente à programação, execução e desenvolvimento dos entes artificialmente inteligentes, a tutela jurídica mais adequada é a subjetiva em razão do potencial dano. No mais, conclui-se que a tutela ética pode ser visualizada como excludente de responsabilização enquanto mecanismo de rompimento do nexo causal, vez que exercida quando da elaboração do sistema autônomo mediante programação de abstenções de ações potencialmente causadora de danos. Utiliza-se o método de pesquisa integrada, bem como a técnicas de estudo de caso e pesquisa bibliográfica.Este artigo tem como problema de pesquisa o seguinte questionamento: como deve ser a tutela ética e jurídica dos danos causados por um ente artificialmente inteligente? Objetiva-se verificar a suficiência das diretrizes éticas e do sistema jurídico de responsabilidade civil brasileiro frente aos atos causados em análise. Contrapõe-se os regimes de responsabilização: subjetivo; objetivo; transubjetivo; e preventivo. Identifica-se a ontologia da inteligência artificial e afasta-se sua titularidade do dever de indenizar. No mais, apresentam-se reflexões etimológicas, estatísticas e jurídicas sobre o conceito de risco, verificando-se que essa a concepção jurídica se restringe à capacidade de causar dano. Assim, analisa-se se as atividades envolvendo programação de entes inteligentes artificialmente são consideradas de risco. Conclui-se que, diante da incerteza e da aleatoriedade inerente à programação, execução e desenvolvimento dos entes artificialmente inteligentes, a tutela jurídica mais adequada é a subjetiva em razão do potencial dano. No mais, conclui-se que a tutela ética pode ser visualizada como excludente de responsabilização enquanto mecanismo de rompimento do nexo causal, vez que exercida quando da elaboração do sistema autônomo mediante programação de abstenções de ações potencialmente causadora de danos. Utiliza-se o método de pesquisa integrada, bem como a técnicas de estudo de caso e pesquisa bibliográfic

    Desarrollo de un algoritmo heurístico, con programación multiagentes, para la generación de la matriz de ruta del sistema lineal Y=AX utilizado en la estimación de la matriz origen-destino

    Get PDF
    El actual documento ilustra el diseño y la elaboración de un algoritmo heurístico implementado en dos diferentes escenarios: el primero orientado a objetos y el segundo con programación multiagente. El algoritmo realiza el cálculo y generación de la matriz de ruta considerada en el modelo, = donde representa la matriz de ruta. el número de pasajeros que ingresan-salen de la parada o el número de pasajeros que desciende del bus entre los pares origen-destino y, es el número de pasajeros estimado que viajan desde una estación origen hacia una estación destino. Una vez elaborado los dos algoritmos se realizan pruebas de rendimiento para saber cuál es más eficiente en cuanto a tiempo de ejecución.The current document illustrates the design and elaboration of a heuristic algorithm implemented in two different scenarios: the first object-oriented and the second with multi-agent programming. The algorithm performs the calculation and generation of the route matrix considered in the model = , where represents the route matrix, the number of passengers entering-leaving the stop or the number of passengers getting off the bus between origin-destination pairs, and is the estimated number of passengers traveling from an origin station to a destination station. Once the two algorithms have been developed, performance tests are carried out to find out which is more efficient in terms of execution time

    Of Flesh and Steel:Computational Creativity in Music and the Body Issue

    Get PDF
    Could machines ever take our place in the creation of art, and particularly music? The outstanding results of some well-known AIs (e.g. EMI, Flow Machines) might make us believe that this is the case. However, despite this evidence it seems that machines present some intrinsic limits both in creative and non-creative contexts (already highlighted by John Searle and the debate around mechanism). The arguments of this paper are centred around this very belief: we are convinced that the utopian claims regarding all-round machine intelligence are not plausible and that our attention should be directed towards more relevant issues in the field of computational creativity. In particular, we focus our attention on what we call the “body issue”, i.e. the role of the body in the experience and creation of music, that we consider problematic for the idea of a truly creative machine (even if we take into consideration weaker renditions of artificial intelligence). Our argument is based on contemporary findings in neuroscience (especially on embodied cognition) and on the theories of Maurice Merleau-Ponty and Roland Barthes

    TRANSPORTE COOPERATIVO DE OBJETOS CON UNA PLATAFORMA MÓVIL EN UN ENTORNO ESTRUCTURADO

    Get PDF
    La robótica cooperativa busca diseñar sistemas compuestos de varios robots capaces de resolver problemas conjuntamente, de tal manera que dicha implementación puede llevar consigo distintos tipos de control (centralizado o distribuido), de esta manera una de las aplicaciones en esta línea de investigación es el transporte de objetos mediante distintas estrategias que van desde el empuje, la sujeción y arrastre de los objetos; tales trabajos se han presentado desde la década de los 90 hasta el día de hoy. El enfoque del presente artículo busca mostrar el desarrollo e implementación de una plataforma robótica cooperativa aplicada al transporte de objetos largos a través de un entorno estructurado utilizando las herramientas que provee el kit Lego Mindstorms RCX 2.0 y el grupo de investigación en robótica móvil autónoma ROMA

    Approximate Multi-Agent Fitted Q Iteration

    Full text link
    We formulate an efficient approximation for multi-agent batch reinforcement learning, the approximate multi-agent fitted Q iteration (AMAFQI). We present a detailed derivation of our approach. We propose an iterative policy search and show that it yields a greedy policy with respect to multiple approximations of the centralized, standard Q-function. In each iteration and policy evaluation, AMAFQI requires a number of computations that scales linearly with the number of agents whereas the analogous number of computations increase exponentially for the fitted Q iteration (FQI), one of the most commonly used approaches in batch reinforcement learning. This property of AMAFQI is fundamental for the design of a tractable multi-agent approach. We evaluate the performance of AMAFQI and compare it to FQI in numerical simulations. Numerical examples illustrate the significant computation time reduction when using AMAFQI instead of FQI in multi-agent problems and corroborate the similar decision-making performance of both approaches
    corecore