308 research outputs found

    Melhoria na converg?ncia do algoritmo Q-Learning na aplica??o de sistemas tutores inteligentes

    Get PDF
    O uso sistemas computacionais como complemento ou substitui??o da sala de aula ? cada vez mais comum na educa??o e os Sistemas Tutores Inteligentes (STIs) s?o uma dessas alternativas. Portanto ? fundamental desenvolver STIs capazes tanto de ensinar quanto aprender informa??es relevantes sobre o aluno atrav?s de t?cnicas de intelig?ncia artificial. Esse aprendizado acontece por meio da intera??o direta entre o STI e o aluno que ? geralmente demorada. Esta disserta??o apresenta a inser??o da metaheur?sticas Lista Tabu e GRASP com o objetivo de acelerar esse aprendizado. Para avaliar o desempenho dessa modifica??o, foi desenvolvido um simulador de STI. Nesse sistema, foram realizadas simula??es computacionais para comparar o desempenho da tradicional pol?tica de explora??o aleat?ria e as metaheur?sticas propostas Lista Tabu e GRASP. Os resultados obtidos atrav?s dessas simula??es e os testes estat?sticos aplicados indicam fortemente que a introdu??o de meta-heur?sticas adequadas melhoram o desempenho do algoritmo de aprendizado em STIs.Disserta??o (Mestrado Profissional) ? Programa de P?s-Gradua??o em Educa??o, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 2016.Using computer systems as a complement or replacement for the classroom experience is an increasingly common practice in education and Intelligent Tutoring Systems (ITS) are one of these alternatives. Therefore, it is crucial to develop ITS that are capable of both teaching and learning relevant information about the student through artificial intelligence techniques. This learning process occurs by means of direct, and generally slow, interaction between the ITS and the student. This dissertation presents the insertion of meta-heuristic Tabu search and GRASP with the purpose of accelera ting learning. An ITS simulator was developed to evaluate the performance of this change. Computer simulations were conducted in order to compare the performance of traditional randomized search methods with the meta-heuristic Tabu search. Results obtained from these simulations and statistical tests strongly indicate that the introduction of meta-heuristics in exploration policy improves the performance of the learning algorithm in ITS

    Combinando Modelos de Interação para Melhorar a Coordenação em Sistemas Multiagente

    Get PDF
    A contribuição principal deste artigo é a implementação de um método híbrido de coordenação a partir da combinação de modelos de interação desenvolvidos anteriormente. Os modelos de interação são baseados no compartilhamento de recompensas para aprendizagem com múltiplos agentes, no intuito de descobrir de maneira interativa políticas de boa qualidade. A troca de recompensas entre os agentes durante a interação é uma tarefa complexa e se realizada de forma inadequada pode ocasionar atrasos no aprendizado ou até mesmo causar comportamentos inesperados, tornando a cooperação ineficiente e convergindo para uma política não-satisfatória. A partir desses conceitos, o método híbrido utiliza as particularidades de cada modelo, reduzindo possíveis conflitos entre ações com recompensas de políticas diferentes, melhorando a coordenação dos agentes em problemas de aprendizagem por reforço. Resultados experimentais mostram que o método híbrido é capaz de acelerar a convergência, conquistando rapidamente políticas ótimas mesmo em grandes espaços de estados, superando os resultados de abordagens clássicas de aprendizagem por reforço

    Mapas Cognitivos Fuzzy Dinâmicos Hierárquicos para arquitetura cooperativa de robótica móvel autônoma inspirada por SLAM e ACO/ Hierarchical Dynamic Fuzzy Cognitive Maps for autonomous mobile robotics cooperative architecture inspired by SLAM and ACO

    Get PDF
    Este trabalho apresenta uma arquitetura de navegação robótica construída através de Mapas Cognitivos Fuzzy Dinâmicos e Hierárquicos (HD-FCM), uma evolução dos Mapas Cognitivos Fuzzy, aplicadas em navegação autônoma, em especial navegação autônoma cooperativa. A arquitetura proposta é inspirada na arquitetura de subsunção de Brooks devido ao gerenciamento hierárquico de funções e processamento paralelo, e em conceitos de técnicas de SLAM como Landmarks artificiais e recuperação de informações. Entretanto, a logística de operação é inspirada em Robótica Coletiva, em especial no comportamento de formigas para otimização de trajetória. Uma arquitetura de um controlador baseado HD-FCM é desenvolvida com vários níveis de funcionalidades, desde ações de baixo nível até o nível mais alto de gerenciamento, planejamento de ações, sintonia dinâmica do modelo. No último nível é inserido no modelo um compartilhamento de trajetória entre uma sequência agentes, através de uma memória de tráfego baseado em sistemas multiagentes, técnicas de SLAM e algoritmos bioinpirados

    Contribuições de aprendizado por reforço em escolha de rota e controle semafórico

    Get PDF
    A área de sistemas inteligentes de transporte há muito investiga como empregar tecnologias da informação e comunicação a fim de melhorar a eficiência do sistema como um todo. Isso se traduz basicamente em monitorar e gerenciar a oferta (rede viária, semáforos etc.) e a demanda (deslocamentos de pessoas e mercadorias). A esse esforço, mais recentemente, estão sendo adicionadas técnicas de inteligência artificial. Essa tem o potencial de melhorar a utilização da infraestrutura existente, a fim de melhor atender a demanda. Neste trabalho é fornecido um panorama focado especificamente em duas tarefas onde a inteligência artificial tem contribuições relevantes, a saber, controle semafórico e escolha de rotas. Os trabalhos aqui discutidos objetivam otimizar a oferta e/ou distribuir a demanda.The field of of intelligent transportation systems has long investigated how to employ information and communication technologies to improve the efficiency of the system as a whole. This basically means to monitor and manage both supply (traffic network, traffic signals etc.) and demand (vehicles, people and goods). More recently, artificial intelligence techniques are being added to this effort, as they have the potential to improve the usage of existing infrastructure to meet the corresponding demand. In this paper, an overview is given, focusing specifically on two tasks where artificial intelligence has made relevant contributions, namely, traffic signal controls and route choices. The works discussed here aim at optimize the supply and/or distribute the demand

    Sistema de detecção e reconhecimento de números baseado em cascata de classificadores e redes neurais

    Get PDF
    Trabalho de Conclusão Curso (graduação)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2018.Grandes avanços tem sido observados nos processadores modernos nas últimas décadas. Ano após ano a capacidade de processamento de computadores e dispositivos eletrônicos aumenta em ritmo exponencial. Este aumento no poder de processamento acelera a execução de algoritmos de aprendizado de máquina e viabiliza seu uso em novos campos como na segurança, robótica e saúde. Além disso, a introdução e massificação dos chamados dispositivos móveis, ou smartphones, contribuíram para o barateamento e acessibilidade à tecnologia fotográfica e de gravação de vídeos com qualidade. Neste contexto, estudos de visão computacional como detecção de texto passam a ser viáveis. Detecção de texto é um problema complexo, porém sua solução permite aplicações interessantes como OCR em documentos impressos e alternativas de automação para a robótica. Este trabalho apresenta um sistema de detecção e reconhecimento exclusivo para números, tanto escritos como impressos. A implementação da detecção de números foi alcançada por meio da associação das técnicas de visão computacional “cascata de classificadores”, “pirâmide de imagens”, “método da janela móvel” e “geração manual de características Haar”. A classificação dos números detectados foi realizada utilizando-se duas alternativas, um modelo de rede neural multi-camada e um modelo de convolução. A detecção de números foi validada com um grupo de exemplos criados manualmente. Foram extraídos parâmetros da matriz de confusão do detector e também foi calculada sua nota F1, atingindo o máximo de 0.4194. A classificação foi validada por meio do grupo de exemplos da base de dados MNIST, em que o melhor desempenho foi registrado no valor 97.5% e 99% para o modelo de rede multi-camada e convolucional respectivamente. O sistema completo também foi validado em um grupo de exemplos criado à mão, em que o melhor desempenho teve acurácia de 90%.Big advancements have been happening on modern computing hardware within the last decades. Year after year processors and electronic devices have been rising their speed and capabilities, all of this at an exponencial level. This rising on processing power accelerates the execution of complex algorithms from the machine learning field, and this enables their use in new fields of robotics, surveillance and healthcare. Besides all stated about processors, the introduction and wide adoption of mobile devices, or smartphones, contributed the decrease in costs and improvements on accessibility to high quality video recording technology. In this scenario, there has been a surge in studies about computer vision and its applications under these conditions. Text detection is a complex problem related to computer vision, and solutions to it could enable interesting applications such as photo optical character recognition on printed documents as well as new ways to automate processes in robotics. This work presents a system for detecting and recognizing numbers, both written and printed. Number detection was implemented by making use of computer vision techniques like cascade classifiers, image pyramids, the sliding window method along with manual feature generation method “Haar”. Number recognition was done by training two different machine learning classifiers, a multi-layer neural network and a convolutional neural network. The digit detection system was validated with a group of hand crafted examples. A confusion matrix was extracted from the detector’s performance on the set and its f1 score was calculated, achieving a maximum value of 0.4194. Classification was validated by making use of the MNIST dataset, on which each classifier’s accuracy was registered, reaching a maximum of 97.5% for the multi-layer neural net and 99% for the convolutional model. Validation for the system as a whole was also performed by making use of a hand crafted dataset, to which the system achieved a best accuracy of 90%

    Análise da influência da taxa de aprendizado e do fator de desconto sobre o desempenho dos algoritmos Q-learning e SARSA: aplicação do aprendizado por reforço na navegação autônoma

    Get PDF
    Nos algoritmos de aprendizado por reforço, a taxa de aprendizado (alpha) e o fator de desconto (gamma) podem ser definidos entre qualquer valor no intervalo entre 0 e 1. Assim, adotando os conceitos de regressão logística, é proposta uma metodologia estatística para a análise da influência da variação de \alpha e \gamma nos algoritmos Q-learning e SARSA. Como estudo de caso, o aprendizado por reforço foi aplicado em experimentos de navegação autônoma. A análise de resultados mostrou que simples variações em \alpha e \gamma podem interferir diretamente no desempenho do aprendizado por reforço

    Limites legais ao uso da inteligência artificial na magistratura

    Get PDF
    Este trabalho tem como objetivo descobrir se o uso da Inteligência Artificial como autora, coautor ou substituta do trabalho intelectual do magistrado pode ser considerado legal e constitucional segundo o ordenamento jurídico brasileiro. A fim de se atingir o objetivo almejado, levantou-se a conceituação básica a respeito da tecnologia envolvida na Inteligência Artificial, pesquisou-se, nos autores relevantes, e em artigos científicos, as reflexões a respeito dos limites legais relevantes, e, por fim, foi analisado se o uso da Inteligência Artificial como entidade julgadora afronta os direitos, garantias e princípios constitucionais. O método utilizado na realização da pesquisa foi o hipotético-dedutivo, partindo da hipótese de que o ordenamento jurídico brasileiro não dá suporte a esse tipo de aplicação da Inteligência Artificial. Confrontando essa hipótese com a legislação pertinente ao assunto, e com os princípios aplicáveis, por meio dos métodos de interpretação jurídica, chegou-se à conclusão de que, apesar de não existir regulamentação explícita acerca da matéria, a substituição das atividades do magistrado por um sistema de Inteligência Artificial configura-se inconstitucional por afrontar diversos princípios da Lei Maior

    Ajuste Dinâmico de Dificuldade pelo desempenho e perfil de jogador em jogo de plataforma

    Get PDF
    Dissertação (Mestrado em Informática) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Brasília, 2022.O Ajuste Dinâmico de Dificuldade (ADD) dos jogos pode desempenhar um papel importante para aumentar o envolvimento e a diversão do jogador. A dificuldade de jogo pode ser adaptada de acordo com o desempenho do jogador, seu estado afetivo ou usando um modelo híbrido que combina as duas abordagens. Ademais, pode adaptar configurações ou componentes do jogo e utilizar métricas pré-estabelecidas ou aprendizado de máquina para análise do que será adaptado. Este trabalho investiga os distintos mecanismos de um sistema de ADD para um jogo de plataforma adaptar adequadamente seu nível de dificuldade e manter o jogador em um estado de fluxo. Este trabalho contribui com a definição de um método que estima a dificuldade do jogo a partir de características específicas de componentes comuns ao gênero de plataforma. Também são revisadas métricas para medição do estado do fluxo e do perfil do jogador e propostas regras para criação de níveis ao testar modelos de ADD. O ajuste proposto varia o tamanho da plataforma e a altura do salto, comparando distintas abordagens a partir de sistemas do jogo e verificando a eficiência de cada uma em relação ao monitoramento e análise dos dados e ao controle da adaptação dos componentes. Um jogo de plataforma de código aberto foi adaptado para suportar os algoritmos de ADD e para execução de testes com grupos de amostra, nos quais os participantes respondiam a questionários e tiveram seus dados coletados para fins de investigação. Os resultados indicaram que a dificuldade de jogos de plataforma pode ser estimada pelos componentes dos níveis, incluindo correlação entre a dificuldade e os dados de desempenho dos jogadores. Além disso, perfis de jogadores foram previstos a partir de dados brutos da sessão do jogo e utilizados com métodos de aprendizado de máquina para definir a progressão de dificuldade. Por fim, os modelos de ADD foram capazes de ajustar a dificuldade do jogo aos jogadores, diminuindo a dispersão entre os dados de desempenho e mantendo o jogador em estado de fluxo, especialmente ao utilizar redes neurais diretas para predição da dificuldade experienciada e do perfil do jogador.The Dynamic Difficulty Adjustment (DDA) of games can play an important role in increasing the player engagement and fun. Gameplay difficulty can be adapted according to the player’s performance, its affective state or by using a hybrid model that combines both approaches. In addition, you can adapt game settings or components and use pre-established metrics or machine learning to analyze what will be adapted. This work investigates the different mechanisms of an DDA system for a platform game to adequately adapt its difficulty level and keep the player in a state of flow. This work contributes with the definition of a method that estimates the game’s difficulty based on specific characteristics of components common to the platform genre. Metrics for measuring the flow state and player profile are also reviewed, and rules for creating levels when testing ADD models are proposed. The proposed adjustment varies the size of the platform and the height of the jump, comparing different approaches from the game systems and verifying the efficiency of each one in relation to the monitoring and analysis of the data and the control of the components adaptation. An open source platform game was adapted to support the ADD algorithms and to run tests with sample groups, in which participants answered questionnaires and had their data collected for research purposes. The results indicated that the difficulty of platform games can be estimated by the components of the levels, including correlation between the difficulty and player performance data. In addition, player profiles were predicted from raw game session data and used with machine learning methods to define difficulty progression. Finally, the DDA models were able to adjust the game difficulty to the players, decreasing the dispersion between the performance data and keeping the player in a state of flow, especially when using feedforward neural networks to predict the difficulty experienced and the player’s profile

    Estratégias de Atualização de Políticas para a Coordenação de Agentes Baseados em Enxames

    Get PDF
    Neste artigo é analisada a influência dos parâmetros de aprendizagem de algoritmos de enxames e propostas estratégias de atualização de políticas geradas por recompensas (feromônios) para ambientes dinâmicos. Nós verificamos que quando os parâmetros de algoritmos baseados em recompensas são ajustados inadequadamente pode ocorrer atrasos no aprendizado e convergência para uma solução não-satisfatória. Além disso, esse problema é agravado em ambientes dinâmicos, pois o ajuste dos parâmetros de tais algoritmos não é suficiente para garantir convergência. Para solucionar tal problema, nós desenvolvemos estratégias que modificam valores de feromônio, melhorando a coordenação entre os agentes e permitindo convergência mesmo quando o ambiente é alterado dinamicamente. Para isso, um framework capaz de demonstrar de maneira iterativa a influência dos parâmetros e das estratégias foi desenvolvido. Resultados experimentais mostram que é possível acelerar a convergência para uma política global consistente, superando os resultados de abordagens clássicas de algoritmos baseados em enxames
    corecore