thesis

Construção de uma rede neural em FPGA para inferência de baixa latência

Abstract

As doenças em plantas representam um dos principais fatores que contribuem para a perda de colheitas na produção agrícola. Logo, diagnosticar uma planta rapidamente pode ser essencial para a produção. Contudo, um diagnóstico manual pode ser custoso, lento e subjetivo. Dessa forma, a implementação de um sistema de baixo consumo de energia capaz de avaliar automaticamente o estado das plantas de maneira contínua, rápida e precisa é crucial no contexto. Dito isto, esse artigo apresenta uma solução baseada em aprendizado de máquina possível de ser implantada em FPGAs para realizar inferências acerca de imagens do domínio tratado. Para isso, foram utilizados recursos como redes neurais convolucionais, transferência de aprendizado e quantização com o framework Vitis AI. Além disso, testes com os diferentes tipos de quantização foram realizados em GPU, CPU e FPGA com o propósito de comparar as métricas de desempenho em cada hardware. Ao fim, com uma acurácia de 97.74%, o modelo classificador obtido pela técnica quantization aware training (QAT) conseguiu melhores resultados frente àquele gerado pelo método post training quantization (PTQ). Ademais, o modelo em FPGA conseguiu obter uma vazão de 27.6 inferências por segundo nos testes, suficiente para diagnósticos em tempo real.16 f

    Similar works