2 research outputs found
Optimization of Convolutional Neural Network Using the Linearly Decreasing Weight Particle Swarm Optimization
Convolutional neural network (CNN) is one of the most frequently used deep
learning techniques. Various forms of models have been proposed and improved
for learning at CNN. When learning with CNN, it is necessary to determine the
optimal hyperparameters. However, the number of hyperparameters is so large
that it is difficult to do it manually, so much research has been done on
automation. A method that uses metaheuristic algorithms is attracting attention
in research on hyperparameter optimization. Metaheuristic algorithms are
naturally inspired and include evolution strategies, genetic algorithms,
antcolony optimization and particle swarm optimization. In particular, particle
swarm optimization converges faster than genetic algorithms, and various models
have been proposed. In this paper, we propose CNN hyperparameter optimization
with linearly decreasing weight particle swarm optimization (LDWPSO). In the
experiment, the MNIST data set and CIFAR-10 data set, which are often used as
benchmark data sets, are used. By optimizing CNN hyperparameters with LDWPSO,
learning the MNIST and CIFAR-10 datasets, we compare the accuracy with a
standard CNN based on LeNet-5. As a result, when using the MNIST dataset, the
baseline CNN is 94.02% at the 5th epoch, compared to 98.95% for LDWPSO CNN,
which improves accuracy. When using the CIFAR-10 dataset, the Baseline CNN is
28.07% at the 10th epoch, compared to 69.37% for the LDWPSO CNN, which greatly
improves accuracy
Otimização de redes convolucionais para classificação de imagens
As redes convolucionais têm demonstrado eficácia na resolução de diversos tipos de problemas,
nomeadamente classificação de imagens, reconhecimento ou localização de objetos,
reconhecimento de som, entre outros. A elevada robustez destas redes permite a sua difusão em
áreas de extrema importância para a sociedade, tal como a área biomédica, que inclui um vasto
conjunto de tarefas de análise de imagens e diagnóstico clínico.
Contudo, o sucesso destes modelos está dependente da identificação da estrutura e dos valores
de outros hiperparâmetros, que melhor se ajustam à resolução de um problema específico, sendo
que esta tarefa requer elevado esforço computacional e conhecimento pericial. De modo a
reduzir estas dificuldades, este trabalho propõe uma metodologia de otimização autónoma dos
hiperparâmetros de diferentes arquiteturas convolucionais.
A metodologia baseia-se na utilização do algoritmo de inteligência coletiva, Particle Swarm
Optimization (PSO), aplicado na otimização de quatro conhecidas arquiteturas convolucionais:
AlexNet, VGGNet, ResNet e DenseNet e para resolução de três problemas de diagnóstico
médico. Procurando-se identificar a solução que proporciona o melhor desempenho com a
menor complexidade possível.
Os resultados obtidos demonstraram a eficácia e a rapidez do PSO na identificação de soluções
efetivas, sendo alcançados resultados superiores comparativamente a outras abordagens, em
duas das três benchmarks em estudo.
A técnica ensemble proposta permitiu a obtenção de um F1Score macroAVG de 91.1% e de 96.6%, respetivamente, para as benchmarks Breast Histopathology e Colorectal Histopathology.
Os modelos estão disponíveis numa plataforma web que possibilita a realização de diagnósticos
de imagens biomédicas, através do uso e da partilha de modelos convolucionais na plataforma.
A plataforma demonstrou ser extremamente eficiente e célere na resposta ao diagnóstico de
imagens, sendo obtidas as previsões num intervalo inferior a 10 segundos. O seu acesso é
público e está disponível no repositório https://github.com/bundasmanu/ProjetoMestrado