5 research outputs found

    Вдосконалення моделі розпізнавання об’єктів на зображеннях з використанням згорткової нейронної мережі

    Get PDF
    This paper considers a model of object recognition in images using convolutional neural networks; the efficiency of the model-based process involving the training of deep layers in convolutional neural networks has been studied. There are objective difficulties associated with determining the optimal characteristics of neural networks, so there is an issue related to retraining a neural network. Eliminating the retraining by determining only the optimal number of epochs is insufficient since it does not provide high accuracy. The requirements for the set of images for model training and verification have been defined. These requirements are better met by the INRIA image set (France). GoogLeNet (USA) has been established to be a trained model that can perform object recognition on images but the object recognition reliability is insufficient. Therefore, it becomes necessary to improve the effectiveness of object recognition in images. It is advisable to use the GoogLeNet architecture to build a specialized model that, by changing the parameters and retraining some layers, could allow for better recognition of objects in images. Ten models were trained using the following parameters: learning speed, the number of epochs, an optimization algorithm, the type of learning speed change, a gamma or power coefficient, a pre-trained model. A convolutional neural network has been developed to improve the precision and efficiency of object recognition in images. The optimal neural network training parameters were determined: training speed, 0.000025; the number of epochs, 100; a power coefficient, 0.25, etc. A 3 % increase in precision was obtained, which makes it possible to assert the proper choice of the architecture for the developed network and the selection of its parameters. That allows this network to be used for practical tasks of object recognition in images.Рассмотрена модель распознавания объектов на изображениях с помощью свёрточных нейронных сетей и исследование эффективности процесса на основе моделей с обучением глубоких слоев свёрточных нейросетей. Существуют трудности, связанные с определением оптимальных характеристик нейронных сетей, поэтому есть проблема переобучения нейросети. Устранение переобучения путем определения только оптимального количества эпох недостаточно, поскольку не обеспечивает высокую точность. Определены требования к набору изображений для обучения и проверки модели. Данным требованиям наиболее соответствует набор изображений INRIA (Франция). Установлено, что GoogLeNet (США) является обученной моделью и может выполнять распознавание объектов на изображениях, однако надежность распознавания недостаточна. Поэтому возникает необходимость повышения эффективности распознавания. Целесообразно использовать архитектуру GoogLeNet для создания специализированной модели, за счет изменения параметров и переобучения некоторых слоев позволит лучше проводить процесс распознавания. Выполнено обучение десяти моделей с использованием следующих параметров: скорость обучения, число эпох, алгоритм оптимизации, вид изменения скорости обучения, коэффициенты gamma или power, предварительно обученная модель. Разработана свёрточная нейронная сеть для повышения точности и эффективности распознавания объектов на изображениях. Определены оптимальные параметры обучения нейросети: скорость обучения – 0,000025, число эпох – 100, коэффициент power – 0,25. Получено повышение точности на 3 %, которое позволяет утверждать о правильности выбора архитектуры разработанной сети и подбора параметров. Это дает возможность использовать данную сеть для практических задач распознавания объектов на изображенияхРозглянуто модель розпізнавання об’єктів на зображеннях за допомогою згорткових нейронних мереж та дослідження ефективності процесу на основі моделей із навчанням глибоких шарів згорткових нейромереж. Існують об’єктивні труднощі, пов’язані з визначенням оптимальних характеристик нейронних мереж, тому є проблема перенавчання нейромережі. Усунення перенавчання шляхом визначення лише оптимальної кількості епох недостатнє, оскільки не забезпечує високу точність. Визначено вимоги до набору зображень для навчання та перевірки моделі. Даним вимогам найбільш відповідає набір зображень INRIA (Франція). Встановлено, що GoogLeNet (США) є навченою моделлю і може виконувати розпізнавання об’єктів на зображеннях, проте надійність розпізнавання об’єктів недостатня. Тому виникає необхідність підвищення ефективності розпізнавання об’єктів на зображеннях. Доцільно використати архітектуру GoogLeNet для створення спеціалізованої моделі, яка за рахунок зміни параметрів та перенавчання деяких шарів дозволить краще проводити процес розпізнавання об’єктів на зображеннях. Виконано навчання десяти моделей з використанням таких параметрів: швидкість навчання, число епох, алгоритм оптимізації, вид зміни швидкості навчання, коефіцієнт gamma чи power, попередньо навчена модель. Розроблено згорткову нейронну мережу для підвищення точності та ефективності розпізнавання об’єктів на зображеннях. Визначено оптимальні параметри навчання нейромережі: швидкість навчання – 0,000025, число епох – 100, коефіцієнт power – 0,25 тощо. Отримано підвищення точності на 3 %, яке дозволяє стверджувати про правильність вибору архітектури розробленої мережі та підбору параметрів. Це дає можливість використовувати дану мережу для практичних задач розпізнавання об’єктів на зображення
    corecore