2 research outputs found

    AUTOMATIC SPEECH RECOGNITION – THE MAIN STAGES OVER LAST 50 YEARS

    Get PDF
    The main stages of automatic speech recognition systems over last 50 years are regarded. The attempt is made to evaluate different methods in the context of approaching to functioning of biological systems. The method implementation based on dynamic programming algorithm and done in 1968 is considered as a benchmark. Shortcomings of the method, which make it possible to use it only for command recognition, are considered. The next method considered is based on a formalism of Markov chains. Based on the notion of coarticulation the necessity of applying context dependent triphones and biphones instead of context independent phonemes is shown. The problems of insufficiency of speech databases for triphone training which lead to state tying methods are explained. The importance of model adaptation and feature normalization methods providing better invariance to speakers, communication channels and additive noise are shown. Deep Neural Networks and Recurrent Networks are considered as the most up-to-date methods. The similarity of deep (multilayer) neural networks and biological systems is noted. In conclusion, the problems and drawbacks of the modern systems of automatic speech recognition are described and prognosis of their development is given

    Метод розпізнавання команд голосового управління комп’ютерною системою

    Get PDF
    Актуальність теми. Мова є найбільш природною формою людського спілкування і тому реалізація інтерфейсу на основі аналізу мовної інформації є перспективним напрямком розвитку інтелектуальних систем управління. Задача розпізнавання мовної інформації є складною задачею, яка використовує такі області науки як: цифрова обробка сигналів, розпізнавання образів та лінгвістика. Діалог з комп’ютерами, роботами, автоматизованими системами управління за допомогою голосових повідомлень відкриває великі перспективи: – простота спілкування з системою; – доступність мовного інтерфейсу людям з порушеннями опорно-рухового та зорового апарату; – можливість роботи користувачів в умовах перевантаженості тактильно-зорового каналу. Об’єктом дослідження є процес розпізнавання голосової команди для керування комп’ютерної системи. Предметом дослідження є способи розпізнавання голосової команди для керування комп’ютерної системи на основі методу динамічного програмування. Мета роботи: прискорення процесу розпізнавання голосової команди для керування комп’ютерної системи на основі методу динамічного програмування, розробка більш точної системи розпізнавання голосової команди на основі додаткового аналізу.Actuality of theme. Language is the most natural form of human communication, and therefore the implementation of the interface based on the analysis of language information is a promising direction for the development of intelligent management systems. The task of recognizing language information is a complex task that uses such fields of science as: digital signal processing, image recognition and linguistics. Dialogue with computers, robots, automated control systems by means of voice messages offers great prospects: - Simple communication with the system; - availability of the language interface for people with musculoskeletal and visual disorders; - the ability to work users in conditions of overload tactile-visual channel. The object of the study is the process of recognizing a voice command to control the computer system. The subject of the study is the methods of recognizing a voice command to control a computer system based on the method of dynamic programming. The purpose of the work is to accelerate the recognition process of the voice command for managing the computer system on the basis of the dynamic programming method, the development of a more accurate voice recognition system based on additional analysis.Актуальность темы. Язык является наиболее естественной формой человеческого общения и поэтому реализация интерфейса на основе анализа речевой информации является перспективным направлением развития интеллектуальных систем управления. Задача распознавания речевой информации является сложной задачей, которая использует такие области науки как: цифровая обработка сигналов, распознавания образов и лингвистика. Диалог с компьютерами, работами, автоматизированными системами управления с помощью голосовых сообщений открывает большие перспективы: - простота общения с системой; - доступность речевого интерфейса людям с нарушениями опорно-двигательного и зрительного аппарата; - возможность работы пользователей в условиях перегруженности тактильно-зрительного канала. Объектом исследования является процесс распознавания голосовых команд для управления компьютерной системы. Предметом исследования являются способы распознавания голосовых команд для управления компьютерной системы на основе метода динамического программирования. Цель работы: ускорение процесса распознавания голосовых команд для управления компьютерной системы на основе метода динамического программирования, разработка более точной системы распознавания голосовых команд на основе дополнительного анализа
    corecore