Search CORE

3 research outputs found

A method of increasing the resolution of voice signals for indoor climate control

Author: Polishchuk Maxym
Поліщук Максим Ігорович
Publication venue
Publication date: 20/12/2019
Field of study

Дипломну роботу магістра присвячено покращення точності розпізнавання голосу в пристроях призначених для керування кліматом. Використтано нейронні мережі, які в останні роки неодноразово показували суттєві результати в процесах прогнозування, класифікації, розпізнавання образів, рукописного тексту та мовлення, у задачах розпізнавання мови.The Master's thesis is dedicated to improving the accuracy of voice recognition in climate-controlled devices. We have used neural networks, which in recent years have repeatedly shown significant results in the processes of forecasting, classification, pattern recognition, handwriting and speech, in language recognition tasks.ВСТУП 8 РОЗДІЛ 1. ГОЛОСОВЕ КЕРУВАННЯ 10 1.1 Керування з підтримкою голосу 10 1.2 Поняття, призначення і види голосового управління 13 1.2.1 Поняття голосового управління 13 1.2.2 Призначення приладів визначення мови 15 1.2.3 Вигляду голосового управління 16 1.3 Архітектура і симптоми приладів голосового управління 17 1.3.1 Архітектура приладів визначення мови 17 1.3.2 Симптому в пристроях визначення мови 18 1.3.3 Параметра властивості мови і головні думки 22 1.4 Синтез мови в голосовому управлінні 23 1.5 Оцифрування звуку 26 1.6 Тест ринку систем голосового управління 29 1.7 Завдання управління кліматом 33 1.8 Тест останніх досліджень і підсумків 34 1.9 Висновок до розділу 1 39 РОЗДІЛ 2. АЛГОРИТМ РОЗПІЗНАВАННЯ МОВИ ЗА ДОПОМОГОЮ НЕЙРОННИХ МЕРЕЖ 41 2.1 Алгоритм роботи нейронної мережі для задач розпізнавання мови 41 2.1.1 Визначення мови з підтримкою нейтонної мережі 41 2.1.2 Обробка отриманих оцифрованих даних 44 2.1.3 Визначення букв з коротких звуків 47 2.2 Розробка алгоритму для опрацювання голоса 51 2.2.1. Короткий опис розробки методу опрацювання 51 2.2.2. Спектральний тест сигналу 55 2.2.3. Створення з підтримкою бібліотеки FANN нейронної мережі 7 для визначення команд 62 2.3 Висновок до розділу 2 67 РОЗДІЛ 3. ДОСЛІДНИЦЬКА ЧАСТИНА 69 3.1 Огляд шляхів проектування 69 3.2. Вибір складових 72 3.3. Середовище для проведення експериментів 79 3.4. Висновки до розділу 3 81 РОЗДІЛ 4. СПЕЦІАЛЬНА ЧАСТИНА 82 4.1 Програмне середовище "Мatlab simulink" 82 4.2 Висновки до розділу 4 85 РОЗДІЛ 5. ОБГРУНТУВАННЯ ЕКОНОМІЧНОЇ ЕФЕКТИВНОСТІ 86 5.1 Науково-технічна актуальність науково-дослідної роботи 86 5.2 Розрахунок витрат на проведення науково-дослідної роботи 91 5.3 Висновки до розділу 5 95 РОЗДІЛ 6. ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ 96 6.1 Охорона праці 96 6.2 Безпека в надзвичайних ситуаціях 103 6.3 Висновки до розділу 108 РОЗДІЛ 7. ЕКОЛОГІЯ 109 7.1 Вплив електромагнітного випромінювання на навколишнє середовище 109 7.2 Наслідки впливу електромагнітного випромін 110 7.3 Висновки до розділу 7 114 ВИСНОВКИ 115 СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 116 ДОДАТКИ 12

Electronic archive of Ternopil National Ivan Puluj Technical University

Пристрій розпізнавання голосу для керування кліматом в приміщенні

Author: Береза Владислав Миколайович
Publication venue: Київ
Publication date: 01/01/2018
Field of study

Останнім часом спостерігається значне зростання інтересу до технологій, пов'язаних з розпізнаванням мови. Завдання управління пристроями за допомогою голосових команд, інтерактивні платформи які надають інформацію після запиту в більш природній формі - за допомогою голосу, все це знаходить широкого застосування в сучасному світі. Багато задач виникає при бажанні взаємодіяти за допомогою голосу з мобільними пристроями. Наприклад, введення голосових команд для отримання інформації з Інтернету, прокладання маршруту руху, запуск програм користувача, диктування тексту. Останнім часом з'явилася можливість управління домашньою, офісною технікою за допомогою електронних пристроїв голосовими командами. Передумовою розвитку голосових технологій є значне збільшення обчислювальних можливостей, обсягу пам'яті при значному зменшенні габаритів комп'ютерних систем. Слід також відзначити розвиток математичних методів, що дозволяють виконати необхідну обробку аудіо сигналу шляхом виділення з нього інформативних ознак. Для прикладу, широко використовується дискретне перетворення Фур'є, яке відоме з теорії цифрової обробки сигналів. Подальша обробка виконується з використанням акустичної моделі, яка ставить у відповідність виділених параметрах конкретні звуки (фонеми). Слід зазначити, що в статті розглядається можливість використання методу динамічного програмування і метод нейронних рекурентних мереж. Розглянуто взаємодію людини і домашніх приладів яка реалізовується на базі Arduino, за допомогою голосових команд. Тут передбачається, що обробка аудіо сигналу, побудова текстового рядка на основі виголошеній фрази виконується спеціальними бібліотеками (класами, методами), шо покращує розпізнавання голосу в порівнянні з існуючими методами.Recently, there has been a significant increase in interest in technologies related to speech recognition. The tasks of controlling devices with the help of voice commands, interactive platforms, provide information after the request in a more natural form - with the help of voice. Many tasks arise when you want to manage with voice with mobile devices. For example, the introduction of voice commands to obtain information from the Internet, the provide route, the launch of user programs, the dictation of the text. Recently, it became possible to manage home, office equipment using electronic devices with voice commands. The prerequisite for the development of speech technologies is a significant increase in computing capabilities, memory capacity with a significant reduction in the size of computer systems. It should also be noted the development of mathematical methods that make it possible to perform the necessary processing of an audio signal by isolating informative features from it. For example, a discrete Fourier transform is widely used, which is known from the theory of digital signal processing. Further processing is performed using an acoustic model, which assigns specific sounds to the selected parameters (phonemes). It should be noted that the article considers the possibility of using the dynamic programming method and the method of neural recurrent networks. The interaction between humans and home devices, that implemented of platform Arduino, with the help of voice commands is considered. Here it is assumed that the processing of an audio signal, the construction of a text string based on the pronounced phrase is performed by special libraries (classes, methods), which improves voice recognition in comparison with existing methods.В последнее время наблюдается значительный рост интереса к технологиям, связанных с распознаванием речи. Задачи управления устройствами с помощью голосовых команд, интерактивные платформы, которые предоставляют информацию по запросу в более естественной форме - с помощью голоса, все это находит широкое применение в современном мире. Многие задачи возникает при желании взаимодействовать с помощью голоса с мобильными устройствами. Например, введение голосовых команд для получения информации из Интернета, прокладка маршрута движения, запуск программ пользователя, диктовки текста. В последнее время появилась возможность управления домашней, офисной техникой с помощью электронных устройств голосовыми командами. Предпосылкой развития голосовых технологий является значительное увеличение вычислительных возможностей, объема памяти при значительном уменьшении габаритов компьютерных систем. Следует также отметить развитие математических методов, позволяющих выполнить необходимую обработку аудиосигнала путем выделения из него информативных признаков. Например, широко используется дискретное преобразование Фурье, которое известно из теории цифровой обработки сигналов. Дальнейшая обработка выполняется с использованием акустической модели, которая ставит в соответствие выделенным параметрам конкретные звуки (фонемы). Следует отметить, что в работе рассматривается возможность использования метода динамического программирования и метод нейронных рекуррентных сетей. Рассмотрено взаимодействие человека и домашних приборов реализуемой на базе Arduino, с помощью голосовых команд. Здесь предполагается, что обработка аудио сигнала, построение текстовой строки на основе произнесенной фразы выполняется специальными библиотеками (классами, методами), что улучшает распознавание голоса по сравнению с существующими методами

Electronic Archive of Kyiv Polytechnic Institute

Rapid Generation of Pronunciation Dictionaries for new Domains and Languages

Author: Schlippe Tim
Publication venue: KIT-Bibliothek, Karlsruhe
Publication date: 01/01/2014
Field of study

This dissertation presents innovative strategies and methods for the rapid generation of pronunciation dictionaries for new domains and languages. Depending on various conditions, solutions are proposed and developed. Starting from the straightforward scenario in which the target language is present in written form on the Internet and the mapping between speech and written language is close up to the difficult scenario in which no written form for the target language exists

KITopen