Search CORE

4 research outputs found

Повышение робастности систем автоматического распознавания речи методами обработки сигналов

Author: Ладошко Ольга Николаевна
Publication venue: Киев
Publication date: 01/01/2016
Field of study

Дисертацію присвячено вирішенню актуальної задачі підвищення робастності систем автоматичного розпізнавання мовлення шляхом розробки нових методів обробки мовленнєвих сигналів. Удосконалено метод ослаблення пізньої реверберації, що дозволяє підвищити точність систем автоматичного розпізнавання мовлення навіть в умовах недостатності апріорної інформації про параметри реверберації. Проведена експериментальна перевірка доцільності використання подання мовленнєвих сигналів в просторі ознак PNCC разом з використанням детектора голосової активності, що дозволяє забезпечити робастність системи автоматичного розпізнавання мовлення при використанні PNCC ознак в умовах нестаціонарного шуму. За отриманими результатами зроблено висновок про необхідність вдосконалення методу PNCC шляхом заміни процедури роздільної обробки голосової активності на основі енергетичного підходу на більш стійкі щодо дії нестаціонарних шумів методи. Розроблено нейромережевий детектор голосової активності системи автоматичного розпізнавання мовлення, що дало можливість використовувати такі ознаки як нормалізовані за потужністю кепстральні коефіцієнти при роботі з нестаціонарними шумами. Розширено перелік ознак запропонованого нейромережевого детектору голосової активності за рахунок введення ознаки «траєкторія основного тону», що дозволило підвищити завадостійкість його роботи. Удосконалено метод навчання нейромережевого детектора голосової активності. Для цього запропоновано алгоритм адаптивної корекції параметрів стаціонарної нелінійної MLP мережі, що дозволило прискорити процедуру навчання такого детектора. Працездатність та ефективність запропонованого детектору голосової активності була експериментально підтверджена шляхом тестування на стандартних сигналах, спотворених білим та рожевим шумами та на реальних сигналах, отриманих з телефонного каналу зв’язку NTIMIT. Результати порівняння запропонованого детектору MLP-IDBD з алгоритмами Д. Їнґ, Д. Согн та алгоритмами міжнародних стандартів ETSI AMR та ITU G.729 показали, що запропонований в даній дисертації детектор MLP-IDBD має перевагу над конкурентними аналогами за критерієм проценту правильно розпізнаних фреймів

Electronic Archive of Kyiv Polytechnic Institute

Комп’ютерна обробка акустичних сигналів

Author: Продеус Аркадій Миколайович
Publication venue: Київ
Publication date: 01/01/2018
Field of study

Розглянуто суб'єктивні й об'єктивні (інструментальні) методи оцінювання якості та розбірливості мовних і музичних сигналів у приміщеннях і каналах зв'язку, а також розглянуто питання корекції сигналів, спотворених шумом та реверберацією. При цьому значну увагу приділено проблемам надійності й автоматизації оцінювання об'єктивних мір якості й розбірливості мови. Питання корекції мовних сигналів, спотворених шумом і реверберацією, розглянуті стосовно до ситуації, коли системи корекції служать препроцесорами систем автоматичного розпізнавання мови. Навчальний посібник також містить розділи, що висвічують питання кодування акустичних сигналів. Найбільшу увагу при цьому приділено смуговим та фазовим вокодерам як таким, що дозволяють досягти максимального стискання мовних сигналів у каналах зв’язку. Наведено велику кількість посилань на відповідні літературні джерела, а також представлено результати авторських аналітичних та експериментальних досліджень. Останні виконані шляхом комп'ютерного моделювання, з використанням програмного інструментарію Matlab. Навчальний посібник призначений студентам акустичних та телекомунікаційних спеціальностей технічних вишів, а також фахівцям в галузі акустичної експертизи та корекції комунікаційних каналів

Electronic Archive of Kyiv Polytechnic Institute