2 research outputs found

    Моделювання багаторівневого поскладового розпізнавання мовленнєвого сигналу

    Get PDF
    В статті проводиться поширення багаторівневої багатозначної моделі автоматичного розпізнавання злитого мовлення на випадок поскладового розпізнавання. Розглядаються два рівні з трьох. На першому рівні проводиться розпізнавання в умовах поскладової граматики, на другому рівні проводиться оброблення (постпроцесинг) вихідних даних першого рівня з метою отримання відповідних послідовностей слів. В описаній моделі постпроцесингу беруться до уваги отримані оцінки акустичних складових мовленнєвого сигналу, а послідовність і фонетичні особливості разом з лексиконом. Аналізуються шляхи вибору множини одиниць на складовому рівні мовленнєвих образів. Описується багатодикторний мовленнєвий корпус і лексикон, що використані в експериментальному дослідженні. Обговорюються результати експериментів, проблеми та майбутні дослідження.В статье проводится распространение многоуровневой многозначной модели автоматического распознавания слитной речи на случай послогового распознавания. Рассматриваются два уровня из трех. На первом уровне проводится распознавание в условиях послоговой грамматики, на втором уровне проводится обработка (постпроцессинг) исходных данных первого уровня с целью получения соответствующих последовательностей слов. В описанной модели постпроцессинга обращается внимание на полученные оценки акустических составляющих речевого сигнала, а последовательность и фонетические особенности вместе с лексиконом. Анализируются пути выбора множества единиц на слоговом уровне речевых образов. Описывается многодикторный речевой корпус и лексикон, которые использованы в экспериментальном исследовании. Обсуждаются результаты экспериментов, проблемы и будущие исследования

    Використання граматик вільного порядку слідування фонем і складів для пофонемного розпізнавання злитого мовлення

    Get PDF
    В статті представлені результати поточних досліджень багаторівневого багатозначного підходу до автоматичного розуміння мовлення, який призначений для мов з розвинутою словозміною та з відносно вільним порядком слів. Ідея використовувати мовленнєві образи на рівні частин слова для пофонемного розпізнавання є продуктивною, оскільки зростання обсягу лексикону практично не призводить до збільшення множини частин слова. Дослідження зосереджено на рівні пофонемного розпізнавання з метою подальшого переходу на лексичний рівень. Щоб зменшити показник помилково розпізнаних фонем, будується граматика декодера на основі вільного слідування частин слова. Подаються способи побудови множини (алфавіту) складів за текстовим корпусом. Описуються підходи до формування навчальної та контрольних вибірок для пофонемного розпізнавання злитого мовлення. Для експериментальних досліджень проведено роботу зі створення корпусу опорного диктора. Порівнюється надійність пофонемного розпізнавання з використанням граматик на основі складів і фонем. Обговорюються придатність отриманих результатів для використання в лексичному рівні, проблеми та майбутні дослідження.В работе представлены результаты текущих исследований в рамках подхода многоуровневого многозначного автоматического понимания речи, предназначенного для языков с развитым словоизменением и с относительно свободным порядком слов, поскольку рост объема лексикона практически не приводит к увеличению множества частей слова. Предлагаются способы построения множества (алфавита) слогов по текстовому корпусу. Описываются подходы к формированию обучающей выборки и контрольных выборок для фонемного распознавания слитной речи. Сравнивается надежность фонемного распознавания с использованием грамматик на основе слогов и фонем. Пригодность результатов к использованию в качестве входных данных лексического уровня является предметом будущих исследований.The paper presents advances in a multi-level automatic speech understanding approach that is initially developed for highly inflective languages with relatively free word order since word lexicon growth leads to practically no new sub-word items. The ways to select a set of sub-word units like syllables are considered. The proposed procedure to select a set of sentences containing all phoneme-triphones allowed for creation the text for training corpus. Three control sets were formed by different ways. The recognition accuracy has been compared to free phoneme order grammar. The results show the promising input for the next lexical level of the multi-level automatic speech understanding system
    corecore