Search CORE

2 research outputs found

Формирование персональной модели голоса диктора с универсальным фонетическим пространством признаков на основе искусственной нейронной сети

Author: Азаров Илья Сергеевич
Петровский Александр Александрович
Publication venue: СПб ФИЦ РАН
Publication date: 16/12/2014
Field of study

The paper investigates possibility of creating a personal voice model using transcribed speech samples of a specified speaker. The paper presents a practical way of building such speech model and some experimental results of applying the model to voice conversion. The model uses an artificial neural network organized as autoencoder that establishes correspondence between space of speech parameters and space of possible phonetic states, unified for any voice.В работе исследуется возможность формирования модели голоса заданного диктора на основе записей образцов его голоса с транскрипцией. В работе предлагается практический способ построения голосовой модели и результаты экспериментов ее применения к задаче конверсии голоса. Модель использует искусственную нейронную сеть, устроенную по принципу автоматического кодера, устанавливающую соответствие между пространством речевых параметров и пространством возможных фонетических состояний, унифицированным для произвольного голоса

Информатика и автоматизация