6 research outputs found

    Zarządzanie rozwojem systemów rozpoznawania mowy: problemy wydajności

    Get PDF
    Speech recognition enables the transformation of spoken words and sentences into text in digital form. This technology is a subject of numerous studies and commercial development for many years. The aim of this paper is to examine performance issues of speech recognition and to manage the development in this field. Thorough analysis of performance limitations of speech recognition systems we identified main 11 issues to overcome. They indicate the direction of managing development of speech recognition systems.Rozpoznawanie mowy umożliwia przekształcanie wypowiadanych słów i zdań w tekst w formie cyfrowej. Technologia ta jest od wielu lat przedmiotem licznych badań naukowych oraz komercyjnych. Celem niniejszego artykułu jest zbadanie zagadnień dotyczących wydajności systemów rozpoznawania mowy i zarządzanie rozwojem tych systemów. Dogłębna analiza w zakresie ograniczeń wydajnościowych systemów rozpoznawania mowy pozwoliła na zidentyfikowanie problemów, które trzeba przezwyciężyć. Wskazują one kierunek zmian w zarządzaniu rozwojem systemów rozpoznawania mowy

    BROAD PHONEME CLASSIFICATION USING SIGNAL BASED FEATURES

    Get PDF
    ABSTRACT Speech is the most efficient and popular means of human communicatio

    Extraction and Representation of Prosody for Speaker, Speech and Language Recognition

    No full text

    Extraction and Representation of Prosody for Speaker, Speech and Language Recognition

    No full text
    N/

    What do you mean? Nuclear stress in english as an international language: uses and interpretations

    Get PDF
    Tese (doutorado) - Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão, Programa de Pós-Graduação em Inglês: Estudos Linguísticos e Literários, Florianópolis, 2017.Abstract : Research has revolved around the pronunciation features that are important to guarantee speech intelligibility by speakers of English as an international language (IL). A considerable body of research has addressed segments while studies investigating suprasegments are scarce. In light of the proposition that unexpected nuclear stress (NS) placement may be one of the villains for communication breakdowns among speakers in the international community (Jenkins, 2000), the present study investigated how NS placement in English by 14 Brazilian Portuguese (L1-BP) speakers of English influenced the way their intents were interpreted by 14 IL-English listeners from a variety of nationalities. Participants met in pairs (a speaker and a listener) and engaged in four pairwork tasks. Task 1 aimed at making participants more comfortable with the presence of each other. Tasks 2, 3, and 4 yielded the production of 501 audio-recorded utterances that had information being elicited, corrected, and contrasted, with NS in three different utterance positions (initial, medial, and final), and with the presence of complex words (non-challenging, short-challenging, and long-challenging), and 378 interpretations made available by checking one out of three options in the listeners? sheets. Besides the tasks, other instruments used were: (a) a questionnaire, (b) a Word Familiarity Test, (c) a Pronunciation Self-Evaluation Test, and (d) an interview with the listeners. Data analysis showed that L1-BP speakers had difficulties to convey important information by means of NS especially if the information was located in the rightmost end of the utterance, and that the perception of NS in utterance-initial position were easier to perceive. It was also found that contrasting information by means of questions was more difficult if compared to eliciting and correcting information in statements, and that NS used to signal information being corrected showed more expected perceptions and interpretations. As to the presence of complex words in the utterances, it was found that both short- and long-challenging words hindered the expected NS placement and, in terms of perception, NS in utterances with long-challenging words were misperceived more often. Finally, results showed that unexpected NS placement caused noise to communication or even led to communication breakdowns, despite the convergence strategies (Giles, H. Coupland, & J. Coupland, 1991) developed by the listeners in order to accommodate to speakers? speech. These findings support the importance of teaching BP-L1 speakers of English (a) to break speech into meaningful units by avoiding unnecessary pauses, (b) to use NS in order to signal important information (narrow-focus contexts), (c) to destress unimportant information, and (d) to place word stress in English long words.Pesquisadores têm investigado quais aspectos da pronúncia são importantes para garantir um discurso inteligível por parte de falantes de inglês como língua internacional. Um corpo considerável de estudos tem investigado os segmentos enquanto estudos investigando os suprassegmentos são escassos. Tendo em vista a assertiva de que o uso inesperado do acento nuclear é um dos grandes vilões para falhas em comunicação entre falantes da comunidade internacional (Jenkins, 2000), este estudo investigou como o uso do acento nuclear em inglês de 14 falantes brasileiros de inglês influenciou o modo como suas intenções foram interpretadas por 14 ouvintes de inglês como língua internacional de diferentes nacionalidades. Os participantes se encontraram em duplas (um falante e um ouvinte) e realizaram quatro tarefas. A Tarefa 1 tinha como objetivo fazer com que os participantes se sentissem mais confortáveis na presença um do outro. As Tarefas 2, 3 e 4 deram origem à produção de 501 enunciados, gravados em áudio, com informações sendo buscadas, corrigidas e contrastadas, com o acento nuclear em três locais diferentes no enunciado (início, meio, final) e com a presença de palavras complexas (simples, complexas curtas e complexas longas). Essas tarefas também originaram 378 interpretações feitas através da escolha de uma das três opções para cada enunciado apresentadas nas folhas dos ouvintes. Além das tarefas, outros instrumentos foram utilizados: (a) um questionário, (b) um Teste de Familiaridade com o Vocabulário, (c) um Teste de Auto-Avaliação da Pronúncia e (d) uma entrevista com os ouvintes. A análise dos dados demonstrou que os falantes brasileiros tiveram dificuldades para transmitir informações importantes por meio do acento nuclear, principalmente se a informação estivesse localizada ao final do enunciado, e que o acento nuclear em posição inicial foi percebido com mais facilidade do que quando em outras posições. Também foi evidenciado que contrastar informações em enunciados interrogativos foi mais difícil do que fornecer e corrigir informações em declarativas. Com relação à presença de palavras complexas, constatou-se que tanto palavras complexas curtas quanto palavras complexas longas prejudicaram o uso esperado do acento nuclear e que, em termos de percepção, o acento nuclear em enunciados com palavras complexas longas foram mais frequentemente não percebidos. Finalmente, os resultados indicaram que o uso inesperado do acento nuclear causou ruídos à comunicação ou, até mesmo, levou a falhas na comunicação, apesar de os ouvintes terem desenvolvido estratégias de convergência (Giles, H. Coupland & J. Coupland, 1991) para se acomodarem ao discurso dos falantes. Esses resultados destacam a importância de se ensinar, aos falantes brasileiros de inglês, como (a) quebrar o discurso em unidades significativas, evitando-se pausas desnecessárias, (b) usar o acento nuclear para sinalizar a informação importante no enunciado (em contextos de foco estreito), (c) retirar a proeminência de informações que não sejam importantes e como (d) atribuir o acento lexical na sílaba adequada em palavras longas em inglês
    corecore