The disambiguation of homonymous words in sentences by Brazilian Portuguese-Libras automatic translation applications

Abstract

Este estudo analisa a Tradução Automática (TA) de palavras homônimas isoladas e inseridas em sentenças, realizada pelos aplicativos Hand Talk (HT) e ProDeaf Móvel (PDM), ambos tradutores automáticos do Português Brasileiro (PB) para Língua Brasileira de Sinais (Libras), uma vez que estudos anteriores têm apontado para a ausência de estratégias de desambiguação, uso de datilologia e erros de tradução. Esta é uma pesquisa qualitativa exploratória fundamentada em estudos sobre o léxico da Libras, Tradução Automática, Processamento de Línguas Naturais e Desambiguação, que tem por finalidade aprofundar achados iniciais, sob o mesmo viés teórico, com vistas a propor melhorias para a TA de PB-Libras. Assim, esta pesquisa analisou a TA de 38 palavras homônimas isoladas e contextualizadas em 38 pares de sentenças (dois significados em cada par de sentença). Os resultados revelaram que na TA de palavras isoladas os aplicativos geram a tradução de apenas um dos significados das palavras homônimas (HT: 89% e PDM: 63%). Nas sentenças, o percentual de acerto do significado das palavras, em ambos os aplicativos, é menor (HT: 82% e PDM: 60%) do que na TA por palavra isolada e ainda mais reduzido (HT: 13% e PDM: 11%) na desambiguação de palavras homônimas. Os achados desta pesquisa indicam a necessidade de aperfeiçoamento do sistema de Processamento de Línguas Naturais dos aplicativos quanto à desambiguação de palavras homônimas. Infere-se que uma TA mais adequada em nível de palavra isolada e de sentença pode oferecer aos usuários traduções mais análogas à Libras em níveis semântico e sintático, enquanto língua natural e oficial da comunidade surda no Brasil.This study analyzes the Automatic Translation (AT) of homonymous words isolated and inserted in sentences, produced by Hand Talk and ProDeaf Mobile applications, both automatic translators from Brazilian Portuguese to Brazilian Sign Language (Libras), once previous studies have pointed to the absence of disambiguation strategies, use of fingerspelling and translation errors. This is an exploratory qualitative research based on studies of the lexicon of Libras, Automatic Translation, Natural Language Processing and Disambiguation, whose purpose is to deepen initial findings, under the same theoretical bias, in order to propose improvements on the AT of Portuguese Language-Libras. Thus, this study analyzed the AT of 38 homonymous words isolated and contextualized in 38 sentence pairs (two distinct meanings in each sentence pair). The results revealed that in AT of isolated words the applications generate the translation of only one of the meanings of the homonymous words (HT: 89% and PDM: 63%). In sentences, the percentage of correct word meanings, in both applications, is lower (HT: 82% and PDM: 60%) than in AT per isolated word and even lower (HT: 13% and PDM: 11 %) in the disambiguation of homonymous words. The findings of this research indicate the need to improve the Natural Language Processing system of the applications for the disambiguation of homonymous words. It is inferred that a more adequate AT at the level of isolated word and sentence can offer users more analogous translations to Libras, as the natural and official language of the deaf community in Brazil

    Similar works