1 research outputs found
Compansion system for a pictogram-based AAC application in Catalan
Dissertação de mest., Processamento da Linguagem Natural e Tecnologia da Linguagem Humana, Faculdade de Ciências Humanas e Sociais, Univ. do Algarve, 2012In this project we have built a compansion (compression-expansion) system that
expands telegraphic language (utterances with only uninflected content words) into
natural language sentences in Catalan, in the context of an Augmentative and
Alternative Communication (AAC) software.
The system has been designed to improve the communication of AAC users, who
usually have severe speech or motor impairments and use pictogram-based
communication methods in their daily life. However, it can also be seen as a potential
tool to support Catalan literacy for these users and to help in the field of language
rehabilitation.
The compansion system has two main components: a syntactic-semantic
dependency parser and a generator that constructs the final sentence. A simile of an
input system has been built to allow the use of an existing AAC vocabulary (CACE).
This vocabulary has been enriched by syntactic and semantic information in view of
the parser and the generator. From the user’s input, the parser extracts sentence
patterns, based on a constraint grammar and a controlled vocabulary, taking into
account input words and their modifiers. It then assigns the remaining words to the
structural slots of those patterns, which correspond to the semantic roles of the
predicative elements and of other words’ complements. Then, the generator builds
the natural language sentence, from the resulting parse tree, reordering and
inflecting words and adding articles, prepositions and other necessary particles.
The system has been evaluated and results are most promising: 98,7% of the
sentences generated by the compansion system were considered correct by three
independent annotators.Este projecto consiste na construção de um sistema de compressão-expansão (em
inglês: compansion) que expande frases em linguagem telegráfica, isto é, frases
formadas apenas por palavras plenamente significativas e sem informação de
flexão, em frases em língua natural (Catalão), no contexto de uma aplicação em
Comunicação Suplementar e Alternativa (CSA).
O sistema foi projectado para melhorar a comunicação dos utilizadores de CSA, que
normalmente apresentam graves perturbações motoras ou de fala e que usam
métodos comunicativos baseados em pictogramas para as suas actividades
quotidianas. Contudo, o sistema pode igualmente ser considerado como uma
potencial ferramenta para apoiar a literacia em Catalão destes utilizadores e para
ajudar na reabilitação da linguagem.
O sistema de compansion tem duas componentes principais: um analisador
sintáctico-semântico (parser) e um gerador, que constrói a frase de saída. Um simile
de sistema de input foi construído de forma a permitir a utilização de um vocabulário
de CSA já existente (o CACE). Este vocabulário foi enriquecido com informação
sintáctica e semântica para poder servir tanto ao módulo de análise como de
geração. A partir do input, o parser extrai os padrões frásicos, baseados numa
gramática e vocabulários controlados, e com base na informação associada às
palavras e seus modificadores. Em seguida, atribui as palavras remanescentes às
diversas posições estruturais desses padrões frásicos, que correspondem aos
papeis semânticos associados aos diversos elementos predicativos e aos
complementos de outras palavras. Em seguida, o sistema gera a frase de saída a
partir da árvore de análise resultante, reordenando e flexionando as diversas
palavras, acrescentando artigos, preposições e outros elementos necessários a uma
expressão adequada em língua natural.
O sistema foi avaliado e os resultados são muito promissores: 98,7% das frases
geradas pelo sistema foram consideradas correctas por três anotadores
independente