Escola de Ciências e Tecnologia da Universidade de Évora
Abstract
Neste artigo apresenta-se um sistema de part-of-speech tagging, independente do domínio, para etiquetação gramatical de texto para o Português e Inglês.
O etiquetador usa informação morfo-sintáctica que vem de um dicionário local que completa a sua informação recorrendo a dicionários disponíveis na rede como o da Priberam e do LookWayUP.
Este etiquetador é baseado numa função heurística que é usada na optimização dos seus parâmetros e posterior etiquetação de texto.
Na optimização dos parâmetros da função heurística são usadas algumas das técnicas de pesquisa
local para reduzir o espaço de pesquisa.
Na avaliação do sistema usaram-se dois textos do corpora Reuters: testa (na fase treino) e testb (na fase de teste)