research

Dicionário aberto : um recurso para processamento de linguagem natural

Abstract

Este artigo apresenta o projecto Dicionário Aberto, a construção de um dicionário aberto, livre e gratuíto, para a língua portuguesa. Para ajudar no arranque optou-se pela transcrição de um dicionário em papel no domínimo público: Novo Diccionário da Língua Portuguesa, de Cândido de Figueiredo, de 1913. Apresentamos o processo usado para a transcrição bem como a metodo- logia usada para garantir um patamar de qualidade mínima da transcrição, e como o dicionário foi posteriormente convertido para um formato XML, per- mitindo uma maior facilidade de processamento a terceiros. Finalmente, são discutidos os problemas existentes no uso de um dicio- nário com quase um século, e como se pretende proceder à sua modernização (de conteúdos e de grafia), e de que forma este recurso pode ser útil para o processamento da língua portuguesa.This document presents Dicionário Aberto project which aims at the construction of an open-source and free dictionary, for the Portuguese language. To help the bootstrap process, a paper dictionary in the public domain was transcribed: Novo Diccionário da Língua Portuguesa, of Cândido de Figueiredo, from 1913

    Similar works