Este artigo apresenta o projecto Dicionário Aberto, a construção de um dicionário aberto, livre e gratuíto, para a língua portuguesa. Para ajudar no arranque optou-se pela transcrição de um dicionário em papel no domínimo público: Novo Diccionário da Língua Portuguesa, de Cândido de Figueiredo, de 1913.
Apresentamos o processo usado para a transcrição bem como a metodo- logia usada para garantir um patamar de qualidade mínima da transcrição, e como o dicionário foi posteriormente convertido para um formato XML, per- mitindo uma maior facilidade de processamento a terceiros.
Finalmente, são discutidos os problemas existentes no uso de um dicio- nário com quase um século, e como se pretende proceder à sua modernização (de conteúdos e de grafia), e de que forma este recurso pode ser útil para o processamento da língua portuguesa.This document presents Dicionário Aberto project which aims at the construction
of an open-source and free dictionary, for the Portuguese language. To
help the bootstrap process, a paper dictionary in the public domain was transcribed:
Novo Diccionário da Língua Portuguesa, of Cândido de Figueiredo,
from 1913