Associação Portuguesa de Sistemas de Informação (APSI)
Abstract
O Método de Reconstituição de Paróquias, no qual os Historiadores Demógrafos do Núcleo de Estudos da
População e Sociedade (NEPS) baseiam o seu trabalho para analisar o comportamento das populações ao
longo dos quatro últimos séculos - através do estudo de factores como a natalidade, a fecundidade, a
nupcialidade, a mortalidade e a mobilidade -, assenta na tratamento dos registos paroquiais de baptizados,
casamentos e óbitos. Da leitura local e exaustiva desses documentos são extraídos os dados que permitem
fazer a reconstituição das famílias. Uma vez estáveis, os dados são armazenados em Bases de Dados
Paroquiais, que são posteriormente fundidas numa única Base de Dados Central sobre a qual actuam as
ferramentas de análise.
A norma XML (eXtensible Markup Language) define um método de anotação de documentos, estabelecendo
os princípios gerais de estruturação de textos e a sintaxe das marcas a usar. Documento original e marcas
formam um ficheiro único de texto ASCII puro, independente de qualquer plataforma de hardware/software.
A anotação estabelece a estrutura do documento e dá interpretação a determinados elementos nele contidos,
sem qualquer informação de formatação ou transformação—é, portanto, também independente da aplicação
final. Ao contrário de outros sistemas de anotação, a norma XML não estabelece um conjunto de anotações
fixo, para um caso específico ou para todos os casos; ao invés é uma metalinguagem que indica como definir
as anotações próprias de cada família de documentos.
Neste artigo é apresentada uma aplicação do XML ao domínio da Demografia, nomeadamente na Anotação
dos Registos Paroquiais analisados pelos Historiadores Demógrafos. Concretamente, discute-se o
desenvolvimento de um XML-Schema para definir uma instância de XML (a linguagem Schema-RP) para
anotação dos Registos Paroquiais. Assim é possível construir uma Base de Dados Documental que contém,
em formato electrónico, os registos originais devidamente marcados. O conteúdo desta Base de Dados
apresenta-se mais rico quando comparado com as respectivas Bases de Dados Paroquiais, uma vez que
permite: i) a reconstrução das fontes históricas originais, reproduzindo-as em diferentes meios, facilitando a
sua disseminação; ii) a extracção dos dados necessários ao carregamento das referidas Bases de Dados
Paroquiais; iii) a análise dos documentos por diversas áreas de estudo, como por exemplo, a linguística.
Este artigo evidencia ainda o processo de edição anotada dos documentos e exemplifica duas transformações
possíveis dos mesmos: a visualização em HTML; e a geração automática de SQL para alimentação das Bases
de Dados