Expressões proverbiais do português - usos, variação formal e identificação automática

Abstract

Os provérbios são uma expressão da cultura de uma sociedade e estão ligados às mais diversas áreas da experiência humana. Este tipo de expressões surge nos mais variados tipos de texto e desempenha diferentes funções retóricas no discurso, nele se integrando por meio de diferentes mecanismos, nem sempre fáceis de detetar formalmente. A interferência nos processos de coerência e de coesão discursivas, p. ex., a referência, e a sua variação formal, constituem sérios desafios ao processamento da linguagem natural (PLN), exigindo a sua identificação e delimitação precisas. Este projeto visa a identificação automática de provérbios portugueses (e as suas variantes) em textos, a fim de melhor caracterizar a sua utilização, tanto qualitativa como quantitativamente. Tal permitirá a definição de índices de frequência e, a partir destes, bem como de outros critérios, a determinação da disponibilidade lexical das unidades paremiológicas (o provérbio e as suas variantes). Estas informações são elementos relevantes a considerar, por exemplo, no desenvolvimento de instrumentos complementares de diagnóstico ou terapia de determinadas patologias da linguagem; ou mesmo para a construção de jogos didáticos para o ensino-aprendizagem de português, língua materna e língua não materna, eventualmente assistido por computador.Proverbs are an expression of the culture of a society and are connected to the most diverse areas of human experience. This type of expression occurs in the most diverse types of text and performs different rhetorical functions in the discourse, integrating it through several mechanisms, not always easy to detect formally. Interference in the processes of discursive coherence and cohesion, e.g. reference, and its formal variation, constitute serious challenges to Natural Language Processing (NLP), requiring its precise identification and delimitation. This project aims at the automatic identification of Portuguese proverbs (and their variants) in texts, to effectively characterize their use, both qualitatively and quantitatively. This will allow the definition of frequency indices and, from these, as well as other criteria, the determination of the lexical availability of the paremiological units (the proverb and its variants). This information is relevant elements to consider, for example, in the development of complementary diagnostic or therapeutic instruments for certain language pathologies; or even for the construction of didactic games for the teaching-learning of Portuguese, either as a Mother Tongue or as a Foreign Language, eventually assisted by computer

    Similar works