2 research outputs found

    Descrição, classificação e processamento automático das construções com o verbo 'dar' em português brasileiro

    Get PDF
    The Apendice_A.xlsx file is the table of properties of the predicational nouns described in the thesis.This PhD thesis starts from the observation of constructions with the verb 'dar' ('give') in Brazilian Portuguese and it proposes an analysis and classification of these constructions. The analysis of all constructions found in corpus is systematic and consistent, based on Transformational Grammar (HARRIS, 1964) and on the Lexicon-Grammar approach (GROSS, 1975; GROSS, 1981). Both theories adopt formal and experimental criteria to make reproducible the identification of base sentences and the classification of constructions with the verb 'dar'. The classification is based on structural and syntactic properties, leading to four classes or categories: (i) full verb or distributional verb, from which 8 verbal senses could be identified; (ii) causative operator verb, whose constructions could be subclassified in 4 groups, depending on the semantic type of the predicative noun; (iii) the verb as a fixed element, in idioms or in proverbs; and (iv) support verb, which is selected by a predicational noun. The first part of this thesis analyzes the constructions with the verb 'dar' as a full verb, as a causative operator verb and as a fixed verb. The second part of this thesis describes the support verb constructions (SVC), which are formed by the support verb 'dar' (Vsup) and the predicational noun (Npred). This description is extensive, considering all the occurrences in the corpus adopted and identifying the main formal, distributional and transformational SVC properties. These properties were described and formalized in a Lexicon-Grammar table, which is a binary matrix: each line corresponds to a lexical entry (Npred) and each column corresponds to a syntactic property of the construction. In the intersection between each line and each column, we marked by the sign “+” or “-” if the property is verified or not. The third part of the thesis presents an automatic syntactic analysis of SVCs, by using an approach based on dependency rules between their constituents. The rules are automatically generated from the L-G matrix data and, then, those rules are used by the parser in order to extract the dependency between the Npred and the Vsup. Thus, this work aims to advance the state of the art of the general verbal classification in Portuguese and Automatic Processing of Natural Languages, to contribute to the development of computational-lexical resources (the Lexicon-Grammar of nominal constructions) and to automatic parsing.Cette thèse part de l'observation des constructions à verbe "dar" ("donner") dans des corpus en portugais du Brésil. Elle en propose une analyse et une classification systématiques et cohérentes sur la base de la grammaire transformationnelle d'opérateurs (Harris, 1964, 1978) et du modèle théorico-méthodologique du lexique-grammaire (Gross, 1975, 1981). Les deux théories adoptent des critères formels/structurels et des procédés expérimentaux reproductibles pour identifier les phrases de base que nous adoptons pour la classification des constructions à verbe "dar". La classification de ces constructions se fonde sur leur structure et sur leurs propriétés syntaxiques. Quatre catégories ou types de constructions fondamentales où figure ce verbe ont été identifiées : (1) verbe plein (distributionnel), où sont identifiés 8 sens différents ; (2) verbe opérateur causatif ; (3) verbe élément d'une phrase figée, soit dans des expressions figées, soit dans des proverbes ; et (4) verbe support, un type particulier d'auxiliaire sélectionné par un nom prédicatif.La première partie de la thèse analyse les trois premiers types syntaxico-sémantiques du verbe "dar" : plein, causatif et figé. La deuxième partie analyse et décrit les constructions à verbe support (CVS) formées par le verbe support (VSup) "dar" et un nom prédicatif (Npred). Cette description est systématique et vise à recenser le plus possible de constructions dans les corpus et à identifier les principales propriétés formelles, distributionnelles et transformationnelles des CVS. Les propriétés sont formalisées au moyen d'une table de lexique-grammaire, c'est-à-dire une matrice de données qui représente de façon compacte les informations linguistiques pertinentes à la description de ces constructions. La troisième partie de la thèse présente une proposition d'analyse syntaxique automatique des CVS par une méthode fondée sur des règles de dépendance entre leurs constituants. Les règles sont produites automatiquement à partir des informations présentes dans la matrice de lexique-grammaire, puis utilisées par l'analyseur syntaxique automatique pour extraire une dépendance entre le Npred et le Vsup en identifiant la CVS. Ainsi, ce travail a pour but de faire progresser l'état de l'art de la classification générale des verbes en portugais et du traitement automatique des langues naturelles, en contribuant à la tâche d'analyse syntaxique automatique par le développement de ressources lexico-computationnelles (le lexique-grammaire des constructions nominales).Esta tese parte da observação das construções com o verbo "dar" em corpus em português brasileiro e propõe uma análise e classificação dessas construções, de forma sistemática e consistente, com base na Gramática Transformacional de operadores (HARRIS, 1964; HARRIS, 1978) e no modelo teórico-metodológico do Léxico-Gramática (GROSS, 1975; GROSS, 1981). Ambas as teorias adotam critérios formais/estruturais e procedimentos experimentais reprodutíveis para a identificação das frases de base e que adotamos para a classificação das construções com o verbo "dar". A classificação dessas construções foi baseada em suas estruturas e propriedades sintáticas, tendo sido identificadas quatro categorias ou tipos de construções fundamentais em que esse verbo ocorre: (i) verbo pleno (distribucional), de onde se identificam 8 sentidos diferentes; (ii) verbo-operador causativo; (iii) o verbo constituinte de uma frase fixa, seja em expressões cristalizadas seja em provérbios; e (iv) verbo-suporte, um tipo particular de auxiliar que é selecionado por um nome predicativo.A primeira parte da tese analisa os três primeiros tipos sintático-semânticos do verbo "dar" (pleno, causativo e fixo). A segunda parte da tese analisa e descreve as construções com verbo-suporte (CVS), formadas pelo verbo-suporte (Vsup) "dar" e um nome predicativo (Npred). Essa descrição é sistemática, buscando recensear o máximo possível de construções em corpus e identificando as principais propriedades formais, distribucionais e transformacionais das CVS. As propriedades são formalizadas por meio de uma matriz de dados, a qual representa de maneira compacta a informação linguística relevante para a descrição dessas construções. A terceira parte da tese apresenta uma proposta de análise sintática automática das CVS, usando uma abordagem baseada em regras de dependência entre seus constituintes. As regras são geradas automaticamente a partir das informações constantes na matriz do Léxico-Gramática e, em seguida, são usadas pelo analisador sintático automático para extrair uma dependência entre o Npred e o Vsup ao identificar a CVS. Assim, este trabalho objetiva avançar o estado da arte da classificação geral dos verbos em português e do Processamento Automático de Línguas Naturais, no sentido de contribuir com o desenvolvimento de recursos léxico-computacionais (o Léxico-Gramática das construções nominais) para a tarefa de análise sintática automática

    Avaliação de métodos de desofuscação de palavrões

    No full text
    Os palavrões são uma forma de expressão notável pela sua intensidade. Quando uma pessoa recorre a este tipo de expressão emite uma opinião ou avaliação espontânea e crua, que muitas vezes é suprimida em nome dos "bons costumes'' e sensibilidades. Acontece que esta forma de expressão tem também valor aquando de certas análises de opinião e de sentimentos, que são operações já feitas de forma rotineira nas redes sociais. Daí que neste trabalho procuramos avaliar os métodos que permitem recuperar e reconhecer estas formas de expressão que foram disfarçadas através de ofuscação, muitas vezes como forma de evasão à censura automática
    corecore