257 research outputs found

    Uso de uma ferramenta de processamento de linguagem natural como auxílio à coleta de exemplos para o estudo de propriedades sintático-semânticas de verbos

    Get PDF
    National audienceThe analysis and description of syntactic-semantic properties of verbs are fundamental both to the knowledge of the grammar of a language and to the automatic processing of natural language, as an encoded form of this description can be exploited by automatic tools. This paper experiments with the use of Unitex, a natural language processing tool, to collect a list of verbs that can be analysed and described by a linguist. This work contributes significantly to linguistics, by decreasing the human manual effort in the search for verbs. A case study is performed to partially automate the collection of verbs in -ecer with adjectival basis in a corpus of 47 million words. The proposed approach is compared with manual collection and with extraction from an NLP dictionary.A análise e descrição de propriedades sintático-semânticas de verbos são importantes para a compreensão do funcionamento de uma língua e fundamentais para o processamento automático de linguagem natural, uma vez que a codificação dessa descrição pode ser explorada por ferramentas que realizam esse tipo de processamento. Esse trabalho experimenta o uso do Unitex, uma ferramenta de processamento de linguagem natural, para coletar uma lista de verbos que podem ser analisados e descritos por um linguista. Isso contribui significativamente para esse tipo de estudo linguístico, diminuindo o esforço manual humano na busca de verbos. Foi realizado um estudo de caso para automatizar parcialmente a coleta de verbos de base adjetiva com sufixo-ecer em um corpus de 47 milhões de palavras. A abordagem proposta é comparada com a coleta manual e a extração a partir de um dicionário para o PLN

    Sistema orientado por um modelo de função baseado na abordagem linguística para formalizar conhecimento funcional no projeto de peça

    Get PDF
    Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-graduação em Engenharia Mecânica.O modelo clássico de função é descrito textualmente por "um verbo" e "um substantivo" e é baseado exclusivamente na abordagem funcional. Embora existam várias formas de se descrever textualmente uma função em linguagem natural durante a modelagem de cada funcionalidade de produto e peça, a maioria delas não é suportada pelo modelo clássico de função que é tradicionalmente aceito pelas metodologias de projeto. O modelo clássico de função tem protagonizado nesses últimos anos, nas pesquisas relacionadas às metodologias de projeto, uma série de insatisfações como, e.g., a incapacidade de: (i) formalizar conhecimento funcional; (ii) inter-relacionar os vários tipos de conhecimento funcional que é incluído em uma função; (iii) reusar conhecimento funcional. Assim, para superar estas limitações amplamente propagadas na literatura sobre metodologia de projeto, apresenta-se um modelo de função baseado na abordagem lingüística que é uma extensão do modelo de função de Roy e Bharadway (que foi estendido do modelo de função de Pahl e Beitz). A metodologia utilizada nesta pesquisa é empírica e qualitativa. A metodologia é: (i) empírica por causa das pesquisas e implementações de ferramentas computacionais necessárias na coleta de descrições textuais de função em linguagem natural relacionadas a diversos tipos de produto e peça para organizar um corpus lingüístico de sentenças funcionais; (ii) qualitativa devido aos processos de análise das funções do corpus lingüístico de sentenças funcionais como, e.g., a: (a) análise e síntese das várias formas de se descrever as funções;(b) análise morfológica (análises sintática, semântica, do discurso e pragmática) das funções necessária na sistematização das características sintáticas, semânticas e estruturas gramaticais delas. O resultado mais significativo desse trabalho de pesquisa foi o desenvolvimento de um modelo de função baseado na abordagem lingüística que consegue integrar três diferentes abordagens: (i) abordagem funcional, para suportar o conceito de decomposição funcional; (ii) abordagem comportamental, para apoiar o conceito de conhecimento comportamental; (iii) abordagem lingüística, para tratar os portadores de conhecimento funcional (constituintes, e.g., verbo, substantivo abstrato/concreto simples/composto, advérbio, adjetivo). A integração das abordagens possibilita a identificação, categorização, definição e inter-relacionamento entre os vários tipos de conhecimento incluído em apenas uma função. O modelo de função foi implementado em um sistema protótipo denominado de SISFCO (AL) - Sistema de suporte à formalização de conhecimento funcional baseado na abordagem lingüística. O SISFCO (AL) foi testado com engenheiros mecânicos do Curso de Pós-Graduação em Engenharia Mecânica de Santa Catarina, nesse teste preliminar os resultados foram satisfatórios. Todavia, há a necessidade de pesquisas adicionais com o SISFCO (AL) em diferentes domínios de aplicação. O modelo de função proposto vem contribuir com as: (i) áreas de pesquisas relacionadas aos sistemas de conhecimento baseado em linguagem natural aplicados à metodologia de projeto; (ii) pesquisas direcionadas para a integração de conhecimento funcional e informação geométrica. Nessa perspectiva, esta tese pode contribui para a efetiva integração entre as etapas iniciais (projeto informacional e conceitual) e finais (projeto preliminar e detalhado) das metodologias de projeto de produto. Contudo, ressalta-se que no momento, "este trabalho de pesquisa foi direcionado apenas para a primeira atividade da etapa do projeto conceitual de peça"

    Modelagem de construções de pretérito imperfeito

    Get PDF
    Este trabajo tiene como objetivo presentar la descripción y el modelado de construcciones de Pretérito Imperfecto en portugués brasileño (PT-Br) y español (ES) para contribuir al desarrollo de un sistema de traducción por máquina que utiliza la base de datos enriquecida de FrameNet Brasil (FN -Br) para mejorar el resultado de los sistemas de traducción por máquina. Primero, se realizó un análisis bibliográfico de las construcciones de Pretérito Imperfecto en PT-Br y en ES. Posteriormente, para certificar las ocurrencias de esa construcción, se constituyó un corpus con ocurrencias de Pretérito Imperfecto en PT-Br y en ES compuesto por datos tomados de cuentos (en lengua meta y versión traducida) de Machado de Assis y García Marques. Según los datos, se notó que había casos de discrepancia entre los usos del Imperfecto. Luego, los contextos de discrepancia fueron analizados entre las traducciones de PT-Br a ES y de ES a PT-Br. El análisis indicó que el Constructicon de la FN-Br, en los moldes actuales, no admite construcciones morfológicas. De esta manera, se propuso la inclusión de un recurso en el Constructicon para almacenar los modelos lingüístico computacionales, en forma de construcciones morfológicas. Para eso, se pretende incorporar restricciones de modo, aspecto y tiempo verbal aplicadas a construcciones del tipo Pretérito Imperfecto.Este trabalho visa apresentar a descrição e a modelagem de construções de Pretérito Imperfeito em Português Brasileiro (PT-Br) e em Espanhol (ES) de modo a contribuir para o desenvolvimento de um sistema de tradução por máquina que utiliza a base de dados enriquecida da FrameNet Brasil (FN-Br) para melhorar o resultado de sistemas de tradução por máquina. Primeiramente, fizemos o levantamento bibliográfico das construções de Pretérito Imperfeito em PT-Br e em ES. Posteriormente, para atestar as ocorrências dessa construção, constituímos um corpus com ocorrências de Pretérito Imperfeito em PT-Br e em ES composto por dados retirados de contos (em língua alvo e versão traduzida) de Machado de Assis e García Marques. Com base nos dados, notamos que havia ocorrências de discrepância entre usos do Imperfeito. Logo, passamos à análise dos contextos de discrepância entre as traduções do PT-Br para ES e do ES para PT-Br. A análise indicou que o Constructicon da FN-Br, nos moldes atuais, não comporta construções morfológicas. Dessa forma, propomos a inclusão de um recurso no Constructicon para armazenar modelos linguístico-computacionais na forma de construções morfológicas. Para tanto, pretendemos incorporar restrições de modo, aspecto e tempo verbal aplicadas a construções do tipo Pretérito Imperfeito

    Dicionários de aprendizes : uma abordagem interdisciplinar para o seu aperfeiçoamento

    Get PDF
    Embora existam dicionários específicos para o ensino-aprendizagem de inglês e de espanhol como língua estrangeira, essas obras são compiladas sem que se tenha um perfil de usuário bem delimitado. Consequentemente, fatores importantes atinentes ao usuário, tais como o seu conhecimento prévio e as suas necessidades de aprendizagem – dentre as quais estão as combinatórias léxicas – raramente são levados em conta. Essa limitação termina distanciando o dicionário de aprendizes do contexto de ensino-aprendizagem no qual está inserido o seu consulente, prejudicando o didatismo da obra lexicográfica. O objetivo da tese foi explorar e aplicar princípios teórico-metodológicos para um aprimoramento do desenho de dicionários de aprendizes de língua inglesa e de língua espanhol destinados aos níveis A2 e B1 de aprendizagem. O aprimoramento a que se refere a tese diz respeito à determinação de um perfil de usuário e à descrição de combinatórias léxicas. Trata-se de uma pesquisa de cunho eminentemente teórico, na qual se analisam diferentes perspectivas teóricas que servem de base para a elaboração de propostas de descrição lexicográfica. Nesse sentido, foi adotada uma abordagem interdisciplinar, de forma a buscar subsídios não somente na Metalexicografia, mas também em outras áreas: Linguística Aplicada, Ciência Cognitiva, Linguística Contrastiva e Lexicologia. A Linguística Aplicada, a Ciência Cognitiva e a Linguística Contrastiva tiveram um papel fundamental no aprofundamento das variáveis Metalexicográficas que definem o perfil de usuário de um dicionário de aprendizes. A Metalexicografia, por sua vez, forneceu subsídios relativos à constituição de segmentos informativos de um dicionário de aprendizes. A Lexicologia, por fim, forneceu subsídios relativos às combinatórias léxicas. Como resultado, foi possível elaborar uma série de orientações e propostas a respeito da determinação do perfil de usuário, da redação de paráfrases explanatórias e notas de uso e da descrição de combinatórias léxicas. A principal conclusão da tese é a de que as limitações teóricas da Metalexicografia podem ser superadas com o auxílio de outras áreas do conhecimento. A aplicação das propostas feitas na tese depende, no entanto, da sua testagem em massa com mais itens e de pesquisas empíricas junto ao seu público-alvo.Aunque existen diccionarios específicos para la enseñanza y aprendizaje de inglés y español como lengua extranjera, estos diccionarios se compilan sin que se establezca un perfil de usuario bien definido. En consecuencia, factores importantes relativos al usuario, como su conocimiento previo y sus necesidades de aprendizaje – entre ellas las combinatorias léxicas – rara vez se tienen en cuenta. Esta limitación acaba por alejar el diccionario de aprendices del contexto de enseñanza-aprendizaje en el que se inserta su público, perjudicando el carácter didáctico de la obra lexicográfica. El objetivo de la tesis fue explorar y aplicar principios teórico-metodológicos para mejorar el diseño de diccionarios de aprendices de inglés y español orientados a los niveles de aprendizaje A2 y B1. La mejoría a que se refiere la tesis se refiere a la determinación de un perfil de usuario y a la descripción de combinaciones léxicas. Se trata de una investigación eminentemente teórica, en la que se analizan diferentes perspectivas teóricas que sirven de base para la elaboración de propuestas para la descripción lexicográfica. En este sentido, se adoptó un enfoque interdisciplinario con el fin de buscar respuestas no solo en Metalexicografía, sino también en otras áreas: Lingüística Aplicada, Ciencias Cognitivas, Lingüística Contrastiva y Lexicología. La Lingüística Aplicada, las Ciencias Cognitivas y la Lingüística Contrastiva desempeñaron un papel fundamental en la profundización de las variables metalexicográficas que definen el perfil de usuario de un diccionario de aprendices. La Metalexicografía, a su vez, forneció orientaciones acerca de la constitución de los segmentos informativos de un diccionario de aprendices. Finalmente, la Lexicología aclaró cuestiones relativas a las combinatorias léxicas. Como resultado, fue posible elaborar una serie de orientaciones y propuestas en cuanto a la determinación del perfil de usuario, a la redacción de paráfrasis explanatorias y notas de uso, y la descripción de combinatorias léxicas. La principal conclusión de la tesis es que las limitaciones teóricas de la Metalexicografía se pueden superar con la ayuda de otras áreas del conocimiento. La aplicación de las propuestas de la tesis depende, sin embargo, de su testeo masivo con más ítems y de la investigación empírica junto al público a quien se dirigen.Although there are specific dictionaries for teaching and learning English and Spanish as a foreign language, these dictionaries are compiled without a well-defined user profile. Consequently, important factors concerning the user, such as their prior knowledge and their learning needs – among which are lexical combinations – are rarely taken into account. This limitation ends up distancing the learner's dictionary from the teaching-learning context of its user, hindering the didactic nature of the lexicographical work. This thesis aimed to explore and apply theoretical-methodological principles to improve the design of EFL and SFL dictionaries to learning levels A2 and B1. The improvement concerns the determination of a user profile and the description of lexical combinations. This is an eminently theoretical research, in which we analyse different theoretical perspectives that serve as a basis for proposals for a lexicographical description. In this sense, an interdisciplinary approach was adopted, in order to seek support not only in Metalexicography, but also in other areas: Applied Linguistics, Cognitive Science, Contrastive Linguistics and Lexicology. Applied Linguistics, Cognitive Science and Contrastive Linguistics played a fundamental role in deepening the Metalexicographical variables that define the user profile of a learner's dictionary. Metalexicography, in turn, provided theoretical support related to informative segments of a learner's dictionary. Finally, Lexicology provided theoretical support about lexical combinations. As a result, it was possible to draw up a series of guidelines and proposals regarding the determination of the user profile, the writing of definitions and usage notes, and the description of lexical combinations. The main conclusion of the thesis is that the theoretical limitations of Metalexicography can be overcome with the help of other areas of knowledge. To apply the proposals of the thesis it is necessary, h To apply the proposals of the thesis it is necessary, however, to conduct a mass testing with more items and empirical research with the user profile

    Proposta de dicionário de aprendizagem : descrição de alguns verbos no contexto do Português do Brasil como segunda língua

    Get PDF
    Tese (doutorado)—Universidade de Brasília, Instituto de Letras, Departamento de Linguística, Português e Línguas Clássicas, Programa de Pós-Graduação em Linguística, 2015.Esta pesquisa foi desenvolvida no Centro de Estudos Lexicais e Terminológicos - Centro Lexterm – e está inserida na linha de pesquisa Léxico e Terminologia do Programa de Pós-Graduação em Linguística - PPGL - do Departamento de Linguística, Português e Línguas Clássicas - LIP- da Universidade de Brasília - UnB. A pesquisa é de natureza qualitativa e o método descritivo foi adotado para que os fatos de língua sejam coletados, observados, registrados e analisados. O objeto de estudo é a categoria verbo da língua portuguesa com o objetivo de elaborar uma proposta de dicionário de aprendizagem de verbos do Português do Brasil como segunda língua. As razões para a escolha deste objeto de estudo respaldam-se na natureza do verbo, que ocupa lugar privilegiado nos enunciados, pois contém informações que dão movimento ao discurso, que engloba estados e eventos dentro do universo conceitual humano e, desse modo, seleciona e restringe os argumentos que o acompanham nos enunciados, por isso deve ser lexicografado dentro de base teórica e critérios linguísticos e extralinguísticos. Assim, esta pesquisa apresenta noções acerca da aprendizagem de língua, na perspectiva de segunda língua –L2, da natureza do léxico, dos atributos do verbo e dos princípios teóricos da lexicografia para aprendizagem de línguas. A pesquisa sustenta-se na base epistemológica da Gramática Discursivo-Funcional - GDF de Hengeveld e Mackenzie (2008, 2010), nos estudos teóricos de Chafe (1979), na teoria de valência Borba (1996 e 2003) e da Lexicologia e da Lexicografia, de Rey-Devobe (1971, 1984), Haensch (1982, 1997), Faulstich (1990, 1993, 1998 e 2010) e Lara (1997). A GDF inclui a interação verbal na análise de língua, além das expressões linguísticas, e inclui o componente conceitual, componente contextual, componente de saída na interação verbal, que se interligam ao componente gramatical por meio de operações de formulação e de codificação, seguindo uma organização hierárquica, a top down. Os estudos de Chafe (1979) e Borba (1996) apresentam o sistema sintático-semântico que descreve características dos verbos como de estado, de ação, de processo e de estado-processo, além das informações morfossitáticas como número, pessoa, tempo e modo. A análise dos significados dos verbos é apresentada segundo aspectos sintático-semânticos em enunciados relacionados a 17 contextos situacionais, a saber: alimentação, atividades comerciais, atividades domésticas, clima e tempo, crime e violência, educação, esporte, lazer, moradia, profissão e trabalho, relações sociais, trânsito e transporte, vestimentas e indumentárias e viagem e hospedagem. O resultado deste estudo é a apresentação da proposta Dicionário de aprendizagem de verbos do português do Brasil como segunda língua – Dicverb/PL2 -, para aprendizes da língua portuguesa, em fase inicial de aprendizagem. O Dicveb/PL2 visa a oferecer meios que auxiliem a aprendizagem dos verbos de modo eficiente, dentro de contextos linguístico, situacionais e culturais existentes na língua portuguesa falada no Brasil.This research was developed in Centro de Estudos Lexicais e Terminológicos – Centro Lexterm - and it is inserted in the search line Lexicon and Terminology of the Graduate Program in Linguistics - PPGL - Department of Linguistics, Portuguese and Classical Languages - LIP- University of Brasilia - UnB. The research is qualitative and the descriptive method was adopted for the facts of language are collected, observed, recorded, analyzed. The study object is the verb category of the Portuguese language in order to draft a Portuguese verb learning dictionary of Brazilian Portuguese as a second language – L2. The reasons for choosing this object is because the nature of the verb, that is a kind of word that occupies a special place in the statements, because it contains information that gives movement to the speech, this is a type of word which encompasses states and events within the human conceptual universe and thus selects and restricts the arguments that follow it in the statements, so it should be described in dictionary within theoretical basis and linguistic and extralinguistic criteria. Thus, this research presents notions about language learning from the perspective of second language -L2, the nature of the lexicon, the verb attributes and theoretical principles of pedagogical lexicography. The research supports on the epistemological basis of Functional Discourse Grammar - GDF Hengeveld and Mackenzie (2008, 2010), Chafe (1979) and Borba (1996 and 2003), Lexicology and Lexicography, Rey-Devobe (1971, 1984), Haensch (1982, 1997), Faulstich (1990, 1993, 1998 and 2010) and Lara (1997). The GDF includes discursive interaction in the language analysis beyond linguistic expressions, and includes conceptual component, context component output component verbal interaction which interconnect the grammar component by means of formulation and coding operations, following a hierarchical organization, the top down. The study of Chafe (1979) and Borba (1996) presents the syntactic-semantic system that describes characteristics of verbs such as state, action, process and state-process, in addition to morphosyntactic information such as number, person, time and mode. The analysis of the meanings of the verb is presented according to syntactic-semantic aspects in statements related to 17 situational contexts, namely food, business activities, domestic activities, climate and weather, crime and violence, education, sport, leisure, housing, occupation and work, social relations, traffic and transportation, clothing and costumes and travel and lodging. The result of this study is presenting the proposal Dicionário de aprendizagem de verbos do português do Brasil como segunda língua – Dicverb/PL2 -, for beginners of Portuguese Language. The Dicveb/PL2 aims at offering means to assist in verb learning efficiently within Brazilian linguistic, situational and cultural contexts

    Descrição, classificação e processamento automático das construções com o verbo 'dar' em português brasileiro

    Get PDF
    The Apendice_A.xlsx file is the table of properties of the predicational nouns described in the thesis.This PhD thesis starts from the observation of constructions with the verb 'dar' ('give') in Brazilian Portuguese and it proposes an analysis and classification of these constructions. The analysis of all constructions found in corpus is systematic and consistent, based on Transformational Grammar (HARRIS, 1964) and on the Lexicon-Grammar approach (GROSS, 1975; GROSS, 1981). Both theories adopt formal and experimental criteria to make reproducible the identification of base sentences and the classification of constructions with the verb 'dar'. The classification is based on structural and syntactic properties, leading to four classes or categories: (i) full verb or distributional verb, from which 8 verbal senses could be identified; (ii) causative operator verb, whose constructions could be subclassified in 4 groups, depending on the semantic type of the predicative noun; (iii) the verb as a fixed element, in idioms or in proverbs; and (iv) support verb, which is selected by a predicational noun. The first part of this thesis analyzes the constructions with the verb 'dar' as a full verb, as a causative operator verb and as a fixed verb. The second part of this thesis describes the support verb constructions (SVC), which are formed by the support verb 'dar' (Vsup) and the predicational noun (Npred). This description is extensive, considering all the occurrences in the corpus adopted and identifying the main formal, distributional and transformational SVC properties. These properties were described and formalized in a Lexicon-Grammar table, which is a binary matrix: each line corresponds to a lexical entry (Npred) and each column corresponds to a syntactic property of the construction. In the intersection between each line and each column, we marked by the sign “+” or “-” if the property is verified or not. The third part of the thesis presents an automatic syntactic analysis of SVCs, by using an approach based on dependency rules between their constituents. The rules are automatically generated from the L-G matrix data and, then, those rules are used by the parser in order to extract the dependency between the Npred and the Vsup. Thus, this work aims to advance the state of the art of the general verbal classification in Portuguese and Automatic Processing of Natural Languages, to contribute to the development of computational-lexical resources (the Lexicon-Grammar of nominal constructions) and to automatic parsing.Cette thèse part de l'observation des constructions à verbe "dar" ("donner") dans des corpus en portugais du Brésil. Elle en propose une analyse et une classification systématiques et cohérentes sur la base de la grammaire transformationnelle d'opérateurs (Harris, 1964, 1978) et du modèle théorico-méthodologique du lexique-grammaire (Gross, 1975, 1981). Les deux théories adoptent des critères formels/structurels et des procédés expérimentaux reproductibles pour identifier les phrases de base que nous adoptons pour la classification des constructions à verbe "dar". La classification de ces constructions se fonde sur leur structure et sur leurs propriétés syntaxiques. Quatre catégories ou types de constructions fondamentales où figure ce verbe ont été identifiées : (1) verbe plein (distributionnel), où sont identifiés 8 sens différents ; (2) verbe opérateur causatif ; (3) verbe élément d'une phrase figée, soit dans des expressions figées, soit dans des proverbes ; et (4) verbe support, un type particulier d'auxiliaire sélectionné par un nom prédicatif.La première partie de la thèse analyse les trois premiers types syntaxico-sémantiques du verbe "dar" : plein, causatif et figé. La deuxième partie analyse et décrit les constructions à verbe support (CVS) formées par le verbe support (VSup) "dar" et un nom prédicatif (Npred). Cette description est systématique et vise à recenser le plus possible de constructions dans les corpus et à identifier les principales propriétés formelles, distributionnelles et transformationnelles des CVS. Les propriétés sont formalisées au moyen d'une table de lexique-grammaire, c'est-à-dire une matrice de données qui représente de façon compacte les informations linguistiques pertinentes à la description de ces constructions. La troisième partie de la thèse présente une proposition d'analyse syntaxique automatique des CVS par une méthode fondée sur des règles de dépendance entre leurs constituants. Les règles sont produites automatiquement à partir des informations présentes dans la matrice de lexique-grammaire, puis utilisées par l'analyseur syntaxique automatique pour extraire une dépendance entre le Npred et le Vsup en identifiant la CVS. Ainsi, ce travail a pour but de faire progresser l'état de l'art de la classification générale des verbes en portugais et du traitement automatique des langues naturelles, en contribuant à la tâche d'analyse syntaxique automatique par le développement de ressources lexico-computationnelles (le lexique-grammaire des constructions nominales).Esta tese parte da observação das construções com o verbo "dar" em corpus em português brasileiro e propõe uma análise e classificação dessas construções, de forma sistemática e consistente, com base na Gramática Transformacional de operadores (HARRIS, 1964; HARRIS, 1978) e no modelo teórico-metodológico do Léxico-Gramática (GROSS, 1975; GROSS, 1981). Ambas as teorias adotam critérios formais/estruturais e procedimentos experimentais reprodutíveis para a identificação das frases de base e que adotamos para a classificação das construções com o verbo "dar". A classificação dessas construções foi baseada em suas estruturas e propriedades sintáticas, tendo sido identificadas quatro categorias ou tipos de construções fundamentais em que esse verbo ocorre: (i) verbo pleno (distribucional), de onde se identificam 8 sentidos diferentes; (ii) verbo-operador causativo; (iii) o verbo constituinte de uma frase fixa, seja em expressões cristalizadas seja em provérbios; e (iv) verbo-suporte, um tipo particular de auxiliar que é selecionado por um nome predicativo.A primeira parte da tese analisa os três primeiros tipos sintático-semânticos do verbo "dar" (pleno, causativo e fixo). A segunda parte da tese analisa e descreve as construções com verbo-suporte (CVS), formadas pelo verbo-suporte (Vsup) "dar" e um nome predicativo (Npred). Essa descrição é sistemática, buscando recensear o máximo possível de construções em corpus e identificando as principais propriedades formais, distribucionais e transformacionais das CVS. As propriedades são formalizadas por meio de uma matriz de dados, a qual representa de maneira compacta a informação linguística relevante para a descrição dessas construções. A terceira parte da tese apresenta uma proposta de análise sintática automática das CVS, usando uma abordagem baseada em regras de dependência entre seus constituintes. As regras são geradas automaticamente a partir das informações constantes na matriz do Léxico-Gramática e, em seguida, são usadas pelo analisador sintático automático para extrair uma dependência entre o Npred e o Vsup ao identificar a CVS. Assim, este trabalho objetiva avançar o estado da arte da classificação geral dos verbos em português e do Processamento Automático de Línguas Naturais, no sentido de contribuir com o desenvolvimento de recursos léxico-computacionais (o Léxico-Gramática das construções nominais) para a tarefa de análise sintática automática

    A Transitividade: da Visão Tradicional ao Funcionalismo

    Get PDF
    Esta dissertação versa sobre o fenômeno da transitividade. Inicialmente apresenta, de uma forma geral, os estudos lingüísticos e um breve panorama histórico. Trabalha com a perspectiva funcionalista de linguagem e de transitividade. Neste trabalho, busca-se fazer um contraponto da abordagem tradicional, valencial e funcional norte-americana - no tratamento da transitividade, ressaltando-se a relevância desta última, na análise dos excertos e nos estudos lingüísticos, como um todo. A perspectiva norte-americana considera a transitividade não como uma propriedade intrínseca do verbo enquanto item lexical, mas como um complexo de dez parâmetros sintático-semânticos independentes (HOPPER & THOMPSON,1980), que focalizam diferentes ângulos da transferência da ação em uma porção diferente da oração. O objeto de análise é constituído por relatos de opinião escritos por informantes de ensino superior e ensino médio, ou seja, informantes com idade igual ou superior a 18 anos. Os relatos fazem parte do material coletado e organizado pelo Grupo de Estudos Discurso & Gramática (D&G). Os estudos do grupo contemplam as localidades do Rio de Janeiro, do Rio Grande, de Natal, de Juiz de Fora e de Niterói; no entanto, focaliza-se, neste trabalho, as produções referentes ao Rio de Janeiro. Discute-se a noção de tipo/gênero textual e sua relação no processo de construção da significação do texto e da alta ou baixa transitividade, ou seja, do status informacional. Percebe-se que as sentenças de textos narrativos, analisados por Hopper e Thompson (1980) apresentam comportamento diferente do apresentado pelos relatos de opinião trabalhados nesta dissertação. Palavras Chave: Transitividade; funcionalismo; gênero textual; relatos de opiniã

    Recuperação da informação em acervos digitais de jornais: proposta para uso de ontologia no domínio do futebol

    Get PDF
    Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-Graduação em Ciência da Informação, Florianópolis, 2016.Esta pesquisa visa a modelagem de uma ontologia do domínio do futebol para o tratamento de variações diacrônicas e sincrônicas da língua, com intuito de apoiar a recuperação da informação em acervos digitais de jornais. Com a oferta dos acervos de jornais em sítios na Internet é preciso que os acessos a essas informações sejam facilitados, pois esses ambientes reúnem documentos de diferentes épocas e culturas e também estão em constante atualização. Por essa razão, necessitam de uma organização que contemple a diversidade linguística e de conteúdo. Quando a organização da informação é conduzida para um domínio do conhecimento, as ambiguidades podem ser tratadas e entendidas conforme o contexto que se aplicam. Assim, o futebol tem o jornal como importante fonte de informação e também apresenta mudanças gramaticais e variações linguísticas que se mostraram pertinentes a este estudo. Trata-se de uma pesquisa aplicada, utilizando como base um acervo digital de jornal. Possui caracterização exploratória e descritiva e abordagem qualitativa. Utiliza a metodologia OntoForInfoScience, de Mendonça (2015) para desenvolver a ontologia do domínio do futebol. A coleta das informações foi realizada em materiais de referência do domínio e em notícias de jornais. Cronologicamente, o recorte estabelecido abrange terminologia utilizada entre 1900 a 2015, período que contempla a existência dos clubes de futebol no Brasil. A coleta foi realizada em jornais digitalizados e também nascidos digitais. A partir da amostra dos termos criou-se artefatos como Glossário de Conceitos, Dicionário de Conceitos, Glossário de Relações, Tabela de Conceitos e Valores e modelo de representação gráfica, em que foram tratados os aspectos linguísticos do domínio do futebol presentes nos acervos digitais. Com base do que foi modelado em linguagem natural foi formalizada a ontologia em linguagem lógica, com o auxílio do editor Protegé, etapa em que foram definidas classes, subclasses, propriedades de relação e equivalências. Como forma de avaliar a ontologia desenvolvida, elaborou-se questões de competência que foram executadas em linguagem SPARQL. Para atestar o uso da ontologia em ambientes compostos por jornais impressos e digitais foram realizadas buscas demonstrativas em um acervo real, analisando quais os resultados obtidos sem a ontologia e quais os prováveis resultados se ela fosse implementada. A análise dos resultados permitiu evidenciar que sem o uso da ontologia nos acervos digitais de jornais, a recuperação das informações é exaustiva e recupera documentos não relevantes, devido à ausência de relacionamentos entre os termos que formam o domínio. Dessa forma, com a inclusão da ontologia no sistema, a pesquisa por informações não exigiria tanto letramento do usuário, visto que as ontologias tornam mais inteligentes os sistemas, pois suas relações são feitas com base na realidade. Assim, as principais contribuições científicas deste trabalho para a Ciência da Informação envolvem a análise e tratamento de documentos históricos do domínio do futebol, a fim de apoiar a recuperação da informação de acervos digitais de jornais, utilizando como recurso uma ontologia de domínio.Abstract : This research proposes the making of a domain-ontology on soccer, to deal with the synchronic and diachronic variances of the language, and to aid information retrieval on digital files of newspapers. With the supply of newspaper archives in websites, it is necessary for the access to this information to be improved, because these sites group documents from different times and cultures and also are constantly under update. For that reason, they need an arrangement that encompasses the diversity of language and content. When the arrangement of the information is placed in a domain knowledge, all ambiguity can be dealt with and understood according to the context to which they apply. Thus, soccer has the newspaper as an important source of information, and also presents grammar changes and linguistic variations that are shown to be pertinent to this study. This is an applied research, based on a digital newspaper archive. it is exploratory and descriptive and a qualitative approach to its subject matter. Uses Mendonça s OntoForInfoScience methodology (2015) to develop the domain-ontology on soccer. The gathering of information was done based on reference material from the domain and in newspaper articles. The chronological interval that was established encompasses the terminology used between 1900 and 2015, period that covers the spawn of soccer clubs in Brazil. The data collection was from digitized and originally digital newspapers. Artifacts were created from the sample of terms, which are: glossary of concepts, dictionary of concepts, glossary of relationships, table of concepts and values, and graphic representation model, in which we deal with the linguistic aspects of the soccer domain, in the digital files. Based on what was modeled in natural language we formalized the ontology in logic language, with the help of the Protegé editor. At this stage, we defined categories, subcategories, relationship properties and equivalences. As a means to evaluate the developed ontology, questions of competence were created and executed in SPARQL language. In order to attest the usage of the ontology in environments with digital and printed newspapers some demonstrative searches were carried out in a real archive, analyzing what were the results without the ontology and the probable results if it were implemented. The analysis of the results allowed us to show that without the use of the ontology in the digital archive of newspaper the information retrieval is exhaustive and retrieves irrelevant documents, due to the lack of relationships among the terms that compose the domain. In this fashion, having the ontology included in the system, the research would not require much specific knowledge of the user, since the ontologies make systems smarter because their relationships are based on reality. So the main scientific contributions of this work to the Information Science are about the analysis and management of historical documents on the soccer domain, in order to improve the information retrieval in digital archives of newspapers, using the domain ontology as a resource
    corecore