56 research outputs found

    Preparação de material didático para Aprendizagem Baseada em Tarefas com WordSmith Tools e corpora

    Get PDF
    Neste trabalho, apresento algumas maneiras de usar o programa de análise de corpus WordSmith Tools (Scott, 1997) na preparação de material didático dentro de uma proposta de Aprendizagem Baseada em Tarefas para ensino de inglês como língua estrangeira. Espero com isso contribuir para divulgar o potencial do programa na área de ensino de línguas estrangeiras. Palavras-chave: lingüística de corpus, Aprendizagem Baseada em Tarefas, WordSmith Tools


    Get PDF
    The present study is aimed at describing the semantic prosody of equivalent items in English and Portuguese. Semantic prosody is the connotation conveyed by the regular co-occurrence of lexical items, as revealed by the exploration of a computer-readable corpus. Although there are several studies dealing with semantic prosody in English, only one has looked at this issue constrasting English and Portuguese. In general, the findings indicate important similarities and differences between the two languages, and point toward inadequacies in contemporary dictionaries. The study was based on the exploration of a Portuguese. The NBC, with 100 million words, was also by the course of the investigation. The general conclusion of the study presented here is that information on connotation, especially that based on the exploration of corpora, should be part of glossaries and dictionaries, particularly production and bilingual dictionaries, which are tools that translators rely upon regularly.El objetivo del presente trabajo es describir la prosodia semántica entre términos equivalentes en inglés y portugués. La Prosodia semántica se define como las connotaciones que ciertas concurrencias habituales que acompañan a una palabra, transmiten (tal y como ha quedado atestiguado en varios estudios basados en corpus) Encontramos varios estudios sobre prosodia semántica para el inglés, pero solamente un estudio constructivo inglés-portugués. En general, los resultados señalan importantes similitudes y divergencias entre ambas lenguas, encontrándose inconsistencias en algunos diccionarios actuales. Este estudio se ha basado en dos corpus lingüísticos: un corpus del portugués con más de 140 millones de palabras (uno de los más exhaustivos en esta lengua y el BNC, con 100 millones de palabras. La principal conclusión de que se ha llegado en este estudio es que la información que conllevan las connotaciones, especialmente la que se puede extraerse de corpus lingüísticos, debería incluirse en glosarios y diccionarios, sobre todo a la hora de compilar diccionarios y en diccionarios bilingües, al ser éstos, utensilios en los que habitualmente confía un(a) traductor(a)

    Preparação de material didático para Aprendizagem Baseada em Tarefas com WordSmith Tools e corpora

    Get PDF
    In this paper, I present a few ways in which the WordSmith Tools (Scott, 1997) corpus analysis suite can be used to prepare teaching materials within the framework of Task-Based Learning for teaching English as a Foreign Language. As such, I hope to contribute to spreading the potential of the software among practitioners in the field of EFL. Key words: corpus linguistics, Task-Based Learning, WordSmith Tools.Neste trabalho, apresento algumas maneiras de usar o programa de análise de corpus WordSmith Tools (Scott, 1997) na preparação de material didático dentro de uma proposta de Aprendizagem Baseada em Tarefas para ensino de inglês como língua estrangeira. Espero com isso contribuir para divulgar o potencial do programa na área de ensino de línguas estrangeiras. Palavras-chave: lingüística de corpus, Aprendizagem Baseada em Tarefas, WordSmith Tools

    Corpus Linguistics for 21st Century Language Learning

    Get PDF
    [ES] Esta Language Learning Roundtable Conference se centra en ‘La lingüística de corpus para el aprendizaje de la lengua en el Siglo XXI’ y busca explorar cómo y hasta qué punto la lingüística de corpus ha impregnado el aprendizaje de las lenguas extranjeras o las segundas lenguas, con un especial hincapié en los contextos educativos españoles y latinoamericanos, tanto en términos de la descripción de la lengua nativa o extranjera, como del aprendizaje de una lengua extranjera (típicamente la lengua inglesa).[EN] This Language Learning Roundtable Conference focuses on “Corpus Linguistics for 21st Century Language Learning” and aims to explore how and to what extent corpus linguistics has permeated second and foreign language learning, with an special emphasis on Spanish and Latin American educational contexts, both in terms of the description of the native or the foreign language and of foreign language learning (typically English)

    Portal multimodal/multilíngue para o avanço da Ciência Aberta nas Humanidades

    Get PDF
    Although open science practices have been widely used in several knowledge areas for many years, open science has had greater acceptance in fields such as the natural sciences, exact sciences and computing. In the Human Sciences, the migration to open science is still in its infancy. In this work, we present the project to build the Multimodal/multilingual Portal for the Advancement of Open Science in the Humanities, supported by CNPq through Call 25/2020, designed to help fill this gap. The Portal intends to provide a range of open science materials for the Humanities, including verbal, visual, verbal-visual and verbal-gesture data, to stimulate both national and international research in the Humanities. The Portal was designed around four vectors, namely: open access, open data, open source and citizen science/citizen humanities. This paper presents a discussion of the problems and planned actions for each of the vectors. In addition, the paper outlines the major design principles underlying the implementation of the Portal. Open science requires a new set of postures and practices, which the Portal intends to encourage. In line with open science, its ultimate goal is democratizing science.Embora práticas de ciência aberta tenham sido adotadas em diversos campos do conhecimento ao longo dos anos, em larga medida estão concentradas nem campos como as ciências naturais, exatas e computação. Nas Ciências Humanas a migração para a ciência aberta ainda é incipiente. Neste trabalho, apresentamos Portal multimodal/multilíngue para o Avanço da Ciência Aberta nas Humanidades, apoiado pelo CNPq por meio do Edital 25/2020, destinado a ajudar a preencher essa lacuna. O Portal prevê fornecer uma série de conteúdos relacionados à ciência aberta nas Humanidades, incluindo dados verbais, visuais, verbo-visuais e verbo-gestuais, por meio dos quais possam ser desenvolvidas pesquisas, nacionais e internacionais. O Portal foi concebido em torno de quatro vetores, a saber: acesso aberto, dados abertos, fonte aberta e ciência cidadã / humanidades cidadãs. O trabalho apresenta, em relação a cada um dos vetores, a problemática envolvida bem como as ações pretendidas. Além disso, são apresentados os princípios de design do Portal, visando à sua usabilidade e acesso. O movimento de abertura da ciência exige novas posturas e novas práticas, que o Portal pretende estimular, pois entende que esse movimento é em última análise responsável pela democratização da ciência

    Corpus linguistics: readings in a widening discipline

    No full text


    No full text
    This article offers a reexamination of two of Saussure’s insights from the point of view of corpus linguistics—namely, freedom of combination and heterogeneity in language in use. Regarding the first insight, an analysis of word combinations in a corpus of newspaper texts written in Brazilian Portuguese was carried out to determine how many of these combinations were actual collocations—that is, were used frequently enough in a very large reference corpus (the Brazilian corpus) to warrant statistical significance. The results suggested that most word combinations are not free; rather, they follow previously established preferences among speakers. Regarding the second notion, that of heterogeneity, the collocations in the newspaper texts were tracked as they were deployed one after the other along each text, and this flow was visually depicted. The inspection of the charts revealed unique patterns of the distribution of collocation, thereby suggesting that the evidence supports the view of heterogeneity. A cluster analysis was later conducted on the amount of collocations in each text, revealing three basic collocation bands onto which all the texts can be fitted. This was interpreted as suggesting that heterogeneity, despite being present and noticeable, is constrained rather than limitless. The article concludes that the methods and techniques afforded by present-day corpus linguistics can shed light onto Saussure’s many valuable insights. ------------------------------------------------------------------------------ LIBERDADE DE COMBINAÇÃO E HETEROGENEIDADE: UM OLHAR DA LINGUÍSTICA DE CORPUS EM DOIS INSIGHTS SAUSSUREANOS O artigo reexamina dois dos insights de Saussure a partir da perspectiva da linguística de corpus, a saber a liberdade de combinação e a heterogeneidade no uso da língua. Com relação ao primeiro, foi feita uma análise de combinações de palavras em corpus de textos de jornais para determinar quantas eram realmente colocações, isto é, quantas eram usadas com frequência suficiente num corpus de referência (o Corpus Brasileiro). Os resultados sugerem que a maioria das combinações de palavras não são livres, mas seguem preferências previamente estabelecidas pelos sujeitos falantes. Com relação à segunda noção - heterogeneidade - as colocações dos textos de jornal foram acompanhadas conforme eram empregadas uma após a outra ao longo dos textos, sendo esse fluxo capturado de forma visual. A inspeção dos diagramas revelou padrões únicos de distribuição de colocações, evidenciando dessa forma a visão da heterogeneidade. Uma análise de agrupamento foi feita sobre as colocações em cada texto, revelando três níveis de colocabilidade. Esses níveis indicaram que a heterogeneidade, apesar de presente e aparente, sofre coerções e tem limites. O artigo conclui que os métodos e técnicas da linguística de corpus atual podem iluminar muitos dos insights valiosos propostos por Saussure. --- Original em inglês

    Methodological issues for analysis of metaphor from the Corpus Linguistics perspective

    No full text
    In this paper, I look at ways in which we can apply Corpus Linguistics principles to research in meta­phor, with a focus on methodological issues. Two methodologies are presented: corpus-based and corpus-driven. As far as corpus-based methods, I show a procedure for selecting metaphor candida­tes as well as how to use a concordancer to query a corpus. As far as corpus-driven methodologies, I present two pieces of software: KeyWords and the Metaphor Candidate Identifier