434 research outputs found

    Detección de la unidad central en dos géneros y lenguajes diferentes: un estudio preliminar en portugués brasileño y euskera

    Get PDF
    The aim of this paper is to present the development of a rule-based automatic detector which determines the main idea or the most pertinent discourse unit in two different languages such as Basque and Brazilian Portuguese and in two distinct genres such as scientific abstracts and argumentative answers. The central unit (CU) may be of interest to understand texts regarding relational discourse structure and it can be applied to Natural Language Processing (NLP) tasks such as automatic summarization, question-answer systems or sentiment analysis. In the case of argumentative answer genre, the identification of CU is an essential step for an eventual implementation of an automatic evaluator for this genre. The theoretical background which underlies the paper is Mann and Thompson’s (1988) Rhetorical Structure Theory (RST), following discourse segmentation and CU annotation. Results show that the CUs in different languages and in different genres are detected automatically with similar results, although there is space for improvement.El objetivo de este trabajo es presentar las mejoras de un detector automático basado en reglas que determina la idea principal o unidad discursiva más pertinente de dos lenguas tan diferentes como el euskera y el portugués de Brasil y en dos géneros muy distintos como son los resúmenes de los artículos científicos y las respuestas argumentativas. La unidad central (CU, por sus siglas en inglés) puede ser de interés para entender los textos partiendo de la estructura discursiva relacional y poderlo aplicar en tareas de Procesamiento del Lenguaje Natural (PLN) tales como resumen automático, sistemas de pregunta-respuesta o análisis de sentimiento. En los textos de respuesta argumentativa, identificar la CU es un paso esencial para un evaluador automático de considere la estructura discursiva de dichos textos. El marco teórico en el que hemos desarrollado el trabajo es la Rhetorical Structure Theory (RST) de Mann y Thompson (1988), que parte de la segmentación discursiva y finaliza con la anotación de la unidad central. Los resultados demuestran que las unidades centrales en diferentes lenguas y géneros son detectadas con similares resultados automáticamente, aunque todavía hay espacio para mejora

    ArgMine: Argumentation Mining from Text

    Get PDF
    O objetivo da prospeção de argumentos a partir de texto é a deteção e identificação de forma automática da estrutura argumentativa contida num texto escrito em linguagem natural.Um argumento é uma estrutura retórica que é estudada desde à muitos anos e que se encontra bem fundamentada. De uma forma geral, argumentos são posições justificáveis onde factos (premissas) são apresentados em suporte de uma conclusão.A ambiguidade do texto escrito em linguagem natural, diferentes estilos de escrita, contexto implícito e a complexidade em construir estruturas argumentativas são alguns dos desafios que fazem desta tarefa muito desafiadora.Extraindo de forma automática argumentos a partir de texto, somos capazes de saber não apenas quais são os pontos de vista que estão a ser expressos, mas também quais são as razões para acreditar nesse pontos de vista. Assim sendo, a prospeção de argumentos de forma automática tem o potencial de trazer avanços em algumas áreas de investigação tais como prospeção de opiniões, sistemas de recomendação e sistemas multi-agente.A tarefa completa de prospeção de argumentos pode ser decomposta em várias sub-tarefas. Esta tese aborda a deteção e identificação, de forma automática, dos componentes argumentativos presentes no texto. Isso envolve detetar as zonas do texto que contêm conteúdo argumentativo e, a seleção dos fragmentos de texto que correspondem às unidades elementares de argumentos. Para que seja possível de uma forma automática detetar e identificar componentes argumentativos a partir de texto, algoritmos de aprendizagem máquina supervisionada serão usados.O conjunto de dados alvo que será usado para treinar os algoritmos são noticias escritas na língua Portuguesa.The aim of argumentation mining is the automatic detection and identification of the argumentative structure contained within a piece of natural language text. An argument is an ancient and well studied rhetorical structure. In a general form, arguments are justifiable positions where pieces of evidence (premises) are offered in support of a conclusion. The ambiguity of natural language text, different writing styles, implicit context and the complexity of building argument structures are some of the challenges which make this task very challenging. By automatically extracting arguments from text, we are able to tell not just what views are being expressed, but also what are the reasons to believe those particular views. Therefore, argumentation mining has the potential to improve some research topics such as opinion mining, recommender systems and multi-agent systems. The full task of argumentation mining can be decomposed into several subtasks. This thesis focuses on the automatic detection and identification of the argumentative components presented in the original text. This involves detecting the zones of text that contain argumentative content and the identification of fragments of text that will form the elementary units of the argument. In order to automatically detect and identify argumentative components in text, supervised machine learning algorithms will be used. The target corpus used to train the algorithms are news written in Portuguese language

    Proceedings of the VIIth GSCP International Conference

    Get PDF
    The 7th International Conference of the Gruppo di Studi sulla Comunicazione Parlata, dedicated to the memory of Claire Blanche-Benveniste, chose as its main theme Speech and Corpora. The wide international origin of the 235 authors from 21 countries and 95 institutions led to papers on many different languages. The 89 papers of this volume reflect the themes of the conference: spoken corpora compilation and annotation, with the technological connected fields; the relation between prosody and pragmatics; speech pathologies; and different papers on phonetics, speech and linguistic analysis, pragmatics and sociolinguistics. Many papers are also dedicated to speech and second language studies. The online publication with FUP allows direct access to sound and video linked to papers (when downloaded)

    Black into white and preto no branco: can you tell one's colour by the company one keeps?

    Get PDF
    Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão, Programa de Pós-Graduação em Letras/Inglês e Literatura Correspondente, Florianópolis, 2009.This Thesis was carried out at the interface between Corpus-based Translation Studies (CTS) and Systemic Functional Translation Studies (SFTS). CTS informs the methodological apparatus which framed this Thesis. SFTS provides conceptual tools to look at how the Brazilian entity mestiço is construed in North American English in the textualisation Black into White, and how it is construed in Brazilian Portuguese in the re-textualisation Preto no Branco by means of the categories of the experiential component of the ideational metafunction of language, and by means of the categories of lexical cohesion. The book was written by the Brazil-specialist Thomas Skidmore, and published for the first time in 1974. In 1976, the book was published in Brazil translated by the Brazilian diplomat Raul de Sá Barbosa. The book, which proposes to describe Brazilian racial thought, narrates Brazilian political and social turnabouts from the abolition of slavery until the late thirties of the twentieth century. In this vein, the research questions which guide this Thesis are: (i) How are the mestiços construed in terms of processes in the ideational metafunction of language both in Black into White and Preto no Branco? Do ideational patterns arise in the two representations? If so, which? (ii) Is the cohesive chain of the textualisation different from that of the re-textualisation? (iii) Do textualisation and re-textualisation reaffirm the racist thought of 1870-1930? Textualisation and re-textualisation do not diverge considerably in terms of ideational constructions, though interesting patterns of new language construction have arisen in the re-textualisation. Predominant material and relational processes seem to realise the mestiço in agreement with racist thought that influenced Brazilian political posture from late nineteenth to early twentieth centuries. The lexical cohesive chain of the re-textualisation follows pretty much the same patterns of the textualisation.Esta dissertação foi desenvolvida no âmbito dos Estudos da Tradução baseados em Corpora (ETC) e dos Estudos da Tradução Sistêmico-Funcionais (ETSF). Os ETC moldam os parâmetros metodológicos que desenham este trabalho. Os ETSF fornecem as ferramentas de análise que investigam como a entidade brasileira mestiço é construída em Inglês Norte-Americano na textualização Black into White e como é construída em Português Brasileiro na re-textualização Preto no Branco por meio de categorias do componente experiencial da metafunção ideacional da linguagem e por meio de categorias da coesão lexical. Black into White foi escrito pelo brasilianista Thomas Skidmore publicado pela primeira vez nos EUA em 1974. Em 1976, o livro foi publicado no Brasil na tradução do diplomata aposentado Raul de Sá Barbosa. O livro, uma proposta de descrição do pensamento racial brasileiro, narra os trâmites políticos e sociais iniciais da abolição da escravatura até a década de trinta do século XX. Com base nisso, as seguintes perguntas de pesquisa orientam este estudo: (i) quais processos constroem os mestiços na textualização e na re-textualização? Que padrões ideacionais e textuais surgem?; (ii) A cadeia coesiva lexical da textualização é diferente daquela da re-textualização? (iii) A textualização e a re-textualização reafirmam o suposto pensamento racista de 1870-1930? A textualização a e re-textualização não apresentam grandes diferenças em suas construções ideacionais, embora haja interessantes padrões de novas construções de linguagem na re-textualização. A predominância de processos materiais e relacionais parece apontar para a representação do mestiço em consonância com o pensamento racista que embasou posturas políticas de fins do século XIX a meados do século XX. A cadeia coesiva lexical da re-textualização tende a seguir os mesmos padrões da textualização

    Discourse analysis and syllabus design: an approach to the teaching of reading

    Get PDF
    This thesis has two main concerns. one is with the design of an\ud EFL syllabus for Brazilian secondary schools of the public sector and\ud the other with a preliminary evaluation of this syllabus in this\ud context. To design the syllabus, this thesis takes into account two\ud types of conditions: extrinsic and intrinsic conditions. The extrinsic\ud conditions have to do with the actual characteristics of the "learning\ud milieu" and of the general social context where this "milieu" is found.\ud The study of these conditions point out that for a FL syllabus to be\ud feasible and socially justifiable in this environment it must centre\ud on the provision of reading skills. The intrinsic conditions relate\ud to theoretical issues in applied linguistics which bear upon the\ud internal organisation of a syllabus designed to meet this provision.\ud These issues essentially involve research in the areas of discourse\ud analysis, schema theories of reading comprehension, FL learning and\ud , FL syllabus design theories. The design of the syllabus then comprises\ud a mediating process between these two types of conditions, which\ud results in an interactive schema theoretic reading syllabus model.\ud The inquiry into the operation of the syllabus in the classroom\ud involves the use of a quasi-experimental research paradigm which is\ud complemented by non-experimental research procedures. The findings of\ud this empirical work indicate that it is worth putting the syllabus\ud to the test of practice through its actual realisation in the classrooms\ud so that it can be continually evaluated and improved by teachers.\ud The thesis concludes with the formulation of an action-research\ud methodology for teachers' work which makes this sort of syllabus\ud development possible

    L1 literacy and L2 learning: connecting the dots

    Get PDF
    Tese (doutorado) - Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão. Programa de Pós-Graduação em Letras/Inglês e Literatura CorrespondenteBigelow e Tarone (2004) propõem que aprendizes de língua estrangeira (LE) com níveis baixos de letramento em língua materna (LM), e, por conseqüência, com limitações em consciência metalingüística, terão dificuldades de perceber a diferença entre a sua produção em LE e o insumo recebido. Todavia, esses pesquisadores não mediram o nível de consciência metalingüística de seus participantes em nenhum dos estudos que conduziram. Sendo assim, dados foram coletados com 24 brasileiros (com nível básico de inglês como LE), que fizeram testes de letramento em LM (PISA), consciência metalingüística (fonológica, morfológica e sintática) em LM e LE, e pré- e pós-testes de proficiência em LE (KET). Os objetivos do estudo foram averiguar se há correlação entre o nível de consciência metalingüística desses aprendizes e seu nível de letramento e verificar se consciência metalingüística em LM e/ou LE e/ou letramento seria eficaz em prever ganhos na proficiência em LE entre os dois testes e a nota final em um semestre de um curso de inglês. A análise dos dados permite argumentar que (1) o letramento e a consciência sintática em LM estão relacionados, (2) a consciência sintática, assim como a fonológica, transferem-se da LM para a LE, (3) a consciência fonológica em LM tem um papel prejudicial no aprendizado de LE, e (4) a consciência sintática em LE tem papel benéfico no aprendizado de LE e leva os aprendizes a alcançarem um nível maior de proficiência. A tese proposta é de que o envolvimento com o código escrito (pelo menos para aqueles aprendizes que não têm limitações na consciência fonológica) leva ao refinamento da consciência sintática. Esse conhecimento, quando transferido para a LE, impulsiona o seu desenvolvimento. De acordo com esses resultados, diferentemente do que Krashen (1982) propôs, existe, sim, um papel para o conhecimento explícito no aprendizado de LE

    The written production of ecuadorian efl high school students: grammatical transfer errors and teacher's and learner's perception of feedback

    Get PDF
    346 p.El objetivo de esta tesis doctoral es investigar los errores gramaticales de transferencia en la escritura en inglés como lengua extranjera de alumnos de secundaria ecuatorianos (n=180) y su grado de prevalencia en comparación a los errores léxicos de transferencia. Así mismo, se intenta comparar la variación de los errores gramaticales de transferencia obtenidos en tres grupos de alumnos clasificados de acuerdo a su nivel de dominio de inglés según el Marco Común Europeo (A1, A2, B1) y la variación de dichos errores entre dos tipos de ensayo: narrativo y argumentativo. Finalmente, se desea conocer las percepciones de los estudiantes y profesores con respecto a la retroalimentación en la escritura de inglés como lengua extranjera proporcionada en las clases. Todo esto se realiza con el propósito de contribuir a tratar de cumplir una parte de las metas del Ministerio de Educación del Ecuador relacionadas a la búsqueda de una mejora en el nivel de dominio de inglés como lengua extranjera en estudiantes de educación secundaria

    Terrorism and religion : brazilian media’s image of religion inspired terrorism

    Get PDF
    My research question was: How do Brazilian Media Portray Religious Terrorism? The aim of this thesis was to analyse Brazilian media’s articles and speeches related to the theme of religious terrorism and bring the findings more accessible to Finland and Europe. I collected several articles from Brazilian Internet news websites as well as few articles from foreign websites and analysed those articles using a mixed method of qualitative discourse analysis and content analysis. Discrepancies were found between Brazilian government’s official position of Brazil being a terrorist free country while Wikileaks revealed that there are individuals acting and behaving like terrorists in Brazil. When arrested, those individuals were charged with other charges than terrorism, possibly to not attract media’s attention to them. The articles written in Informal style varied from non emotional to strong emotional connoted, figures of speech such as metaphors metonymies, accismus were richly used. Towards the end, Arab culture in Brazil as well as fundamentalism and extremism religion movements in Islam were used as background to why Brazilian press portrays such image of terrorism. Brazilian journalists were divided; some alarmists warning of a near terrorism danger while others commenting that this is non sense. Brazil has a clear historical peaceful co-existence between different religious groups and has been so far not affected by bombings or anti-immigration feelings seen in other countries, making Brazil a good role model of integration and tolerance

    Mapping passive x active reading tasks in esap teaching: resonance for motivation and critical thinking

    Get PDF
    Tese (doutorado) - Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão. Programa de Pós-Graduaçãoe em Letras/Inglês e Literatura Correspondente.Esta pesquisa fez um mapeamento de tipos de atividades de leitura em livros de Inglês Instrumental utilizados na UFSC; realizou uma investigação correlata em salas de aula; observou a ressonância que tipos diferentes de atividades de leitura podem exercer na motivação, e reflexão crítica dos alunos. O primeiro estudo sondou a predominância de tipos de atividades em 6 livros de Inglês Instrumental; o segundo pesquisou as tarefas dominantes nas aulas de 4 professores; o terceiro investigou a reação de alunos de 3 turmas, perante dois blocos de tipos diferentes de atividades. As observações, transcrições das aulas, e questionários, foram os instrumentos utilizados para análise dos dados. O arcabouço teórico de Davies (1995), de atividades 'passivas' e 'ativas', deu respaldo aos estudos. Os resultados atestam a predominância de atividades 'ativas' nos livros analisados e nas aulas de 3 dos 4 professores observados. Constatou-se também mais motivação, e mais evidências de leitura crítica, durante o uso de tarefas 'ativas'. Tópicos como, instrução baseada no uso de tarefas, demanda cognitiva de diferentes tipos de atividades, diferenças individuais de estilo de ensino/aprendizagem, pensamento crítico, e independência do aprendiz, serviram como aparato teórico para a pesquisa. Outras descobertas importantes foram: que a delimitação entre o que Davies (1995) coloca como atividade 'passiva' ou 'ativa' parece não ser clara, não proporcionando flexibilidade para a variação de demanda cognitiva imposta por cada tipo de tarefa; a maneira de condução das atividades também parece ser mais crucial do que supunha a premissa inicial
    corecore