11 research outputs found

    Complexidade textual em artigos científicos : contribuições para o estudo do texto científico em português

    Get PDF
    This text presents the basis of a research project that deals with the issue of textual complexity (TC), examining aspects of Pediatrics papers against newspaper articles. In the literature review, it is mobilized works related to the subject of TC in Applied Linguistics, Terminology studies that follow a textual point of view, Computational Linguistics and Corpus Linguistics. Some highlighted elements in the contrast between the examination of texts and the literature reviewed are the measures to TC ratio and degrees of text specialization, which would preview differences between specialized language and everyday language. The paper concludes with the presentation of prospects for the treatment of the issue of TC among the studies on scientific discourse

    DESENVOLVIMENTO DA PROFICIÊNCIA ESCRITA EM INGLÊS ESPECIALIZADO: UM ESTUDO DE CORPUS DE ABSTRACTS EM CIÊNCIAS DA SAÚDE

    Get PDF
    Este artigo apresenta um projeto de pesquisa de doutorado em curso e o respectivo estudo piloto sobre o desenvolvimento da proficiência escrita em língua inglesa a partir da produção de abstracts de textos de autoria de estudantes universitários e pesquisadores do campo de Ciências da Saúde com base no uso de itens lexicais. O estudo piloto manipula 112 textos de periódicos internacionais especializados, totalizando 30.371 palavras e 159 textos, incluindo publicações em periódicos internacionais e manuscritos inéditos, produzidos em universidades brasileiras, perfazendo 30394 palavras. O corpus foi analisado através do software Antconc (ANTHONY, 2011) pela função clusters/n-grams, buscando-se ocorrências de pacotes de 4 quatro palavras gráficas. Os resultados da amostra sugerem que os autores brasileiros tendem a se apoiar mais em estruturas pré-fabricadas para construir o discurso acadêmico, divergem do padrão estrutural ao empregarem a mesma frequência de pacotes lexicais e frasais, bem como tendem a adotar expressões que funcionalmente se relacionam à pesquisa e ao texto, mas não ao leitor. Tais contatações preliminrares carecem de maior averiguação através do estudo completo, que cotejará um acervo de dados três vezes mais extenso.

    B2 : um sistema para indexação e agrupamento de artigos científicos em português brasileiro utilizando computação evolucionária

    Get PDF
    Tese (doutorado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2013.Nesta tese é apresentado um estudo estatístico sobre o agrupamento automático de artigos científicos escritos em português do Brasil, são propostos novos métodos de indexação e agrupamento de textos com o objetivo futuro de desenvolver um software para indexar e agrupar textos por área de conhecimento. Foram testadas três classes conhecidas de termos simples para representar (indexar) os textos de entrada a agrupar: (substantivos), (substantivos e adjetivos), (substantivos, adjetivos e verbos) e também foram desenvolvidas três novas classes de termos compostos para representação (indexação) dos textos: classes de termos mais complexos, onde um termo pode ser composto pela junção de substantivos, adjetivos e preposições. Durante a fase de agrupamento textual dos experimentos foram testados os algoritmos de agrupamento: Expectation-Maximization (EM), X-Means, um Algoritmo Evolucionário de Agrupamento Convencional e, ainda, um novo Algoritmo Evolucionário de Agrupamento Proposto cujo diferencial é trabalhar em duas etapas de processamento: uma etapa para localização do agrupamento subótimo genérico e outra etapa para melhorar tal solução. Adicionalmente, o novo algoritmo permite ao usuário definir a formação de mais grupos ou menos grupos no resultado de agrupamento. Os algoritmos de indexação e agrupamento propostos foram codificados e implementados em um protótipo denominado B2, no entanto, para testar os algoritmos de agrupamento EM e X-Means foi utilizado o pacote de mineração de dados WEKA. Quatro corpora de artigos científicos, diferentes entre si por guardarem artigos de áreas científicas distintas, foram reunidos para testar as combinações de indexação e algoritmo de agrupamento propostas. Melhores resultados de agrupamento (por área de conhecimento dos artigos) foram obtidos utilizando termos compostos na indexação, ao invés do uso de termos simples, quando combinados com o uso do novo Algoritmo Evolucionário de Agrupamento Proposto, porém, para obter grupos bem formados, um número excessivo de grupos é gerado pelo protótipo, consumindo alto tempo de computação para executar tais novos métodos, em um computador pessoal convencional do ano de 2012. Pode-se concluir que o problema de agrupar automaticamente artigos científicos em suas áreas originais é uma tarefa complexa. Logo, acredita-se que os métodos de indexação e agrupamento desenvolvidos possam ser aprimorados para utilização futura em situações específicas, onde a fragmentação e geração adicional de grupos além do esperado não seja um problema maior. ______________________________________________________________________________________ ABSTRACTThis thesis presents an empirical study about automated text clustering for scientific articles written in Brazilian Portuguese. We tested three already known classes of simple terms for representing (or indexing) the input texts: (nouns), (nouns and adjectives) and (nouns, adjectives and verbs); we also developed three new classes of composed terms for text representation (or indexing): the new classes consist of more complex terms, where a complex term could be composed by the joint of nouns, adjectives and prepositions. Our final goal is to develop new software for text indexing and clustering. During the clustering stage of the experiments we tested the Expectation-Maximization (EM) Clustering Algorithm, the X-Means Clustering Algorithm, the Conventional Clustering Evolutionary Algorithm and, finally, we also proposed a new Two Phase Clustering Evolutionary Algorithm which works in two phases, the first phase finds the sub-optimal text clustering and the second one improves the result found by the first phase. The Two Phase Clustering Evolutionary Algorithm also permits the user to define whether the system should create a high number or a low number of clusters. The new indexing and clustering algorithmic strategies presented were implemented in a prototype named B2, but for testing the EM and X-Means algorithms we used the known WEKA data mining package. Four different scientific corpora having different sets of scientific topics were assembled and applied for testing the combinations of indexing and clustering methods. Although considerable better results were achieved when indexing with the classes of composed terms combined with the new Two Phase Clustering Evolutionary Algorithm, a considerable higher number of clusters was generated and a considerable additional time was consumed when running the new system over a 2012 conventional personal computer. We conclude that the problem of clustering scientific articles in their original topics is a complex task. Good results of clustering correctness were achieved by the new methods but producing many fragmented additional clusters as output, so, in the future, the methods can be improved and applied in specific situations where the fragmentation and additional production of clusters are not a major problem

    Um panorama do Núcleo Interinstitucional de Linguística Computacional às vésperas de sua maioridade

    No full text
    Este artigo faz uma breve apresenta&ccedil;&atilde;o do N&uacute;cleo Interinstitucional de Lingu&iacute;stica Computacional (NILC), que &eacute; um dos principais grupos brasileiros dedicado a pesquisas na &aacute;rea de Processamento de L&iacute;nguas Naturais, particularmente do portugu&ecirc;s brasileiro. Ap&oacute;s apresentar um breve hist&oacute;rico de sua forma&ccedil;&atilde;o, mostramos como as atuais &aacute;reas de pesquisa do grupo foram consolidando-se ao longo dos anos. Para cada uma dessas &aacute;reas de atua&ccedil;&atilde;o do NILC, fazemos um breve resumo dos resultados mais importantes e do estado atual das pesquisas no grupo.&nbsp;&nbsp; <br /

    Violência e cidadania : práticas sociológicas e compromissos sociais

    Get PDF
    O livro é resultado de uma série de estudos sociológicos realizados pelo Grupo de Pesquisa Violência e Cidadania da UFRGS, desde a década de 1990, partindo de uma conjuntura política e teórica que levou a pesquisar novas questões sociais globais, em particular as dimensões da violência, do crime e do controle social, vivenciando um movimento teórico fecundo, mundializado e inovador de uma prática sociológica na Era da Mundialização das Conflitualidades. O deslocamento do olhar sociológico para a sociedade global possibilitou a passagem para uma sociologia das conflitualidades no processo da mundialização. Os temas analisados indicam que uma sociologia das conflitualidades, no tempo atual, deve ser situada no contexto dos efeitos do processo de mundialização da sociedade e da economia, os quais produzem transformações na estrutura e no espaço social das diversas regiões do planeta, desencadeando novos conflitos sociais e novas formas de conflitualidades. A questão das conflitualidades, das formas de violência, das metamorfoses do crime, da crise das instituições de controle social configura-se pela emergência de lutas sociais protagonizadas por outros agentes sociais com diversas identidades oponentes e pautas de reivindicações. Ainda mais, o aumento dos processos estruturais de exclusão social pode vir a gerar a expansão das práticas de violência como norma social particular, vigente em vários grupos sociais enquanto estratégia de resolução de conflitos, ou meio de aquisição de bens materiais e de obtenção de prestígio social, significados esses presentes em múltiplas dimensões da violência social e política contemporânea. Estamos em presença de um social heterogêneo, no qual nem indivíduos nem grupos parecem reconhecer valores universais. Esse contexto dá origem a múltiplas lógicas de ação coletiva e a forças sociais diversas, em uma sociedade fragmentada e heterogênea

    Violência e cidadania: práticas sociológicas e compromissos sociais

    Full text link

    Comunicación ibero-americana: los desafíos de la internacionalización: libro de actas del II Congreso Mundial de la Comunicación iberoamericana

    Get PDF
    (Excerto da Nota Introdutória) Com uma tradição académica que remonta a meados do século XX, os estudos de comunicação têm acompanhado as principais transformações sociais e culturais operadas sob o signo dos média e por efeito de uma organização cada vez mais tecnológica da vida em sociedade. Ao analisarem as dinâmicas discursivas de um tempo marcado pelo convívio com meios de comunicação igualmente dinâmicos e mutantes, as ciências da comunicação prestam-se a uma compreensão mais vasta dos processos de socialização e manifestação cultural. É por isso que esta é uma área tão recetiva à interdisciplinaridade e, ao mesmo tempo, tão sensível à expressão nas diversas línguas que servem a comunicação. Dedicando-se a um objeto de estudo que nada tem de estável, as ciências da comunicação partilham com todas as outras áreas científicas o repto de internacionalização do conhecimento. À semelhança do que tem acontecido com outros grupos disciplinares, também as ciências da comunicação estão hoje organizadas numa lógica de globalização da ciência. A partir da década de 1950, começaram a ser criadas associações internacionais, como a International Association for Media and Communication Research (IAMCR), lançada em 1957, e a International Communication Association (ICA), criada em 1950 como National Society for the Study of Communication (NSSC), a que se sucederam muitas outras de âmbitos mais especializados ou regionalizados. Por iniciativa destas associações, passaram a realizar-se periodicamente congressos internacionais que depressa concorreram para instituir o Inglês como uma espécie de língua oficial.(Nota introdutória no completa) Con una tradición académica que se remonta a mediados del siglo XX, los estudios de comunicación han sido capaces de acompañar los principales cambios sociales y culturales en el marco de los medios de comunicación social, una consecuencia que resulta de una organización cada vez más tecnológica de la vida en sociedad. Mediante el análisis científico de las dinámicas discursivas de nuestro tiempo, caracterizado por la existencia de múltiples medios de comunicación igualmente dinámicos y cambiantes, las ciencias de la comunicación se proponen comprender los procesos de socialización y las diversas manifestaciones culturales. Es quizás por eso que dicha área científica es tan receptiva tanto a la interdisciplinariedad como a la muy sensible expresión en diversas lenguas que sirven de base a la comunicación. Aunque su objeto de estudio se caracterice por la inestabilidad, las ciencias de la comunicación comparten con todas las áreas científicas el gran reto de la internacionalización del conocimiento. Tal y como ha pasado con otros grupos disciplinares, también las ciencias de la comunicación se presentan hoy más organizadas en la lógica de globalización de la ciencia. En este sentido, a partir de la década de 1950 se han creado asociaciones internacionales como la AIECS (Asociación Internacional de Estudios de Comunicación Social), en 1957, y la ICA (Asociación de Comunicación Internacional), fundada en 1950 como Sociedad Nacional para el Estudio de la Comunicación (NSSC), a las cuáles les han seguido numerosas asociaciones más de ámbitos más especializados o más regionalizados. Como resultado de este proceso, se han organizado con gran frecuencia congresos internacionales que casi han convertido a la lengua inglesa en el idioma oficial de dichos encuentros científicos.Fundação para a Ciência e a Tecnologia (FCT
    corecore