632 research outputs found

    Uma ferramenta de apoio ao processo de aprendizagem de algoritmos

    Get PDF
    Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-graduação em Ciência da Computaçã

    UM LEVANTAMENTO DA PESQUISA EM TÉCNICAS ADAPTATIVAS NA EPUSP // A RESEARCH SURVEY ON ADAPTIVE TECHNIQUES AT THE UNIVERSITY OF SAO PAULO, BRAZIL

    Get PDF
    Este artigo tem como meta apresentar uma versão atual do levantamento da pesquisa que vem sendo desenvolvida na Escola Politécnica da USP, na área da Tecnologia Adaptativa. Conceitua brevemente a Adaptatividade e a Tecnologia Adaptativa, nela baseada, e para tanto inclui e relata brevemente os mais recentes avanços realizados, aplicações ensaiadas, projetos tecnológicos bem sucedidos, e bibliografia produzida. O material apresentado complementa e atualiza um balanço similar; publicado em 2007, apontando os principais avanços, identificando caminhos que estão se delineando e apontando algumas possibilidades promissoras de evoluções futuras.   ABSTRACT ­­­­­­­­­­­­­­­­­­­­This paper presents a summary of the research on Adaptive Technology, in course in the University of Sao Paulo, Brazil, at the Polytechnic School. Initially, the concepts of adaptivity and adaptive technology are defined. Theoretical advances, applications developed and well-succeeded technological projects are discussed, and the associated technical publication is mentioned. A sampler of the most significant results achieved since the first beginning of this activity concludes this publication, stressing their impact and suggesting proposals for the future fundamental and practical advances

    O lugar do input e dos conhecimentos implícito e explícito na aquisição de L2 e na aprendizagem da escrita do PB

    Get PDF
    Este trabalho analisa o papel do input e dos conhecimentos implícito e explícito nos processos de aquisição de segunda língua – L2 e de aprendizagem da escrita do Português do Brasil - PB, tendo como premissa a proposta de que aprender a escrita padrão/culta do PB se assemelhe a adquirir uma L2. A análise aponta haver diferenças entre os processos, em especial no que se refere ao conhecimento implícito, pois o falante do vernáculo do PB já dispõe de saber intuitivo sobre a sua língua ao tentar se apropriar do código de escrita, diferentemente do falante em aquisição de L2 que, durante esse processo, construirá seu sistema implícito da língua. Este artigo discute, ainda, propostas metodológicas fundamentadas na concepção de que o aluno possui uma língua internalizada ao ingressar no sistema de ensino, sugerindo a adoção, pelo professor, da técnica de eliciação como ferramenta pedagógica na mediação do processo de conscientização linguística do aluno

    Inteligência Artificial e os rumos do processamento do português brasileiro

    Get PDF
    Neste artigo apresentamos um posicionamento sobre a área de processamento de língua natural em português, seus desenvolvimentos desde o princípio até a explosão de aplicações modernas baseadas em aprendizado de máquina. Exploramos os desafios que a área necessita enfrentar no momento, tanto de natureza técnica quanto de natureza ética e moral, e concluímos com a inabalável associação do processamento de língua natural com os estudos linguísticos.This is a position paper on the current state of the field of natural language processing (NLP) in Portuguese, its developments from the beginning, and the explosion of recent applications based on machine learning. We explore the challenges that the field is currently facing, of both technical and ethical and moral nature, and conclude with the unwavering association between natural language processing and linguistic studies

    Teoria da otimidade estocástica e algoritmo de aprendizagem gradual : princípios de funcionamento e tutorial para simulação computacional

    Get PDF
    No presente trabalho, apresentamos um tutorial para pesquisadores interessados em utilizar o Algoritmo de Aprendizagem Gradual vinculado ao modelo da Teoria da Otimidade Estocástica (Boersma; Hayes, 2001). Tal modelo permite formalizar gramáticas a partir das quais emergem outputs tanto categóricos quanto variáveis, dando conta da formalização dos processos de aquisição de sistemas de língua materna (L1) e de língua estrangeira (L2). Este texto está organizado em duas partes: em um primeiro momento, apontamos os princípios de funcionamento que caracterizam o Algoritmo de Aprendizagem Gradual (GLA). Após isso, apresentamos um tutorial para a realização de simulações, com o algoritmo em questão, a partir do software Praat (Boersma; Weenink). Esperamos, com este texto, contribuir para uma maior disseminação do modelo, de modo que os pesquisadores possam realizar, de maneira eficiente e sem dificuldades, simulações dos processos desenvolvimentais das gramáticas de L1 e L2 por eles estudadas.In this paper, we provide a tutorial for researchers interested in the Stochastic OT version of the Gradual Learning Algorithm (Boersma; Hayes, 2001). Stochastic OT allows the formalization of OT grammars resulting in variable output forms, making it possible for researchers to run computational simulations on First Language (L1) and Second Language (L2) developmental processes. This article is divided in two main parts. Firstly, we review the basic tenets of the Stochastic version of the Gradual Learning Algorithm. After this brief description, we provide some guidelines on how to run simulations with the Gradual Learning Algorithm on Praat (Boersma; Weenink). We hope this tutorial may contribute to the dissemination of Stochastic OT, making it easier for researchers to run learning simulations of L1 and L2 grammars

    Um estudo sobre aprendizagem distribucional de categorias sintáticas no português brasileiro

    Get PDF
    Em Redington et al. (1998), o potencial da informação distribucional na categorização lexical do inglês é analisado com base em uma série de experimentos computacionais. Tomando-o como base, propomos replicar experimentos e análises conduzidos ali sobre dados do português brasileiro (PB), contribuindo para uma avaliação translinguística. Os corpora consistirão em dois conjuntos de dados: dados de fala dirigida à criança e dados de diálogos entre adultos. Os primeiros serão compilados a partir da Coleção "Projeto de Aquisição da Linguagem Oral" e dos dados do PB disponíveis na base CHILDES. O segundo conjunto será obtido na plataforma NURC ("Projeto Norma Linguística Urbana Culta - RJ")

    JSON uma alternativa para corpus linguístico anotado em padrão XML

    Get PDF
    Resumo Para as investigações em Linguística nas Humanidades Digitais, sobretudo para a formulação de hipóteses sobre gramáticas nos estudos de Linguística Histórica, necessita-se de um grande volume de dados, fato que intensificou a construção e implementação de corpora anotados que crescem em tamanho exigindo maior grau de escalabilidade. Neste artigo discute-se a viabilidade técnica de uma solução computacional alternativa à linguagem XML (eXtensible Markup Language) para corpora linguísticos anotados. A linguagem XML tem sido utilizada em vários corpora que se baseiam no Corpus anotado do português histórico Tycho Brahe (CTB), como o Corpus de Documentos Oitocentistas de Vitória da Conquista (DOViC) e o Corpus Eletrônico de Documentos Históricos do Sertão (CE-DOHS). A linguagem XML pode apresentar problemas de performance para grande volume de dados, além de alto custo de memória. O crescimento de bancos de dados não relacionais, com características de alta flexibilidade e performance, associado aos potenciais problemas de desempenho da anotação XML, motivou uma pesquisa de viabilidade técnica de uma solução computacional alternativa para representação e armazenamento atual dos textos do corpus DOViC em um banco de dados NoSQL no formato JSON (JavaScript Object Notation) (MONGODB, 2008). A pesquisa aqui apresentada verifica a viabilidade da representação,compara a performance obtida em buscas morfossintáticas feitas na anotação proposta (Banco de dados NoSQL e formato JSON) com a anotação e armazenamento atual do corpus DOViC (Sistema de arquivos e formato XML), e faz uma análise de outros aspectos da proposta. Os resultados obtidos no tocante à performance da proposta JSON indicam viabilidade técnica dessa vertente computacional.. Não obstante, para além da performance, o XML apresenta maiores vantagens de interoperabilidade por ser amplamente aceita como padrão para anotação de corpora. Palavras-chave: Corpus anotado. JSON. XML.   Resumen Para las investigaciones en Lingüística en Humanidades Digitales, especialmente para la formulación de hipótesis sobre las gramáticas en los estudios de Lingüística Histórica, se requiere un gran volumen de datos, un hecho que intensificó la construcción e implementación de los corpora anotados que crecen en tamaño y requieren mayor escalabilidad. Este documento analiza la viabilidad técnica de una solución computacional alternativa al XML (eXtensible Markup Language) para corpora lingüísticos anotados. El lenguaje XML se ha utilizado en muchos corpora que se basan en el corpus anotado del portugués histórico Tycho Brahe (CTB), como el Corpus de Documentos Oitocentistas de Vitória da Conquista (DOViC) y el Corpus Eletrônico de Documentos Históricos do Sertão (CE-DOHS). El lenguaje XML puede presentar problemas de rendimiento para grandes datos, así como un alto costo de memoria. El crecimiento de las bases de datos no relacionales, con alta flexibilidad y características de rendimiento, asociadas con posibles problemas de rendimiento de la anotación XML, motivó un estudio de viabilidad técnica de una solución computacional alternativa para la representación y el almacenamiento actual de textos de corpus DOViC. Base de datos NoSQL en formato JSON (JavaScript Object Notation) (MONGODB, 2008). La investigación presentada aquí verifica la viabilidad de la representación, compara el rendimiento obtenido en las búsquedas morfosintácticas realizadas en la propuesta (base de datos NoSQL y formato JSON) con la actual anotación y almacenamiento del corpus DOViC (sistema de archivos y formato XML), y hace un análisis de otros aspectos de la propuesta. Los resultados obtenidos con respecto al rendimiento de la propuesta JSON indican la viabilidad técnica de este aspecto computacional. Además del rendimiento, XML tiene importantes ventajas de interoperabilidad, ya que es ampliamente aceptado como el estándar para la anotación de corpus. Palabras clave: Corpus anotado. JSON. XML

    Gramática fonológica e ensino de inglês como língua adicional: aproximando a linguística formal da linguística aplicada

    Get PDF
    Partindo do pressuposto de que a teoria fonológica pode dialogar com o contexto educacional, este trabalho tem como objetivo principal apresentar e explicitar a relevância da gramática fonológica para o ensino de línguas adicionais, neste caso, o inglês. Para tanto, discutiremos dados de aquisição de aprendizes brasileiros de inglês (GUTIERRES, 2016) para o desenvolvimento da gramática da língua-alvo, analisados à luz da Teoria da Otimidade Estocástica (Boersma; Hayes, 2001). Os dados revelam que, na aprendizagem da nasal velar [ŋ] das palavras terminadas com -ing em inglês, há alternância sistemática entre as nasais velar/velarizada e a palatal (variação), demonstrando a gradualidade que caracteriza a aquisição e a variabilidade que é inerente à aprendizagem de línguas. Dessa forma, há uma demanda para a atualização e o esclarecimento do conceito de gramática, buscando dissociá-la da unicidade da concepção tradicional que ignora a produção linguística do aprendiz e lhe apenas prescreve formas tidas como corretas de expressão

    In this paper, we provide a brief description of the multidisciplinary domain of research called Natural Language Processing (NLP), which aims at enabling the computer to deal with natural languages. In accordance with this description, NLP is conceived a

    Get PDF
    In this paper, we provide a brief description of the multidisciplinary domain of research called Natural Language Processing (NLP), which aims at enabling the computer to deal with natural languages. In accordance with this description, NLP is conceived as “human language engineering or technology”. Therefore, NLP requires consistent description of linguistic facts on every linguistic level: morphological, syntactic, semantic, and even the level of pragmatics and discourse. In addition to the linguistically-motivated conception of NLP, we emphasize the origin of such research field, the place occupied by NLP inside a multidisciplinary scenario, their objectives and challenges. Finally, we provide some remarks on the automatic processing of Brazilian Portuguese language. Key words: natural language processing, human language technology, computational linguistics, linguistics, natural language
    corecore