1,023 research outputs found

    One-Shot Neural Cross-Lingual Transfer for Paradigm Completion

    Full text link
    We present a novel cross-lingual transfer method for paradigm completion, the task of mapping a lemma to its inflected forms, using a neural encoder-decoder model, the state of the art for the monolingual task. We use labeled data from a high-resource language to increase performance on a low-resource language. In experiments on 21 language pairs from four different language families, we obtain up to 58% higher accuracy than without transfer and show that even zero-shot and one-shot learning are possible. We further find that the degree of language relatedness strongly influences the ability to transfer morphological knowledge.Comment: Accepted at ACL 201

    The Mozambican Miner: A study in the export of labour

    Get PDF
    Marc Wuyts' copy of the Mozambican Miner report. A report on Mozambican miners produced by the Centro de Estudos Africanos at Universidade Eduardo Mondlane in Maputo, 1977. The research was directed by Ruth First and conducted by up to 40 other researchers and activists

    Perception in L2 in a Classroom Environment with L2 Portuguese Chinese Students

    Get PDF
    The purpose of this study is to contribute to the knowledge on the impact of common European Portuguese (EP) phonetic-phonological processes in second language (L2) learners. It is well established that L2 listening is a complex process, and that the most common difficulties among L2 learners are related to speech segmentation and word recognition. Due to the occurrence of connected speech processes, sounds are altered and the word boundaries can be hard to determine. Vowel reduction within and across word boundaries is usually described as a very frequent process in EP. The reduction of vowels is even more evident in spontaneous speech, e.g. the word 'telefone' (jtifi'foni] in the citation form, 'telephone') can be produced as [t'fon]. The interplay between these processes can be particularly impactful for L2 learners, in word recognition. Furthermore, this correlation is scarcely studied in a classroom setting. The present study explores the impact of vowel reduction and connected speech processes in word recognition tasks from isolated words to continuous speech. Furthermore, it aims to understand the main difficulties that L2 learners, at the intermediate levei B 1, experience dealing with these phenomena. Lastly, it will contribute to understand not only the acquisition of vowel reduction and connected speech processes but also whether L2 learners could cope with them. Therefore, it was designed a set of perception experiments involving these phenomena in increasing degrees of difficulty: single word identification without (i) and with vowel reduction (ii); word identification with simple (iii) and complex connected speech processes (iv). The experiments were conducted in an ecological setting of an intensive Portuguese course, of the intermediate levei B 1, at the University of Lisbon. A contrai group of EP native speakers also performed the experiments. The overall scores revealed a decreasing tendency: (i) 94%; (ii) 65%; (iii) 31 %; (iv) 16%. The results reveal that word recognition is compromised due to the connected speech processes. Vowel reduction and the consequent deletion of segments also affects the recognition of isolated spoken words even in read speech. The didactic outcomes of the experiments are relevant to contribute to the design of a proposal of a set of listening exercises focused on the practice of these phonetic-phonological phenomena. The sequence is based on the use of Computer-Assisted Language Learning (CALL) technology, and includes two games and a set of perception exercises in which songs are also used as input.Este estudo tem como objetivo contribuir para o conhecimento do impacto dos processos fonético-fonológicos do Português Europeu (PE), em aprendentes de PE Língua Segunda (L2). Pela nossa experiência como falantes nativos, sabemos que ouvir na própria língua nativa (LI) é um processo natural e intuitivo, ainda que complexo. No entanto, talvez por experiência própria também se saiba que, quando se aprende uma língua estrangeira, um dos maiores desafios está relacionado com a compreensão oral. Os mecanismos auditivos que intervêm na compreensão oral da língua nativa são os mesmos que intervêm na compreensão oral da L2. Ouvir e compreender uma língua estrangeira é um processo muito complexo. Quando ouvimos, é necessário segmentar o discurso, e reconhecer as palavras no contínuo sonoro. No entanto, devido à ocorrência de processos fonéticos, próprios do discurso oral, os sons são alterados e coarticulados. Ao processar a L 1, os falantes nativos não têm quaisquer dificuldades. Pelo contrário, os aprendentes L2 podem ter várias dificuldades no que diz respeito ao reconhecimento de palavras no contínuo sonoro. Dada a ocorrência dos vários fenómenos de coarticulação, as fronteiras de palavra deixam de ser percetíveis e evidentes. Em PE, a redução vocálica está bem descrita na literatura, e é referida como um processo muito produtivo. Uma das suas características é promover a redução e o apagamento de vogais átonas. Como resultado, há uma frequente ocorrência de sequências fonéticas de consoantes nas produções orais. Interessa também salientar que a redução vocálica não só ocorre em fala espontânea como também é frequente em fala semi-espontânea e não espontânea. O PE também é rico em processos de coarticulação, e muitos deles estão em direta relação com a redução e o apagamento das vogais átonas. Os processos de discurso oral contínuo muito bem estudados e descritos. Entre os processos de coarticulação estão os encontros vocálicos, os fenómenos de sândi, a assimilação do vozeamento e a inserção da iode Li]. Estes processos causam diversas alterações nos sons das palavras, sobretudo nos que estão presentes nas fronteiras de palavra. Além disso, promovem ainda a realização e a inserção de outros sons, que não têm uma representação gráfica. Outros são responsáveis pela restruturação da estrutura silábica, causando a articulação entre os sons das palavras vizinhas. Do que é conhecido da literatura, a interação entre a redução vocálica e os fenómenos de sândi externo, coarticulação, assimilação, etc. , e o seu impacto na compreensão oral de aprendentes L2 ainda não está estudada. Além disso, ainda não existem estudos realizados em contexto ecológico de sala de aula, que se debrucem sobre esta correlação. Pelo que se sabe, também, o ensino destes processos fonético-fonológicos não é amplamente explorado nos diversos referênciais e programas de ensino de PLE. Como tal, existe a necessidade de consciencializar os alunos para a ocorrência destes processos na oralidade, e de como têm impacto na sua compreensão oral. Isso terá também uma relação direta com a aprendizagem e o desenvolvimento da proficiência dos estudantes. Portanto, o presente estudo tem como objetivo explorar o impacto da ocorrência de processos fonético-fonológicos, tais como a redução vocálica e os processos da oralidade, em tarefas de reconhecimento e identificação de palavra. Estas tarefas foram realizadas quer em contextos de palavra isolada quer em contextos de discurso oral contínuo. Além disso, este estudo procura entender, e descrever, as maiores dificuldades dos aprendentes L2, no nível intermédio B 1, face à presença destes processos fonéticos na oralidade. Finalmente, este estudo será não só um contributo para um melhor conhecimento do processo de aquisição da redução vocálica e dos fenómenos de coarticulção, mas também para entender em que momento do processo de aprendizagem os estudantes precisam de treinar estas estruturas. Portanto, foi criada uma sequência de testes percetivos que incluíram a ocorrência destes fenómenos em diferentes níveis de complexidade: tarefas de reconhecimento de palavra isolada sem (i) e com a produção de redução vocálica (ii); tarefas de reconhecimento de palavra com ocorrência dos processos de discurso oral em contextos simples (iii) e complexos (iv). Os testes de perceção foram aplicados em contexto ecológico de sala de aula de um curso intensivo anual de Português Para Estrangeiros (PLE), do nível intermédio (Bl ), na Universidade de Lisboa. Todos os participantes eram falantes nativos do Chinês Mandarim. Os testes também foram aplicados a um grupo de controlo, composto por falantes nativos do PE. Nos resultados obtidos houve, em geral, uma tendência de decréscimo das percentagens para as respostas corretas conforme o aumento da complexidade das estruturas linguísticas: (i) 94%; (ii) 65%; (iii) 31 %; (iv) 16%. Estes resultados indicam que a ocorrência dos fenómenos do discurso oral comprometeram a tarefa de reconhecimento de palavra, nos diversos contextos. No entanto, este impacto foi bastante evidente nos contextos que testaram fala (serni-) espontânea. Além disso, a redução vocálica, e o consequente apagamento de vogais átonas, afetou ainda o reconhecimento de palavras isoladas. Para complementar estes resultados, foi também realizada a análise das transcrições ortográficas dos alunos que permitiu a descrição dos erros ortográficos mais frequentes. Por outro lado, contribuíram também para entender a interação entre a oralidade e a escrita na sua aprendizagem do PEcomo L2. As transcrições revelaram também que a presença da redução vocálica aumentou a produção de grupos consonânticos fonéticos, algo que se tornou evidente pelo facto de, frequentemente, apenas partes das palavras-alvo (ou apenas consoantes) terem sido transcritas. É importante também salientar que, aquando da realização das tarefas de identificação de palavras em contexto de fala (serni-) espontânea (com a presença de fenómenos de coarticulação), vários alunos transcreveram sequências de palavras articuladas, incluindo os sons articulados e alterados por processos de assimilação, por exemplo. Do ponto de vista didático, os resultados obtidos foram relevantes para a construção de uma proposta de uma sequência didática com exercícios para a prática e para o treino da componente auditiva. Esta proposta de exercícios tem um especial ênfase no ensino dos processos fonéticofonológicos do PE. Esta sequência é baseada na tecnologia existente para a Aprendizagem de Línguas Assistida por Computador (ALAC). Portanto, foram desenhados dois jogos, uma versão do clássico 'Jogo da Forca' e o jogo das 'Palavras Bomba-Relógio'. Finalmente, a sequência também inclui uma série de exercícios de perceção oral, intitulada 'À Procura dos Limites' no qual se pretende praticar o reconhecimento das fronteiras das palavra em diferentes contextos de coarticulação. Além disso, a série inclui uma secção de exercícios lúdica, nos quais são utilizadas músicas portuguesas como input auditivo

    The Sovereign Debt Crisis in Southern Europe: Majoritarian Pitfalls?

    Get PDF
    Although widely debated in broader socioeconomic terms, the Eurozone crisis has not received yet adequate scholarly attention with regard to the impact of alternative political systems. This article revisits the debate on majoritarian and consensus democracies drawing on recent evidence from the Eurozone debacle. Greece is particularly interesting both with regard to its potential ‘global spillover effects’ and choice of a majoritarian political system. Despite facing comparable challenges as Portugal and Spain, the country has become polarized socially and politically, seeing a record number of MP defections, electoral volatility and the rise of the militant extreme right. The article points to the role of majoritarian institutions to explain why Greece entered the global financial crisis in the most vulnerable position while subsequently faced insurmountable political and institutional obstacles in its management

    Improving ASR error detection with non-decoder based features

    Get PDF
    Abstract This study reports error detection experiments in large vocabulary automatic speech recognition (ASR) systems, by using statistical classifiers. We explored new features gathered from other knowledge sources than the decoder itself: a binary feature that compares outputs from two different ASR systems (word by word), a feature based on the number of hits of the hypothesized bigrams, obtained by queries entered into a very popular Web search engine, and finally a feature related to automatically infered topics at sentence and word levels. Experiments were conducted on a European Portuguese broadcast news corpus. The combination of baseline decoder-based features and two of these additional features led to significant improvements, from 13.87% to 12.16% classification error rate (CER) with a maximum entropy model, and from 14.01% to 12.39% CER with linear-chain conditional random fields, comparing to a baseline using only decoder-based features

    The Winonan

    Get PDF
    https://openriver.winona.edu/thewinonan1970s/1169/thumbnail.jp
    corecore