1,443 research outputs found

    Modelo acústico de língua inglesa falada por portugueses

    Get PDF
    Trabalho de projecto de mestrado em Engenharia Informática, apresentado à Universidade de Lisboa, através da Faculdade de Ciências, 2007No contexto do reconhecimento robusto de fala baseado em modelos de Markov não observáveis (do inglês Hidden Markov Models - HMMs) este trabalho descreve algumas metodologias e experiências tendo em vista o reconhecimento de oradores estrangeiros. Quando falamos em Reconhecimento de Fala falamos obrigatoriamente em Modelos Acústicos também. Os modelos acústicos reflectem a maneira como pronunciamos/articulamos uma língua, modelando a sequência de sons emitidos aquando da fala. Essa modelação assenta em segmentos de fala mínimos, os fones, para os quais existe um conjunto de símbolos/alfabetos que representam a sua pronunciação. É no campo da fonética articulatória e acústica que se estuda a representação desses símbolos, sua articulação e pronunciação. Conseguimos descrever palavras analisando as unidades que as constituem, os fones. Um reconhecedor de fala interpreta o sinal de entrada, a fala, como uma sequência de símbolos codificados. Para isso, o sinal é fragmentado em observações de sensivelmente 10 milissegundos cada, reduzindo assim o factor de análise ao intervalo de tempo onde as características de um segmento de som não variam. Os modelos acústicos dão-nos uma noção sobre a probabilidade de uma determinada observação corresponder a uma determinada entidade. É, portanto, através de modelos sobre as entidades do vocabulário a reconhecer que é possível voltar a juntar esses fragmentos de som. Os modelos desenvolvidos neste trabalho são baseados em HMMs. Chamam-se assim por se fundamentarem nas cadeias de Markov (1856 - 1922): sequências de estados onde cada estado é condicionado pelo seu anterior. Localizando esta abordagem no nosso domínio, há que construir um conjunto de modelos - um para cada classe de sons a reconhecer - que serão treinados por dados de treino. Os dados são ficheiros áudio e respectivas transcrições (ao nível da palavra) de modo a que seja possível decompor essa transcrição em fones e alinhá-la a cada som do ficheiro áudio correspondente. Usando um modelo de estados, onde cada estado representa uma observação ou segmento de fala descrita, os dados vão-se reagrupando de maneira a criar modelos estatísticos, cada vez mais fidedignos, que consistam em representações das entidades da fala de uma determinada língua. O reconhecimento por parte de oradores estrangeiros com pronuncias diferentes da língua para qual o reconhecedor foi concebido, pode ser um grande problema para precisão de um reconhecedor. Esta variação pode ser ainda mais problemática que a variação dialectal de uma determinada língua, isto porque depende do conhecimento que cada orador têm relativamente à língua estrangeira. Usando para uma pequena quantidade áudio de oradores estrangeiros para o treino de novos modelos acústicos, foram efectuadas diversas experiências usando corpora de Portugueses a falar Inglês, de Português Europeu e de Inglês. Inicialmente foi explorado o comportamento, separadamente, dos modelos de Ingleses nativos e Portugueses nativos, quando testados com os corpora de teste (teste com nativos e teste com não nativos). De seguida foi treinado um outro modelo usando em simultâneo como corpus de treino, o áudio de Portugueses a falar Inglês e o de Ingleses nativos. Uma outra experiência levada a cabo teve em conta o uso de técnicas de adaptação, tal como a técnica MLLR, do inglês Maximum Likelihood Linear Regression. Esta última permite a adaptação de uma determinada característica do orador, neste caso o sotaque estrangeiro, a um determinado modelo inicial. Com uma pequena quantidade de dados representando a característica que se quer modelar, esta técnica calcula um conjunto de transformações que serão aplicadas ao modelo que se quer adaptar. Foi também explorado o campo da modelação fonética onde estudou-se como é que o orador estrangeiro pronuncia a língua estrangeira, neste caso um Português a falar Inglês. Este estudo foi feito com a ajuda de um linguista, o qual definiu um conjunto de fones, resultado do mapeamento do inventário de fones do Inglês para o Português, que representam o Inglês falado por Portugueses de um determinado grupo de prestígio. Dada a grande variabilidade de pronúncias teve de se definir este grupo tendo em conta o nível de literacia dos oradores. Este estudo foi posteriormente usado na criação de um novo modelo treinado com os corpora de Portugueses a falar Inglês e de Portugueses nativos. Desta forma representamos um reconhecedor de Português nativo onde o reconhecimento de termos ingleses é possível. Tendo em conta a temática do reconhecimento de fala este projecto focou também a recolha de corpora para português europeu e a compilação de um léxico de Português europeu. Na área de aquisição de corpora o autor esteve envolvido na extracção e preparação dos dados de fala telefónica, para posterior treino de novos modelos acústicos de português europeu. Para compilação do léxico de português europeu usou-se um método incremental semi-automático. Este método consistiu em gerar automaticamente a pronunciação de grupos de 10 mil palavras, sendo cada grupo revisto e corrigido por um linguista. Cada grupo de palavras revistas era posteriormente usado para melhorar as regras de geração automática de pronunciações.The tremendous growth of technology has increased the need of integration of spoken language technologies into our daily applications, providing an easy and natural access to information. These applications are of different nature with different user’s interfaces. Besides voice enabled Internet portals or tourist information systems, automatic speech recognition systems can be used in home user’s experiences where TV and other appliances could be voice controlled, discarding keyboards or mouse interfaces, or in mobile phones and palm-sized computers for a hands-free and eyes-free manipulation. The development of these systems causes several known difficulties. One of them concerns the recognizer accuracy on dealing with non-native speakers with different phonetic pronunciations of a given language. The non-native accent can be more problematic than a dialect variation on the language. This mismatch depends on the individual speaking proficiency and speaker’s mother tongue. Consequently, when the speaker’s native language is not the same as the one that was used to train the recognizer, there is a considerable loss in recognition performance. In this thesis, we examine the problem of non-native speech in a speaker-independent and large-vocabulary recognizer in which a small amount of non-native data was used for training. Several experiments were performed using Hidden Markov models, trained with speech corpora containing European Portuguese native speakers, English native speakers and English spoken by European Portuguese native speakers. Initially it was explored the behaviour of an English native model and non-native English speakers’ model. Then using different corpus weights for the English native speakers and English spoken by Portuguese speakers it was trained a model as a pool of accents. Through adaptation techniques it was used the Maximum Likelihood Linear Regression method. It was also explored how European Portuguese speakers pronounce English language studying the correspondences between the phone sets of the foreign and target languages. The result was a new phone set, consequence of the mapping between the English and the Portuguese phone sets. Then a new model was trained with English Spoken by Portuguese speakers’ data and Portuguese native data. Concerning the speech recognition subject this work has other two purposes: collecting Portuguese corpora and supporting the compilation of a Portuguese lexicon, adopting some methods and algorithms to generate automatic phonetic pronunciations. The collected corpora was processed in order to train acoustic models to be used in the Exchange 2007 domain, namely in Outlook Voice Access

    Exploring Gender and Identity in Ontario’s Early Years Curriculum Documents

    Get PDF
    Understanding how Ontario Ministry of Education (OME) early years’ curriculum and framework documents, such as The Kindergarten Program (OME, 2016), How Does Learning Happen? (OME, 2014) and ELECT (BSEPEL, 2007) set the expectations for fostering gender and identity formation is increasingly vital in contemporary society. Educators need to understand how the mandated documents feed their practice and influence what is understood by educators as “appropriate” gendered practices and identities. Drawing on a poststructural feminist perspective (Blaise & Taylor, 2012), the authors examine these early years’ documents for systemic or structural aspects that suggest the formation of specific gender identities. Specifically, this study explores the language and systemic gender beliefs contained in the three documents identified above. The study also examines how specific ideologies may influence gender identity formation in young children. The authors expect to find that these curriculum and framework documents do not support educators in fostering the formation of gender identities, particularly those which are outside of heteronormative expectations

    From lab to plate: life cycle assessment of herring and lingonberry co-product valorization

    Get PDF
    Food industry side streams can be a source of valuable raw materials, e.g., high-quality proteins from fish filleting co-products, and natural antioxidants from fruit pomace. pH-shifting is a food processing technique that allows the solubilization and extraction of proteins.\ua0 Cross-processing fish co-products and a helper (e.g., lingonberry pomace), inhibits lipid oxidation during processing. We carried out a life cycle assessment of a pH-shift method for cross-processing herring heads and back bones with lingonberry pomace (CROSS). We modeled the resulting protein ingredient as input to a fish ball and compared that with a benchmark fish ball.\ua0 We upscaled primary laboratory data for the cross-process following Piccinno et al. (2016). Life cycle inventory data for salmon production was based on Winther et al. (2020), including feed composed of agricultural, micro-ingredients, and 14 different fish species. We also included fishery discards following P\ue9rez Roda (2019). Among other impact indicators we used the depleted stock fraction proposed by H\ue9lias et al. (2018) to characterize impacts on marine resources. Fish balls produced with the cross-processed protein ingredient perform better than the benchmark option in all investigated categories. Using oils extracted during cross-processing in the fish ball formulation could reduce land use impacts of the final product and improve its nutritional profile

    The contribution of the artistic workshops measured by the Rosenberg Self-Esteem Scale

    Get PDF
    Mental health is now considered indispensable for well-being and general health. Self-esteem, in turn, is an important indicator of mental health. Knowing the self-esteem of people with Mental Illness thus becomes an important part of the process of help and recovery, promoting the implementation of appropriate therapeutic measures. This study aims to determine the impact of the INcluir workshops on participants’ self-esteem, an experimental study composed of adult participants of both genders. Two groups were created: the control group composed of participants who did not attend the artistic workshops and the experimental group who attended the workshops. The Rosenberg Self-Esteem Scale (RSES) was used to measure the levels of self-esteem. Considering the results obtained, the artistic workshops produced improvements in the participants’ self-esteem.info:eu-repo/semantics/publishedVersio

    Prevalência de hipertensão arterial na cidade de Castelo Branco

    Get PDF
    A hipertensão arterial (HTA) é um dos principais factores de riscos para as doenças cardiovasculares, sendo uma das principais causas de enfarte agudo do miocárdio e de acidente vascular cerebral (AVC), principalmente quando desconhecida, mal tratada ou mal controlada. Objectivo: Determinar a prevalência de HTA na população adulta da Cidade de Castelo Branco e sua associação com factores de risco. Método: A amostra estudada tem 402 indivíduos, 61,2% do sexo feminino e 38,8% do sexo masculino. Foram realizadas 3 avaliações da pressão arterial (PA) em cada indivíduo, com um esfignomanómetro (ALrK2) depois de 5 minutos de repouso e em intervalos de um minuto entre cada avaliação. Foi ainda aplicado um questionário a cada indivíduo para recolha dos dados antropométricos, demográficos, antecedentes pessoais e familiares de HTA e hábitos diários. Resultados: Foi encontrada uma prevalência de HTA de 62,4%, (38,3% do sexo feminino e 24,1% do sexo masculino). Dos indivíduos com HTA 79,3% estavam medicados, e destes apenas 49,2% apresentavam valores de PA normais. Dos indivíduos com HTA não controlada 71,8% apresentaram HTA grau I, 18,8% grau II e 9,4% grau III. Conclusão: Os resultados mostram uma elevada prevalência de hipertensão arterial, este facto alerta para a necessidade de adopção de medidas preventivas. Abstract- Hypertension (HTA) is leading risk factors for cardiovascular disease, being a major cause of acute myocardial infarction and cerebral vascular accident (AVC), especially when unknown, poorly treated or poorly controlled. Objective: Determine the prevalence of hypertension in adult population of the city of Castelo Branco and its association with risk factors. Method: The study sample contained 402 subjects, 61.2% female and 38.8% male. Were performed three evaluations of blood pressure (BP) in each individual with a sphygmomanometer (ALrK2) after 5 minutes of rest and at intervals of one minute each. A questionnaire was applied to each subjects to collect anthropometric data, demographic, personal and family history of hypertension and daily habits. Results: The prevalence of hypertension was 62.4% (38.3% female and 24.1% males). Subjects The subjects with HTA 79.3% were medicated, and of these only 49.2% had normal BP values. The subjects with uncontrolled hypertension 71.8% had grade I HT, 18.8% grade II and 9.4% grade III. Conclusions: The results showed a high prevalence of hypertension, this warning for the need to adopt preventive measures

    Stepwise functional evolution in the Ffz sugar transporter family

    Get PDF
    Abstract of the poster presented at the Microbiotec’15 Congress, 10-12 December 2015, University of Évora, Portugal

    Microbiological monitoring of water for control of Legionella

    Get PDF
    Legionellosis is a collection of infections that are caused by Legionella pneumophila and related Legionella bacteria. The severity of legionellosis varies from mild febrile illness (Pontiac fever) to a potentially fatal form of pneumonia (Legionnaires’ disease) that can affect anyone, but principally affects those who are susceptible due to age, illness, immunosuppression or other risk factors, such as smoking. Legionella spp. are heterotrophic bacteria found in a wide range of water environments and proliferate at temperatures between 25°C and 45°C. These bacteria are members of the natural flora of many freshwater environments, such as rivers, streams and impoundments, where they occur in relatively low numbers. Bacteria of the genus Legionella are ubiquitous, they can proliferate in certain human-made water environments, such as water cooling devices associated with air conditioning systems, hot water, spas, distribution systems, on the inside surfaces of shower heads especially in warm waters. Legionellae can be ingested by certain amoebae which play an important role in their persistence in water environments. Devices that support multiplication of Legionella have been associated with outbreaks of Legionnaires’disease. Nosocomial cases usually make up a small proportion of reported cases of legionellosis. However, the proportion of cases that are fatal tends to be much higher with nosocomial infections than with community-acquired infections. Health-care facilities may include environments that support the proliferation and dissemination of Legionella and must be monitored. In Portugal only exists legislation for air conditioning systems and thermal waters. It is important to be aware of the need to develop specific rules for the detection of Legionella in water intended for human consumption in order to act more for the prevention of the disease than to act only in the monitoring of an outbreak. In recent years there has been an increasing incidence of disease caused by this bacterium, atypical pneumonia, and a large variety of water systems are different sources of contamination

    ICT in portuguese secondary schools: from resistance to innovation

    Get PDF
    El artículo adopta una perspectiva organizacional los modos e intensidades diferentes de implementación de las Tecnologías de Información y Comunicación (TIC) en doce escuelas secundarias portuguesas. Un ambicioso Plan Tecnológico para la Educación ha generado cambios significativos en las escuelas públicas en los últimos años. Sin embargo, las respuestas de directores, docentes y alumnos en estas escuelas, complementados por los informes de evaluación externa, demuestran que los recursos, estrategias y usos pedagógicos de las TIC varían enormemente entre escuelas, desafiando el principio constitucional de la igualdad de oportunidades. La investigación ha identificado tres categorías de escuelas con relación a este dominio: innovadoras, ambivalentes y tradicionales. Liderazgo, coordinación tecnológica, identidad de escuela, cooperación entre departamentos y acuerdos con organizaciones del entorno son señalados como factores clave para explicar el alto grado de diversidad. El artículo concluye con una perspectiva de las implicaciones de estos resultados, tanto para la investigación como para las políticas públicas.There is a strong consensus on how central Information and Communication Technologies (ICT), especially computers and the Internet, are for virtually all dimensions of contemporary society – oftencalled the information or network society – includingthe economy, culture, and politics. However,the introduction of ICT and its effective use in schools have been slow and face complex challenges all over the world. In Portugal, a major Technological Plan for Education was implemented since 2007, which has been partially funded by the European Union. Its goal is to place Portugal among the most advanced countries in world in terms of implementation of ICT in state schools. The Planlaidout ambitious goals, including a ratio of two students per computer, the availability of high-speed broadband in all primary and secondary schools across the country, and ensuring that 90 per cent of teachers have ICT certification.2info:eu-repo/semantics/publishedVersio
    corecore