4 research outputs found

    Adaptation de la production labiale d'un participant sourd et classification : le cas des voyelles en contexte du code LPC.

    Get PDF
    International audienceThe phonetic translation of Cued Speech (CS) gestures needs to mix the manual CS information together with the lips, taking into account the desynchronization delay (Attina et al. [2], Aboutabit et al. [7]) between these two flows of information. This contribution focuses on the lip flow modeling in the case of French vowels. Previously, classification models have been developed for a professional normal hearing CS speaker (Aboutabit et al., [7]). These models are used as a reference. Now, we process the case of a deaf CS speaker and discuss the possibilities of classification. The best performance (92,8%) is obtained with the adaptation of the deaf data to the reference models.Dans un système de communication entre des personnes normo entendantes et des personnes malentendantes, la transcription phonétique du code LPC nécessite de fusionner l'information issue des gestes de main et de lèvres. Cette contribution est centrée sur le traitement du flux labial dans le cas des voyelles. Des modèles de classification ont été développé pour un participant normo-entendant pratiquant le LPC. (Aboutabit et al., [7]). Ces modèles sont utilisés dans cette contribution comme une référence pour étudier les possibilités de classification des voyelles produites par un codeur LPC sourd. La meilleure performance (92,8%) est obtenue avec une adaptation des données "sourd" au modèles de référence

    A New Methodology For Speech Corpora Definition From Internet Documents

    No full text
    In this paper, a new methodology for speech corpora definition from internet documents is described, in order to record a large speech database, dedicated to the training and testing of acoustic models for speech recognition. In the first section, the Web robot which is in charge of collecting Web pages from Internet is presented, then the web text to French sentences filtering mechanism is explained. Some information about the corpus organization (90% for training and 10% for test) is given. In the third section, the phoneme distribution of the corpus is presented and comparison is made with others French language studies. Finally tools and planning for recording the speech database with more than one hundred speakers are described. 1. INTRODUCTION Nowadays, many people can access the Internet, either from work, school or home. This growing population is not only passive by consulting existing documents on the Web pages, news servers and chat session

    Reconnaissance automatique de la parole de personnes âgées pour les services d'assistance à domicile

    Get PDF
    In the context of the aging population, the aim of this thesis is to include in the living environment of the elderly people an automatic speech recognition (ASR) system, which can recognize calls to alert the emergency services. The acoustic models of ASR systems are mostly learned with non-elderly speech, delivered in a neutral way, and read. However, in our context, we are far from these ideal conditions (aging and expressive voice). So, our system must be adapted to the task. For our work, we recorded corpora made of elderly voices and distress calls. From these corpora, a study on the differences between young and old voices, and between neutral and emotional voice permit to develop an ASR system adapted to the task. This system was then evaluated on data recorded during an experiment in realistic situation, including falls played by volunteers.Dans le contexte du vieillissement de la population, le but de cette thèse est d'inclure au domicile des personnes âgées un système de reconnaissance automatique de la parole (RAP) capable de reconnaître des appels de détresse pour alerter les secours. Les modèles acoustiques des systèmes de RAP sont généralement appris avec de la parole non âgée, prononcé de façon neutre et lue. Or, dans notre contexte, nous sommes loin de ces conditions idéales (voix âgée et émue), et le système doit donc être adapté à la tâche. Notre travail s’appuie sur des corpus de voix âgées et d'appels de détresse que nous avons enregistrés. A partir de ces corpus, une étude sur les différences entre voix jeunes/âgées d'une part, et entre voix neutre/émue d'autre part nous ont permis de développer un système de RAP adapté à la tâche. Celui-ci a ensuite été évalué sur des données issues d'une expérimentation en situation réaliste incluant des chutes jouées

    Contrôle intelligent de la domotique à partir d'informations temporelles multi sources imprécises et incertaines

    Get PDF
    La Maison Intelligente est une résidence équipée de technologie informatique qui assiste ses habitant dans les situations diverses de la vie domestique en essayant de gérer de manière optimale leur confort et leur sécurité par action sur la maison. La détection des situations anormales est un des points essentiels d'un système de surveillance à domicile. Ces situations peuvent être détectées en analysant les primitives générées par les étages de traitement audio et par les capteurs de l'appartement. Par exemple, la détection de cris et de bruits sourds (chute d'un objet lourd) dans un intervalle de temps réduit permet d'inférer l'occurrence d'une chute. Le but des travaux de cette thèse est la réalisation d'un contrôleur intelligent relié à tous les périphériques de la maison capable de réagir aux demandes de l'habitant (par commande vocale) et de reconnaître des situations à risque ou détresse. Pour accomplir cet objectif, il est nécessaire de représenter formellement et raisonner sur des informations, le plus souvent temporelles, à des niveaux d'abstraction différents. Le principale défi est le traitement de l'incertitude, l'imprécision, et incomplétude, qui caractérisent les informations dans ce domaine d'application. Par ailleurs, les décisions prises par le contrôleur doivent tenir compte du contexte dans lequel une ordre est donné, ce qui nous place dans l'informatique sensible au contexte. Le contexte est composé des informations de haut niveau tels que la localisation, l'activité en cours de réalisation, la période de la journée. Les recherches présentées dans ce manuscrit peuvent être divisés principalement en trois axes: la réalisation des méthodes d'inférence pour acquérir les informations du contexte(notamment, la localisation de l'habitant y l'activité en cours) à partir des informations incertains, la représentation des connaissances sur l'environnement et les situations à risque, et finalement la prise de décision à partir des informations contextuelles. La dernière partie du manuscrit expose les résultats de la validation des méthodes proposées par des évaluations amenées à la plateforme expérimental Domus.A smart home is a residence featuring ambient intelligence technologies in order to help its dwellers in different situations of common life by trying to manage their comfort and security through the execution of actions over the effectors of the house. Detection of abnormal situations is paramount in the development of surveillance systems. These situations can be detected by the analysis of the traces resulting from audio processing and the data provided by the network of sensors installed in the smart home. For instance, detection of cries along with thuds(fall of a heavy object) in a short time interval can help to infer that the resident has fallen. The goal of the research presented in this thesis is the implementation of an intelligence controller connected with the devices in the house that is able to react to user's commands(through vocal interfaces) and recognize dangerous situations. In order to fulfill this goal, it is necessary to create formal representation and to develop reasoning mechanism over informations that are often temporal and having different levels of abstraction. The main challenge is the processing the uncertainty, imprecision, and incompleteness that characterise this domain of application. Moreover, the decisions taken by the intelligent controller must consider the context in which a user command is given, so this work is made in the area of Context Aware Computing. Context includes high level information such as the location of the dweller, the activity she is making, and the time of the day. The research works presented in this thesis can be divided mainly in three parts: the implementation of inference methods to obtain context information(namely, location and activity) from uncertain information, knowledge representation about the environment and dangerous situations, and finally the development of decision making models that use the inferred context information. The last part of this thesis shows the results from the validation of the proposed methods through experiments performed in an experimental platform, the Domus apartment.SAVOIE-SCD - Bib.électronique (730659901) / SudocGRENOBLE1/INP-Bib.électronique (384210012) / SudocGRENOBLE2/3-Bib.électronique (384219901) / SudocSudocFranceF
    corecore