3,368 research outputs found
RÎle des reprises dans l'acquisition des articles et des critiques sujets chez des enfants francophones ùgés de 2 à 3 ans
The role of repetition in language acquisition is often studied for lexical development. In this study, we propose to explore the role of adult and child repetition in the acquisition process of articles and clitical subject pronouns. After a brief presentation of a quantitative analysis of the evolution of repetition in the adult and child productions, we focus our analysis on the dialogical phenomenon of repetition in the child and adult verbalizations. The aim of the study is to illustrate the interactional process of the acquisition of articles and clitical subjects pronouns with an analysis of transformations in child productions after adjusted adult repetitions, considered as indications of an acquisition process in progress
Ătude psycholinguistique des capacitĂ©s pragmatiques du langage chez les enfants de cinq Ă dix ans
Le but de cet article est de prĂ©senter certaines donnĂ©es sur les formes linguistiques employĂ©es par des enfants de 5:6, 8:6 et 10:6 ans regroupĂ©s en dyades, dans une situation de jeu de rĂŽle. Les donnĂ©es ont Ă©tĂ© analysĂ©es en termes dâactes de langage et des concordances ont Ă©tĂ© Ă©tablies pour faire ressortir les formes de surface servant Ă accomplir un sous-ensemble dâactes illocutionnaires produits dans le corpus. Les rĂ©sultats prĂ©liminaires obtenus sur la moitiĂ© du corpus montrent une lĂ©gĂšre diversification des formes linguistiques pour un mĂȘme acte illocutionnaire et une utilisation plus grande de formes plus complexes chez les plus ĂągĂ©s. Les indices paralinguistiques ont tendance Ă dĂ©croĂźtre avec lâĂąge; pour leur part, les enfants plus ĂągĂ©s ont recours Ă ces moyens de façon plus sĂ©lective. Les rĂ©sultats sont interprĂ©tĂ©s dans le cadre des thĂ©ories sur le dĂ©veloppement du langage Ă la fois du point de vue pragmatique linguistique et socio-cognitif.This article presents data on linguistic and paralinguistic forms used by three groups of children aged 5:6, 8:6, 10:6 years in a situation of dyadic role play. The data were analysed in terms of speech act types and concordances were established documenting the surface forms associated with each speech act type (illocutionary force). The results show a diversification of linguistic forms and an increasing use of more complex forms with age. Paralinguistic forms of expression tend to decrease with age, while older chidren tend to be more selective in the use of these forms. The results are interpreted with reference to both pragmatic linguistic and socio-cognitive theories of langage development
Text-To-Speech Ă base de HMM (Hidden Markov Model) pour le vietnamien : modĂ©lisation de la segmentation prosodique, la conception du corpus, la conception du systĂšme, et lâĂ©valuation perceptive
The thesis objective is to design and build a high quality Hidden Markov Model (HMM-)based Text-To-Speech (TTS) system for Vietnamese â a tonal language. The system is called VTED (Vietnamese TExt-tospeech Development system). In view of the great importance of lexical tones, a âtonophoneâ â an allophone in tonal context â was proposed as a new speech unit in our TTS system. A new training corpus, VDTS (Vietnamese Di-Tonophone Speech corpus), was designed for 100% coverage of di-phones in tonal contexts (i.e. di-tonophones) using the greedy algorithm from a huge raw text. A total of about 4,000 sentences of VDTS were recorded and pre-processed as a training corpus of VTED.In the HMM-based speech synthesis, although pause duration can be modeled as a phoneme, the appearanceof pauses cannot be predicted by HMMs. Lower phrasing levels above words may not be completely modeled with basic features. This research aimed at automatic prosodic phrasing for Vietnamese TTS using durational clues alone as it appeared too difficult to disentangle intonation from lexical tones. Syntactic blocks, i.e. syntactic phrases with a bounded number of syllables (n), were proposed for predicting final lengthening (n = 6) and pause appearance (n = 10). Improvements for final lengthening were done by some strategies of grouping single syntactic blocks. The quality of the predictive J48-decision-tree model for pause appearance using syntactic blocks combining with syntactic link and POS (Part-Of-Speech) features reached F-score of 81.4% Precision=87.6%, Recall=75.9%), much better than that of the model with only POS (F-score=43.6%)or syntactic link (F-score=52.6%) alone.The architecture of the system was proposed on the basis of the core architecture of HTS with an extension of a Natural Language Processing part for Vietnamese. Pause appearance was predicted by the proposed model. Contextual feature set included phone identity features, locational features, tone-related features, and prosodic features (i.e. POS, final lengthening, break levels). Mary TTS was chosen as a platform for implementing VTED. In the MOS (Mean Opinion Score) test, the first VTED, trained with the old corpus and basic features, was rather good, 0.81 (on a 5 point MOS scale) higher than the previous system â HoaSung (using the non-uniform unit selection with the same training corpus); but still 1.2-1.5 point lower than the natural speech. The quality of the final VTED, trained with the new corpus and prosodic phrasing model, progressed by about 1.04 compared to the first VTED, and its gap with the natural speech was much lessened. In the tone intelligibility test, the final VTED received a high correct rate of 95.4%, only 2.6% lower than the natural speech, and 18% higher than the initial one. The error rate of the first VTED in the intelligibility test with the Latin square design was about 6-12% higher than the natural speech depending on syllable, tone or phone levels. The final one diverged about only 0.4-1.4% from the natural speech.Lâobjectif de cette thĂšse est de concevoir et de construire, un systĂšme Text-To-Speech (TTS) haute qualitĂ© Ă base de HMM (Hidden Markov Model) pour le vietnamien, une langue tonale. Le systĂšme est appelĂ© VTED (Vietnamese TExt-to-speech Development system). Au vu de la grande importance de tons lexicaux, un tonophoneâ â un allophones dans un contexte tonal â a Ă©tĂ© proposĂ© comme nouvelle unitĂ© de la parole dans notre systĂšme de TTS. Un nouveau corpus dâentraĂźnement, VDTS (Vietnamese Di-Tonophone Speech corpus), a Ă©tĂ© conçu Ă partir dâun grand texte brut pour une couverture de 100% de di-phones tonalisĂ©s (di-tonophones) en utilisant lâalgorithme glouton. Un total dâenviron 4000 phrases ont Ă©tĂ© enregistrĂ©es et prĂ©-traitĂ©es comme corpus dâapprentissage de VTED.Dans la synthĂšse de la parole sur la base de HMM, bien que la durĂ©e de pause puisse ĂȘtre modĂ©lisĂ©e comme un phonĂšme, lâapparition de pauses ne peut pas ĂȘtre prĂ©dite par HMM. Les niveaux de phrasĂ© ne peuvent pas ĂȘtre complĂštement modĂ©lisĂ©s avec des caractĂ©ristiques de base. Cette recherche vise Ă obtenir un dĂ©coupage automatique en groupes intonatifs au moyen des seuls indices de durĂ©e. Des blocs syntaxiques constituĂ©s de phrases syntaxiques avec un nombre bornĂ© de syllabes (n), ont Ă©tĂ© proposĂ©s pour prĂ©voir allongement final (n = 6) et pause apparente (n = 10). Des amĂ©liorations pour allongement final ont Ă©tĂ© effectuĂ©es par des stratĂ©gies de regroupement des blocs syntaxiques simples. La qualitĂ© du modĂšle prĂ©dictive J48-arbre-dĂ©cision pour lâapparence de pause Ă lâaide de blocs syntaxiques, combinĂ©e avec lien syntaxique et POS (Part-Of-Speech) dispose atteint un F-score de 81,4 % (PrĂ©cision = 87,6 %, Recall = 75,9 %), beaucoup mieux que le modĂšle avec seulement POS (F-score=43,6%) ou un lien syntaxique (F-score=52,6%).Lâarchitecture du systĂšme a Ă©tĂ© proposĂ©e sur la base de lâarchitecture HTS avec une extension dâune partie traitement du langage naturel pour le Vietnamien. Lâapparence de pause a Ă©tĂ© prĂ©dit par le modĂšle proposĂ©. Les caractĂ©ristiques contextuelles incluent les caractĂ©ristiques dâidentitĂ© de âtonophonesâ, les caractĂ©ristiques de localisation, les caractĂ©ristiques liĂ©es Ă la tonalitĂ©, et les caractĂ©ristiques prosodiques (POS, allongement final, niveaux de rupture). Mary TTS a Ă©tĂ© choisi comme plateforme pour la mise en oeuvre de VTED. Dans le test MOS (Mean Opinion Score), le premier VTED, appris avec les anciens corpus et des fonctions de base, Ă©tait plutĂŽt bonne, 0,81 (sur une Ă©chelle MOS 5 points) plus Ă©levĂ© que le prĂ©cĂ©dent systĂšme â HoaSung (lequel utilise la sĂ©lection de lâunitĂ© non-uniforme avec le mĂȘme corpus) ; mais toujours 1,2-1,5 point de moins que le discours naturel. La qualitĂ© finale de VTED, avec le nouveau corpus et le modĂšle de phrasĂ© prosodique, progresse dâenviron 1,04 par rapport au premier VTED, et son Ă©cart avec le langage naturel a Ă©tĂ© nettement rĂ©duit. Dans le test dâintelligibilitĂ©, le VTED final a reçu un bon taux Ă©levĂ© de 95,4%, seulement 2,6% de moins que le discours naturel, et 18% plus Ă©levĂ© que le premier. Le taux dâerreur du premier VTED dans le test dâintelligibilitĂ© gĂ©nĂ©rale avec le carrĂ© latin test dâenviron 6-12% plus Ă©levĂ© que le langage naturel selon des niveaux de syllabe, de ton ou par phonĂšme. Le rĂ©sultat final ne sâĂ©carte de la parole naturelle que de 0,4-1,4%
Les propriétés grammaticales du genre de l'offre d'emploi aux fondements d'une méthode de classement automatique.
Nous présentons un projet de fouille de textes qui vise à développer une méthode de classement automatique d'offres d'emploi et d'identification des impératifs de compétences ; la méthode s'appuie sur l'étude des termes au sein de constructions grammaticales prototypiques (Bourrigault et Jacquemin, 2000 ; Tutin, 2007) permettant de saisir la sémantique lexicale et ce d'autant mieux au sein de l'horizon interprétatif défini par un genre spécifique (Condamines, 2006). Notre corpus se compose de 13375 offres d'emploi couvrant l'ensemble des métiers et secteurs, et annotées automatiquement en dépendances suivant une technique décrite dans (De La Clergerie et al., 2009 ; Erk & Padó, 2008 ; Padó & Lapata, 2007). Les patrons relevés, qui associent un jargon des ressources humaines et un lexique spécifique au métier concerné, permettent de distinguer les " compétences " d'autres classes de locutions emblématiques (par ex. l'intitulé du poste etc.) (Loth, 2010), ainsi que de classer les compétences (savoir-faire, personnalité, formation etc.). L'étude questionne ainsi la caractérisation multi-dimensionnelle des genres (Biber, 1988, 1993 ; Malrieu & Rastier, 2001 ; Rastier, 2001) et les liens entre syntaxe et sémantique (paradigmes constructionnels typiques et sémantique résultante)
Stratégies de compréhension d'énoncés exprimant une relation spatiale : étude génétique.
International audiencePour étudier, chez des enfants de 3 à 6 ans, la disponibilité de diverses stratégies de compréhension, on a présenté des phrases comportant des marques de localisation spatiale mettant en jeu un sujet pronominal à référent interne à l'énoncé, un prédicat, un syntagme prépositionnel. Ces phrases sont réparties en quatre types de suites selon les caractéristiques lexicales et positionnelles attribuées au SN référent du pronom. Elles rendent disponibles pour l'interprétation : des indices morphosyntaxiques, positionnels et lexico-pragmatiques.L'expérience a permis de mettre en évidence deux modes d'interprétation utilisant, pour l'un des indices lexico-pragmatiques , pour l'autre des indices syntaxiques. Le mode d'interprétation lexico-pragmatique est présent à tous les ùges étudiés, mais surtout chez les sujets les plus jeunes. Le mode d'interprétation morphosyntaxique apparaßt vers 4 ans et se développe au-delà . il n'a pas été possible par ailleurs de ramener le type de performance d'un petit nombre de sujets à un mode d'interprétation unique et prédictible a priori
DĂ©terminants socioculturels de lâapprentissage du discours dĂ©contextualisĂ© en milieu scolaire : vers un cadre thĂ©orique intĂ©grĂ©
La disparitĂ© entre la performance scolaire des enfants des groupes majoritaire et minoritaire devrait normalement diminuer avec les annĂ©es de scolarisation. Câest pourtant lâinverse qui se produit et ce paradoxe, bien connu des chercheurs dans le domaine, nâa pas encore reçu dâexplication satisfaisante.Cet article se propose de tracer les grandes lignes dâun cadre thĂ©orique qui, tout en aidant Ă saisir la grande complexitĂ© du problĂšme, permet dâapprofondir la comprĂ©hension dâun de ses aspects : lâinteraction entre la culture et la cognition.La thĂ©orie des schĂ©mas est utilisĂ©e pour expliquer certaines difficultĂ©s rencontrĂ©es dans la pratique de la lecture et de lâĂ©criture, en se basant sur le fait que des expĂ©riences culturelles disparates donnent lieu au dĂ©veloppement de schĂ©mas distincts chez les individus de cultures diffĂ©rentes.Le processus de scolarisation, qui devrait consister Ă Ă©tendre le rĂ©pertoire de schĂ©mas cognitifs, sociaux et linguistiques de lâenfant est Ă lâorigine dâun aspect du paradoxe Ă©tudiĂ©; en Ă©tant axĂ©s sur les habiletĂ©s de base, les programmes scolaires offrent un contexte peu propice au dĂ©veloppement de certains schĂ©mas cognitifs essentiels.The disparity between the scholastic performance of children belonging to majority and minority groups should normally decrease with schooling. Nevertheless, it is the opposite that is observed and this paradox, well-known to the researchers in this field, has not yet received a satisfactory explanation.This paper proposes to sketch the main lines of a theoretical framework that helps to understand the great complexity of the problem and allows a deeper comprehension of one of its aspects: the interaction between culture and cognition.Schema theory is used to explain certain difficulties in reading and writing, based on the fact that differences in cultural experiences give rise to the development of different schemas for individuals coming from different cultures.The schooling process, which should contribute to extending the repertory of the child's cognitive, social and linguistic schemas, is in fact at the origin of one aspect of the paradox in question; being centrated on basic skills, scholastic programs offer a context that is not conductive to the emergence of certain essential cognitive schemas
Les résistances pragmatiques au traitement syntaxique des phrases simples chez l'enfant.
On Ă©tudie, dans une tĂąche de comprĂ©hension, les circonstances dans lesquelles les modes d'interprĂ©tation syntaxiques et pragmatiques sont plus particuliĂšrement utilisĂ©s.Trois types de situation, prĂ©sentant Ă des degrĂ©s divers des aspects antipragmatiques, sont Ă©voquĂ©s verbalement et proposĂ©s Ă des enfants de 3;6 Ă 6;5 ans. Ces situations (dĂ©nommĂ©es Paradoxales, Improbables, et Extraordinaires) s 'opposent par les caractĂ©ristiques de renversabilitĂ© situationnelle (P, E/I) et de compatibilitĂ© sĂ©mantique des unitĂ©s (P, l/E,). A leur cĂŽtĂ© sont Ă©voquĂ©es des situations Communes.II apparall que : les situations dĂ©crites par les phrases forment, Ă des degrĂ©s divers, obstacle Ă la mise en ceuvre d'une interprĂ©tation svntaxique fondĂ©e sur l'ordre des lexĂšmes dans la phrase (stratĂ©gie syntaxique au demeurant dominante dans toutes les situations) et suscitent le recours Ă des interprĂ©tations pragmatiques. Il faut attendre cinq ans pour voir les phrases Ă©voquant des situations improbables interprĂ©tĂ©es de la mĂȘme façon que les phrases dĂ©crivant des situations communes ; et six ans pour que les phrases Ă©voquant des situations paradoxales soient d'Ă©gale facilitĂ© que celles dĂ©crivant des situations extraordinaires. A six ans les phrases Ă©voquant ces deux derniers types de situations demeurent encore les plus difficiles Ă interprĂ©ter Ă l'aide de la stratĂ©gie syntaxique.Il ressort que l'application effective de la stratĂ©gie syntaxique n'est pas forcement entravĂ©e par l'incompatibilitĂ© sĂ©mantique des unitĂ©s. Les caractĂ©ristiques de non renversabilitĂ© des situations y suffisent
- âŠ