177 research outputs found

    Alignement de transcriptions imparfaites sur un flux de parole

    Get PDF
    Dans de nombreuses situations, un texte descriptif peut être associé à un flux audio parlé : sous-titres de films, scénario/texte et théâtre, résumés et émissions radiophoniques, transcription réarrangée pour les débats politiques. Le texte correspond rarement à la transcription exacte de la parole : une pièce de théâtre est jouée différemment à chaque représen-tation et un présentateur s'éloigne parfois de son prompteur. Le but de ce travail est d'aligner un texte descriptif sur le flux parlé lorsqu'il lui correspond, et de laisser la main au système de reconnaissance lorsque la transcription s'en éloigne. Les applications visées sont multiples : permettre à des malentendants de suivre une pièce de théâtre en affichant le texte de la pièce ali-gné avec la parole correspondante en respectant les variations, suivre un film dans une langue en alignant au plus près les sous-titres avec une voix audio, suivre des débats, des réunions. ABSTRACT. In many cases, a descriptive transcript can be associated to speech signal : movies subtitles, scenario and theatre, summaries and radio broadcast, rearranged transcription for political debates. Transcripts correspond rarely to the exact word utterance. An actor plays differently each play and a speaker is sometimes far of the promptor. The goal of this work is whether to align the given transcript when it matches the speech signal or to fall back on an automatic speech recognition (ASR) adapted with the transcript language. There are multiple applications : to help deaf people following a play with closed caption aligned to the voice signal (with respect to performers variations), to watch a movie in another language using aligned closed caption, to transcript in real time debates or meetings

    Évaluation de l'interopérabilité d'une plate-forme de téléapprentissage

    Get PDF
    Une des préoccupations majeures des concepteurs et éditeurs de plates-formes de téléapprentissage est d'offrir une bonne qualité de leurs produits logiciels si l'on considère que l'offre est de plus en plus variée et la compétition accrue. Or, l'un des facteurs de qualité les plus demandés pour ces plates-formes est leur interopérabilité car ces systèmes fonctionnent de plus en plus dans des environnements très ouverts comme le Web pour l'importation et l'exportation des fichiers de toute nature. Or, pour atteindre un niveau de qualité satisfaisant, il faut d'abord disposer de méthodes d'évaluation de la qualité qui soient rigoureuses et fiables. Parmi ces méthodes, notre travail propose une méthode d'évaluation basée sur une norme internationale, ISO 9126, donc une méthode relativement plus fiable que les méthodes courantes basées sur la perception des usagers qui sont des méthodes très subjectives (exemple: questionnaire, entrevues). Plus précisément, notre travail vise à analyser la conformité de la plate-forme WebCT à l'exigence d'interopérabilité incluse dans la norme de qualité logiciel ISO 9126. Cette analyse de conformité est basée sur des tests d'opérabilité sur chacun des 17 outils logiciels de cette plate-forme et les observations issues de ces tests serviront de base à l'évaluation de l'interopérabilité de WebCT. Les résultats de l'évaluation montrent que l'interopérabilité est un des maillons les plus faibles de cette plate-forme car l'interopérabilité du contenu ne satisfait qu'à 65% des exigences de la norme ISO 9126 alors que l'interopérabilité technique ne répond qu'à 53% des spécifications de cette norme. Il en résulte qu'une amélioration importante devrait être apportée à cette fonctionnalité critique qu'est l'interopérabilité dans la prochaine version campus de WebCT. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Téléapprentissage, E-learning, Interopérabilité, Évaluation, Normes de téléapprentissage, ISO 9126, WebCT, Analyse de conformité

    Modélisation de connaissances à partir de textes pour une recherche d'information sémantique

    Get PDF
    Avec l'avènement d'Internet et des réseaux d'entreprise, les documents numériques ont subi de profondes transformations, tant dans la diversification de leur support (texte, image, son, vidéo), que dans la forte augmentation de leur nombre accessible informatiquement. La Recherche d'Information (RI) a alors pris une importance capitale : l'utilisateur en quête de données répondant à ses besoins veut disposer de logiciels capables d'exploiter les contenus textuels et de trouver automatiquement tout document pertinent pour la requête. Pour comparer selon leur sens requête et documents, la RI sémantique nécessite deux opérations préalables : l'obtention d'un modèle des connaissances manipulées et, grâce à lui, l'indexation sémantique des données textuelles. Dans ce mémoire, nous étudions les modèles de Ressources Termino-Ontologiques (RTO) adaptés à la RI et développons un formalisme qui, contrairement aux approches classiques, décrit explicitement la relation entre termes du lexique et concepts de l'ontologie, tout en respectant le standard OWL-DL. Nous abordons ensuite la problématique de maintenance d'une RTO pour la RI : quand un domaine évolue dans le temps, sa RTO correspondante doit être modifiée en conséquence. L'originalité de notre approche réside dans la mise en parallèle entre maintenance de RTO et indexation sémantique : l'ontographe définit des règles évaluant automatiquement la correction de la RTO en fonction des résultats d'indexation attendus ; appliquées aux documents à indexer, ces règles aident à repérer ceux qui témoignent de la nécessité de maintenance. L'outil présente alors ces documents avec des conseils de modification. Notre dernière contribution inclut notre formalisme de RTO et le cycle de maintenance au sein d'un processus global de RI sémantique. Nous nous intéressons notamment à la comparaison sémantique d'un document à une requête en langue naturelle. Nous proposons une mesure de similarité tenant compte de la proximité taxonomique de deux notions, ainsi que de la manière dont chacune est reliée sémantiquement à d'autres éléments. La pertinence de nos contributions a été principalement mise à l'épreuve par la réalisation et l'utilisation d'un prototype d'outil pour la RI sémantique dans le cadre d'un partenariat avec Actia, une société spécialiste du diagnostic automobile.With the spreading of Internet and local networks, numerical documents have been undergoing deep mutations, mainly due to the diversification of supports (text, image, sound, video) and their high number accessible by computers. Information Retrieval (IR) has thus become crucial: any user of a search engine wants it to be able to process textual contents to find automatically all documents relevant for their query. In order to compare a query with a document, semantic IR needs two prior operations to be carried out: obtaining a model for the handled knowledge and using it to index semantically the textual data. In this thesis, we study Ontological and Terminological Resources (OTR) adapted for IR and we develop a formalism which, unlike classical approaches, explicitly describes the relationship between terms and concepts, while respecting OWL-DL standard. Afterwards, we broach the topic of maintaining an OTR for IR: when a domain evolves in time, its corresponding OTR must be modified accordingly. The originality of our approach lies in the parallel computing of OTR maintenance and semantic indexing: the engineer can define rules which evaluate automatically the correctness of the OTR with respect to the expected indexing results; applied to the documents to be indexed, these rules help to spot the ones which show the necessity of maintaining the OTR. The tool then displays these documents with evolution advice. Our last contribution consists in integrating our OTR formalism and the maintenance cycle into a global semantic IR process. We especially focus on the semantic matching between a document and a keyword based query. We propose a semantic similarity measure which takes into account both the taxonomical proximity of two notions and the way each one is semantically connected to other entities. The relevance of our contributions was mainly tested by the implementation and use of a prototype tool for semantic IR as part of a partnership with ACTIA, a company specialized in automotive diagnosi

    Enquête diagnostique des connaissances en information-documentation des élèves du secondaire en France

    Get PDF
    Cette enquête menée sur 6 ans (2009-2015) avait pour but de faire un état des lieux des connaissances et des élèves du secondaire. L\u27objectif était déterminer les manques en terme de formation des élèves, les points forts, afin de renforcer l\u27expertise didactique des professeurs documentalistes dans les processus de transposition didactique externe (l\u27élaboration des savoirs scolaires) et interne (la mise en situation didactique de ces savoirs dans la classe) en leur apportant des données objectives sur l\u27état des acquisitions des élèves à l\u27entrée et à la sortie du collège et du lycée. Enfin, cette étude permet d\u27établir des comparaisons à partir des résultats enregistrés en Terminale avec deux enquêtes nationales réalisées au Québec (CREPUQ) et en Belgique (EDUDOC) en 2003 et 2008 pour des étudiants en début d\u27année de premier cycle

    Sémantique interprétative et analyses automatiques de textes : que deviennent les sèmes ?

    Get PDF
    Numéro thématique dirigé par Benoît HABERT et intitulé :"Dépasser les sens iniques dans l'accès automatisé aux textes"National audienceSemes are usually understood as semantic primitives, in order to describe meanings. As for F. Rastier, semes are contextually defined, and are the result of an interpretative path. This modelisation accounts for successes and limits of some statistical and distributional approaches. Some of the mathematical properties implied are not linguistically appropriate, so that the processing has to be defined on new bases. Text semantics also sheds new light on NLP tools and processes : dictionaries, taggers, corpus. A new clustering method is proposed as a means to modelize isotopies, and thus texts topics. These computed semantic classes are inherently different from the ones manually defined by experts.Le sème est souvent compris comme une primitive utilisable pour décrire les sens des mots. Or, tel que le présente F. Rastier, il est défini par et dans un contexte, et apparaît comme le résultat de l'interprétation d'un texte. Cette conception du sème permet de comprendre les succès et les limites d'analyses statistiques ou distributionnelles de textes. Certaines propriétés mathématiques des modélisations se révèlent linguistiquement inadéquates ; choisir le cadre de la sémantique interprétative conduit alors à redéfinir les traitements par-delà le seul ajustement des paramètres. Cette perspective oriente également certains choix concernant les outils et les étapes du TAL : dictionnaires, analyseurs morpho-syntaxiques, corpus et étiquetage. Un nouveau mode de classification automatique est présenté, comme moyen de repérage et de représentation des isotopies et donc de la thématique d'un texte. Ces classes sémantiques calculées sont d'une autre nature que celles définies par des experts

    Vocabulaire des techniques de l\u27information et de la communication (TIC)

    Get PDF
    Cette nouvelle édition du Vocabulaire des techniques de l’information et de la communication (TIC), publiée par la Délégation générale à la langue française et aux langues de France, comprend 850 termes et définitions concernant des notions nouvelles dont la plupart n’avaient pas encore de désignation en français. Ils sont issus pour l’essentiel des travaux menés depuis 1979 par les groupes d’experts du dispositif d’enrichissement de la langue française chargés de l’électronique, de l’informatique et des télécommunications, sans oublier d’autres groupes d’experts travaillant dans les domaines de l’audiovisuel et de l’éducation. Tous ces termes publiés au Journal officiel sont représentatifs de l’essor et de l’évolution très rapides d’un secteur d’activité dont le vocabulaire n’était, au début des années 1980, employé et compris que par quelques professionnels. Aujourd’hui, ce vocabulaire s’adresse à un très grand nombre de citoyens. Le lecteur ne s’étonnera donc pas de parcourir un vaste panorama du Vocabulaire des TIC qui va de « banque de données », « logiciel » ou « système d’exploitation » à « enfant du numérique »

    Ontologies, web sémantique et elearning : vers la composition automatique des objets d'apprentissage fondée sur les ontologies et les théories pédagogiques

    Get PDF
    Un des grands défis de l'apprentissage en ligne est la difficulté de composition des scénarios de formation à partir des objets d'apprentissages sémantiquement référencés pour répondre aux besoins spécifiques de formation. Un tel travail demande l'acquisition des connaissances du domaine qui repose généralement sur des experts humains du domaine et sur un processus d'explicitation de leurs connaissances. Il en est de même pour les principes devant guider la composition des scénarios afin de garantir leur qualité (valeurs pédagogiques). Répondre rapidement à ces besoins d'apprentissage par la proposition d'un contenu approprié ainsi qu'un cheminement d'apprentissage efficace et pédagogiquement valide est une nécessité, tant dans la formation classique en ligne que dans la formation en milieu industriel. L'offre d'une solution permettant d'atteindre un tel objectif contribuerait à une économie de coûts liés à la formation. Ce mémoire rend compte d'un travail visant à proposer une solution novatrice pour générer un contenu sur mesure (selon un besoin précis) et ainsi qu'un parcours pédagogiquement valide de celui-ci. La méthode s'appuie essentiellement sur une ontologie du domaine pour sélectionner les éléments de contenus appropriés (ou objets d'apprentissage) et sur un ensemble de principes pédagogiques explicites pour les structurer. Après un état de l'art conséquent qui met en perspectives l'ensemble des domaines en jeu (elearning, web sémantique et ingénierie ontologique), les standards disponibles dans le domaine du elearning pour la gestion des contenus d'apprentissage, et les problèmes de composition automatique (fondée ou non sur les ontologies) des objets d'apprentissage, une architecture générale de l'approche proposée est présentée, illustrant clairement les éléments qui soutiennent le processus de composition. Ce dernier comporte essentiellement trois (3) étapes : la sélection des ressources pertinentes, leur organisation (par la prise en compte des contraintes de référencement sémantique réalisé à partir de l'ontologie du domaine) et la scénarisation pédagogique qui prend en compte les principes de la théorie pédagogique sélectionnée. Un modèle définissant les opérateurs essentiels est proposé ainsi que des algorithmes qui implémentent les différents services. Un outil a été réalisé et testé avec des contenus d'un cours de programmation en Java.\ud ______________________________________________________________________________ \ud MOTS-CLÉS DE L’AUTEUR : elearning, web sémantique, ontologies, objets d'apprentissage, théories pédagogiques, composition automatique des objets d'apprentissage

    Conception générique d'un outil de configuration de « e-TP »

    Get PDF
    Powered by the technological advances of the “Information and communication sciences and technologies”, the Electronic Laboratory for Practical Training “ELab” (also known as ELab hands-on training) has become an inescapable teaching mode especially in the technical and scientific disciplines. Thus, several ELab modes have emerged: virtual ELab, remote ELab, Local Elab, augmented reality ELab, etc. The latter require the use of hardware devices (educational mock ups, measuring instruments, robots, etc.). In most cases, before or during an ELab session, these devices need to be reconfigured according to teaching purposes. For complex systems, like Automated Production Systems (APS), this reconfiguration process requires technical skills which the instructor does not have systematically. This imposes that a technician should be available, failing which the usage of the pedagogical platform will be limited to a few skilled instructors. Accordingly, this research aims at facilitating the reconfiguration process of complex systems (particularly the APS) featuring ELabs. A first survey designated to the users of « AIP-Priméca-RAO », located at the INSA de Lyon, has revealed the needs and constraints related to such a platform. It has been highlighted that beyond the (re)configuration process, a waste of precious time was detected. It has been established that it was due to the absence of a common tool for pedagogical resource management. This observation fed the design of a software tool managing an editorial chain aiming at simplifying creation, edition, assembling, organization, and the reutilization of different resources that can be exploited in an ELab session. This tool is also intended to improve the autonomy of the instructor during the preparation of an ELab session, by reducing the required time to configure this session. This implies to automate the reconfiguration process of an APS supporting the ELab and the publishing of the pedagogical learning scenarios on a Learning Management System (LMS). In order to validate this design, a prototype has been developed and tested on real Elab cases. Subsequently, this tool could be rendered more generic so that it can serve Elabs in different disciplines.Renforcés par les avancées technologiques des « Sciences et Technologies de l’Information et de la Communication (STIC) », les Travaux Pratiques électroniques « e-TP » sont devenus un mode d’enseignement incontournable surtout dans les disciplines techniques et scientifiques. Plusieurs modes d’e-TP ont émergé : TP virtuel, TéléTP, TP présentiel assisté par ordinateur, TP en réalité augmentée... ces derniers modes nécessitant l'usage de dispositifs matériels (maquette pédagogique, appareils de mesure, robots, etc.). Dans la majorité des cas, avant ou même pendant une session d'e-TP, il est nécessaire de (re)configurer ces dispositifs selon des besoins pédagogiques. Cette reconfiguration nécessite, pour des systèmes complexes, comme les Systèmes Automatisés de Production (SAP), des compétences que l'instructeur ne possède pas systématiquement. Ce qui impose la présence d'un technicien ou limite le nombre d'instructeurs susceptibles d'utiliser la plate-forme pédagogique. Ce travail de recherche a pour objectif de faciliter la (re)configuration de systèmes complexes, particulièrement les SAP, dans le cadre d'e-TPs. Une première enquête auprès des utilisateurs de l’« AIP-Priméca-RAO » (situé à l’INSA de Lyon) a révélé les besoins et contraintes liés à une plate-forme de ce type. Il s'est avéré qu'au-delà de la (re)configuration, l'absence d'outil commun de gestion des ressources pédagogiques faisait perdre un temps précieux aux utilisateurs. Ce constat a nourri la conception d'un outil informatique gérant une chaîne éditoriale dont le but est de simplifier la création, l’édition, l’assemblage, l’organisation et la réutilisation des différentes ressources à exploiter dans une session d’e-TP. Cet outil a également pour objectif d’améliorer l’autonomie de l’instructeur lors de la préparation de sessions d’e-TP tout en réduisant le temps requis pour configurer cette session. Cela a impliqué d’automatiser le processus de reconfiguration du SAP support d'e-TP, et de publication des scénarios pédagogiques sur un système de gestion d’apprentissage « LMS » (Learning Management System). Un prototype a été développé et testé sur des e-TPs réels afin de valider cette conception. Cet outil pourrait, ultérieurement, être rendu plus générique afin de servir des e-TPs dans d'autres disciplines

    Rapport d\u27activités Abes 2020

    Get PDF
    Le Rapport d\u27activités 2020 de l\u27Abes propose un retour complet sur cette année compliquée du fait de la crise sanitaire au cours de laquelle cette agence a tout mis en œuvre pour apporter aux professionnels des réseaux qu\u27elle anime les services attendus et les accompagner au quotidien pendant cette période
    • …
    corecore