65 research outputs found

    " Quand rédiger c'est décrire " : Mise en forme matérielle des textes et construction d'ontologies à partir de textes

    Get PDF
    National audienceLa construction d'ontologie Ă  partir de textes met classiquement en oeuvre des outils issus du Traitement Automatique de la Langue et/ou des outils d'apprentissage supervisĂ© ou non. Dans cet article nous revenons sur la possibilitĂ© d'exploiter des objets textuels Ă  la fois facilement identifiables, souvent fertiles en connaissances ontologiques, et dont la sĂ©mantique peut clairement ĂȘtre explicitĂ©e par les thĂ©ories du discours : les structures Ă©numĂ©ratives. Ici, nous ajoutons une nouvelle classe de relations sĂ©mantiques portĂ©e par les structures Ă©numĂ©ratives trĂšs prĂ©sentes dans nos corpus : les relations lexicales telles que l'homonymie ou la synonymie. Ces relations semblent propices pour alimenter la facette terminologique d'une Ressource Termino-Ontologique. Nous montrons que ces relations peuvent ĂȘtre formellement caractĂ©risĂ©es. Une Ă©valuation de notre approche Ă  partir d'un corpus annotĂ© manuellement nous permet de valider notre position, ce qui constitue une premiĂšre Ă©tape vers un outil d'apprentissage supervisĂ© pour la construction d'ontologie Ă  partir de texte

    READ : une plateforme pour l'évaluation de méthodes d'accÚs non-visuelles aux documents numériques

    Get PDF
    International audienceREAD (Restitution de l’Architecture des Documents)est un logiciel permettant un accĂšs non-visuel augmentĂ© Ă  des documents balisĂ©s. Cette plateforme a Ă©tĂ© initialement dĂ©veloppĂ©e pour Ă©valuer diffĂ©rentes mĂ©thodes de restitution de la mise en forme des textes [8]. La flexibilitĂ© de l’architecture de READ permet d’implĂ©menter facilement de nouvelles modalitĂ©s d’entrĂ©e et de sortie, ainsi que de nouvelles fonctionnalitĂ©s;l’application sera mise Ă  disposition prochainement en open source pour rĂ©utilisation non-commerciale. Le but principal est de permettre l’implĂ©mentation et l’évaluation rapide de mĂ©thodes d’accĂšs non-visuels aux documents, domaine dans lequel un effort de recherche certain est attendu [7]. Une dĂ©monstration permettra aux participants de la confĂ©rence d’observer les fonctionnalitĂ©s implĂ©mentĂ©es et d’avoir un aperçu des possibilitĂ©s d’extension de l’application

    L'utilisation des POMDP pour les résumés multi-documents orientés par une thématique

    Get PDF
    National audienceL’objectif principal du rĂ©sumĂ© multi-documents orientĂ© par une thĂ©matique est de gĂ©nĂ©rer un rĂ©sumĂ© Ă  partir de documents sources en rĂ©ponse Ă  une requĂȘte formulĂ©e par l’utilisateur. Cette tĂąche est difficile car il n’existe pas de mĂ©thode efficace pour mesurer la satisfaction de l’utilisateur. Cela introduit ainsi une incertitude dans le processus de gĂ©nĂ©ration de rĂ©sumĂ©. Dans cet article, nous proposons une modĂ©lisation de l’incertitude en formulant notre systĂšme de rĂ©sumĂ© comme un processus de dĂ©cision markovien partiellement observables (POMDP) car dans de nombreux domaines on a montrĂ© que les POMDP permettent de gĂ©rer efficacement les incertitudes. Des expĂ©riences approfondies sur les jeux de donnĂ©es du banc d’essai DUC ont dĂ©montrĂ© l’efficacitĂ© de notre approche

    A reinforcement learning formulation to the complex question answering problem

    Get PDF
    International audienceWe use extractive multi-document summarization techniques to perform complex question answering and formulate it as a reinforcement learning problem. Given a set of complex questions, a list of relevant documents per question, and the corresponding human generated summaries (i.e. answers to the questions) as training data, the reinforcement learning module iteratively learns a number of feature weights in order to facilitate the automatic generation of summaries i.e. answers to previously unseen complex questions. A reward function is used to measure the similarities between the candidate (machine generated) summary sentences and the abstract summaries. In the training stage, the learner iteratively selects the important document sentences to be included in the candidate summary, analyzes the reward function and updates the related feature weights accordingly. The final weights are used to generate summaries as answers to unseen complex questions in the testing stage. Evaluation results show the effectiveness of our system. We also incorporate user interaction into the reinforcement learner to guide the candidate summary sentence selection process. Experiments reveal the positive impact of the user interaction component on the reinforcement learning framework

    Improving the accessibility of digital documents for visually impaired users : Contributions of the Textual Architecture Model

    Get PDF
    International audienceThis paper presents a framework which aims at describing text formatting, based on a model coming from the field of logic and linguistics, the Textual Architecture Model [23]. The goal is to improve documents accessibility for blind users. The project will later focus on evaluating the efficiency of different navigation and content presentation strategies, based on this framework

    TALN et IHM : une approche transdisciplinaire pour la saisie de textes de personnes en situation de handicaps

    Get PDF
    International audienceCe papier vise d'une part, à présenter une synthÚse des méthodes d'optimisation pluridisciplinaires alliant le traitement automatique de la langue naturelle et celui l'interaction homme-machine et d'autre part à soulever les nouveaux verrous scientifiques posés par l'arrivée des nouvelles technologies et des nouveaux modes d'écriture pour la saisie de textes. Cette synthÚse abordera les principes d'optimisation des agencements spatiaux des claviers virtuels et ceux de la prédiction de caractÚres et/ou des mots à afficher en tenant compte des nouveaux supports d'interaction et des nouvelles technologie

    Communicating text structure to blind people with Text-To-Speech

    Get PDF
    International audienceThis paper presents the results of an experiment conducted with nine blind subjects for the evaluation of two audio restitution methods for headings, using Text-To-Speech. We used specialized audio and two voices to demarcate headings. This work is part of a research project which focuses on structural in-formation accessibility for the blind in digital documents

    DĂ©tection automatique de la structure organisationnelle de documents Ă  partir de marqueurs visuels et lexicaux

    Get PDF
    National audienceLa comprĂ©hension d'un texte s'opĂšre Ă  travers les niveaux d'information visuelle, logique et discursive, et leurs relations d'interdĂ©pendance. La majoritĂ© des travaux ayant Ă©tudiĂ© ces relations a Ă©tĂ© menĂ©e dans le cadre de la gĂ©nĂ©ration de textes, oĂč les propriĂ©tĂ©s visuelles sont infĂ©rĂ©es Ă  partir des Ă©lĂ©ments logiques et discursifs. Les travaux prĂ©sentĂ©s ici adoptent une dĂ©marche inverse en proposant de gĂ©nĂ©rer automatiquement la structure organisationnelle du texte (structure logique) Ă  partir de sa forme visuelle. Le principe consiste Ă  (i) labelliser des blocs visuels par apprentissage afin d'obtenir des unitĂ©s logiques et (ii) relier ces unitĂ©s par des relations de coordination ou de subordination pour construire un arbre. Pour ces deux tĂąches, des Champs AlĂ©atoires Conditionnels et un Maximum d'Entropie sont respectivement utilisĂ©s. AprĂšs apprentissage, les rĂ©sultats aboutissent Ă  une exactitude de 80,46% pour la labellisation et 97,23% pour la construction de l'arbre

    Une architecture multi-agents en PAO pour le formatage de documents structures

    No full text
    SIGLEINIST T 80200 / INIST-CNRS - Institut de l'Information Scientifique et TechniqueFRFranc
    • 

    corecore