Search CORE

65 research outputs found

" Quand rédiger c'est décrire " : Mise en forme matérielle des textes et construction d'ontologies à partir de textes

Author: Kamel Mouna
Mojahid Mustapha
Rothenburger Bernard
Publication venue: HAL CCSD
Publication date: 25/06/2012
Field of study

National audienceLa construction d'ontologie à partir de textes met classiquement en oeuvre des outils issus du Traitement Automatique de la Langue et/ou des outils d'apprentissage supervisé ou non. Dans cet article nous revenons sur la possibilité d'exploiter des objets textuels à la fois facilement identifiables, souvent fertiles en connaissances ontologiques, et dont la sémantique peut clairement être explicitée par les théories du discours : les structures énumératives. Ici, nous ajoutons une nouvelle classe de relations sémantiques portée par les structures énumératives très présentes dans nos corpus : les relations lexicales telles que l'homonymie ou la synonymie. Ces relations semblent propices pour alimenter la facette terminologique d'une Ressource Termino-Ontologique. Nous montrons que ces relations peuvent être formellement caractérisées. Une évaluation de notre approche à partir d'un corpus annoté manuellement nous permet de valider notre position, ce qui constitue une première étape vers un outil d'apprentissage supervisé pour la construction d'ontologie à partir de texte

Scientific Publications of the University of Toulouse II Le Mirail

HAL-Rennes 1

READ : une plateforme pour l'évaluation de méthodes d'accès non-visuelles aux documents numériques

Author: Lemarié Julie
Mojahid Mustapha
Sorin Laurent
Publication venue: HAL CCSD
Publication date: 27/10/2015
Field of study

International audienceREAD (Restitution de l’Architecture des Documents)est un logiciel permettant un accès non-visuel augmenté à des documents balisés. Cette plateforme a été initialement développée pour évaluer différentes méthodes de restitution de la mise en forme des textes [8]. La flexibilité de l’architecture de READ permet d’implémenter facilement de nouvelles modalités d’entrée et de sortie, ainsi que de nouvelles fonctionnalités;l’application sera mise à disposition prochainement en open source pour réutilisation non-commerciale. Le but principal est de permettre l’implémentation et l’évaluation rapide de méthodes d’accès non-visuels aux documents, domaine dans lequel un effort de recherche certain est attendu [7]. Une démonstration permettra aux participants de la conférence d’observer les fonctionnalités implémentées et d’avoir un aperçu des possibilités d’extension de l’application

Scientific Publications of the University of Toulouse II Le Mirail

HAL Descartes

L'utilisation des POMDP pour les résumés multi-documents orientés par une thématique

Author: Chali Yllias
Hasan Sadid A.
Mojahid Mustapha
Publication venue: HAL CCSD
Publication date: 01/01/2013
Field of study

National audienceL’objectif principal du résumé multi-documents orienté par une thématique est de générer un résumé à partir de documents sources en réponse à une requête formulée par l’utilisateur. Cette tâche est difficile car il n’existe pas de méthode efficace pour mesurer la satisfaction de l’utilisateur. Cela introduit ainsi une incertitude dans le processus de génération de résumé. Dans cet article, nous proposons une modélisation de l’incertitude en formulant notre système de résumé comme un processus de décision markovien partiellement observables (POMDP) car dans de nombreux domaines on a montré que les POMDP permettent de gérer efficacement les incertitudes. Des expériences approfondies sur les jeux de données du banc d’essai DUC ont démontré l’efficacité de notre approche

Scientific Publications of the University of Toulouse II Le Mirail

Open Archive Toulouse Archive Ouverte

A reinforcement learning formulation to the complex question answering problem

Author: Chali Yllias
Hasan Sadid A.
Mojahid Mustapha
Publication venue: 'Elsevier BV'
Publication date: 01/05/2015
Field of study

International audienceWe use extractive multi-document summarization techniques to perform complex question answering and formulate it as a reinforcement learning problem. Given a set of complex questions, a list of relevant documents per question, and the corresponding human generated summaries (i.e. answers to the questions) as training data, the reinforcement learning module iteratively learns a number of feature weights in order to facilitate the automatic generation of summaries i.e. answers to previously unseen complex questions. A reward function is used to measure the similarities between the candidate (machine generated) summary sentences and the abstract summaries. In the training stage, the learner iteratively selects the important document sentences to be included in the candidate summary, analyzes the reward function and updates the related feature weights accordingly. The final weights are used to generate summaries as answers to unseen complex questions in the testing stage. Evaluation results show the effectiveness of our system. We also incorporate user interaction into the reinforcement learner to guide the candidate summary sentence selection process. Experiments reveal the positive impact of the user interaction component on the reinforcement learning framework

Crossref

Scientific Publications of the University of Toulouse II Le Mirail

Open Archive Toulouse Archive Ouverte

HAL Descartes

Improving the accessibility of digital documents for visually impaired users : Contributions of the Textual Architecture Model

Author: Aussenac-Gilles Nathalie
Lemarié Julie
Mojahid Mustapha
Sorin Laurent
Publication venue: HAL CCSD
Publication date: 01/01/2013
Field of study

International audienceThis paper presents a framework which aims at describing text formatting, based on a model coming from the field of logic and linguistics, the Textual Architecture Model [23]. The goal is to improve documents accessibility for blind users. The project will later focus on evaluating the efficiency of different navigation and content presentation strategies, based on this framework

Crossref

Scientific Publications of the University of Toulouse II Le Mirail

Open Archive Toulouse Archive Ouverte

HAL Descartes

TALN et IHM : une approche transdisciplinaire pour la saisie de textes de personnes en situation de handicaps

Author: BOISSIÈRE Philippe
Mojahid Mustapha
Sauzin Damien
Vella Frédéric
Vigouroux Nadine
Publication venue: 'Association for Computational Linguistics (ACL)'
Publication date: 01/01/2015
Field of study

International audienceCe papier vise d'une part, à présenter une synthèse des méthodes d'optimisation pluridisciplinaires alliant le traitement automatique de la langue naturelle et celui l'interaction homme-machine et d'autre part à soulever les nouveaux verrous scientifiques posés par l'arrivée des nouvelles technologies et des nouveaux modes d'écriture pour la saisie de textes. Cette synthèse abordera les principes d'optimisation des agencements spatiaux des claviers virtuels et ceux de la prédiction de caractères et/ou des mots à afficher en tenant compte des nouveaux supports d'interaction et des nouvelles technologie

Scientific Publications of the University of Toulouse II Le Mirail

Open Archive Toulouse Archive Ouverte

Communicating text structure to blind people with Text-To-Speech

Author: Aussenac-Gilles Nathalie
Lemarié Julie
Mojahid Mustapha
Oriola Bernard
Sorin Laurent
Publication venue: HAL CCSD
Publication date: 01/01/2014
Field of study

International audienceThis paper presents the results of an experiment conducted with nine blind subjects for the evaluation of two audio restitution methods for headings, using Text-To-Speech. We used specialized audio and two voices to demarcate headings. This work is part of a research project which focuses on structural in-formation accessibility for the blind in digital documents

Crossref

Scientific Publications of the University of Toulouse II Le Mirail

Open Archive Toulouse Archive Ouverte

HAL Descartes

Détection automatique de la structure organisationnelle de documents à partir de marqueurs visuels et lexicaux

Author: Aussenac-Gilles Nathalie
Fauconnier Jean-Philippe
Kamel Mouna
Mojahid Mustapha
Sorin Laurent
Publication venue: HAL CCSD
Publication date: 01/01/2014
Field of study

National audienceLa compréhension d'un texte s'opère à travers les niveaux d'information visuelle, logique et discursive, et leurs relations d'interdépendance. La majorité des travaux ayant étudié ces relations a été menée dans le cadre de la génération de textes, où les propriétés visuelles sont inférées à partir des éléments logiques et discursifs. Les travaux présentés ici adoptent une démarche inverse en proposant de générer automatiquement la structure organisationnelle du texte (structure logique) à partir de sa forme visuelle. Le principe consiste à (i) labelliser des blocs visuels par apprentissage afin d'obtenir des unités logiques et (ii) relier ces unités par des relations de coordination ou de subordination pour construire un arbre. Pour ces deux tâches, des Champs Aléatoires Conditionnels et un Maximum d'Entropie sont respectivement utilisés. Après apprentissage, les résultats aboutissent à une exactitude de 80,46% pour la labellisation et 97,23% pour la construction de l'arbre

Scientific Publications of the University of Toulouse II Le Mirail

Open Archive Toulouse Archive Ouverte