742 research outputs found

    Vers un processus continu d'extraction de connaissances à partir de textes

    Get PDF
    National audienceNous posons les bases d'un système continu, itéractif et interactif, d'extraction de connaissances à partir de textes. Le coeur de notre approche repose sur l'analyse formelle de concept. Elle permet de préserver le lien entre les textes et la conceptualisation du domaine, i.e. le treillis construit à partir des objets et des propriétés identifiés dans les textes. Les propriétés formelles du treillis sont exploitées pour suggérer à l'expert différentes stratégies lui permettant de modifier l'état courant de la conceptualisation. Le système calcule alors les modifications à apporter aux annotations textuelles pour qu'à l'itération suivante, le treillis intègre la modification souhaitée

    Contribution à la maintenance des ontologies à partir d'analyses textuelles : extraction de termes et de relations entre termes

    Get PDF
    Les ontologies sont des nouvelles formes de contrôle intelligent de l'information. Elles présentent un savoir préalable requis pour un traitement systématique de l'information à des fins de navigation, de rappel, de précision, etc. Toutefois, les ontologies sont confrontées de façon continue à un problème d'évolution. Étant donné la complexité des changements à apporter, un processus de maintenance, du moins semi-automatique, s'impose de plus en plus pour faciliter cette tâche et assurer sa fiabilité.\ud L'approche proposée trouve son fondement dans un modèle cognitif décrivant un processus d'extraction de connaissances à partir de textes et de thésaurus. Nous mettons ainsi, les textes au centre du processus d'ingénierie des connaissances et présentons une approche se démarquant des techniques formelles classiques en représentation de connaissances par son indépendance de la langue. Les traitements textuels sont fondés principalement sur un processus de classification supporté par un réseau de neurones (ART 1) et sur l'Indexation Sémantique Latente appliquée sur des classes de termes. Partant de l'hypothèse que l'extraction -de connaissances à partir de textes ne peut se contenter d'un traitement statistique (ni même linguistique) de données textuelles pour accaparer toute leur richesse sémantique, un processus d'extraction de connaissances à partir d'un thésaurus a été conçu afin d'intégrer, le mieux possible, les connaissances du domaine au sein de l'ontologie. Ce processus est fondé principalement sur un calcul d'associations sémantiques entre des Vecteurs Conceptuels. Le modèle proposé représente une chaîne de traitement (ONTOLOGICO) au sein de la plateforme\ud SATIM. Ce modèle vise à assister les experts de domaine dans leur tâche de conceptualisation et de maintenance des ontologies en se basant sur un processus itératif supporté par un ensemble de modules, en particulier, un extracteur de termes, un lemmatiseur, un segmenteur, un classifieur, un module de raffinement sémantique basé sur l'Indexation Sémantique Latente et un identificateur de termes reliés basé sur le calcul de similarité sémantique entre les couples de vecteurs conceptuels. La découverte de relations entre termes pour les besoins d'une conceptualisation de domaine s'avère être le résultat d'une complémentarité de traitements appliqués tant sur des textes de domaine que sur un thésaurus. D'une part, les analyses textuelles fondées principalement sur l'application de l'Indexation Sémantique Latente sur des classes de termes génèrent des relations sémantiques précises. D'autre part, l'extraction de relations sémantiques à partir d'un thésaurus, en se basant sur une représentation par des Vecteurs conceptuels, constitue un choix théorique judicieux et performant. Ce processus joue en effet, un rôle important dans la complétude des relations.\ud Ce projet de recherche se place au coeur des échanges entre terminologie et acquisition de connaissances. Il amène une réflexion sur les divers paliers à envisager dans une telle démarche de modélisation de connaissances textuelles pour des objectifs de maintenance d'une ontologie de domaine. La méthodologie proposée constitue une aide précieuse dans le domaine de la maintenance des ontologies. Elle assiste les terminologues chargés de naviguer à travers de vastes données textuelles pour extraire et normaliser la terminologie et facilite la tâche des ingénieurs en connaissances, chargés de modéliser des domaines. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Maintenance d'ontologie, Traitement Automatique du Langage Naturel (TALN), Indexation Sémantique Latente, Vecteurs Conceptuels, Classification automatique, Réseaux de Neurones

    UNE EXPLOITATION DU BIG DATA AU SERVICE DE LA RELATION ELECTEUR-POLITIQUE

    Get PDF
    La société contemporaine connaît une évolution rapide par rapport aux technologies de collecte, de traitement et de stockage de l’information. Ces évolutions génèrent des données toujours plus nombreuses, des traitements de plus en plus automatisés, complexes et rapides. L’exploitation de ces masses de données crée de nouvelles connaissances, de nouveaux services et de nouveaux comportements de la société. La terminologie utilisée pour décrire ces phénomènes est souvent « Big data ».Cet article expose de ce fait, une revue de littérature approfondie sur le système Big data, ainsi que son exploitation pour améliorer la relation électeur-politique. Le cas des élections présidentielles d’Obama est aussi mis en détail. Les processus d’analyse des données du Big data sont aussi présentés et une chaîne de valeur virtuelle pour l’exploitation du Big data pour créer de la valeur est proposée. 

    Extraction de relations d'associations maximales dans les textes : représentation graphique

    Get PDF

    Que peut (ou veut) la théorie du théâtre? La théorie comme traduction

    Get PDF
    Il faut s’en remettre à l’évidence, le domaine de la théorie du théâtre souffre de plusieurs maux. Le premier tient à la nature même de la théorie qui a connu au cours des années 1990 un recul certain, résultat sans doute du ressac qui a accompagné la fin des discours dominants au centre de la réflexion des années 1960 et 1970. Le second tient au soupçon généralisé et toujours actuel qui affecte toute approche théorique dès lors que celle-ci prend pour champ d’application la création artistique. Cette rupture radicale peut-elle s’expliquer et, plus encore, peut-elle se dépasser? Ce texte tente un tel rapprochement en posant comme hypothèse que la réflexion théorique et la création artistique portent en leur coeur un même principe de fonctionnement : ils traduisent le monde. Vaste principe à partir duquel Antoine Vitez voit le travail du metteur en scène et que cet article applique aussi par analogie au domaine de la théorie.One cannot but acknowledge that the theoretical investigation of theatre is undermined by several liabilities. The first has to do with the very nature of the theoretical approach itself, an approach which has lost much of its currency in the 1990s due to the general ebbing away of the dominant discourses which shaped theory in the 1960s and 1970s. The second has to do with the widespread suspicion which still surrounds any theoretical approach inasmuch as it operates within the field of artistic creation. How can such a radical rupture be accounted for, and, more importantly, surpassed? This is the task in which the article proposes to engage, by positing that theoretical thinking and artistic creation hinge upon the same active principle: they both translate the world. This principle, which was key to Antoine Vitez's conception of the director's work, also happens to operate, by analogy, at the heart of theory

    Collection test pour une évaluation des performances des systèmes documentaires

    Get PDF

    Le repérage automatique des entités nommées dans la langue arabe : vers la création d'un système à base de règles

    Full text link
    Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal

    Problématique de la veille informationnelle en contexte interculturel : étude de cas d'un processus d'identification d'experts vietnamiens

    Get PDF
    Nom anglais de la conférence : 1st. International Symposium ISKO-Maghreb'2011 - "Concepts and Tools for Knowledge Management (KM)"International audienceThe topics of this research cover all phases of expert identification process in a context of information monitoring. Identify scientists for technological expertise is relatively easy through infometric analysis. However, lots of scientists residing in developing countries still remains a challenge. How to proceed then since the largest part of them does not appear in bibliographic databases ? This question raises two problematics : firstly, how a firm has the necessity to find such experts and what is the utility of this ? Secondly, cross-cultural factor must be taken into account and represents a key of success to integrate foreign experts from developing countries into internal expertise teams of the firm. We take the case of Vietnamese experts as example, pointing out cultural characteristic features and difficulties we encountered relating to language and data treatment. We propose a computer treatment of a database, using Natural Language processing to identify experts and get a visual rendering of experts localization. A corollary aspect of our approach is to redefine the role and the responsabilities of information watcher regarding a cross-cultural environment

    Problématique de la veille informationnelle en contexte interculturel : étude de cas d'un processus d'identification d'experts vietnamiens

    Get PDF
    Nom anglais de la conférence : 1st. International Symposium ISKO-Maghreb'2011 - "Concepts and Tools for Knowledge Management (KM)"International audienceThe topics of this research cover all phases of expert identification process in a context of information monitoring. Identify scientists for technological expertise is relatively easy through infometric analysis. However, lots of scientists residing in developing countries still remains a challenge. How to proceed then since the largest part of them does not appear in bibliographic databases ? This question raises two problematics : firstly, how a firm has the necessity to find such experts and what is the utility of this ? Secondly, cross-cultural factor must be taken into account and represents a key of success to integrate foreign experts from developing countries into internal expertise teams of the firm. We take the case of Vietnamese experts as example, pointing out cultural characteristic features and difficulties we encountered relating to language and data treatment. We propose a computer treatment of a database, using Natural Language processing to identify experts and get a visual rendering of experts localization. A corollary aspect of our approach is to redefine the role and the responsabilities of information watcher regarding a cross-cultural environment
    • …
    corecore