27 research outputs found

    Un système data mining en ligne pour la maintenance ontologique d'une mémoire corporative DM

    Get PDF
    L'intégration de la connaissance dans la mémoire corporative (Ribière et Matta, 1998), (Dieng et al., 1998) fait face à l'hétérogénéité des données (Visser, Jones et al., 1997). L'utilisation de l'ontologie est une approche possible pour surmonter ce problème. Cependant, l'ontologie est une structure de donnée comme n'importe quelle structure informatique, elle est donc dynamique et évolue dans le temps à cause des conditions dynamiques résultant des changements du domaine conceptuel, les changements de conceptualisation, les changements de spécification, les changements descendants, etc. (Yildiz, 2006). Ces dernières années, plusieurs approches ont été proposées pour résoudre le problème de la maintenance des ontologies. Cependant, la précision et le rappel ne permettent pas de satisfaire les besoins des utilisateurs. De plus, ces approches ne prennent pas en compte toute l'information disponible pour prendre une décision réaliste. Pour résoudre le problème de l'évolution de la connaissance dans les ontologies, nous proposons une approche hybride qui utilise l'apprentissage machine et un processus d'alignement qui contrôle les relations syntaxiques entre les entrées dans l'ontologie. De plus, des règles structurelles et des heuristiques sont appliquées pour améliorer le degré de similitude entre les entités ontologiques. Ce processus hybride crée des règles de correspondance qui définissent comment transformer les entrées dans l'ontologie en définissant tous les types d'associations possibles entre les entités ontologiques. L'approche d'enrichissement de l'ontologie exploite les techniques de la fouille de données, les techniques du traitement automatique du langage naturel et la recherche d'information pour améliorer la performance d'apprentissage durant la tâche d'enrichissement du domaine conceptuel. L'évaluation des ontologies demeure un problème important et le choix d'une approche appropriée dépend des critères utilisés. Dans notre approche, nous adoptons la vérification de la cohérence décrite dans (Maziar Amirhosseini et al., 2011) et (Abderrazak et al., 2011).\ud ______________________________________________________________________________ \ud MOTS-CLÉS DE L’AUTEUR : Data Mining, Traitement automatique du langage naturel, Apprentissage machine, Recherche d'information, Intégration, Ontologie, Mémoire corporative, Web sémantique

    Contribution à la maintenance des ontologies à partir d'analyses textuelles : extraction de termes et de relations entre termes

    Get PDF
    Les ontologies sont des nouvelles formes de contrôle intelligent de l'information. Elles présentent un savoir préalable requis pour un traitement systématique de l'information à des fins de navigation, de rappel, de précision, etc. Toutefois, les ontologies sont confrontées de façon continue à un problème d'évolution. Étant donné la complexité des changements à apporter, un processus de maintenance, du moins semi-automatique, s'impose de plus en plus pour faciliter cette tâche et assurer sa fiabilité.\ud L'approche proposée trouve son fondement dans un modèle cognitif décrivant un processus d'extraction de connaissances à partir de textes et de thésaurus. Nous mettons ainsi, les textes au centre du processus d'ingénierie des connaissances et présentons une approche se démarquant des techniques formelles classiques en représentation de connaissances par son indépendance de la langue. Les traitements textuels sont fondés principalement sur un processus de classification supporté par un réseau de neurones (ART 1) et sur l'Indexation Sémantique Latente appliquée sur des classes de termes. Partant de l'hypothèse que l'extraction -de connaissances à partir de textes ne peut se contenter d'un traitement statistique (ni même linguistique) de données textuelles pour accaparer toute leur richesse sémantique, un processus d'extraction de connaissances à partir d'un thésaurus a été conçu afin d'intégrer, le mieux possible, les connaissances du domaine au sein de l'ontologie. Ce processus est fondé principalement sur un calcul d'associations sémantiques entre des Vecteurs Conceptuels. Le modèle proposé représente une chaîne de traitement (ONTOLOGICO) au sein de la plateforme\ud SATIM. Ce modèle vise à assister les experts de domaine dans leur tâche de conceptualisation et de maintenance des ontologies en se basant sur un processus itératif supporté par un ensemble de modules, en particulier, un extracteur de termes, un lemmatiseur, un segmenteur, un classifieur, un module de raffinement sémantique basé sur l'Indexation Sémantique Latente et un identificateur de termes reliés basé sur le calcul de similarité sémantique entre les couples de vecteurs conceptuels. La découverte de relations entre termes pour les besoins d'une conceptualisation de domaine s'avère être le résultat d'une complémentarité de traitements appliqués tant sur des textes de domaine que sur un thésaurus. D'une part, les analyses textuelles fondées principalement sur l'application de l'Indexation Sémantique Latente sur des classes de termes génèrent des relations sémantiques précises. D'autre part, l'extraction de relations sémantiques à partir d'un thésaurus, en se basant sur une représentation par des Vecteurs conceptuels, constitue un choix théorique judicieux et performant. Ce processus joue en effet, un rôle important dans la complétude des relations.\ud Ce projet de recherche se place au coeur des échanges entre terminologie et acquisition de connaissances. Il amène une réflexion sur les divers paliers à envisager dans une telle démarche de modélisation de connaissances textuelles pour des objectifs de maintenance d'une ontologie de domaine. La méthodologie proposée constitue une aide précieuse dans le domaine de la maintenance des ontologies. Elle assiste les terminologues chargés de naviguer à travers de vastes données textuelles pour extraire et normaliser la terminologie et facilite la tâche des ingénieurs en connaissances, chargés de modéliser des domaines. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Maintenance d'ontologie, Traitement Automatique du Langage Naturel (TALN), Indexation Sémantique Latente, Vecteurs Conceptuels, Classification automatique, Réseaux de Neurones

    Modélisation informatique de structures dynamiques de segments textuels pour l'analyse de corpus

    No full text
    The objective of the thesis is to propose a data-processing model to represent, build and exploit textualstructures. The suggested model relies on a «type/token» form of text representation extended bysystems of lexical and contextual annotations. This model's establishment was carried out in the SATOsoftware -- of which the functionalities and the internal organization are presented. Reference to anumber of works give an account of the development and use of the software in various contexts.The formal assumption of the textual and discursive structures find an ally in the beaconing XMLlanguage and the proposals of the Text Encoding Initiative (TEI). Formally, the structures built on thetextual segments correspond to graphs. In a development driven textual analysis context, these graphsare multiple and partially deployed. Their resolution, within the fastening of the nodes to textualsegments or that of other graphs, is a dynamic process which can be sustained by various dataprocessingmechanisms. Examples drawn from textual linguistics are used to illustrate the principles ofstructural annotation. Prospective considerations for the data-processing establishment of amanagement system of the structural annotation are also exposed.L'objectif de la thèse est de proposer un modèle informatique pour représenter, construire et exploiterdes structures textuelles. Le modèle proposé s'appuie sur une représentation du texte sous la forme d'unplan lexique/occurrences augmenté de systèmes d'annotations lexicales et contextuelles, modèle dontune implantation a été réalisée dans le logiciel SATO dont on présente les fonctionnalités etl'organisation interne. La présentation d'un certain nombre de travaux rendent compte dudéveloppement et de l'utilisation du logiciel dans divers contextes.La prise en charge formelle des structures textuelles et discursives trouve un allié dans le langage debalisage XML et dans les propositions de la Text Encoding Initiative (TEI). Formellement, lesstructures construites sur les segments textuels correspondent à des graphes. Dans le contexte d'uneanalyse textuelle en élaboration, ces graphes sont multiples et partiellement déployés. La résolution deces graphes, au sens du rattachement des noeuds à des segments textuels ou à des noeuds d'autresgraphes, est un processus dynamique qui peut être soutenu par divers mécanismes informatiques. Desexemples tirés de la linguistique textuelle servent à illustrer les principes de l'annotation structurelle.Des considérations prospectives sur une implantation informatique d'un système de gestion del'annotation structurelle sont aussi exposées

    Vers l'automatisation de la mise à jour des bases de données spatio-temporelles d'aide à la navigation : cas d'une base de données pour la navigation des personnes à mobilité réduite

    Get PDF
    De nos jours, les systèmes d'aide à la navigation occupent une place de plus en plus importante dans la vie quotidienne. Toutefois, leur potentiel est mal exploité pour le déplacement des personnes à mobilité réduite (PMR). À cet égard, le projet MobiliSIG a vu le jour. Son objectif est de développer une solution d'assistance multimodale mobile selon les principes de la conception cognitive pour la navigation des PMR. Au cœur de cette solution se trouve une base de données d'accessibilité dont l'usage permettra de proposer des itinéraires adaptés aux profils des utilisateurs. Cependant, vu que l'environnement évolue et que certains obstacles ont un caractère spatio-temporel, l'outil développé doit être doté d'un système qui lui permettra de rester continuellement à jour. L'objectif global assigné à notre projet est la conception d'un système automatique de mise à jour (MÀJ) continuelle des données d'accessibilité en temps quasi-réel à partir de données multi-sources hétérogènes. Pour ce faire, tout d'abord, nous avons passé en revue la littérature inhérente aux concepts relatifs à notre problématique. Ensuite, nous avons créé et implémenté une ontologie d'obstacles/facilitateurs sur la base des facteurs environnementaux de la classification PPH afin d'identifier et de bien cibler les données spatio-temporelles d'accessibilité. Par la suite, nous avons déterminé les besoins et fonctionnalités utiles à notre système de MÀJ à travers la présentation et l'analyse des spécifications des données d'accessibilité et de différents scénarios de cas d'utilisations. Finalement, en s'inspirant des concepts fondamentaux des processus ETL et des architectures orientées services, nous avons proposé une solution composée d'une couche d'extraction automatique de multi-sources; une couche de transformation qui répond au besoin du multi-formats; une application web pour les collaborateurs; et un service web de MÀJ chargé des tâches de traitement automatique et en temps quasi-réel de l'information reçue de multi-sources en effectuant l'analyse syntaxique et sémantique, la géolocalisation, le géocodage, la projection du système de référence le cas échéant, la validation et le contrôle d'unicité avant de procéder au chargement. Les résultats des tests et validations du prototype développé ont permis de confirmer l'atteinte de l'objectif de la recherche

    Dynamiques sociales et appropriation informelle des espaces publics dans les villes du Sud : le cas du centre-ville de Port-au-Prince

    Get PDF
    Notre projet de thèse proposait d'étudier le phénomène d'appropriation des espaces publics dans les villes du Sud. Considérant l'espace urbain comme un territoire de lutte entre divers groupes d'acteurs, la recherche porte un regard phénoménologique sur leur perception de la rue et d'autres espaces ouverts au public. Elle tente de dresser un portrait des citoyens qui les occupent de manière informelle et de schématiser le processus d'appropriation tout en essayant de comprendre le rôle du profil de l'individu et des ressources dont il dispose dans la détermination de sa position spatiale. Basée sur une méthodologie mixte permettant d'aborder le sujet selon plusieurs approches et plusieurs méthodes, la recherche entreprend une analyse approfondie de deux sites du centre-ville de Port-au-Prince, la capitale d'Haïti. Les conclusions sont fondées sur des articles de presse, des observations directes et des entrevues auprès de diverses catégories d'acteurs concernés par le phénomène. La thèse exploite donc des données statistiques ainsi que des matériaux textuels et visuels. Certaines ont été analysées avec le logiciel SPSS et d'autres avec QSR NVivo. Les résultats mettent en lumière un conflit de perception parmi les acteurs. Pour certains, les pratiques informelles observées dans les espaces publics en font une ressource matérielle, un espace polyvalent, diversement exploité par les citoyens. Les observations montrent la capacité des citoyens et des fonctions de négocier de manière informelle le partage des espaces communs. Cependant, d'autres en ont, au contraire, une image normative mettant l'emphase sur le rôle esthétique des espaces publics et sur la nécessité de préserver le caractère formel des pratiques spatiales. Les instances étatiques ne partagent pas toutes les mêmes positions par rapport à l'appropriation populaire et informelle des rues et des galeries du centre-ville. Les occupants sont très diversifiés selon leur nature, leur profil et leur statut social. Certains peuvent être considérés comme étant socialement défavorisés alors que d'autres sont des acteurs économiques importants. Il n'y a pas que les citoyens qui s'approprient à des fins personnelles les espaces publics ; des entreprises du secteur formel des affaires pratiquent aussi des formes d'appropriation matérielle et encombrante des sites étudiés. Outre le profil de l'individu, la thèse atteste que son capital social et son capital culturel influencent son habilité d'accéder aux espaces publics et déterminent sa position spatiale. Le capital économique tient parfois un rôle dans le processus d'accès, mais le capital social s'avère une ressource essentielle pour un ancrage durable dans l'espace approprié et une légitimation « informelle » de l'acte d'appropriation. En somme, l'informatisation des espaces publics en fait des territoires de tension et de proximité, mais ils sont loin d'être également accessibles en tant que ressource.\ud ______________________________________________________________________________ \ud MOTS-CLÉS DE L’AUTEUR : espaces publics, appropriation informelle, perception, Port-au-Prince, position spatiale

    L'AIS : une donnée pour l'analyse des activités en mer

    Get PDF
    4 pages, session "Mer et littoral"International audienceCette contribution présente des éléments méthodologiques pour la description des activités humaines en mer dans une perspective d'aide à la gestion. Différentes procédures, combinant l'exploitation de bases de données spatio-temporelles issue de données AIS archivées à des analyses spatiales au sein d'un SIG, sont testées afin de caractériser le transport maritime en Mer d'Iroise (Bretagne, France) sur les plans spatiaux, temporels et quantitatifs au cours d'une année

    Les effets de la multiplicité des normes et des référentiels de bonnes pratiques : le cas de la Direction des Systèmes d’Information

    Get PDF
    The purpose of this research is to explore the effects of multiple standards and frameworks of best practices in information systems at the level of the Information Technology Department. The main challenge of this thesis is to highlight an issue that has not been addressed before in academic research. The lack of literature on the subject and the failure to grasp its scope the practitioner literature support the uniqueness and the merits of our research question.Our research strategy was developed in order to contribute to the knowledge of an unknown object in the academic research. The research question has been submitted to the professional reality using an empirical device based on three elements. First, three exploratory interviews allowed us to refine our research question and to highlight its importance to the professional community. Then, ten semi-structured interviews within five French companies have aimed to deepen the understanding of the effects of the multiple standards and frameworks of best practices for IT Department. Finally, a single case study based on two waves of extensive interviews with the CIO of a French company listed on NYSE, had the ambition to extend the reflection focusing on a particular aspect of our research object.These elements were complementary and relevant to shed light on the multiple standards and frameworks of best practices in Information System. As this is a theme that was not spontaneously controlled by respondents, we suggested a perspective of our results through theoretical understanding elements. Considering the exploratory nature of this research, the results of this thesis are mostly plausible and acceptable proposals which aim to suggest lines of inquiry for future research projects.Ce travail de recherche se donne pour ambition d'explorer les effets de la multiplicité des normes et des référentiels de bonnes pratiques en systèmes d'information au niveau de la direction des systèmes d'information. L'enjeu principal de cette thèse est de mettre en évidence une question qui n'a pas été traitée auparavant dans la recherche académique. Les carences de littérature sur le sujet ainsi que le manque de lisibilité révélé dans la littérature praticienne soutiennent la singularité et le bien-fondé de notre question.Notre stratégie de recherche a été élaborée dans le but de contribuer à la connaissance d'un objet méconnu dans la recherche académique. La question de recherche a été mise à l'épreuve de la réalité professionnelle à l'aide d'un dispositif empirique qui s'articule autour de trois éléments. Tout d'abord, trois entretiens exploratoires nous ont permis d'affiner notre question de recherche et d'affirmer son intérêt vis-à-vis de la communauté professionnelle. Ensuite, dix entretiens semi-directifs auprès de cinq entreprises françaises ont eu pour but d'approfondir la compréhension des effets de la multiplicité des normes et des référentiels pour la direction systèmes d'information. Enfin, une étude de cas unique basée sur deux vagues d'entretiens approfondis avec le DSI d'une société française cotée à Wall Street, a eu pour ambition de prolonger la réflexion en se focalisant sur un aspect particulier de notre objet de recherche.Ces éléments ont été complémentaires et pertinents pour apporter un éclairage sur la multiplicité des normes et des référentiels en systèmes d'information. S'agissant d'une thématique non spontanément maîtrisée par les répondants, nous avons suggéré une mise en perspective de nos résultats à travers des clés de compréhension théoriques. En tenant compte de la nature exploratoire de notre recherche, les résultats de cette thèse constituent principalement des propositions plausibles et acceptables dont le but de suggérer des pistes de réflexion pour des projets de recherche ultérieurs

    Analyse argumentative du discours épilinguistique au Québec les lieux communs comme indicateurs de normes

    Get PDF
    The purpose of this thesis is to gain a better understanding of linguistic representations among young Québec adults between 25 and 35 years old. Few studies have dealt with this subject since the 1990s, and the more recent work has been concerned with future teachers (Remysen, 2002) or high school students (Razafimandimbimanana, 2005). I chose to focus on young Québec adults raised after the Quiet Revolution and the adoption of the Charter of the French Language (1977) and who are not working in a field related to language in order to determine if, on the one hand, linguistic representations have changed since the 1990s and, on the other hand, if the facts of not being a"language professional" and of not being assessed by a learning institution anymore could affect their attitude towards language. Based on a corpus of interviews conducted with 30 young Québec adults living in and around Sherbrooke, this study aims firstly at collecting the opinions of my informants on various themes related to linguistic representations in Québec, i. e. superiority of French from France, the threat of English in Québec, the use of anglicisms, the degeneration of French in Québec, the concept of mistakes and the complexity of written French. Second, I identify the normative criteria revealed in the informants' discourse that are used to assess the French that is spoken in Québec. This identification is based on an argumentative analysis of the epilinguistic discourse in order to shed light on commonplaces, which are clues of what the informants view as being part of the common standards. Based on the criteria I found, in combination with the standards of A.-M. Houdebine's linguistic imaginary, I developed a hierarchy allowing to determine, on the one hand, which criteria most often lead to a conclusion, and on the other hand, which ones are only used as a concession, indicating that they are acknowledged as a common standard but not taken up by the informant. As some commonplaces are not agreed upon in the discourse on language, I analyse the discourse in which these contradictions are found while paying special attention to the scope of the arguments put forward and to the dissociation of concepts, which helps foster a better understanding of these apparent contradictions.The results of this research reveal, among the group of a speakers interviewed, a certain tolerance towards discrepancies from the standard described in reference works as well as a certain indifference regarding the standard coming from France. Moreover, the normative criteria that bear the greatest argumentative weight are criteria associated to the use of the language, not to the standard of reference. This distinction between use and standard is also found in the explanation of contradictions, which means that the informants make a distinction between assessment of their own use of French and assessment of the use of others (for instance using French of France) and between the spoken language and the"ideal" language.The conclusions drawn from the various analyses carried out in this study reveal a greater linguistic security among my informants than among the populations that had been examined in previous studies

    UNE LECTURE TYPO-MORPHOLOGIQUE DU KSAR DE KHANGUET SIDI NADJI

    Get PDF
    La recherche sur la forme urbaine des tissus traditionnels à caractère historique est importante dans le cadre de la sauvegarde du patrimoine bâti pour les générations futures. À travers cette recherche, nous avons essayé d’identifier les caractéristiques typo-morphologiques du Ksar de Khanguet Sidi Nadji et de déterminer les lois qui ont historiquement dirigé son développement organique. Deux questions encadrent méthodologiquement ce travail de recherche. La première est la suivante : comment peut-on identifier les caractéristiques morphologiques caractérisant sa forme urbaine originelle du Ksar de Khanguet Sidi Nadji (avant transformations) et actuelle, malgré le manque d’informations (supports cartographiques et iconographiques) ? La deuxième question est : est-ce que le cadre bâti, tel qu'il se présente aujourd'hui, a conservé la spécificité de ses caractéristiques morphologiques originelles décrites dans les récits des visiteurs du Ksar durant la fin du XIXème siècle et le début du XXème siècle ? Ces questions définissent les axes de la présente recherche qui se veut transdisciplinaire, combinant les approches historique, architecturale et urbanistique. De ce fait, le travail de recherche appelle à une lecture approfondie de la forme urbaine du Ksar de Khanguet Sidi Nadji en identifiant les caractéristiques morphologiques des différents systèmes composant son tissu urbain, notamment : le site naturel, en tant que support à toute organisation urbaine et humaine ; le système viaire ; le système bâti (bâtiments répétitifs et singuliers) ; et les espaces libres (publics et privés), ainsi que les rapports qui les relient les uns aux autres. Cependant, deux hypothèses apparaissent : premièrement, pour la lecture des caractéristiques morphologiques du Ksar de Khanguet Sidi Nadji, il semble nécessaire d’élaborer une méthodologie d’approche basée sur des outils opérationnels afin d’identifier les éléments caractérisant sa forme physique. Deuxièmement, les caractéristiques morphologiques originelles du Ksar de Khanguet Sidi Nadji semblent avoir été affectées par les différentes transformations ayant touché son cadre bâti. Dans cette optique, la recherche s’est appuyée pleinement sur deux approches différentes mais complémentaires. La première est historique (l’analyse du contenu) et la deuxième est la typo-morphologie. La méthodologie adoptée dans ce travail constitue sans doute un point très fort, en combinant deux méthodes différentes. D'une part, la méthode historique est souvent utilisée pour la reconstitution du passé à partir des documents (ici, c’est le cas de l’analyse du contenu des récits de voyage). D'autre part, la typo-morphologie est utilisée comme modèle théorique de l'organisme urbain élaboré par l'architecte italien Gianfranco Caniggia, constituant en soi l'une des formulations les plus explicites avancées ces dernières années dans le débat sur la ville et sur la protection de son patrimoine architectural et urbain. Les résultats ainsi obtenus s’avèrent d’une grande pertinence. La richesse tant historique qu'architecturale et urbaine du Ksar de Khanguet Sidi Nadji, ainsi que sa fragilité physique face aux dangers climatiques, aux effets du temps et à l’intervention de l’homme, ont rendu le choix du site très judicieux. Un autre tissu urbain n’aurait peut-être pas permis de révéler autant de variété et de richesse de la forme physique du tissu urbain
    corecore