15 research outputs found

    Analyse de concepts formels pour la classification de triplets RDF

    Get PDF
    National audienceL'émergence du web des données et des linked open data donne lieu a de nouvelles problématiques d'abstraction, d'organisation et d'interprétation. Nous nous intéressons icì a la classification de triplets RDF. Pour cela, nous nous appuyons sur l'analyse de concepts formels (FCA) et ses extensions, notamment les structures de patrons. La FCA permet notamment de construire une représentation visuelle de la classification et permet à l'utilisateur de naviguer facilement au sein de celle-ci

    Analyse de concepts formels pour la classification de triplets RDF

    Get PDF
    National audienceL'émergence du web des données et des linked open data donne lieu a de nouvelles problématiques d'abstraction, d'organisation et d'interprétation. Nous nous intéressons icì a la classification de triplets RDF. Pour cela, nous nous appuyons sur l'analyse de concepts formels (FCA) et ses extensions, notamment les structures de patrons. La FCA permet notamment de construire une représentation visuelle de la classification et permet à l'utilisateur de naviguer facilement au sein de celle-ci

    Analyse multimodale de situations conflictuelles en contexte véhicule

    Get PDF
    Dans cette thèse nous étudions les interactions humaines afin d'identifier des situations conflictuelles dans l'habitacle d'un véhicule. Les humains utilisent le plus communément la vue et l'ouïe pour analyser les interactions. Cette tâche paraît anodine, mais reste complexe pour un modèle d'intelligence artificielle. Celui-ci doit capturer les informations vidéo et audio et les analyser pour prédire une situation conflictuelle. Notre approche est nouvelle en regard des recherches réalisées jusque-là sur ce sujet puisque les passagers sont contraints dans leurs mouvements dans l'habitacle et que la puissance de calcul embarqué pour cette tâche est limitée. Aucuns travaux, à notre connaissance, ne se sont intéressés à l'analyse des interactions humaines pour la détection de situations conflictuelles dans ce contexte et avec ces contraintes. Nos investigations s'appuient tout d'abord sur un corpus public d'analyse de sentiment pour se comparer à la littérature. Nous implémentons un modèle capable d'ingérer des données vidéo, audio et textes (transcription de l'audio) pour les fusionner et prendre une décision. Dans notre contexte applicatif, nous enregistrons par la suite un jeu de données multimodal d'interactions humaines simulant des situations plus ou moins conflictuelles dans un habitacle de véhicule. Cette base de données est exploitée afin d'implémenter des modèles de classification de bout-en-bout et paramétrique. Les résultats obtenus sont cohérents avec la littérature sur l'impact de chaque modalité sur les performances du système. Ainsi, le texte est respectivement plus informatif que l'audio et que la vidéo. Les différentes approches de fusion implémentées montrent des bénéfices notables sur les performances de classification mono-modalité.In this thesis we study human interactions in order to identify potential aggression situations in the vehicle cabin. Humans most commonly use sight and hearing to analyze interactions. This task seems trivial, but is complex for an artificial intelligence model. It must capture video and audio information and analyze it to predict a conflictual situation. Our approach is new compared to previous research on this topic since passengers are constrained in their movements in the cabin and the computing power on board for this task is limited. To our knowledge, no work has been done on the analysis of human interactions for conflictual situation detection in this context and with these constraints. Our investigations are first based on a public corpus of sentiment analysis to compare with the literature. We implement a model capable of ingesting video, audio and text data (audio transcription) to merge them and make a decision. In our application context, we then record a multimodal dataset of human interactions simulating more or less conflictual situations in a vehicle cockpit. This database is exploited to implement end-to-end and parametric classification models. The results obtained are consistent with the literature on the impact of each modality on the system performance. Thus, text is respectively more informative than audio and video. The different fusion approaches implemented show significant benefits on the performance of single-modality classification

    Learning visual representations with neural networks for video captioning and image generation

    Full text link
    La recherche sur les réseaux de neurones a permis de réaliser de larges progrès durant la dernière décennie. Non seulement les réseaux de neurones ont été appliqués avec succès pour résoudre des problèmes de plus en plus complexes; mais ils sont aussi devenus l’approche dominante dans les domaines où ils ont été testés tels que la compréhension du langage, les agents jouant à des jeux de manière automatique ou encore la vision par ordinateur, grâce à leurs capacités calculatoires et leurs efficacités statistiques. La présente thèse étudie les réseaux de neurones appliqués à des problèmes en vision par ordinateur, où les représentations sémantiques abstraites jouent un rôle fondamental. Nous démontrerons, à la fois par la théorie et par l’expérimentation, la capacité des réseaux de neurones à apprendre de telles représentations à partir de données, avec ou sans supervision. Le contenu de la thèse est divisé en deux parties. La première partie étudie les réseaux de neurones appliqués à la description de vidéo en langage naturel, nécessitant l’apprentissage de représentation visuelle. Le premier modèle proposé permet d’avoir une attention dynamique sur les différentes trames de la vidéo lors de la génération de la description textuelle pour de courtes vidéos. Ce modèle est ensuite amélioré par l’introduction d’une opération de convolution récurrente. Par la suite, la dernière section de cette partie identifie un problème fondamental dans la description de vidéo en langage naturel et propose un nouveau type de métrique d’évaluation qui peut être utilisé empiriquement comme un oracle afin d’analyser les performances de modèles concernant cette tâche. La deuxième partie se concentre sur l’apprentissage non-supervisé et étudie une famille de modèles capables de générer des images. En particulier, l’accent est mis sur les “Neural Autoregressive Density Estimators (NADEs), une famille de modèles probabilistes pour les images naturelles. Ce travail met tout d’abord en évidence une connection entre les modèles NADEs et les réseaux stochastiques génératifs (GSN). De plus, une amélioration des modèles NADEs standards est proposée. Dénommés NADEs itératifs, cette amélioration introduit plusieurs itérations lors de l’inférence du modèle NADEs tout en préservant son nombre de paramètres. Débutant par une revue chronologique, ce travail se termine par un résumé des récents développements en lien avec les contributions présentées dans les deux parties principales, concernant les problèmes d’apprentissage de représentation sémantiques pour les images et les vidéos. De prometteuses directions de recherche sont envisagées.The past decade has been marked as a golden era of neural network research. Not only have neural networks been successfully applied to solve more and more challenging real- world problems, but also they have become the dominant approach in many of the places where they have been tested. These places include, for instance, language understanding, game playing, and computer vision, thanks to neural networks’ superiority in computational efficiency and statistical capacity. This thesis applies neural networks to problems in computer vision where high-level and semantically meaningful representations play a fundamental role. It demonstrates both in theory and in experiment the ability to learn such representations from data with and without supervision. The main content of the thesis is divided into two parts. The first part studies neural networks in the context of learning visual representations for the task of video captioning. Models are developed to dynamically focus on different frames while generating a natural language description of a short video. Such a model is further improved by recurrent convolutional operations. The end of this part identifies fundamental challenges in video captioning and proposes a new type of evaluation metric that may be used experimentally as an oracle to benchmark performance. The second part studies the family of models that generate images. While the first part is supervised, this part is unsupervised. The focus of it is the popular family of Neural Autoregressive Density Estimators (NADEs), a tractable probabilistic model for natural images. This work first makes a connection between NADEs and Generative Stochastic Networks (GSNs). The standard NADE is improved by introducing multiple iterations in its inference without increasing the number of parameters, which is dubbed iterative NADE. With a historical view at the beginning, this work ends with a summary of recent development for work discussed in the first two parts around the central topic of learning visual representations for images and videos. A bright future is envisioned at the end

    Actes du groupe de travail en biostatistiques NANCY septembre 2005-juin 2006

    Get PDF
    A l'aide d'un spectromètre de masse, on détermine à partir d'un échantillon de sang d'un individu les quantités de protéines de différents types présentes. Le problème est alors de voir si l'on peut distinguer par cette analyse (les statisticiens disent "discriminer") un individu sain d'un individu atteint d'un certain type de cancer, de déterminer des protéines qui sont des "biomarqueurs" de ce cancer (il s'agit de déterminer des caractères discriminants), puis, pour un individu dont on ne sait pas s'il est sain ou cancéreux, de le classer dans l'une de ces catégories à partir de l'observation des biomarqueurs (c'est le problème du classement, encore appelé classification supervisée). L'intérêt statistique de l'étude est que l'on peut observer dans un spectre 15000 quantités de protéines différentes, alors que le nombre d'individus observés n'est que de deux ou trois centaines : on a un tableau de données avec peu d'individus et un très grand nombre de caractères (c'est le "fléau de la dimension")

    Créations didactiques pour publics non-initiés : une démarche qui met en relation composition, lutherie numérique et médiation culturelle

    Full text link
    Cette recherche-création cherche à comprendre la relation particulière qu'une artiste entretient avec la composition sonore, la lutherie numérique et la médiation culturelle au sein d'une démarche unique dédiée à la création d'œuvres didactiques pour publics non-initiés : « La couleur du son » et « Art martial sonore ». Pour ce faire, ce mémoire présente d'abord une étude sur chacune de ses disciplines, puis offre une réflexion sur les façons de les faire coexister. Sont ensuite étudiées différentes créations originales s'inscrivant dans ces trois disciplines. Chacune de ces créations se concentre principalement sur une discipline et tisse autour de cette dernière des liens avec les deux autres dans une démarche unifiée.This research-creation project aims to understand the specific relationship of an artist wanting to work on sound composition, digital lutherie and cultural mediation in a unique creative process dedicated to the creation of didactic art projects for non-initiated publics : "La couleur du son" and "Art martial sonore". To do so, this master's thesis first presents a study for each of the field, one at a time, before presenting a reflexion on how they can coexist. Are then studied different original art projects containing each of the three field of works, created specifically for this research-creation. Each of those creations concentrates mainly on one of the three fields of work and connect the other two to it in a way that seeks to be as uniform as possible

    Proust et les limites du corps

    Full text link
    Quel est le statut du corps aujourd’hui ? Quel est le rôle du sensible à une époque où la pensée de l’artificiel fait bouger les lignes de la communauté académique ? Cette thèse vise à déterminer comment les écrits de Proust ont pu contribuer à une culture contemporaine centrée autour du corps vécu et de ses modalités. L’écrivain, en tant que témoin privilégié de son époque, décrit la façon dont les dispositifs techniques affectent le « voir » du sujet à une époque d’urbanisation progressive des villes. Certains auteurs se sont intéressés à la dimension philosophique de la 'Recherche', la concevant successivement comme initiation (Deleuze, 1964), quête de vérité (Descombes, 1987) ou phénoménologie du sujet (Breeur, 2000). Si ces études ont le mérite d’explorer une « théorie du sujet qui articule de façon nouvelle et cohérente differents aspects de l’être-au-monde » (Leriche, 2004), elles se limitent néanmoins aux termes d’une identité impossible et semblent passer à côté de la présence d’un monde intracorporel si fondamentale dans l’écriture de la 'Recherche'. Ce projet entend interroger cet impensé, en partant de l’hypothèse selon laquelle nous assistons avec Proust à l’émergence d’une nouvelle pensée du corps. En s’appuyant sur les lectures successives du corps au XXe siècle (réflexion sur la technique à l’époque contemporaine, l’ontologie tardive de Merleau-Ponty, les sciences cognitives au début des années 1990), nos analyses s’inscrivent dans une histoire précise. Dans un premier chapitre, il sera montré comment la crise de la représentation contribue à l’émergence d’un espace corporel. Il s’agira ensuite de déterminer dans quelle mesure l’apport de la phénoménologie dans la France de l’après-guerre contribue à une refonte de l’expérience corporelle. Nous verrons en particulier comment certains détails sensibles (l’incarnat, le visage humain, la palpation tactile du regard) esquissent la voie d’une intercorporéité. Le troisième chapitre nous permettra d’intégrer différents corps de savoir dans nos analyses en soulignant comment l’opacité de l’expérience corporelle peut profiter d’un éclairage épistémologique. Enfin, il nous faudra dans un dernier temps élargir notre enquête au problème de l’expression et au rapport entre corps et énonciation.What is the status of the body today ? What is the role of the sensible world at a time when the thought of the artificial is shifting the lines of the academic community ? This thesis aims to determine how Proust’s writings have contributed to a contemporary culture centred around the lived body and its modalities. The writer, as a privileged witness of his time, describes how technical devices affect the subject’s “seeing” in a period of overwhelming urbanization. Some authors have taken an interest in the philosophical dimension of 'Remembrance of Things Past', conceiving it successively as initiation (Deleuze, 1964), search for truth (Descombes, 1987) or phenomenology of the subject (Breeur, 2000). If these studies have the merit of exploring a “theory of the subject that articulates in a new and coherent way different aspects of being in the world” (Leriche, 2004), they are nevertheless limited to the terms of an impossible identity and seem to miss the presence of an intracorporeal world that is so fundamental in Proust’s writing. This project intends to question this unthought, based on the hypothesis that we are witnessing with Proust the emergence of a new way of thinking about the body. Building on the successive readings of the body in the 20th century (reflection on technique in the contemporary era, Merleau-Ponty’s late ontology, cognitive sciences in the early 1990s), our analyses have a precise history. In a first chapter, it will be shown how the crisis of representation contributes to the emergence of a corporeal space. It will then be a question of determining the extent to which phenomenology in post-war France contributes to a recasting of bodily experience. We will see in particular how certain sensitive details (incarnateness, the human face, the tactile palpation of the gaze) sketch the way to an intercorporeality. The third chapter will allow us to integrate different bodies of knowledge in our analyses by underlining how the opacity of body experience can benefit from an epistemological lighting. Finally, we will have to extend our investigation to the problem of expression and to the relationship between body and enunciation

    Similarity coefficients for binary data : properties of coefficients, coefficient matrices, multi-way metrics and multivariate coefficients

    Get PDF
    In data analysis, an important role is played by similarity coefficients. A similarity coefficient is a measure of resemblance or association of two entities or variables. Similarity coefficients for binary data are used, for example, in biological ecology for measuring the degree of coexistence between two species type over different locations, or in psychology for a 2×2 reliability study where two observers classify a sample of subjects using a dichotomous response. In choosing a coefficient, a measure has to be considered in the context of the data-analytic study of which it is a part. Because there are so many similarity coefficients for binary data to choose from, it is important that the different coefficients and their properties are better understood. The dissertation contains a mathematical approach to the analysis of similarity coefficients for binary data. A variety of data-analytic properties are considered for various coefficients it is established whether they possess the property or not. Part I contains results on correction for chance and maximum value. In part II sufficient conditions for Robinson matrices and some mathematical properties of multiple correspondence analysis are presented. In part III various two-way notions are generalized to the multi-way case. Part IV contains formulations of multi-way coefficients.LEI Universiteit LeidenMultivariate analysis of psychological data - ou

    Модална алтернација индикатив/субјунктив у зависним комплетивним реченицама у француском језику Mood alternation (indicative/subjunctive) in french complement clauses Модальная альтернация индикатив / субъюнктив в дополнительных придаточных вo французском языке

    Get PDF
    Le choix du subjonctif ou de l’indicatif est un problème pratique et théorique notoire dans la linguistique française. Pratique, car les grammaires d’apprenant qui dictent les règles de ce choix, recourent souvent à des listes interminables de constructions verbales qui imposent uniquement le subjonctif (l’indicatif n’étant pas considéré comme problématique), omettant souvent de mentionner la possibilité de déclencher les deux modes, selon le contexte – autrement dit, l’alternance modale. Théorique, car il a provoqué d’innombrables études proposant des théories unifiées, cependant souvent basées sur un unique point de vue (p. ex. exclusivement sémantique), parfois se basant sur les informations qu’on trouve dans les grammaires, ou bien analysant un seul verbe ou groupe de verbes, mais le plus souvent étudiant principalement la modalité. Contrairement à ces dernières approches, dans cette étude basée sur un corpus, nous avons opté pour une approche inductive, et nous avons observé des données linguistiques brutes (principalement issues de la littérature française des 20e et 21e siècles), pour en tirer des conclusions théoriques. Le lecteur trouvera ici les analyses de 75 verbes qui causent l’alternance modale, illustrées à l’aide de plus de 800 exemples d’extraits littéraires. Tous ces verbes ont été analysés, pour la première fois à notre connaissance, dans le contexte affirmatif aussi bien que négatif, et ensuite catégorisés selon la fréquence relative de l’indicatif ou du subjonctif qu’ils commandent dans ces contextes. Cette catégorisation nous a permis, par la suite, d’essayer de répondre à la question principale – quel mécanisme déclenche le mode? Ce problème demandait un traitement multifactoriel, à l’interface sémantique-pragmatique, sans oublier les limitations syntaxiques. Nous avons tiré une hiérarchie des facteurs qui se combinent dans la principale pour choisir le mode dans la complétive, et nous avons distingué entre les constructions, les ensembles des facteurs qui permettent l’alternance pour chaque verbe individuel, et les déclencheurs, les ensembles des facteurs qui désambiguïsent ladite construction et choisissent effectivement le mode. Ces déclencheurs peuvent être sémantiques et résoudre la polysémie (le sens du verbe), pragmatiques et résoudre la polyphonie (la perspective du locuteur), ou complexes (où la syntaxe joue un rôle proéminent). Ces mécanismes sont représentés sous forme des tableaux pour chaque verbe, qui ne sont néanmoins pas conçus comme des règles prescriptivistes ou didactiques, mais plutôt comme des hypothèses de travail à tester grâce aux méthodes TALN sur des corpus plus larges ou dans des études expérimentales. Enfin, en réponse à l’hypothèse initiale que les modes ont un sens, nous avons conclu que le sens des modes est pragmatique, et, en tant que tel, existe uniquement en corrélation avec le sens du syntagme verbal : il est déclaratif pour l’indicatif, et volitif et délibératif pour le subjonctif. Ainsi, ces sens, qui pourraient être vus comme des résultats des mécanismes de la production d’un énoncé, deviennent des facteurs eux-mêmes lorsque l’accent est sur l’interprétation de l’énoncé (sauf si l’indicatif et le subjonctif sont homographes, ce qui rend l’apprentissage automatique particulièrement compliqué).Избор субјунктива или индикатива представља ноторни практични и теоријски проблем у француској лингвистици. Практични, зато што граматике најчешће нуде бескрајне листе глаголских конструкција које захтевају само субјунктив (пошто се индикатив не сматра проблематичним), често занемарујући могућност да се у зависној реченици нађу оба глаголска начина, у зависности од контекста - овај феномен је познат под именом модална алтернација. Теоријски, зато што је подстакао безброј студија које су покушале да га обухвате неком јединственом теоријом, међутим, често користећи само један приступ (нпр. семантички), понекад полазећи од информација које се налазе у граматикама, понекад кроз анализе појединачних глагола или глаголских група, а најчешће кроз призму модалности. Ми смо се, насупрот томе, определили за индуктивни приступ: кренули смо да анализирамо сирови лингвистички материјал (тј. углавном примере из француског књижевног корпуса 20. и 21. века), и на основу тих анализа смо извели теоријске закључке. Читалац ће тако у овој тези наћи анализе 75 глагола који изазивају модалну алтернацију, илустроване уз помоћ више од 800 примера. Ово је први пут, колико знамо, да су сви ови глаголи анализирани и у афирмативном и у негативном контексту, а затим категорисани у складу са релативном учесталошћу индикатива и субјунктива које изазивају у тим контекстима. Ова категоризација нам је, потом, омогућила да покушамо да одговоримо на главно питање – како изгледа механизам који проузрокује један или други глаголски начин? Овај проблем је захтевао мултифакторијални приступ кроз спој семантике и прагматике, не заборављајући синтаксичка ограничења. Зато смо извели хијерархију фактора који се комбинују у главној реченици не би ли учествовали у избору начина у комплетивној реченици, те тако разликујемо конструкције, скупове фактора који дозвољавају алтернацију за сваки појединачни глагол, и окидаче, скупове фактора који разрешују коначни избор начина. Ови окидачи могу бити семантичке природе и тицати се полисемије (значење глагола), могу бити прагматичке природе и тицати се полифоније (перспектива говорног лица), а постоје и случајеви сложених фактора (где синтакса такође игра значајну улогу). Представили смо ове механизме у облику табела за сваки глагол, с тим што те табеле нису замишљене као прескриптивистичка, дидактичка правила, већ као радне хипотезе, за тестирање кроз рачунарску обраду језика на већим корпусима, или за експерименталне студије. Најзад, у одговору на почетну хипотезу, према којој глаголски начини поседују значење, закључили смо да је то значење прагматичко, и да постоји само у корелацији са значењем глаголске синтагме : декларативно значење за индикатив, волитивно и делиберативно значење за субјунктив. Ова значења, која би могла да се посматрају као резултат механизама производње исказа, захваљујући поменутој корелацији постају и сама фактори онда када је акценат на тумачењу исказа (под условом да индикатив и субјунктив нису хомографи, што нарочито компликује машинско учење)
    corecore