Search CORE

109 research outputs found

Pratique de l'analyse des données numériques et textuelles avec Dtm-Vic

Author: Lebart L.
Piron Marie
Publication venue: L2C
Publication date: 01/01/2012
Field of study

HAL Descartes

Horizon / Pleins textes

HAL-Paris1

Hal-Diderot

Structuration de bases multimédia pour une exploration visuelle

Author: Voiron Nicolas
Publication venue: HAL CCSD
Publication date: 18/12/2015
Field of study

The large increase in multimedia data volume requires the development of effective solutions for visual exploration of multimedia databases. After reviewing the visualization process involved, we emphasis the need of data structuration. The main objective of this thesis is to propose and study clustering and classification of multimedia database for their visual exploration.We begin with a state of the art detailing the data and the metrics we can produce according to the nature of the variables describing each document. Follows a review of the projection and classification techniques. We also present in detail the Spectral Clustering method.Our first contribution is an original method that produces fusion of metrics using rank correlations. We validate this method on an animation movie database coming from an international festival. Then we propose a supervised classification method based on rank correlation. This contribution is evaluated on a multimedia challenge dataset. Then we focus on Spectral Clustering methods. We test a supervised Spectral Clustering technique and compare to state of the art methods. Finally we examine active semi-supervised Spectral Clustering methods. In this context, we propose and validate constraint propagation techniques and strategies to improve the convergence of these active methods.La forte augmentation du volume de données multimédia impose la mise au point de solutions adaptées pour une exploration visuelle efficace des bases multimédia. Après avoir examiné les processus de visualisation mis en jeu, nous remarquons que ceci demande une structuration des données. L’objectif principal de cette thèse est de proposer et d’étudier ces méthodes de structuration des bases multimédia en vue de leur exploration visuelle.Nous commençons par un état de l’art détaillant les données et les mesures que nous pouvons produire en fonction de la nature des variables décrivant les données. Suit un examen des techniques de structuration par projection et classification. Nous présentons aussi en détail la technique du Clustering Spectral sur laquelle nous nous focaliserons ensuite.Notre première réalisation est une méthode originale de production et fusion de métriques par corrélation de rang. Nous testons cette première méthode sur une base multimédia issue de la vidéothèque d’un festival de films. Nous continuons ensuite par la mise au point d’une méthode de classification supervisée par corrélation que nous testons avec les données vidéos d’un challenge de la communauté multimédia. Ensuite nous nous focalisons sur les techniques du Clustering Spectral. Nous testons une technique de Clustering Spectral supervisée que nous comparons aux techniques de l’état de l’art. Et pour finir nous examinons des techniques du Clustering Spectral semi-supervisé actif. Dans ce contexte, nous proposons et validons des techniques de propagation d’annotations et des stratégies permettant d’améliorer la convergence de ces méthodes de classement

Thèses en Ligne

Hal - Université Grenoble Alpes

HAL Université de Savoie

Data Warehouse Design and Textual Data

Author: SCHINCKUS Malik
Publication venue
Publication date: 22/06/2023
Field of study

Repository of the University of Namur

Partager le travail scientifique à l'âge numérique.

Author: Comte Marie-Hélène
Guitton Pascal
Viéville Thierry
Publication venue: HAL CCSD
Publication date: 18/03/2014
Field of study

National audienceCe texte s'intéresse au changement profond qu'a connu la publication scientifique sur une génération de chercheurs. Cette apparition du document numérique s'est accompagnée d'une mise en ligne progressive mais surtout le document a évolué : il est devenu hypertexte, multimédia (son, vidéo) ou logiciel exécutable sans oublier les données d'expérimentations et les cours en ligne qui deviennent à leur tour publications. C'est en fait la nature même de la publication scientifique qui est bouleversée par l'apparition de ces documents 3.0

INRIA a CCSD electronic archive server

Les bibliothèques scientifiques et les données de la recherche: défis et enjeux

Author: Fachinotti Elena
Gozzelino Eva
Lonati Sara
Schneider René (Dir.)
Publication venue
Publication date: 24/03/2016
Field of study

Les données produites lors des activités de recherche sont partie intégrante de l’information scientifique. Traditionnellement, les bibliothèques académiques ont pris en main les activités de gestion des données de recherche (GDR) et les formations auprès des chercheurs. La Suisse, avec un temps de retard sur d’autres pays, lance désormais un projet national, le DLCM, pour créer des solutions adaptées à la gestion des données de recherche tout au long de leur cycle de vie. Elle espère ainsi notamment faire face aux exigences du programme européen Horizon 2020. Dans ce contexte, certains professionnels de l’information, et notamment les bibliothécaires académiques, seront appelés à dispenser des formations à la gestion des données de recherche. Le propos de cette recherche est de fournir des éléments d’analyse pour aider à la prise de décision en vue de prochaines formations de formateurs. A travers une veille sur l’offre internationale de formations à la GDR, nous dressons un panorama analytique de 57 programmes différents ainsi qu’un tableau comparatif synoptique. Un questionnaire destiné aux professionnels de l’information en Suisse a été diffusé, visant à estimer parmi cette population les niveaux d’activités liées à la GDR et les connaissances et compétences déjà acquises ou à développer. Les résultats montrent que les connaissances actuelles sont très hétéroclites, avec des différences parfois extrêmes entre les participants. Néanmoins, la grande majorité d’entre eux a des compétences balbutiantes. Il apparaît que les besoins en formation se dessinent sur un large spectre de thématiques liées à la GDR, plutôt que sur des aspects très précis. 88% des participants estiment qu’ils seront confrontés à la GDR d’ici 5 ans. Des entretiens auprès des collaborateurs responsables du dossier GDR de trois universités romandes (EPFL, UNIGE, UNIL) nous ont permis de déterminer le positionnement de ces dernières en termes de développement de services. La combinaison de ces informations avec celles obtenues à travers l’enquête permet de voir se profiler deux grandes tendances concernant la mise en place de services dans les institutions suisses : il s’agit du développement d’infrastructures et outils et du conseil/formation. Notre recherche aboutit à une esquisse de formation modulaire destinée aux professionnels qui seront en charge de sensibiliser et former les chercheurs et le staff de leurs institutions respectives. Ce canevas de formation comprend trois niveaux, de basique à avancé ; les modules peuvent servir de base pour des workshops, ou, s’ils sont suivis en intégralité, constituer un Certificate of advanced studies en GDR

RERO DOC Digital Library

Visualisation de l'évolution d'un domaine scientifique par l'analyse des résumés de publication à l'aide de réseaux neuronaux

Author: Archambeault Jean
Publication venue
Publication date: 01/01/2002
Field of study

Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal

Dépôt Institutionnel Numérique

Fouille multidimensionnelle sur les données textuelles visant à extraire les réseaux sociaux et sémantiques pour leur exploitation via la téléphonie mobile

Author: El Haddadi Anass
Publication venue
Publication date: 09/12/2011
Field of study

La concurrence est un concept fondamental de la tradition libérale et des sciences économiques qui oblige les entreprises à pratiquer l'Intelligence Economique (IE) pour bien se positionner sur le marché ou tout simplement pour survivre. Mais souvent, ce n'est pas le plus fort qui survit, ni le plus intelligent, mais celui qui est le plus sensible au changement, facteur dominant dans la société actuelle. Les changements proviennent de l'extérieur ou naissent au sein même de l'entreprise et peuvent l'affecter plus ou moins durablement. Dès lors, les entreprises sont appelées à rester constamment en veille pour guetter le moindre changement en vue d'y apporter la solution adéquate en temps réel. Cependant, pour une veille réussie, on ne doit pas se contenter uniquement de surveiller les opportunités, mais avant tout, d'anticiper les menaces. Malheureusement, cette veille se déroule en oubliant l'indispensable volet sécurité de l'IE à savoir la sécurité des données manipulées et celle des procédés suivis pour atteindre les objectifs de l'IE. Nos travaux de recherche consistent à proposer un Système d'Intelligence Economique (SIE) Généraliste et Mobile. Ce SIE intègre une approche de modélisation du contrôle d'accès aux données et aux traitements pour sécuriser toutes les informations et les flux d'interaction durant son cycle de vie. Le besoin en matière de sécurité dans un SIE provient du fait que les informations manipulées sont d'ordre stratégique ayant une valeur assez importante. Une telle sécurité ne doit pas être considérée comme une option supplémentaire qu'offre un SIE pour se distinguer d'un autre. D'autant plus que la fuite de ces informations n'est pas le fait de faiblesses inhérentes aux systèmes informatiques des entreprises, mais c'est avant tout une question organisationnelle. La mobilité présente un choix stratégique pour notre SIE ''XPlor EveryWhere'', dont le but est de permettre aux utilisateurs de nos solutions de veille de continuer à rechercher, surveiller, valider et rediffuser des informations stratégiques au cours de leurs déplacements. Ils n'ont ainsi plus besoin d'être assis face à leur ordinateur pour accéder à des données utiles dans l'instant (préparation d'une réunion, nouvel ordre du jour, information sur un interlocuteur, une technologie, un marché, demande urgente d'une analyse ou d'un focus spécifique). Il leur suffit simplement d'utiliser discrètement, et en tout sécurité, leur appareil mobile. Grâce à XPlor EveryWhere, ils sont en permanence au cœur de l'information pertinente.Competition is a fundamental concept of the liberal economy tradition that requires companies to resort to Competitive Intelligence (CI) in order to be advantageously positioned on the market, or simply to survive. Nevertheless, it is well known that it is not the strongest of the organizations that survives, nor the most intelligent, but rather, the one most adaptable to change, the dominant factor in society today. Therefore, companies are required to remain constantly on a wakeful state to watch for any change in order to make appropriate solutions in real time. However, for a successful vigil, we should not be satisfied merely to monitor the opportunities, but before all, to anticipate risks. The external risk factors have never been so many: extremely dynamic and unpredictable markets, new entrants, mergers and acquisitions, sharp price reduction, rapid changes in consumption patterns and values, fragility of brands and their reputation. To face all these challenges, our research consists in proposing a Competitive Intelligence System (CIS) designed to provide online services. Through descriptive and statistics exploratory methods of data, Xplor EveryWhere display, in a very short time, new strategic knowledge such as: the profile of the actors, their reputation, their relationships, their sites of action, their mobility, emerging issues and concepts, terminology, promising fields etc. The need for security in XPlor EveryWhere arises out of the strategic nature of information conveyed with quite a substantial value. Such security should not be considered as an additional option that a CIS can provide just in order to be distinguished from one another. Especially as the leak of this information is not the result of inherent weaknesses in corporate computer systems, but above all it is an organizational issue. With Xplor EveryWhere we completed the reporting service, especially the aspect of mobility. Lastly with this system, it's possible to: View updated information as we have access to our strategic database server in real-time, itself fed daily by watchmen. They can enter information at trade shows, customer visits or after meetings

Thèses en ligne de l'Université Toulouse III - Paul Sabatier

Algorithmes automatiques pour la fouille visuelle de données et la visualisation de règles d’association : application aux données aéronautiques

Author: Bothorel Gwenael
Publication venue: École Doctorale Mathématiques, Informatique et Télécommunications (Toulouse);142547247
Publication date: 18/11/2014
Field of study

Depuis quelques années, nous assistons à une véritable explosion de la production de données dans de nombreux domaines, comme les réseaux sociaux ou le commerce en ligne. Ce phénomène récent est renforcé par la généralisation des périphériques connectés, dont l'utilisation est devenue aujourd'hui quasi-permanente. Le domaine aéronautique n'échappe pas à cette tendance. En effet, le besoin croissant de données, dicté par l'évolution des systèmes de gestion du trafic aérien et par les événements, donne lieu à une prise de conscience sur leur importance et sur une nouvelle manière de les appréhender, qu'il s'agisse de stockage, de mise à disposition et de valorisation. Les capacités d'hébergement ont été adaptées, et ne constituent pas une difficulté majeure. Celle-ci réside plutôt dans le traitement de l'information et dans l'extraction de connaissances. Dans le cadre du Visual Analytics, discipline émergente née des conséquences des attentats de 2001, cette extraction combine des approches algorithmiques et visuelles, afin de bénéficier simultanément de la flexibilité, de la créativité et de la connaissance humaine, et des capacités de calculs des systèmes informatiques. Ce travail de thèse a porté sur la réalisation de cette combinaison, en laissant à l'homme une position centrale et décisionnelle. D'une part, l'exploration visuelle des données, par l'utilisateur, pilote la génération des règles d'association, qui établissent des relations entre elles. D'autre part, ces règles sont exploitées en configurant automatiquement la visualisation des données concernées par celles-ci, afin de les mettre en valeur. Pour cela, ce processus bidirectionnel entre les données et les règles a été formalisé, puis illustré, à l'aide d'enregistrements de trafic aérien récent, sur la plate-forme Videam que nous avons développée. Celle-ci intègre, dans un environnement modulaire et évolutif, plusieurs briques IHM et algorithmiques, permettant l'exploration interactive des données et des règles d'association, tout en laissant à l'utilisateur la maîtrise globale du processus, notamment en paramétrant et en pilotant les algorithmes. ABSTRACT : In the past few years, we have seen a large scale data production in many areas, such as social networks and e-business. This recent phenomenon is enhanced by the widespread use of devices, which are permanently connected. The aeronautical field is also involved in this trend. Indeed, its growing need for data, which is driven by air trafic management systems evolution and by events, leads to a widescale focus on its key role and on new ways to manage it. It deals with storage, availability and exploitation. Data hosting capacity, that has been adapted, is not a major challenge. The issue is now in data processing and knowledge extraction from it. Visual Analytics is an emerging field, stemming from the September 2001 events. It combines automatic and visual approaches, in order to benefit simultaneously from human flexibility, creativity and knowledge, and also from processing capacities of computers. This PhD thesis has focused on this combination, by giving to the operator a centered and decisionmaking role. On the one hand, the visual data exploration drives association rules extraction. They correspond to links between the data. On the other hand, these rules are exploited by automatically con_gurating the visualization of the concerned data, in order to highlight it. To achieve this, a bidirectional process has been formalized, between data and rules. It has been illustrated by air trafic recordings, thanks to the Videam platform, that we have developed. By integrating several HMI and algorithmic applications in a modular and upgradeable environment, it allows interactive exploration of both data and association rules. This is done by giving to human the mastering of the global process, especially by setting and driving algorithms

Thèses en Ligne

Scientific Publications of the University of Toulouse II Le Mirail

Open Archive Toulouse Archive Ouverte

Institut National Polytechnique de Toulouse (Theses)

La sémiométrie : essai de statistique structurale

Author: Lebart L.
Piron Marie
Steiner J.F.
Publication venue: Dunod
Publication date: 01/01/2003
Field of study

Horizon / Pleins textes