Search CORE

435 research outputs found

Comment coproduisons-nous notre environnement numérique marchand ?

Author: Vayre Jean-Sébastien
Publication venue: HAL CCSD
Publication date: 25/08/2014
Field of study

International audienceAvec le développement des Technologies de l'Information et de la Communication (TIC) au sein des diverses sphères de la société, nous sommes actuellement conduit à produire une grande quantité de données numériques (i.e. : les big data) durant nos activités quotidiennes. Ces big data constituent autant d'indices que les e-commerçants mobilisent afin de personnaliser automatiquement les environnements numériques de leurs consommateurs. Pour ce faire, ils développent différents systèmes de filtrage destinés à améliorer la qualité de leurs services. C'est pourquoi, afin de mieux comprendre ce processus, nous proposons dans cet article de rendre compte de la manière dont nous coproduisons nos environnements numériques marchands. Nous verrons ainsi que cette coproduction recouvre finalement une asymétrie de conception qui la distingue très nettement d'une cocréation

Scientific Publications of the University of Toulouse II Le Mirail

Manipuler les données. Documenter le marché: Les implications organisationnelles du mouvement big data

Author: Vayre Jean-Sébastien
Publication venue: 'Lavoisier'
Publication date: 02/06/2014
Field of study

International audienceWhat is big data? How to characterize it? What is its impact on the organization of the market? From a merchant point of view, big data consist in transforming the traces of consumers' activities into information which are transmit to the market participants. Big data is, therefore, a process of documentation. First, we argue that the dynamics of this process refers to a socio-technical evolution and a socio-cognitive revolution. Then, we underline the implications of this revolution on the market organization. In conclusion, we note that if big data documentation process can promote the reactivity and adaptability of commercial organizations, it can also lead to important knowledge biases in socioeconomic terms.Qu'est-ce que le big data ? Comment le caractériser ? Quel est son impact sur l'organisation du marché ? D'un point de vue marchand, le big data consiste à transformer les traces d'activités des consommateurs en informations dans le but de documenter les acteurs du marché. Le big data est donc un processus de documentation. D'abord, nous soutenons que la dynamique de ce processus renvoie à une évolution sociotechnique et une révolution sociocognitive. Ensuite, nous pointons les implications de cette révolution sur l'organisation du marché. En conclusion, nous soulignons que si le processus de documentation big data peut favoriser la réactivité et l'adaptabilité des organisations marchandes, il peut également engendrer des biais de connaissance importants sur le plan socioéconomique

Scientific Publications of the University of Toulouse II Le Mirail

La quête du Graal et la réalité numérique

Author: Laurent Anne
Roche Mathieu
Serp Claire
Teisseire Maguelonne
Publication venue: 'Korean Association of Corpus Linguistics'
Publication date: 12/11/2009
Field of study

Cet article présente un processus de fouille de données afin d’extraire des connaissances associées au motif de la parenté et de la famille dans un corpus en ancien français de la première moitié du XIIIe siècle. Après une numérisation puis un prétraitement des données fondé sur des techniques de TAL (Traitement Automatique du Langage), il a été procédé à une extraction de motifs séquentiels (enchaînements de voisinages de mots liés à la thématique traitée). Dans cet article, nous présentons les problèmes liés à la numérisation et aux traitements du texte. Puis, nous détaillons ce processus automatique et exhaustif et analysons les premiers résultats obtenus en procédant à l’étude précise d’un motif séquentiel dans différents textes du cycle Lancelot-Graal.La Quête du Graal and the question of digital reality This paper describes a method to mine texts written in Old French in the second half of the 13th century. The method is based on data mining tools, which are used here to automatically extract patterns dealing with family relationships. After scanning and digitizing the texts, a pre-treatment has been applied based on NLP (Natural Language Processing) to clean the texts. Sequential patterns are then extracted, which provide the expert with sequences of neighbourhoods of words that are relevant to the analysis being carried out by the expert.We report here the problems raised by numerizing such texts. Then we present the process we have applied and the results we have obtained. Finally, we detail how a specific sequential pattern, chosen among those appearing in the Lancelot-Graal series, can be further analyzed

OpenEdition

Le traitement automatique des langues face aux données textuelles volumineuses et potentiellement dégradées : qu'est-ce que cela change ?

Author: Sébillot Pascale
Publication venue: De Boeck
Publication date: 01/02/2015
Field of study

National audiencePrétendre que le phénomène récent du Big Data a bouleversé théoriquement et méthodologiquement le traitement automatique des langues (TAL) serait inexact : le TAL a connu sa dernière véritable révolution à la fin des années 80 - début des années 90. C'est en effet à cette période que s'est opéré un changement de paradigme, un passage du rationalisme vers l'empirisme, avec le " remplacement " des approches symboliques, à base de règles, fondées sur l'expertise humaine par des approches empiriques fondées sur les données, où la connaissance est extraite par des techniques d'apprentissage automatique, en particulier statistique. Permis par des capacités de stockage et de traitement accrues des ordinateurs et la disponibilité de volumes conséquents de textes au format numérique, ce bouleversement, même s'il s'est étendu sur plusieurs années, a été en fait assez profond : passage d'un TAL très linguistique où l'on cherchait à comprendre - expliquer les jugements de grammaticalité dont sont capables les locuteurs natifs d'une langue, construire et manipuler des représentations assez élaborées du sens... - à un TAL " très statistique " où l'on fait émerger des connaissances grâce à l'observation à grande échelle, au comptage..., et où l'on extrait des représentations de " sens utile " pour des traitements applicatifs. Affirmer que les volumes actuels de données à l'échelle du Big Data n'ont eu et n'ont aucun impact sur le TAL serait cependant également faux. Les données textuelles à traiter se déclinent à l'aune des 3 V (variété, volume, vélocité). Elles consistent bien sûr en des documents écrits, pages Web, emails et autres textes " traditionnels ", mais également en contenus de blogs, de réseaux sociaux, en sms, en documents audio transcrits automatiquement, ce qui correspond donc à des types et des qualités de langue très divers. Pour ne citer que quelques chiffres donnant tant une idée des volumes que de la vitesse d'évolution de ceux-ci, nous pouvons par exemple nous référer à ceux de Go-globe.com de juin 2011, cités à davidfayon.fr/2011/croissance-du-web-une-minute, qui, quoique un peu anciens, sont déjà extrêmement parlants : création par minute de 60 blogs, de 98000 messages sur Twitter, de 510000 commentaires sur Facebook, de 168 millions d'emails ou de 600 vidéos sur YouTube. À l'heure actuelle, ces nombres sont encore plus impressionnants. Ces volumes énormes de données textuelles ont accru le phénomène décrit précédemment de passage du TAL à l'empirisme, accompagné du renforcement de certains champs du domaine - parfois avec un regard nouveau - et de l'émergence d'applications nouvelles. Dans ce chapitre, nous revenons en détail sur l'impact de ce déluge de données sur le TAL en débutant par un rappel des spécificités des données textuelles au sein de ce monde du Big Data dans lequel les données volumineuses auxquelles il est fait référence sont fréquemment (semi-)structurées ; ceci nous permet de mieux comprendre l'intérêt mais aussi la difficulté d'accéder au contenu sémantique de ces données particulières. Nous nous penchons ensuite sur la façon dont les chercheurs en TAL représentent et exploitent ces données massives pour en faire émerger la connaissance utile pour l'objectif visé. Nous présentons ensuite successivement d'une part des applications qui tentent de trouver des solutions pour faire face au déluge de données disponibles, d'autre part certaines qui, elles, cherchent à tirer profit de cette masse d'informations et à exploiter sa redondance. Nous concluons en rappelant les grandes lignes de l'évolution du TAL

HAL-CentraleSupelec

INRIA a CCSD electronic archive server

HAL-Rennes 1

Recherche et extraction d'information dans des cas cliniques. Présentation de la campagne d'évaluation DEFT 2019

Author: Claveau Vincent
Grabar Natalia
Grouin Cyril
Hamon Thierry
Publication venue: HAL CCSD
Publication date: 02/07/2019
Field of study

International audienc

HAL-CentraleSupelec

INRIA a CCSD electronic archive server

HAL-Paris 13

HAL-Rennes 1

Le programme Mogador en linguistique formelle arabe et ses applications dans le domaine de la recherche et du filtrage sémantique

Author: Gaubert Christian
Jaccarini André
Publication venue: HAL CCSD
Publication date: 31/07/2012
Field of study

The MOGADOR project aims at devolopping a new approach to Arabic Natural Langage Processing, by designing software tools based on an original description of Arabic grammar that gives top priority to its tool-words (in a redefined definition). These 'tool-words', that do not derivate from the standard morphological system, trigger off expectations at both syntactic and semantic levels, and thus constrain the sentence either locally or globally. Based on our theoretical and algorithmic work in morphological analysis, electronic dictionaries and proof software in corpora analysis and Information Retrieval, we plan to make available a new generation of filters featuring limited complexity. We propose steps in both theoretical and software fields, with the design of new parsers and software proof tools. These filters could be embedded in search tools boosting them with the results of new linguistic analysis, which have become essential considering the recent boom of the Arabic Web.Développer une approche nouvelle du traitement automatique de larabe fondés sur une modélisation originale de la grammaire arabe donnant la priorité aux mots-outils (redéfinis), est l'ambition du programme MOGADOR. Échappant au système de dérivation, ces mots-outils induisent des attentes syntaxiques voire sémantiques contraignant localement et/ou globalement la phrase. Forts de nos développements algorithmiques et applicatifs en analyse morphologique, en dictionnaires électroniques et en démonstrateurs dans le domaine de l'analyse de corpus et de la recherche d'informations, nous projetons, par des développements théoriques, la construction de nouveaux analyseurs et des mises en oeuvre concrètes, de rendre possibles de nouvelles méthodes de filtrage à complexité maîtrisée. Ces filtres pourront être couplés à des moteurs de recherche, dopant ces derniers par des analyses linguistiques qui sont devenues nécessaires depuis l'explosion du Web en langue arabe

HAL AMU

Mise en œuvre d’une méthode de Data Mining pour appréhender le comportement d’un sujet en état de tunnélisation attentionnelle

Author: Thooris Charles
Publication venue
Publication date: 01/01/2011
Field of study

Dans l’aéronautique, on considère que 80% des accidents sont dus à une erreur humaine dans l’aviation civil et militaire (O'Hare, Wiggins, Batt, & Morrison, 1994) (Wiegmann & Shappell, 2003). Ces statistiques ont donc amené nombre de scientifiques à s’intéresser au sujet des facteurs humains. L’idée est d’améliorer la sécurité aérienne en comprenant mieux le comportement humain. On s’aperçoit en effet que certains accidents rejoués en simulateur par d’autres pilotes expérimentés conduisent parfois au même crash (Wanner & Wanner, 1999). C’est parfois l’environnement qui conduit à l’erreur humaine. Ainsi il est intéressant de rechercher des moyens d’aider l’opérateur dans sa tâche. Ce n’est pas chose si aisée. Van Eslande et al (Van Eslande, Erreur de conduite et besoin d’aide : une approche accidentologique, 2001) (Van Eslande, Alberton, Nachtergaële, & Blancher, 1997) postulent que le comportement des automobilistes est essentiellement conditionné par les infrastructures routières. Il a été remarqué que les conflits étaient un précurseur remarquable d’erreurs humaines conduisant à l’accident. Des confits entre l’humain et la machine, ou entre l’opérateur et la tour de contrôle, ou encore entre le pilote et le co-pilote. L’étude des conflits s’avère alors un thème pertinent pour les facteurs humains. C’est dans ce domaine que nous travaillons au CAS au sein de l’ISAE. Le rapport sera constitué de trois grandes sections. Dans un premier temps nous présenterons l’environnement de travail à l’ISAE. Puis dans les parties suivantes nous définirons de manière plus précise ce qu’est la « tunnélisation attentionnelle » et décrirons plus en profondeur l’expérience du robot qui est notre base de travail. Enfin nous présenterons les résultats en termes de diagnostic de l’état d’un opérateur

Open Archive Toulouse Archive Ouverte

Construction et évolution de connaissances par confrontation de points de vue : prototype pour la recherche d'information scientifique

Author: Cerri Stefano A.
Jonquet Clément
Lemoisson Philippe
Surroca Guillaume
Publication venue: s.n.
Publication date: 01/01/2014
Field of study

Avec le Web 2.0, les utilisateurs, devenus contributeurs, ont pris une place centrale dans les processus de consommation et de production de connaissances ; cependant la paternité des contributions est souvent perdue lors de l'indexation de l'information. Viewpoints est un formalisme de représentation des connaissances centré sur le point de vue individuel, humain ou artificiel. Nous considérons trois types d'objets de connaissance : les documents (supports), les agents (émetteurs) et les topics (descripteurs). Un viewpoint émis par un agent exprime son opinion sur la proximité entre deux objets. Les viewpoints permettent de définir et de calculer une distance entre objets qui évolue au fil des interactions (requêtes et retours d'utilisation) et de l'ajout de nouveaux viewpoints. Un prototype de moteur de recherche pour des données de publications scientifiques tirées de HAL-LIRMM montre comment Viewpoints peut faire émerger, de façon transparente, une intelligence collective à partir des interactions des utilisateurs contributeurs. (Résumé d'auteur

Agritrop

HAL-CIRAD

Fouille de traces dans le sport électronique : recommandation stratégique, analyse spatiale et enjeux pour le sport réel

Author: Durand Christophe
HELLEU BORIS
Metivier Jean-Philippe
Rioult François
Scelles Nicolas
Publication venue: HAL CCSD
Publication date: 01/01/2012
Field of study

International audienceLe développement et la professionnalisation du jeu vidéo suscitent le besoin d'outils adaptés à l'analyse de la pratique des joueurs, selon des axes sportif, tactique et stratégique. Très populaires et par nature informatique, ces jeux fournissent de nombreuses traces. Dans le cadre d'un jeu opposant deux équipes de cinq joueurs (un MOBA, Multiplayer Online Battle Arena), analogue au Rugby, nous montrons que la fouille de ces traces est fructueuse. Elle permet d'émettre des recommandations stratégiques et l'analyse des configurations spatiales des joueurs fournit des indications précieuses sur l'issue du match. La fouille de traces de sport électronique ouvre des perspectives intéressantes pour l'analyse stratégique du sport réel. ABSTRACT. The development and professionalization of video game require tools for analysing the practice of the players and teams, their tactics and strategies. Very popular and by nature numerical, these games provide many tracks that we analyze in terms of team play. We study DotA, a MOBA-like (Multiplayer Online Battle Arena), where two teams battle in a game very similar to rugby or American football. We show through topological measures-area of polygon described by the players, inertia, diameter, distance to the goal-that are independent with the exact nature of the game, that simple measures on spacial tracks allow for relevantly predicting the outcome of the match. MOTS-CLÉS : jeu vidéo, sport électronique, fouille de traces, recommandation, stratégie KEYWORDS: video game, electronic sport, track mining ICT10, le 25 mai 2010. 2 ICT1

Projet KidLearn : Vers une personnalisation motivante des parcours d’apprentissage

Author: Clément Benjamin
Oudeyer Pierre-Yves
Roy Didier
Sauzéon Hélène
Publication venue: 'Departmento Expresion Grafica y Cartografia'
Publication date: 01/04/2020
Field of study

Article de médiation scientifiqueBulletin de l'Association française pour l'Intelligence Artificielle vise à fournir un cadre de discussions et d'échanges au sein de la communauté universitaire et industrielle. Ainsi, toutes les contributions, pour peu qu'elles aient un intérêt général pour l'ensemble des lecteurs, sont les bienvenues. En particulier, les annonces, les comptes rendus de conférences, les notes de lecture et les articles de débat sont très recherchés. Le Bulletin de l'Af IA publie également des dossiers plus substantiels sur différents thèmes liés à l'IA. Le comité de rédaction se réserve le droit de ne pas publier des contributions qu'il jugerait contraire à l'esprit du bulletin ou à sa politique éditoriale. En outre, les articles signés, de même que les contributions aux débats, reflètent le point de vue de leurs auteurs et n'engagent qu'eux-mêmes. Édito Ce second numéro de l'année du Bulletin de AfIA est consacré à un dossier thématique monté par Marie LEFEVRE (Université Claude Bernard Lyon 1, LIRIS) sur « IA & Éducation ». Il s'agit un dossier très complet qui est présenté ici, avec pas moins de 15 contributions provenant d'autant d'équipes ou laboratoires français (voir page 5). Ce Bulletin vous présente également le compte rendu de la seconde journée « Philosophie des sciences et intelligence artificielle » du 6 février 2020 (voir page 61). Vous y trouverez enfin la liste des thèses et HDR soutenues lors du trimestre écoulé. La composition actuelle du Conseil d'Administration se trouve en quatrième de couverture de tous nos bulletins (voir page 66). Encore un grand merci à tous les contributeurs de ce numéro, sans oublier Claire LEFÈVRE pour sa relecture assidue

INRIA a CCSD electronic archive server