Search CORE

14,999 research outputs found

Les Forêts Aléatoires en Apprentissage Semi-Supervisé (Co-forest) pour la segmentation des images rétiniennes

Author: Mohammed El Amine Bechar
Nesma Settouti
Publication venue: HAL CCSD
Publication date: 08/12/2015
Field of study

Nous proposons une approche qui permet la reconnaissance automatique des régions Disques et Cups pour la mesure du rapport CDR (Cup/Disc Ratio) par apprentissage semi-supervisé. Une étude comparative de plusieurs techniques est proposée. Le principe repose sur une croissance de région en classifiant les pixels voisins à partir des pixels d'intérêt de l'image par apprentissage semi-supervisé. Les points d'intérêt sont détectés par l'algorithme Fuzzy C-means (FCM)

HAL Clermont Université

Éditorial

Author: Antoniadis Georges
Chanier Thierry
Publication venue: HAL CCSD
Publication date: 01/12/2005
Field of study

Nous avons le plaisir de publier dans la revue Alsic ce numéro thématique consacré au traitement automatique des langues (Tal) et à l'apprentissage des langues. Les six articles regroupés à cette occasion sont des versions étendues et relues par notre comité scientifique d'articles originellement présentés lors de la journée d'étude de l'Atala (Association pour le Traitement Automatique des Langues) le 22 octobre 2004 à Grenoble. Même si notre revue a déjà ouvert ses colonnes à des articles appartenant à ce domaine de recherche, c'est la première fois que nous pouvons en présenter un panorama représentatif des thématiques qui la traversent : système de traitement de corpus textuels, dictionnaires électroniques, générateurs d'activités lexico-grammaticales, systèmes de diagnostic des connaissances de l'apprenant, système de traitement de la prosodie et de l'intonation. A ces thèmes, on peut ajouter, sans chercher pour autant l'exhaustivité, ceux abordés dans deux articles récents, articles dont les auteurs étaient également présents à la journée de l'Atala : le diagnostic d'erreur (L´haire & Vandeventer-Faltin, 2003) et la simulation (Michel & Lehuen, 2005)

HAL - Université de Franche-Comté

Hal - Université Grenoble Alpes

Directory of Open Access Journals

Du quatrième de proportion comme principe inductif : une proposition et son application à l’apprentissage de la morphologie

Author: Stroppa Nicolas
Yvon François
Publication venue: Association pour le Traitement Automatique des Langues
Publication date: 01/01/2006
Field of study

Nous présentons un modèle d’apprentissage par analogie qui exploite la notion de proportions analogiques formelles ; cette approche présuppose de savoir donner un sens à ces proportions et de pouvoir implanter efficacement leur calcul. Nous proposons une définition algébrique de cette notion, valable pour les structures utilisées couramment pour les repré- sentations linguistiques : mots sur un alphabet fini, structures attribut-valeur, arbres étiquetés. Nous présentons ensuite une application à une tâche concrète, consistant à apprendre à ana- lyser morphologiquement des formes orthographiques inconnues. Des résultats expérimentaux sur plusieurs lexiques permettent d’apprécier la validité de notre démarche

Irish Universities

DCU Online Research Access Service

Une approche par apprentissage basée sur des modèles linguistiques

Author: Blache Philippe
Nouali Omar
Régnier Alain
Publication venue: 'Lavoisier'
Publication date: 01/01/2005
Field of study

International audienceNous proposons une double amélioration des systèmes de filtrage de courriels existants. D'une part, en utilisant une méthode d'apprentissage automatique permettant à un système de filtrage d'élaborer des profils utilisateur. D'autre part, nous utilisons un ensemble de connaissances linguistiques sous forme de modèles réduits issues de modèles linguistiques de textes. Dans ce contexte, nous cherchons à évaluer si l'utilisation de connaissances et de traitements linguistiques peut améliorer les performances d'un système de filtrage. En effet, nous utilisons, au-delà des caractéristiques lexicales, un ensemble d'indicateurs sur le message portant sur la structure et le contenu. Ces connaissances sont indépendantes du domaine d'application et la fiabilité repose sur l'opération d'apprentissage. Pour tenter de statuer sur la faisabilité de notre approche et d'évaluer son efficacité, nous l'avons expérimenté sur un corpus de 1 200 messages. Nous présentons les résultats d'un ensemble d'expériences d'évaluation

HAL AMU

Peut-on bien chunker avec de mauvaises étiquettes POS ?

Author: Dupont Yoann
Eshkol-Taravella Iris
Tellier Isabelle
Wang Ilaine
Publication venue: HAL CCSD
Publication date: 02/07/2014
Field of study

http://www.taln2014.org/site/actes-en-ligne/actes-en-ligne-articles-taln/National audienceDans cet article, nous testons deux approches distinctes pour chunker un corpus oral transcrit, en cherchant à minimiser les étapes de correction manuelle. Nous ré-utilisons tout d'abord un chunker appris sur des données écrites, puis nous tentons de ré-apprendre un chunker spécifique de l'oral à partir de données annotées et corrigées manuellement, mais en faible quantité. L'objectif est d'atteindre les meilleurs résultats possibles pour le chunker en se passant autant que possible de la correction manuelle des étiquettes POS. Nos expériences montrent qu'il est possible d'apprendre un nouveau chunker performant pour l'oral à partir d'un corpus de référence annoté de petite taille, sans intervention sur les étiquettes POS. Abstract. In this paper, we test two distinct approaches to chunk transcribed oral data, trying to minimize the phases of manual correction. First, we use an existing chunker, learned from written texts, then we try to learn a new specific chunker from a small amount of manually corrected labeled oral data. The purpose is to reach the best possible results for the chunker with as few manual corrections of the POS labels as possible. Our experiments show that it is possible to learn a new effective chunker for oral data from a labeled reference corpus of small size, without any manual correction of POS label

HAL Université de Tours

Filtrage automatique de courriels : une approche adaptative et multi niveaux

Author: Blache Philippe
Nouali Omar
Publication venue: 'Springer Fachmedien Wiesbaden GmbH'
Publication date: 01/01/2005
Field of study

International audienceCet article propose un système de courriers électroniques paramétrable avec plusieurs niveaux de filtrage: un filtrage simple basé sur l'information contenue dans l'entête du courriel ; un filtrage booléen basé sur l'existence ou non de mots clés dans le corps du courriel ; un filtrage vectoriel basé sur le poids de contribution des mots clés du courriel ; un filtrage approfondi basé sur les propriétés linguistiques caractérisant la structure et le contenu du courriel. Nous proposons une solution adaptative qui offre au système la possibilité d'apprendre à partir de données, de modifier ses connaissances et de s'adapter à l'évolution des intérêts de l'utilisateur et à la variation de la nature des courriels dans le temps. De plus, nous utilisons un réseau lexical permettant d'améliorer la représentation du courriel en prenant en considération l'aspect sémantique.<BR /

HAL AMU

Étude des critères de désambiguïsation sémantique automatique : résultats sur les cooccurrences

Author: Audibert Laurent
Publication venue: HAL CCSD
Publication date: 11/06/2003
Field of study

pp. 35-44Nous présentons dans cet article une étude sur les critères de désambiguïsation sémantique automatique basés sur les cooccurrences. L'algorithme de désambiguïsation utilisé est du type liste de décision, il sélectionne une cooccurrence unique supposée véhiculer línformation la plus fiable dans le contexte ciblé. Cette étude porte sur 60 vocables répartis, de manière égale, en trois classes grammaticales (nom, adjectif et verbe) avec une granularité fine au niveau des sens. Nous commentons les résultats obtenus par chacun des critères évalués de manière indépendante et nous nous intéressons aux particularités qui différencient les trois classes grammaticales étudiées. Cette étude s'appuie sur un corpus français étiqueté sémantiquement dans le cadre du projet SyntSem

HAL AMU

Gestion supervisée d’une unité de coagulation pour la potabilisation des eaux à partir d’une méthodologie d’apprentissage et d’expertise

Author: Benhammou Ahmed
Lakhal El Khadir
Lamrini Bouchra
Le Lann Marie-Véronique
Publication venue: 'Consortium Erudit'
Publication date: 01/01/2007
Field of study

Le travail présenté propose une méthodologie de classification par apprentissage qui permet l’identification des états fonctionnels sur une unité de coagulation impliquée dans le traitement des eaux de surface. La supervision et le diagnostic de ce procédé ont été réalisés en utilisant la méthode de classification LAMDA (Learning Algorithm for Multivariate Data Analysis). Cette méthodologie d’apprentissage et d’expertise permet d’exploiter et d’agréger toutes les informations provenant du procédé et de son environnement ainsi que les connaissances de l’expert. L’étude montre qu’il est possible d’ajouter aux informations issues des capteurs classiques (température, matières en suspension, pH, conductivité, oxygène dissous), la valeur de la dose de coagulant calculée par un capteur logiciel développé dans une étude antérieure afin d’affiner le diagnostic. Le site d’application choisi pour l’identification des états fonctionnels est la station de production d’eau potable Rocade de la ville de Marrakech, Maroc.The present work proposes a learning classification method to identify the functional states of a coagulation process for the treatment of surface water and production of drinking water. Supervisory control and diagnosis were performed using the LAMDA (Learning Algorithm for Multivariate Data Analysis) classification technique. This expert learning method involves the processing and aggregation of all information stemming from an environmental process, and it allows the incorporation of the user’s knowledge. The study shows that it is possible to refine the diagnosis by taking into account the information obtained from common sensors (e.g., temperature, suspended solids, pH, conductivity, dissolved oxygen) together with the predicted coagulant dosage, as computed with an intelligent software sensor developed previously. The Rocade drinking water plant located at Marrakech, Morocco was chosen to test the method

Crossref

Érudit

Data Science : une formation internationale de niveau Master en science des données

Author: Amini Massih-Reza
Durand Jean-Baptiste
Gaudoin Olivier
Gaussier Eric
Juditsky Anatoli,
Publication venue: Société Française de Statistique
Publication date: 01/06/2016
Field of study

International audienceWe present the international training program in Data Science at master 2 level. This program is supported by both Grenoble Alpes University and Grenoble INP. In this article, we elaborate on the specific features of the program, its strategic position, operating and historical features, the detailed contents of courses and perspectives of evolution.Nous présentons la formation internationale de niveau master 2 en Data Science de l'Université Grenoble Alpes et de Grenoble INP : spécificités et positionnement de la formation, fonctionnement et aspects historiques de sa création, programme de cours détaillé et perspectives d'évolution

Hal - Université Grenoble Alpes

INRIA a CCSD electronic archive server

HAL Descartes

HAL-CIRAD

Reconnaissance de documents assistée: architecture logicielle et intégration de savoir-faire

Author: Bapst Frédéric
Ingold Rolf
Publication venue
Publication date: 19/07/2007
Field of study

Cette thèse aborde la reconnaissance de documents suivant une approche assistée, qui vise à exploiter au mieux les compétences respectives de l’homme et de la machine. Nos contributions portent notamment sur les questions d’architecture logicielle soulevées par la mise en oeuvre de systèmes de reconnaissance de documents. Les avantages d’un environnement coopératif sont motivés par une analyse critique des systèmes actuels, et une projection sur les futures applications de la reconnaissance de documents. Diverses propositions concrètes sont émises sur la conduite du dialogue homme-machine, ainsi que sur les possibilités d’amélioration à l’usage. L’inventaire des données à gérer dans un système de reconnaissance est organisé de façon modulaire et homogène, et représenté à l’aide du format standard DAFS Sur le plan du contrôle, le système est décomposé selon une modélisation multi-agents. Cette découpe conceptuelle est alors simulée dans notre plateforme de développement, qui repose sur la programmation concurrente, distribuée, et multi-langages. Une solution expressive est proposée pour le couplage entre le noyau de l’application et l’interface graphique. Le prototype qui a servi à valider l’architecture est présenté. Notre architecture logicielle encourage l’exploitation du savoir-faire typographique, par l’intermédiaire d’un support de fontes standardisé. Ce rapprochement entre les deux disciplines profite à la fois à l’ergonomie, à la valorisation des résultats de reconnaissance, et aux méthodes d’analyse automatiques. Nous présentons une poignée d’analyseurs originaux, pour des tâches de reconnaissance de caractères, d’identification des fontes, ou de segmentation. Les expériences conduites en guise de première évaluation démontrent l’utilité potentielle de nos outils d’analyse. Par ailleurs, une contribution est apportée au problème de l’évaluation des performances de systèmes de reconnaissance assistée, avec l’introduction d’un nouveau modèle de coûts. Celui-ci intègre l’influence du comportement de l’utilisateur, de même que l’amélioration des performances liée au phénomène d’apprentissage incrémental. Notre modèle de coûts est utilisé dans des simulations, ainsi que dans des expériences mettant en jeu des analyseurs existants. Les observations mettent en évidence la dynamique particulière des systèmes assistés par rapport aux approches entièrement automatiques.This thesis addresses the question of document recognition with an assisted perspective advocating an adequate combination between human and machine capabilities. Our contributions tackle various aspects of the underlying software architecture. Both a study of existing systems and a projection on some future applications of document recognition illustrate the need of cooperative environments. Several mechanisms are proposed to drive the human-machine dialog or to make the recognition systems able to improve with use. The various data involved in a recognition system are organized in a modular and homogeneous way. The whole information is represented using the DAFS standard format. In our proposition, the control is decentralized according to a multi-agent modelling. This conceptual scheme is then simulated on our development platform, using concurrent, distributed, and multi-languages programming. An expressive solution is proposed for the coupling between the application kernel and a graphical user interface. A prototype is realized to validate the whole architecture. Our software architecture takes advantage of the typographical know-how, through the use of a standardized font management support. This integrated approach lets us enhance the ergonomy, extend the possible use of the recognition results, and redefine some recognition techniques. A few innovative analyzers are described in the field of optical character recognition, font identification, or segmentation. The first experiments show that our simple methods behave surprisingly well, with respect to what can be expected from the state of the art. Besides, we bring a contribution to the problem of measuring the performance of cooperative recognition systems, through the introduction of a new cost model. Our notations are able to describe assisted recognition scenarios, where the user takes part in the process, and where the accuracy is modified dynamically thanks to incremental learning. Our cost model is used both in simulations and in experiments implying existing analyzers. The dynamic aspects of assisted systems can then be observed

RERO DOC Digital Library