Search CORE

32 research outputs found

Statut scientifique de l'archeologie et formalisation de l'analyse des textes: exemple d'un metalangage d'analyse du Corpus des Inscriptions Latines

Author: Borillo M.
Virbel Jacques
Publication venue
Publication date: 01/01/1975
Field of study

Crossref

Repositori d'Objectes Digitals per a l'Ensenyament la Recerca i la Cultura

Directory of Open Access Journals

Définition des unités linguistiques intervenant dans l\u27indexation automatique en arabe/mémoire

Author: Abbas Wigdan
Publication venue: enssib
Publication date
Field of study

Bibliothèque numérique de l'enssib

Article en français : état des recherches réalisées depuis 1986 (L\u27)

Author: Hachard Vincent
Publication venue: enssib
Publication date
Field of study

Bibliothèque numérique de l'enssib

Descripteurs complexes en indexation automatique arabe : étude des structures annectives extraites d\u27un corpus économique

Author: El Hachani Mabrouka
Publication venue: Université de Lyon - Université Lumière Lyon 2
Publication date
Field of study

Bibliothèque numérique de l'enssib

Systèmes de recherche d\u27information en langage naturel (Les)

Author: Kuramoto Hélio
Publication venue: enssib
Publication date
Field of study

Bibliothèque numérique de l'enssib

Description des documents textuels : indices pour une typologie prenant en compte le contexte et la finalité de la communication

Author: Ben Abdallah Nabil
Publication venue: enssib
Publication date
Field of study

Bibliothèque numérique de l'enssib

Automatisation dans les métiers documentaires

Author: Kouakou Alley-Hugues
Publication venue: grenoble 2
Publication date
Field of study

Bibliothèque numérique de l'enssib

Construction des langages d\u27indexation : aspects théoriques

Author: Rivier Alexis
Publication venue: Lyon 1
Publication date
Field of study

Bibliothèque numérique de l'enssib

Construction des langages d\u27indexation : aspects théoriques

Author: Rivier Alexis
Publication venue: Lyon 1
Publication date
Field of study

Bibliothèque numérique de l'enssib

Exploitation des arbres fréquents de dépendance pour la représentation et la classifacation automatique de textes

Author: Meghaoui Ali
Publication venue: 'Universite de Sherbrooke'
Publication date: 01/01/2008
Field of study

L'intégration de l'information syntaxique dans la représentation vectorielle des documents s'est avérée une source d'amélioration de la performance des systèmes de classification automatique de documents textuels. Cette information est souvent représentée sous forme d'arbres de dépendance qui peuvent être générés automatiquement par un analyseur syntaxique de la langue naturelle. Dans ce travail, nous proposons un nouveau modèle de représentation des documents basée sur l'extraction des sous-arbres fréquents d'arbres de dépendance en utilisant l'algorithme de fouille d'arbres FREQT, que nous avons adapté à nos besoins. Dans ce modèle, un document est représenté par l'ensemble de ses phrases, et chaque phrase est représentée à l'aide d'un ensemble de sous-arbres fréquents. Afin d'appliquer efficacement cette représentation à la classification automatique non supervisée (ou clustering ) de documents, nous proposons une nouvelle mesure de similarité entre documents basée sur notre méthode de représentation. Ainsi, nous construisons un système de clustering de documents qui englobe notre méthode de représentation, notre mesure de similarité et l'algorithme de clustering hiérarchique par agglomération. Nous évaluons notre système sur des collections de textes bien connues dans la communauté de la classification de textes: la collection Reuters-21578, 20Newsgroups et OHSUMED. Nous montrons sur ces données que notre méthode améliore le clustering de documents. Nous présentons également une évaluation des approches existantes de représentation des documents

Savoirs UdeS