Skip to main content
Article thumbnail
Location of Repository

Lettres, mots, textes - Clefs d'accès à l'écrit numérique

By Bénédicte Pincemin

Abstract

National audienceLes moteurs de recherche en texte intégral font partie des outils centraux pour l'anayse littéraire sur corpus numérique. Une introduction simple aux techniques usuelles (indexation par fichier inverse, modèle de l'espace vectoriel) permet de comprendre sur quoi reposent les différents modes d'accès au texte et de prendre en compte les biais induits par le traitement automatique. Avec une approche linguistique, on examine en particulier dans le détail le fonctionnement et la signification de l'ensemble des opérateurs booléens courants issus des langages documentaires (troncature, ET, OU, etc.), pour en maîtriser et adapter l'utilisation pour l'interrogation du texte intégral. On explique pourquoi certaines propositions novatrices (interrogation en langage naturel, pondération manuelle des mots-clés, tri par pertinence décroissante, représentations cartographiques...) peuvent s'avérer contre-productives, et supposent a minima un utilisateur averti. Le texte intégral se prête en définitive à trois approches dont il faut cultiver la complémentarité : il peut être vu comme une suite de lettres (perspective graphique), donnant notamment accès à certaines propriétés morphologiques quelquefois intéressantes en contexte multilingue ; le texte peut être naturellement analysé comme formé d'unités lexicales articulées syntaxiquement ; mais cette seconde persective ne doit pas occulter un point de vue textuel, qui restitue aux unités linguistiques les contextes conditionnant leur composition et leur interprétation

Topics: littérature et ordinateur, corpus, base de textes numériques, texte intégral, analyse textuelle assistée par ordinateur, lexicométrie, textométrie, statistique textuelle, linguistique, sémantique différentielle, sémantique interprétative, herméneutique, contexte textuel, recherche d'information, modèle de l'espace vectoriel, moteur de recherche, pertinence, représentation cartographique, projection plane, espace sémantique, analyse factorielle, ergonomie, interface, document numérique, [SHS.LANGUE] Humanities and Social Sciences/Linguistics, [SHS.STAT] Humanities and Social Sciences/Methods and statistics
Publisher: CIRLEP, Presses Universitaires de Reims
Year: 2001
OAI identifier: oai:HAL:halshs-00168992v1
Provided by: Hal-Diderot
Download PDF:
Sorry, we are unable to provide the full text but you may find it at the following location(s):
  • https://halshs.archives-ouvert... (external link)
  • https://halshs.archives-ouvert... (external link)
  • https://halshs.archives-ouvert... (external link)
  • https://halshs.archives-ouvert... (external link)
  • https://halshs.archives-ouvert... (external link)
  • Suggested articles


    To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.