1,990 research outputs found

    Paléographie statistique pour décrire, identifier, dater. . . Normaliser pour coopérer et aller plus loin ?

    Get PDF
    Les initiatives TEI (Text Encoding Initiative) et MUFI (Medieval Unicode Font Initiative) multiplient les potentialités des transcriptions et invitent à interroger le processus même d’une opération pourtant commune dans les études médiévales. Transcrire, c’est décrire un texte et sa mise en forme graphique. Cela ouvre des voies aux études paléographiques, notamment par la description des diverses variantes morphologiques des lettres ou abréviations. Des recherches entreprises sur la production écrite de l’abbaye cistercienne de Fontenay démontrent le potentiel considérable des transcriptions dites « allographétiques » et des statistiques descriptives pour comprendre les évolutions de l’écriture médiévale. La fragmentation du paysage actuel de la recherche amène pourtant à souhaiter une harmonisation des pratiques, tant pour décrire les phénomènes paléographiques que pour structurer les données et formuler des ontologies

    Plan de gestion des données de l\u27observatoire des cultures écrites de l\u27argile à l\u27imprimé Biblissima+

    Get PDF
    Ce document décrit le plan de gestion des données (PGD) de l’observatoire des cultures écrites anciennes Biblissima+. Fédérant 17 établissements, dont plusieurs équipes de recherche, une entreprise et le ministère de la Culture, Biblissima+ crée une infrastructure modulaire mettant en interopérabilité toutes les données en jeu dans l\u27histoire de la transmission et l\u27étude de toutes les cultures écrites, de l’argile à l’imprimé, sans limite de temps, de langue ou de type de documentation. Le présent document correspond à la version initiale du livrable à fournir à l’ANR dans les 6 mois après le démarrage du projet. Il a été préparé à partir du modèle générique diffusé par l’ANR en 2019 et de la grille de relecture des PGD proposée par l’INIST-CNRS1 en 2020

    Localisation, traduction et diversité sociolinguistique en Afrique sub-saharienne : stratégies et perspectives

    Get PDF
    Pour les langues d’Afrique sub-saharienne, localisation et traduction interviennent dans un double jeu de contraintes linguistiques et sociolinguistiques et font face à deux tendances parfois conflictuelles : la mondialisation, d’une part, et les politiques déclarées de promotion de la diversité linguistique, d’autre part. En nous focalisant sur les pratiques s’appuyant sur les technologies de l’information, à la fois outils de la localisation et de la traduction en langues africaines et moyens de développement de celles-ci, nous présenterons les problèmes liés à ces activités et exposerons comment ces activités s’organisent et se déploient dans le contexte actuel. Nous ferons état de la présence des langues africaines sub-sahariennes dans les environnements numériques et proposerons une analyse de la dynamique de la traduction où s’articulent des processus et des pratiques qui agissent selon deux axes, l’un de facilitation et l’autre de complexification.Localization and translation for languages of sub-Saharan Africa are done within a double set of linguistic and sociolinguistic constraints, and they face two often conflicting trends, on the one hand globalization, and on the other hand the declared policies of promotion of language diversity. I will focus on the area of information technologies, which are both the tools for localization and translation in African languages and the means for developing them. I will present the problems encountered in translation and localization activities, and how these activities develop in the present context. I will review the presence of African languages in digital environments and propose an analysis of the dynamics of translation in which processes and practices interact along two axes, facilitation and complexification

    Etat de l\u27art en matière de crowdsourcing

    Get PDF
    Document réalisé dans le cadre d’un projet de Recherche & Développement pour la conception d’une plateforme de correction collaborative et d’enrichissement des documents numérisés

    Méthodologies croisées pour l’attribution des textes : la place de la génétique. Le cas Gary/Ajar

    Get PDF
    Le présent article tente de s’interroger sur la façon dont se fabrique et se configure un style d’auteur ; il tente, du même coup, de situer la place de la génétique des textes parmi plusieurs méthodologies d’analyse possibles. Dans cette perspective, l’œuvre de Romain Gary est un objet d’analyse de première importance. L’attribution des textes et ses méthodes L’attribution des textes anonymes ou écrits sous un pseudonyme, ou recherche en paternité des œuvres littéraires, est un des objets ma..

    L’organisation des connaissances au prisme du langage, du texte et du discours. Un parcours en recherche d’information.

    No full text
    Ce mémoire d’habilitation à diriger des recherches dresse une synthèse des travaux réalisés en sciences de l’information et de la communication et portent sur la description et la caractérisation de contenus textuels, sur leur représentation sous la forme de connaissances organisées et médiatisées pour la recherche d’information. L’organisation des connaissances est abordée comme un « objet d’étude des processus cognitifs et des techniques intellectuelles qui permettent de classer, indexer, formaliser et modéliser le réel » (Polity et al. 2005, p. 13). La recherche d’information est un paradigme structurant pour appréhender cet objet. Dans la première partie du mémoire, la recherche d’information est saisie dans le seul rapport à la technique : les connaissances linguistiques sont utilisées pour organiser les données afin d’améliorer l’indexation en texte intégral et la classification de textes. Dans la seconde partie, la recherche d’information est appréhendée comme une activité humaine et sociale : les connaissances linguistiques sont utilisées pour favoriser l’accès aux documents et permettre diverses activités informationnelles (lire, écrire, annoter, partager, etc.). Ce mémoire témoigne d’un parcours qui traverse les deux grandes conceptions de l’information. La première est inspirée du courant nord-américain de l’information retrieval qui cherche à établir des principes généraux de l’information, les technologies qui permettent de la traiter et de la rendre accessible. La seconde est inspirée de courants en sciences humaines et sociales (information seeking notamment) et donne la primeur aux usages de l’information et aux pratiques informationnelles dans des contextes socio-professionnels précis

    L’organisation des connaissances au prisme du langage, du texte et du discours. Un parcours en recherche d’information.

    Get PDF
    Ce mémoire d’habilitation à diriger des recherches dresse une synthèse des travaux réalisés en sciences de l’information et de la communication et portent sur la description et la caractérisation de contenus textuels, sur leur représentation sous la forme de connaissances organisées et médiatisées pour la recherche d’information. L’organisation des connaissances est abordée comme un « objet d’étude des processus cognitifs et des techniques intellectuelles qui permettent de classer, indexer, formaliser et modéliser le réel » (Polity et al. 2005, p. 13). La recherche d’information est un paradigme structurant pour appréhender cet objet. Dans la première partie du mémoire, la recherche d’information est saisie dans le seul rapport à la technique : les connaissances linguistiques sont utilisées pour organiser les données afin d’améliorer l’indexation en texte intégral et la classification de textes. Dans la seconde partie, la recherche d’information est appréhendée comme une activité humaine et sociale : les connaissances linguistiques sont utilisées pour favoriser l’accès aux documents et permettre diverses activités informationnelles (lire, écrire, annoter, partager, etc.). Ce mémoire témoigne d’un parcours qui traverse les deux grandes conceptions de l’information. La première est inspirée du courant nord-américain de l’information retrieval qui cherche à établir des principes généraux de l’information, les technologies qui permettent de la traiter et de la rendre accessible. La seconde est inspirée de courants en sciences humaines et sociales (information seeking notamment) et donne la primeur aux usages de l’information et aux pratiques informationnelles dans des contextes socio-professionnels précis

    Interprétation contextuelle et assistée de fonds d'archives numérisées (application à des registres de ventes du XVIIIe siècle)

    Get PDF
    Les fonds d'archives forment de grandes quantités de documents difficiles à interpréter automatiquement : les approches classiques imposent un lourd effort de conception, sans parvenir à empêcher la production d'erreurs qu'il faut corriger après les traitements.Face à ces limites, notre travail vise à améliorer la processus d'interprétation, en conservant un fonctionnement page par page, et en lui apportant des informations contextuelles extraites du fonds documentaire ou fournies par des opérateurs humains.Nous proposons une extension ciblée de la description d'une page qui permet la mise en place systématique d'échanges entre le processus d'interprétation et son environnement. Un mécanisme global itératif gère l'apport progressif d'informations contextuelles à ce processus, ce qui améliore l'interprétation.L'utilisation de ces nouveaux outils pour le traitement de documents du XVIIIe siècle a montré qu'il était facile d'intégrer nos propositions à un système existant, que sa conception restait simple, et que l'effort de correction pouvait être diminué.Fonds, also called historical document collections, are important amounts of digitized documents which are difficult to interpret automatically: usual approaches require a lot of work during design, but do not manage to avoid producing many errors which have to be corrected after processing.To cope with those limitations, our work aimed at improving the interpretation process by making use of information extracted from the fond, or provided by human operators, while keeping a page by page processing.We proposed a simple extension of page description language which permits to automatically generate information exchange between the interpretation process and its environment. A global iterative mechanism progressively brings contextual information to the later process, and improves interpretation.Experiments and application of those new tools for the processing of documents from the 18th century showed that our propositions were easy to integrate in an existing system, that its design is still simple, and that required manual corrections were reduced.RENNES-INSA (352382210) / SudocSudocFranceF

    Classe Patrimoine

    Get PDF
    Jouer le Patrimoine, c’est inscrire la bibliothèque dans un parcours complet qui, du passé au présent, de l’école aux archives, du local à l’universel, inscrit le jeune public dans un espace élargi. Reconnaissance, fréquentation, transversalité, communication : un résultat gagnant-gagnant. À Viroflay comme à Saint- Deni
    • …
    corecore