90 research outputs found

    Comment faire lire des gribouillis Ă  mon ordinateur ?

    Get PDF
    Vous avez dans vos tiroirs des manuscrits avec lesquels vous aimeriez travailler dans votre éditeur de texte ? Pas de problème : l’HTR est fait pour ça ! L’HTR ? C’est la reconnaissance automatique des écritures manuscrites. Avec l’exemple de deux logiciels, eScriptorium et Transkribus, ce tuto@mate vous propose de retracer les principales étapes à suivre pour récupérer un texte dans un document manuscrit tout en abordant la question de l’efficacité d’une telle démarche et celle des bonnes pratiques pour assurer l’optimisation d’un traitement de ce type, en particulier dans le cadre d’un projet de recherche

    Corpus, méthodes et ressources pour la transcription automatique des documents manuscrits patrimoniaux francophones contemporains

    Get PDF
    Prix Étudiant pour "Corpus, méthodes et ressources pour la transcription automatique des documents manuscrits patrimoniaux francophones contemporains"International audienceRésumé en 5 minutes du projet de recherche doctorale intitulé "Corpus, méthodes et ressources pour la transcription automatique des documents manuscrits patrimoniaux francophones contemporains" débuté en novembre 2021 et récompensé par le Bourse d'Excellence 2022 du GREN. La communication replaçait le projet dans le contexte de la disponibilité actuelle des logiciels grand public pour l'application de la transcription automatique de documents manuscrits et le manque de ressources conceptuelles et méthodologiques permettant d'en tirer pleinement parti. L'une des principales difficultés évoquées était celle de la convergence des pratiques vers les modèles et des données interopérables

    Conditions de la mutualisation : les principes FAIR et HTR-United

    Get PDF
    International audienc

    LECTAUREP: Paris Notary Record Books Automated Reading

    Get PDF
    International audienc

    An accessible and transparent pipeline for publishing historical egodocuments

    Get PDF
    The automatization of the processing of documents oriented towards online publication and exploration by the humanities increases the rapidity of treatments like the transcription, but they should also be an opportunity to make the experimentation and the resulting corpora sustainable and reusable. The DAHN project (Dispositif de soutien à l’Archivistique et aux Humanités Numériques) relies on a joint interdisciplinary collaboration between Inria, the EHESS and the University of Le Mans. By taking theexample of egodocuments, the project aims to create a ready-to-use digital and scientific publishing pipeline going from the material archive to an online publication.In this presentation, we introduce our method and guidelines for the processing of non-digital-native textual documents using open-source and easily hackable tools that guarantee visibility across an accessible pipeline, thus challenging the notions of a black box or scattered tools which tend to be hard to maintain in the long run

    An accessible and transparent pipeline for publishing historical egodocuments

    Get PDF
    International audienceThe automatization of the processing of documents oriented towards online publication and exploration by the humanities increases the rapidity of treatments like the transcription, but they should also be an opportunity to make the experimentation and the resulting corpora sustainable and reusable. The DAHN project (Dispositif de soutien à l’Archivistique et aux Humanités Numériques) relies on a joint interdisciplinary collaboration between Inria, the EHESS and the University of Le Mans. By taking the example of egodocuments, the project aims to create a ready-to-use digital and scientific publishing pipeline going from the material archive to an online publication. In this presentation, we introduce our method and guidelines for the processing of non-digital-native textual documents using open-source and easily hackable tools that guarantee visibility across an accessible pipeline, thus challenging the notions of a black box or scattered tools which tend to be hard to maintain in the long run

    Sharing HTR datasets with standardized metadata: the HTR-United initiative

    Get PDF
    The recording of the conference is available at: https://www.canal-u.tv/chaines/enc/25-sharing-htr-datasets-with-standardized-metadata-the-htr-united-initiativ
    • …
    corecore