140 research outputs found

    Guide de transcription pour les manuscrits du Xe au XVe siècle

    No full text
    Ce guide est le fruit d’une réflexion menée au cours des années 2021 et 2022 dans la cadre du projet CREMMALab et du séminaire de recherche « Création de modèle(s) HTR pour les documents médiévaux en ancien français et moyen français entre le Xe et le XVe siècle ». Nos préconisations ont pour but d’accompagner la création des données d’entraînement afin d’optimiser l’apprentissage machine des modèles d’HTR. Produire des données d’entraînement demande de modéliser une représentation la matière textuelle afin de créer des données homogènes qui assureront la qualité des prédictions HTR. Ce guide ne prétend pas répondre à toutes les problématiques de transcriptions présentes dans les manuscrits médiévaux, mais nous espérons qu’il permettra aux transcripteurs de répondre aux interrogations les plus courantes et d’harmoniser les pratiques

    Des petites histoires pour Ă©crire l'Histoire

    No full text
    International audienc

    CREMMALab Project: Handwritten text recognition (HTR) for medieval manuscripts

    No full text
    International audienc

    Comprendre la composition des légendiers en l’aide à l’aide des méthodes numériques: Acquisition automatique du texte et analyses stylométriques

    No full text
    International audienceLes premières études sur la compilation des légendiers français remontent au début du 20 e siècle avec les célèbres travaux de Paul Meyer 1. Les mécanismes qui régissent leur compilation sont encore l'objet de recherches récentes 2 , montrant notamment que les premiers regroupements de Vies de saints en français ne proposent pas à l'intérieur de leurs principales subdivisions (apôtres, martyres, vierges et confesseurs) une organisation stable. L'ordre des Vies y est redistribué de famille en famille. Ainsi, les légendiers français sont le résultat d'un système de compilation complexe. Au niveau des manuscrits entiers, ils sont formés de grandes familles de légendiers qui se sont au cours du temps accumulées. À plus petite échelle, il semble qu'on puisse également détecter des microséries possiblement d'un même auteur, à l'instar du recueil des « Seint Confessor » de Wauchier de Denain (manuscrit, fr. 412 de la BnF). L'objet de l'exposé, ici, est de proposer d'étudier les Vies de saint en langue vernaculaire avec une approche non pas par Vie ou dossier isolé, mais au niveau du légendier complet, voire des familles de légendier pour mieux comprendre les spécificités de ces compilations. Une telle approche nous permettrait : 1. d'identifier des microcompilations jusqu'ici passées inaperçues. 2. d'examiner l'histoire de leur transmission dans les légendiers postérieurs pour retracer l'évolution des récits, de leur circulation et de leurs usages

    Reconnaissance automatique d'Ă©criture et manuscrits Limites et nouvelles perspectives

    No full text
    International audienceL’émergence d’outils de reconnaissance automatique d’écriture avec une interface utilisateur de plus en plus intuitive, tels que Transkribus ou eScriptorium, a ouvert de nouvelles perspectives. De nombreuses équipes de recherche se sont lancées dans l'utilisation de l'ATR et l’entraînement de modèles de plus en plus performants sur les sources historiques, capables de reconnaître efficacement une grande variété de documents qu'ils présentent des écritures différentes, ou qu’ils proviennent de périodes historiques et d’ères linguistiques variées, modernes comme médiévales.Toutefois, malgré les progrès significatifs réalisés, des défis subsistent pour les néophytes désireux de s'engager dans de tels projets. L'un des principaux obstacles réside dans le prétraitement et l'analyse des images avant même d'aborder la reconnaissance d'écriture. Comment composer avec des images de tailles inhabituelles, des supports endommagés par l'eau ou le feu, etc. ? Enfin, la phase de reconnaissance de la mise en page (segmentation) reste une étape à la fois essentielle et délicate dont nous expliquerons les limites, mais aussi les futures perspectives, à travers de nouvelles approches, comme celle proposée par l’outil YALTAi.En conclusion, si la reconnaissance automatique d’écriture offre la possibilité d'explorer des tailles de corpus inédites, elle requiert toujours une certaine expertise pour relever les défis inhérents à la diversité et la complexité des documents médiévaux, limites et enjeux que nous aborderons dans cette présentation

    CREMMALab Project: Handwritten text recognition (HTR) for medieval manuscripts

    No full text
    International audienc
    • …
    corecore