research article

Transkribus za namen optične prepoznave rokopisa: poročilo o uporabi in učenju besedilnega modela

Abstract

Digitalizacija in prepoznavanje besedila sta ključna za omogočanje dostopa do zgodo­vinskih dokumentov, vključno z rokopisi. Članek predstavlja pregled obstoječih praks na področju optične prepoznave rokopisov (HTR) v Sloveniji in nekaj primerov tujih praks. Sledi poročilo o uporabi in učenju besedilnega modela za optično prepoznavo rokopisov z uporabo orodja Transkribus. Narodna in univerzitetna knjižnica (NUK) je v okviru projekta EODOPEN testirala platformo Transkribus na razmnoženih rokopisih semeniških predavanj Janeza Evangelista Kreka iz začetka 20. stoletja. Zapiske Kre­kovih predavanj so med letoma 1903 in 1907 nekateri bogoslovci stenografirali in po njegovem pregledu litografirali. Poročilo opisuje proces učenja besedilnega modela na enem delu in nato uporabo nastalega modela na treh dodatnih delih s podobno pisavo. Predstavljeni so tudi izzivi, s katerimi so se soočili, ter rezultati, ki so pokazali, da je uporaba Transkribusa učinkovita pri prepoznavanju besedil v slovenščini, čeprav spr­va zahteva nekaj dodatnega ročnega dela. Članek se zaključuje s priporočili in idejami za nadaljnjo uporabo ter raziskovanje te tehnologije

    Similar works