Titulkování přímých televizních přenosů z Olympijády v Soči: některé zajímavé pohledy

Abstract

Článek popisuje proces a některé zajímavé poznatky získané během titulkování více než 70 hodin živého televizního vysílání z olympijských her v Soči. Skryté titulky byla vytvářeny pro kanál ČT Sport což je sportovní kanál veřejnoprávního vysílání v České republice. V článku je diskutováno naše řešení a architektura pro distribuované vytváření titulků živých televizních programů přemlouvacím přístupem, stejně jako několik úprav stávajících aplikace pro tvorbu titulků (zejména LVCSR systému), ale také specifické vlasnosti jednotlivých titulkovaných sportů. Ukážeme, že přemlouvač může po usilovném tréninku dosáhnout takové přesnosti (více než 98%) a čitelnost titulků, které jednoznačně překonají správnost titulků vytvořených automatické uznávání originálního televizního kanálu.In this paper, we describe our effort and some interesting insights obtained during captioning more than 70 hours of live TV broadcasts from the Olympic Games in Sochi. The closed captioning was prepared for CT Sport, the sport channel of the public service broadcaster in the Czech Republic. We will briefly discuss our solution for distributed captioning architecture on live TV programs using re-speaking approach as well as several modifications of existing live captioning application (especially LVCSR system), but also the way of re-speaking of a real TV commentary for individual sports. We will show that a re-speaker after hard training can achieve such accuracy (more than 98%) and readability of captions which clearly outperform accuracy of captions created by automatic recognition of TV soundtrack

    Similar works