thesis

Multimedia Diff - Audio Documents

Abstract

Tato práce se zabývá vývojem nástroje, který umožňuje funkci diff nad audio soubory obsahujícími obecný zvuk jako hudbu, řeč a jiné zvuky. Jsou zde uvedeny poznatky z různých oblastí vědy zabývající se zvuky jako například psychoakustiky, zpracování řeči a automatické kategorizace hudby podle žánru. Jsou zde popsány některé algoritmy diffu a také externí nástroje potřebné pro vývoj cílové aplikace. Dále tato práce uvádí návrh a implementaci výsledné aplikace, nastavení použitá pro extrakci charakteristických znaků zvuku a zhodnocení dosažených výsledků.This work describes development of a diff tool working with audio files containing general sound such as music, speech and other sounds. There are presented facts from different domains of science related to sound, such as psychoacoustics, speech recognition and automatic music genre categorisation. This paper also contains description of some diff algorithms and external tools needed for development of the goal application. Moreover, there is introduced design and implementation of the application, settings used for sound features extraction and evaluation of attained results.

    Similar works