research

Conversion of Piano Recording from WAV to MIDI

Abstract

Cílem této práce je návrh systému pro strojový převod polyfonních nahrávek piana z audio formátu WAV do MIDI. Práce popisuje problematiku rozpoznání tónů v hudebních záznamech a předkládá návrh řešení postavený na pravděpodobnostním modelu využívajícím metodu Probabilistic Latent Component Analysis. Pro trénování modelu byly použity nahrávky jednotlivých tónů digitálního piana. Navržený systém byl následně testován na sadě syntetizovaných nahrávek klasické hudby z databáze Classical Piano Midi i na sadě nahrávek piana Korg SP-250 a následně byl vyhodnocen za pomoci odlišných metrik. V závěru jsou výsledky úspěšnosti rozpoznání porovnány s jinými již existujícími systémy.The aim of the thesis is to propose a system capable of automatic conversion of polyphonic piano recordings from the audio format WAV to MIDI. The thesis describes problems related to single tone recognition in music recordings and proposes a solution based on a probabilistic model that uses the Probabilistic Latent Component Analysis method. Recordings of isolated digital piano tones were used to train the system. The proposed system was tested on classical recordings of the Classical Piano MIDI database and on recordings of a Korg SP-250 piano and evaluated using a variety of metrics. The conclusion part contains the results of recognition success rate and their comparison with other existing systems.

    Similar works