    Robust feature representation for classification of bird song syllables

    A novel feature set for low-dimensional signal representation, designed for classification or clustering of non-stationary signals with complex variation in time and frequency, is presented. The feature representation of a signal is given by the first left and right singular vectors of its ambiguity spectrum matrix. If the ambiguity matrix is of low rank, most signal information in time direction is captured by the first right singular vector while the signal’s key frequency information is encoded by the first left singular vector. The resemblance of two signals is investigated by means of a suitable similarity assessment of the signals’ respective singular vector pair. Application of multitapers for the calculation of the ambiguity spectrum gives an increased robustness to jitter and background noise and a consequent improvement in performance, as compared to estimation based on the ordinary single Hanning window spectrogram. The suggested feature-based signal compression is applied to a syllable-based analysis of a song from the bird species Great Reed Warbler and evaluated by comparison to manual auditive and/or visual signal classification. The results show that the proposed approach outperforms well-known approaches based on mel-frequency cepstral coefficients and spectrogram cross-correlation

    Large-scale automated acoustic monitoring of birds and the challenges of field data

    Modern technologies for the automated acoustic monitoring of animal communities enable species surveys that yield data in unprecedented volumes. Interpretation of these data bring new challenges related to the need of automated species identification. Coupling automated audio recording with automated species identification has enormous potential for biodiversity assessment studies, but it has posed many challenges to the effective use of techniques in real-world situations. This thesis develops new methods in the field of bioacoustics applied to automated monitoring of vocal species in terrestrial environments. Specifically, I developed automated methods to classify acoustic ecological data generated under the two most common contexts used in ecology: identification of vocalization data stored in acoustic libraries of sounds and identification of vocalizations in audio data collected from the field, through e.g., acoustic monitoring programs. The methods bring key developments across the entire pipeline for automated acoustical identification, connecting techniques from the data acquisition in the field to the ecological modelling of data identified utilizing automated classification methods. I show the performance of methods over huge datasets, compare them with alternative cutting-edge techniques and provide an ample study case of Amazonian bird communities to show the tools in practice. The methods in this thesis are available as open source and ready-to-use software capable to work directly on field data collected from acoustic monitoring efforts.Nykyaikaiset/modernit teknologiat/tekniikat eläinyhteiskuntien automattiseen akustiseen monitorointiin mahdollistavat lajitutkimuksen, joka tuottaa ennennäkemättömän määrän tutkimusaineistoa. Tällaisen tutkimusaineiston tulkinta aiheuttaa uusia haasteita (kuten) tarpeen automatisoituun lajitunnistukseen. Automatisoitu audiotallennus yhdistettynä automaattiseen lajitunnistukseen luo uusia mahdollisuuksia biodiversiteetin inventointiin/ luontotyyppien seurantatutkimukseen, mutta ne ovat myös aiheuttaneet monia haasteita menetelmän käyttämiseen todellisissa tilanteissa. Tämä tutkimus kehittää uusia menetelmiä maalla elävien ääntelevien lajien automaattiseen seurantaan bioakustiikan tutkimuksen kentälle. Kehitin ennenkaikkea automatisoituja menetelmiä kahden tyypillisimmän akustisessa ekologiassa käytetyn aineiston; lajiäänitteiden tietokantojen sekä lajiäänitteiden maastoaineiston tallenteiden, luokitteluun. Nämä menetelmät kehittävät olennaisesti koko automatisoidun akustisen tunnistuksen kenttää yhdistäen maastoaineiston automatisoidun keruun automaattisten luokitusmenetelmien avulla tunnistettujen tietojen ekologiseen mallintamiseen. Osoitan menetelmien toimivuuden (käytännössä) erittäin suurten aineistojen avulla vertaillen niitä tämänhetkisiin huipputekniikoihin sekä tarjoan laajan Amazonin lintuyhdyskuntia koskevan tapaustutkimuksen/tutkimusesimerkin osoittaen näin välineiden/menetelmien toimivuuden käytännössä. Tutkimuksessa tuotetut menetelmät ovat saatavilla avoimen lähdekoodin sekä käyttöönotettavan/toimivan ohjelmiston muodossa maastoaineiston käsittelyä varten