3 research outputs found
Automatisierte Extraktion rhythmischer Merkmale zur Anwendung in Music Information Retrieval-Systemen
This thesis describes the automated extraction of features for the
description of the rhythmic content of musical audio signals. These
features are selected with respect to their applicability in music
information retrieval (MIR) systems.
While research on automatic extraction of rhythmic features, for example
tempo and time signature has been in progress for some time, current
algorithms still seem to be a long way from matching human recognition
performance. Among the reasons of the difference between the performances
of a machine listening system and a trained listener are the use of
information on different levels of abstraction and musical knowledge in
human cognition. The approach described here is influenced by these two
principles of cognition.
In order to identify appropriate features and relevant aspects of human
processing of audio signals the necessary knowledge of musicology,
psychoacoustics and cognition science are described.Subsequently, the
description of the state-of-the-art comprises known methods for the
extraction of rhythmic features from musical audio signals. The main part
of the thesis contains a collection of machine-listening methods evaluating
information on different levels of abstraction. A compact representation of
metrical structure of musical audio signals is proposed.The evaluation of
low-level features enables the application of musical knowledge to a
minimal degree only. On the other hand it becomes apparent, that the
processing of high-level features is prone to errors due to the propagation
of the errors in the extraction process of this information. This motivates
the joint evaluation of low- and high-level information depending on their
reliability.
The extraction of rhythmic features from information of automated detected
percussive instruments represents a technical progress compared to the
state-of-the-art. The segmentation of the audio signals in characteristic
and similar regions representing verse or chorus for example is introduced
as a valuable pre-processing step. The achieved significant improvements of
the recognition rate are proved with real-world test data.
The performances of the developed methods are evaluated using a large
corpus of test data and the applicability of the extracted features for the
use in an exemplary MIR-system is examined.Das Thema dieser Dissertation ist die Extraktion von Merkmalen, die
rhythmische Eigenschaften von Audiosignalen beschreiben. Diese Merkmale
sind für die Anwendung in Music Information Retrieval (MIR)-Systemen
ausgewählt.
Obwohl in der Vergangenheit an der Extraktion rhythmischer Merkmale wie zum
Beispiel Tempo und Taktart in großem Umfang gearbeitet wurde, erreichen
aktuelle Verfahren nicht die Erkennungsleistung eines geübten Zuhörers.
Eine der Ursache dafür wird in der Auswertung von Informationen auf
unterschiedlichen Abstraktionsebenen beim Menschen vermutet, eine weitere
bei der Berücksichtigung von \mbox{musikalischem} Vorwissen. Der hier
beschriebene Ansatz orientiert sich an diesen Analyse\-mechanismen.
Zur Identifikation von geeigneten Merkmalen und relevanten Aspekten der
menschlichen Verarbeitung der Schallsignale werden Grundlagen aus
Musiktheorie, Psychoakustik und Kognitionswissenschaft erklärt. Bekannte
Verfahren zur Extraktion rhythmischer Merkmale werden in einer
ausführlichen Darstellung des Standes der Technik anschließend erläutert.
Der Hauptteil der Arbeit enthält eine Zusammenstellung von Verfahren des
maschinellen Hörens, die Informationen auf unterschiedlichen
Abstraktionsebenen auswerten. Eine kompakte Darstellung der metrischen
Struktur wird zur Ermittlung der metrischen Merkmale vorgestellt.Da
einerseits die Auswertung von Low-level-Merkmalen die Anwendung von
musikalischem Vorwissen nur in geringen Maß ermöglicht, und andererseits
die Informationen auf höheren Abstraktionsebenen durch ihre
Fehlerhaftigkeit die Erkennungsleistung in verschiedenen Situationen
einschränken können, werden die Ergebnisse der verschiedenen Verfahren in
Abhängigkeit ihrer Konfidenzmaße zu einem Gesamtergebnis zusammengefasst.
Die Extraktion von rhythmischen Merkmalen aus den Informationen maschinell
detektierter perkussiver Instrumente stellt einen Fortschritt im Vergleich
zu bekannten Arbeiten dar. Eine Segmentierung in charakteristische
Abschnitte des Audiosignals, die zum Beispiel Strophe oder Refrain
repräsentieren, wird als Vorverarbeitungsschritt zur Analyse vorgestellt
und die dadurch erreichte signifikante Verbesserung der
Erkennungs\-leistung nachgewiesen.
Die Leistungsfähigkeit der Verfahren wird anhand eines umfangreichen
Testdatensatzes evaluiert und die Eignung der extrahierten Merkmale in
einem MIR-System untersucht
Wissensbasierte Tagesrhythmenerfassung und -auswertung in ubiquitären Umgebungen
Ein an geregelte Tagesablaeufe angepasstes Leben erhoeht nicht nur das allgemeine Wohlbefinden, sondern wirkt proaktiv auf Gesundheit und Stresslevel. Feste Rhythmen in Aktivitaeten im Tagesverlauf bieten Menschen Sicherheit, Struktur und Orientierung im Alltag. Eine wiederholte oder permanente Missachtung dieser Rhythmen kann zu Schlafproblemen bis hin zu chronischer Depression fuehren. Personen, die ihren festen Rhythmen nachkommen, sind hingegen weniger von diesen Krankheiten betroffen. Um diese Folgen praeventiv zu vermeiden oder zu loesen, kann der eigene Tagesablauf manuell erfasst und ausgewertet werden. Dieser aufwendige Prozess erfolgt bislang nur mit wenig, automatisierter Assistenz und kann durch computergestuetzte Verfahren erleichtert werden. Dabei ist sowohl ein lueckenloser Datensatz an Aktivitaeten, als auch das Vorhandensein von moeglichst heterogener Sensorik von Bedeutung. Durch eine entsprechende automatisierte Erkennung von Tagesrhythmen kann der Tagesablauf assistiert komplettiert werden und die heterogene Sensorik macht Abweichungen in den Routinen des Nutzers deutlich. Diese Informationen werden dann zur aktiven Lebensunterstuetzung genutzt, indem Metriken aus diesen abgeleitet oder Anomalien erkannt werden. Einen moeglichen Loesungsansatz zur automatisierten Assistenz bieten dafuer sogenannte Human Activity Recognizer Algorithms (HARA) aus dem Bereich Ambient Assisted Living (AAL).
Das Ziel dieser HARA ist es, auf Basis sensorischer Werte und individuellen Vergleichsmustern die aktuelle Aktivitaet eines Nutzers zu erkennen. Da diese Systeme haeufig im Bereich pflegebeduerftiger Personen eingesetzt werden, ist die Auswahl der erkannten Aktivitaeten jedoch sehr eingeschraenkt und bezieht sich im Regelfall auf nicht-erweiterbare, innerhaeusliche Aktivitaeten aus der Pflege. Darueber hinaus erfolgt bei diesen Systemen eine Auswertung unter der Voraussetzung, dass sich einzelne Tage in ihrem Ablauf nur wenig unterscheiden, was in anderen Anwendungsdomaenen zu Problemen fuehrt. Um zu einer weitergehenden Erfassung des Tagesablaufs zu kommen, muss neben der Auswertung sensorischer Werte auch weiteres Wissen einbezogen werden. Externe Wissensquellen maschinenauswertbar zu formalisieren, kombinieren und bestmoeglich auszuwerten, stellt eine Herausforderung dieser Arbeit dar, denn heterogene Datenquellen, unvollstaendige oder informationslose Daten erschweren dem HARA die Auswertung. Dazu muessen Methoden des maschinellen Lernens, semantischer Modellierung und Analyse untersucht und weiterentwickelt werden
Modelle zur computergestützten Analyse von Überlieferungen der Mensuralmusik : Empirische Textforschung im Kontext phylogenetischer Verfahren
Da die Analyse von Überlieferungsprozessen auf die Rekonstruktion von Beziehungen zwischen Quellen abzielt, liegt der Fokus vor allem auf den Unterschieden sehr ähnlicher Objekte. Dies erfordert Substitutionsmodelle, die für feine Grade von Differenz und struktureller Varianz optimiert sind. In diesem Buch wird sich der Entwicklung computergestützter Verfahren zur Analyse der Überlieferung mensuraler Musikquellen gewidmet. Teil I legt mit der Schilderung der Grundannahmen der Filiation von Mensuralmusik und zentraler Konzepte phylogenetischer Analyse die methodischen Grundlagen. Teil II umfasst eine Fallstudie begonnen mit den methodischen und gegenstandsspezifischen Anforderungen, über Fragen zur Kodierung und Sequenzbildung, hin zu einem Ansatz, Substitutionsmodelle mithilfe von Surrogatdatenanalyse zu evaluieren