Machine Learning gestützte Analyse des Auditiven Motokontrollsystems der Sprache bei schwerhörigen Sprechern

Abstract

Hintergrund: In dem von der DFG geförderten Projekt wird nicht nur untersucht wie sich Schwerhörigkeit (55-80db Hörverlust) auf das Einarbeiten gestörten auditiven Feedbacks während der Stimmproduktion auswirkt, sondern auch, ob die Störung dieses Feedbacks sich auf andere Teile des Motorkontrollsystem der Sprache (MdS) auswirkt.Material und Methoden: Wir planen das MdS der Stimme mithilfe des Pitch Shift Reflexes (PSR) zu untersuchen. In diesem Experiment phonieren Teilnehmende (40 schwerhörig, 40 normalhörig) einen Model Laut, während ihnen ihre Stimme über schallisolierende Kopfhörer mit 70dB SPL vorgespielt wird. Das somit erzeugte künstliche Signal überschattet das über Luft- und Knochenleitung übertragene auditive Feedback. Anschließend wird in zufälligen Intervallen das Spektrum des Signals um 200cents angehoben. Die Reaktion, PSR, wurde für Normalhörige bereits, sowohl in Tonhöhe (Shift folgend oder entgegengesetzt), EEG (Mismatch Negativity [MMN]) als auch endoskopischen Hochgeschwindigkeitsaufnahmen (HSV) der Glottis (Glottal Area Waveform [GAW]) experimentell beobachtet. Anschließend werden aus den Aufnahmen signalspezifische Parameter (SP), z.B. Cepstral Peak Prominence für die Stimme, MMN für EEG und GAW für HSV, berechnet. Anschließend werden die SP auf ihren Zusammenhang mit probandenspezifischen Parametern (PP), namentlich Grad, Fortschritt und Hörbereich der Schwerhörigkeit, Alter, Sprachverständlichkeit und differentielle Wahrnehmbarkeitsschwelle, durch lineare Regression, Korrelationsanalyse und Boosted Decision Stumps untersucht. Darüber hinaus werden Encoder-Decodernetzwerke angewandt um die Aufnahmen auf abstrakte Features (AF) zu reduzieren. Diese werden ebenfalls mit den PP korreliert um komplexere Zusammenhänge offen zu legen.Ergebnisse: Wir werden nach Durchführung der Studie den Einfluss jedes PP auf die bekannten und unbekannten Aspekte des MdS, dargestellt durch SP und AF, genau quantifizieren können.Diskussion: Die für das MdS als besonders einflussreich quantifizierten PP bieten somit neue Ziele für Hörversorgung und die SP für Sprachtherapie.Fazit: Die hohe Teilnehmerzahl von 80 Probanden, welche je 20-mal den Pitch Shift in einem Zeitfenster von 3,5s durchlaufen gepaart mit einer temporalen Auflösung von 20kHz wird zu einem umfangreichen Datensatz von hoher wissenschaftlicher Relevanz vor allem in Bezug auf maschinelles Lernen führen

    Similar works

    Full text

    thumbnail-image

    Available Versions