25 research outputs found

    Automatische Identifizierung spontan gesprochener Sprachen mit neuronalen Netzen

    Get PDF

    Analyse und Korrektur von Disfluenzen in gesprochener Sprache

    Get PDF
    Disfluenzen sind ein wesentlicher Bestandteil von spontan gesprochenen Äußerungen. Bei Disfluenzen handelt es sich um Unterbrechungen des normalen Sprechflusses, die durch Fehler, Wortwiederholungen, FĂŒllwörter oder Ă€hnliche andere Wörter entstanden sind. Sie erschweren die Bearbeitung einer Äußerung und mĂŒssen daher korrigiert werden. Eine automatisierte Korrektur dieser Disfluenzen erweist sich jedoch aufgrund des unregelmĂ€ĂŸigen Aufbaus solcher Disfluenzen als schwierig. Deshalb wird in dieser Arbeit die Erkennung und Korrektur von Disfluenzen in natĂŒrlichsprachlichen Äußerungen erarbeitet. Hierzu wird mit Hilfe eines maschinellen Lernverfahrens ein Klassifikator entwickelt, der diese Disfluenzen erkennt und korrigiert. Das maschinelle Lernverfahren basiert auf einem rekurrenten neuronalen Netzwerk mit langen KurzzeitgedĂ€chtnis (engl. long short-term memory - LSTM). Die FunktionalitĂ€t des entworfenen Werkzeugs wird anhand von hĂ€ndischen Transkriptionen sowie einem Testdatensatz des Switchboard-Korpus getestet. Auf diesen beiden DatensĂ€tzen wird entsprechend ein F1-Wert von 0,710 beziehungsweise 0,792 erreicht

    Entwicklung einer Klassifikationsmethode zur akustischen Analyse fortlaufender Sprache unterschiedlicher StimmgĂŒte mittels Neuronaler Netze und deren Anwendung

    Get PDF
    Die akustische Analyse fortlaufender Sprache stellt bei der Beschreibung von Stimmstörungen eine wesentliche Erweiterung zur Analyse gehaltener Phonation dar. Zur Selektion stimmhafter Phoneme aus fortlaufender Sprache ist eine Klassifikationsmethode (vup) entwickelt worden, die eine Segmentierung des Sprachsignals in zusammenhĂ€ngende Bereiche stimmhafter und stimmloser Phonation sowie Pause mittels Neuronaler Netze (Multi-Layer Perceptron) ermöglicht. Auf Basis dieser Klassifikation ist das Göttinger Heiserkeits-Diagramm fĂŒr fortlaufende Sprache (GHDT) in Anlehnung an das Göttinger Heiserkeits-Diagramm fĂŒr gehaltene Phonation (GHD) entwickelt worden

    Ein sprachgestĂŒtztes Trainingssystem zur Evaluierung der NasalitĂ€t

    Full text link
    In der vorliegenden Arbeit wurde ein sprachgestĂŒtztes Trainingssystem zur Evaluierung der NasalitĂ€t aus Mikrophonaufnahmen konzipiert und prototypisch implementiert. Die wichtigste Voraussetzung fĂŒr dieses Vorhaben war die automatische Messung der NasalitĂ€t mit einer hohen GĂŒte. Hierzu wurde die Sprachdatenbank NASAL mit verschiedenen Sprechergruppen, Passagen und NasalitĂ€tsausprĂ€gungen aufgebaut und logopĂ€disch bewertet. Aufbauend auf dieser erfolgten umfangreiche Untersuchungen zur Quantifizierung der NasalitĂ€t. Als ein wesentliches Ergebnis dieser Untersuchungen wird ein automatisches Verfahren zur Quantifizierung der NasalitĂ€t mit einer hohen GĂŒte vorgestellt. Dieses beruht auf den FrequenzbandintensitĂ€ten und Sprachmodellparametern stimmhafter Laute. Um Aussagen ĂŒber die beeinflussenden Faktoren der NasalitĂ€t gewinnen zu können, wurde als Klassifizierungsverfahren die Lineare Diskriminanzanalyse gewĂ€hlt. Die im Trainingssystem zu Zuge kommende Spracherkennungstechnologie basiert auf dem kommerziellen Produkt „ViaVoice“ der Firma IBM. Über das Mikrophon aufgenommene Sprachdaten werden sowohl bzgl. der NasalitĂ€t als auch der Spracherkennungsleistung bewertet. Gerade in der dabei beobachteten sehr niedrigen Spracherkennungsrate zeigte sich die KomplexitĂ€t bei der Verarbeitung sprechgestörter Aussprache. Die Integration der kommerziellen Spracherkennung ist daher zum jetzigen Zeitpunkt nicht empfehlenswert

    Grundlagen der Informationswissenschaft

    Get PDF

    Tropen & Neuronen. \ud Transzendentale, physiologische und sprachliche Korrelate von »Begriffen«\ud

    Get PDF
    Diese Arbeit ist als wiederholte, interdisziplinĂ€re Begriffsbildung ĂŒber den "Begriff" als Wort- und Denkeinheit angelegt. Begriffe werden als grundlegende Einheiten von Sprache und "Begreifen" aufgefasst, Neuronen als grundlegende Einheiten biologischer "Informationsverarbeitung". Tropen als Überbegriff einer bestimmten Gruppe rhetorischer Sprachfiguren (Metapher, Allegorie, Metonymie und die Synekdoche) verbinden Bezeichnung und (davon verschiedene) Bedeutung durch Sprung und Verschiebung. Die Schwierigkeit ist, zu beschreiben, wie Sprache, Denken und Erkennen grundlegend zusammenwirken könnten, denn es gilt entweder die Trennung von Erfahrung, Gedachtem und sprachlichen PhĂ€nomenen (wie Schrift oder Rede) zu ĂŒberbrĂŒcken oder das Gemeinsame zu orten. Diese BrĂŒcke, dieses "Dazwischen", wird hier als "tropisches VerhĂ€ltnis" postuliert. Als das Gemeinsame von Philosophie und Naturwissenschaft wird die Verwendung von Sprache herausgestellt, um Erfahrung und/oder Denken zu ĂŒbertragen. Im Durchlaufen von Kants Argumentation der transzendentalen Deduktion in der Kritik der reinen Vernunft sowie von physiologischen Beschreibung von NervenzellaktivitĂ€ten bei Lernen und GedĂ€chtnis wird diese These kohĂ€rent nachvollzogen. Tropen, Begriffe und Neuronen werden korreliert, die These lĂ€sst sich aber durch das sprachliche Regressproblem nicht beweisen. Die Rolle von Einbildungskraft, Schemabildung, Zeit, subjektiver Sinnesphysiologie, kognitiven KategorisierungsvorgĂ€ngen etc. verdichtet die Verweise auf Sprung, Verschiebung und Polysemie im Gegensatz zu einer monosemischen (naiven) Abbildungstheorie. Tropen und Neuronen werden als Perspektiven der brauchbaren Verwendung von sprachlichen Figuren in Naturwissenschaft und Philosophie vorgestellt, um "Begriffe" in Bewegung zu halten oder zu hypostasieren
    corecore