2 research outputs found

    Steuerung sprechernormalisierender Abbildungen durch künstliche neuronale Netzwerke

    Get PDF
    Im Sinne dieser Arbeit bedeutet Sprechernormalisierung eine Vorverarbeitung bzw. Filterung der aufbereiteten Eingangssignale eines automatischen Spracherkennungssystems mit dem Ziel, die Variation in den Signalen analoger Äußerungen verschiedener Sprecher zu reduzieren. Dies bewirkt eine Verminderung von Mehrdeutigkeit und dadurch eine Verbesserung der Erkennungsleistung durch den anschließenden Klassifikator.In dieser Arbeit werden Normalisierungen durch ein auf einer Hauptkomponentenanalyse der Barkspektrogramme basierendes Verfahren und durch die Abbildungen der Spektrogramme vermittels ein- und mehrschichtiger Perzeptrone untersucht. Besondere Aufmerksamkeit erfährt hierbei die Interpolierbarkeit von Nachbarschaftsbeziehungen zwischen verschiedenen Sprechern. Hierbei wird speziell darauf eingegangen, wie diese Interpolation unter Verwendung weiterer Perzeptrone ebenfalls automatisch erreicht werden kann. Die hierfür notwendige Information wird wiederum durch Barkspektrogramme sowie durch - ebenfalls aus dem Sprachsignal ermittelte - artikulatorische Parameter bereitgestellt
    corecore