4 research outputs found

    An Audio Retrieval Algorithm Based on Audio Shot and Inverted Index

    Full text link

    Recuperación automática de información en documentos de audio mediante una arquitectura distribuida

    Get PDF
    Gran parte de los documentos de origen reciente tienen un formato multimedia y, por su importancia y relevancia, deben ser preservados y puestos a disposición de la ciudadanía en general. El objetivo último de este proyecto es dotar de accesibilidad a grandes archivos compuestos por grabaciones, ya que, hoy por hoy, el acceso a determinados documentos sonoros se convierte en una labor larga y tediosa y, en multitud de ocasiones, el acceso al fragmento específico de la grabación es en la práctica imposible. El reconocimiento perfecto de los archivos de voz es una tarea complicada todavía en desarrollo. Cuantos más módulos de análisis sobre las condiciones del entorno y el hablante tengamos, podremos aplicar un reconocedor más específico que mejorará considerablemente esta labor. Así tendremos disponible un buscador eficiente que permitirá la recuperación de documentos sonoros

    Untersuchungen zur Auswirkung erhöhten Stimmaufwands auf Sprache unter Einbezug des Anwendungsfalls der automatischen Sprechererkennung

    Get PDF
    Das Ziel dieser Arbeit war die Analyse der Auswirkung erhöhten Stimmaufwands auf Sprache und sprachverarbeitende Systeme. Als Beispielszenario wurde die automatische Sprechererkennung bei ungleichem Stimmaufwand in Trainings- und Testdaten ausgewählt. Hierbei wurden zwei Schwerpunkte gesetzt. Zunächst wurden die akustischen Veränderungen, bedingt durch erhöhten Stimmaufwand, analysiert. Dann wurde ein Sprecherverifikationssystem für nicht-übereinstimmenden Stimmaufwand realisiert. Die Untersuchung akustischer Veränderungen bei erhöhtem Stimmaufwand befasste sich mit der statistischen Analyse spektraler Veränderungen bei einer Erhöhung des Stimmaufwands. Es wurden unterschiedliche spektrale Parameter analysiert und miteinander verglichen. Diese Parameter wurden dann zur automatischen Klassifikation des Stimmaufwands genutzt und systematisch evaluiert. Da bekannt war, dass sich sowohl das Spektrum als auch die Grundfrequenz verändern, schloss sich eine Analyse der Zusammenhänge zwischen der Grundfrequenz und den spektralen Parametern an. Zur Realisierung eines Sprecherverifikationssystems für nicht-übereinstimmenden Stimmaufwand wurde zunächst ein Framework zur automatischen Sprechererkennung implementiert. Um die Sprechererkennung bei unterschiedlichem Stimmaufwand zu verbessern wurden verschiedene Standardmerkmale, grundfrequenzbasierte Merkmale und selbst entwickelte Merkmale hinsichtlich des Einflusses erhöhten Stimmaufwands evaluiert und die besten Merkmale sowie Merkmalskombinationen bestimmt. Zur weiteren Verbesserung wurden Verfahren zur Adaption der Testdaten oder der Modelle untersucht. Im Anschluss wurden die besten Ergebnisse aller Tests vergleichend dargestellt. Abschließend wurden die Ergebnisse der Arbeit zusammenfassend präsentiert und mögliche Fortführungen der Arbeit vorgestellt
    corecore