Search CORE

1 research outputs found

Development of an audio input toolkit for multiple sources

Author: Kosch Thomas
Publication venue
Publication date: 01/01/2013
Field of study

Audio services, like voice over IP or several voice recognition systems, are developing very fast and since they are easy to use nearly everybody is linked to such systems. In this thesis about the processing of multiple audio inputs, an audio toolkit for processing multiple audio inputs has to be developed. Used audio input devices are bluetooth headsets, which can send audio via UDP to the audio toolkit. This audio toolkit is able to process these multiple audio inputs and determines a dominant signal. The dominant signal is a signal from a specific client with an audio input device. The focus of the audio toolkit is to suppress every other signal than the dominant signal. The dominant signal can then be transferred to a voice over IP service, like Skype, or to a voice recognition system, like the Microsoft Speech API. This thesis gives a general overview how audio processing works, the development of algorithms which determine the dominant signal and the development process.Audio Dienste, wie voice over IP oder Spracherekennungsdienste, haben sich in den letzten Jahrzehnten stark weiterentwickelt. Diese rasante Weiterentwicklung ist einer immer einfacheren Benutzung dieser Dienste zuzuschreiben. In dieser Thesis über das verarbeiten mehrerer eingehender Audiosignale, soll ein Audio Toolkit entwickelt werden, dass diese eingehenden Audiosignale verarbeitet. Als Eingabegeräte werden Bluetooth Headsets verwendet, welche die Audiosignale über das UDP Protokoll an ein Audio Toolkit übertragen. Das Audio-Toolkit ermittelt aus allen eingehenden Signalen ein dominantes Signal, welches als einziges hörbar sein soll. Ziel dieser Bachelorarbeit ist die Entwicklung des beschriebenen Audio Toolkits. Das dominante Signal kann an einen voice over IP Dienstleister wie beispielsweise Skype oder an eine Sprachererkennungssoftware, wie beispielsweise die Microsoft Speech API, übertragen werden. Darüber hinaus gibt diese Thesis einen Überblick über die Funktionsweise der Soundverarbeitung, Entwicklung geeigneter Algorithmen und dem Entwicklungsprozess