377 research outputs found

    Impact of microphone array configurations on robust indirect 3D source localization

    Get PDF

    MICROPHONE ARRAY OPTIMIZATION IN IMMERSIVE ENVIRONMENTS

    Get PDF
    The complex relationship between array gain patterns and microphone distributions limits the application of traditional optimization algorithms on irregular arrays, which show enhanced beamforming performance for human speech capture in immersive environments. This work analyzes the relationship between irregular microphone geometries and spatial filtering performance with statistical methods. Novel geometry descriptors are developed to capture the properties of irregular microphone distributions showing their impact on array performance. General guidelines and optimization methods for regular and irregular array design are proposed in immersive (near-field) environments to obtain superior beamforming ability for speech applications. Optimization times are greatly reduced through the objective function rules using performance-based geometric descriptions of microphone distributions that circumvent direct array gain computations over the space of interest. In addition, probabilistic descriptions of acoustic scenes are introduced to incorporate various levels of prior knowledge for the source distribution. To verify the effectiveness of the proposed optimization methods, simulated gain patterns and real SNR results of the optimized arrays are compared to corresponding traditional regular arrays and arrays obtained from direct exhaustive searching methods. Results show large SNR enhancements for the optimized arrays over arbitrary randomly generated arrays and regular arrays, especially at low microphone densities. The rapid convergence and acceptable processing times observed during the experiments establish the feasibility of proposed optimization methods for array geometry design in immersive environments where rapid deployment is required with limited knowledge of the acoustic scene, such as in mobile platforms and audio surveillance applications

    Mathematical modelling ano optimization strategies for acoustic source localization in reverberant environments

    Get PDF
    La presente Tesis se centra en el uso de técnicas modernas de optimización y de procesamiento de audio para la localización precisa y robusta de personas dentro de un entorno reverberante dotado con agrupaciones (arrays) de micrófonos. En esta tesis se han estudiado diversos aspectos de la localización sonora, incluyendo el modelado, la algoritmia, así como el calibrado previo que permite usar los algoritmos de localización incluso cuando la geometría de los sensores (micrófonos) es desconocida a priori. Las técnicas existentes hasta ahora requerían de un número elevado de micrófonos para obtener una alta precisión en la localización. Sin embargo, durante esta tesis se ha desarrollado un nuevo método que permite una mejora de más del 30\% en la precisión de la localización con un número reducido de micrófonos. La reducción en el número de micrófonos es importante ya que se traduce directamente en una disminución drástica del coste y en un aumento de la versatilidad del sistema final. Adicionalmente, se ha realizado un estudio exhaustivo de los fenómenos que afectan al sistema de adquisición y procesado de la señal, con el objetivo de mejorar el modelo propuesto anteriormente. Dicho estudio profundiza en el conocimiento y modelado del filtrado PHAT (ampliamente utilizado en localización acústica) y de los aspectos que lo hacen especialmente adecuado para localización. Fruto del anterior estudio, y en colaboración con investigadores del instituto IDIAP (Suiza), se ha desarrollado un sistema de auto-calibración de las posiciones de los micrófonos a partir del ruido difuso presente en una sala en silencio. Esta aportación relacionada con los métodos previos basados en la coherencia. Sin embargo es capaz de reducir el ruido atendiendo a parámetros físicos previamente conocidos (distancia máxima entre los micrófonos). Gracias a ello se consigue una mejor precisión utilizando un menor tiempo de cómputo. El conocimiento de los efectos del filtro PHAT ha permitido crear un nuevo modelo que permite la representación 'sparse' del típico escenario de localización. Este tipo de representación se ha demostrado ser muy conveniente para localización, permitiendo un enfoque sencillo del caso en el que existen múltiples fuentes simultáneas. La última aportación de esta tesis, es el de la caracterización de las Matrices TDOA (Time difference of arrival -Diferencia de tiempos de llegada, en castellano-). Este tipo de matrices son especialmente útiles en audio pero no están limitadas a él. Además, este estudio transciende a la localización con sonido ya que propone métodos de reducción de ruido de las medias TDOA basados en una representación matricial 'low-rank', siendo útil, además de en localización, en técnicas tales como el beamforming o el autocalibrado

    Acoustic Source Localisation in constrained environments

    Get PDF
    Acoustic Source Localisation (ASL) is a problem with real-world applications across multiple domains, from smart assistants to acoustic detection and tracking. And yet, despite the level of attention in recent years, a technique for rapid and robust ASL remains elusive – not least in the constrained environments in which such techniques are most likely to be deployed. In this work, we seek to address some of these current limitations by presenting improvements to the ASL method for three commonly encountered constraints: the number and configuration of sensors; the limited signal sampling potentially available; and the nature and volume of training data required to accurately estimate Direction of Arrival (DOA) when deploying a particular supervised machine learning technique. In regard to the number and configuration of sensors, we find that accuracy can be maintained at state-of-the-art levels, Steered Response Power (SRP), while reducing computation sixfold, based on direct optimisation of well known ASL formulations. Moreover, we find that the circular microphone configuration is the least desirable as it yields the highest localisation error. In regard to signal sampling, we demonstrate that the computer vision inspired algorithm presented in this work, which extracts selected keypoints from the signal spectrogram, and uses them to select signal samples, outperforms an audio fingerprinting baseline while maintaining a compression ratio of 40:1. In regard to the training data employed in machine learning ASL techniques, we show that the use of music training data yields an improvement of 19% against a noise data baseline while maintaining accuracy using only 25% of the training data, while training with speech as opposed to noise improves DOA estimation by an average of 17%, outperforming the Generalised Cross-Correlation technique by 125% in scenarios in which the test and training acoustic environments are matched.Heriot-Watt University James Watt Scholarship (JSW) in the School of Engineering & Physical Sciences

    Sensor resource management with evolutionary algorithms applied to indoor positioning

    Get PDF
    Premio Extraordinario de Doctorado de la UAH en el año académico 2016-2017Esta tesis pretende contribuir a la mejora de la gestión de recursos en sistemas de sensores aplicados a localización en interiores. Mediante esta gestión pueden abordarse dos temas, la colocación de estos sensores y su uso óptimo una vez colocados, centrándose la tesis en el primero de ellos. Durante la tesis se considera el uso de un sistema de posicionamiento en interiores basado en señales infrarrojas con medida de diferencia de fase. Estas medidas de fase son posteriormente transformadas en distancias, con lo cual nuestro problema es el de trilateración hiperbólica utilizando medidas de diferencia de distancia. Aunque se describe un modelo para el error en diferencia de distancias del enlace infrarrojo, podemos abstraernos de este y simplemente considerar que utilizamos medidas de diferencia de distancia que están normalmente distribuidas con una varianza dada por el modelo usado. De hecho, el trabajo expuesto en esta tesis podría ser usado con cualquier otro sistema del cual obtengamos un modelo de los errores de medida, ya sea empleando además trilateración esférica o angulación. La gran mayoría de trabajos que mejoran la precisión de un sistema de posicionamiento colocando sensores optimizan funciones de coste basadas en el límite inferior de Cramér-Rao, enfoque que adoptamos también en este trabajo. En el capítulo de la tesis dedicado al estado del arte hacemos un repaso de las diferentes propuestas existentes, que concluye explicando qué pretendemos aportar sobre las contribuciones existentes en la literatura científica. En resumen, podemos clasificar las propuestas actuales en tres clases. La primera de ellas trata de determinar una configuración óptima para localizar un objetivo, normalmente utilizando el determinante de la matriz de información de Fisher o la dilución de la precisión. Estos métodos pueden obtener expresiones analíticas que proporcionan una explicación sobre como intervienen las características de los sensores y su colocación en la precisión obtenida. Sin embargo, carecen de aplicabilidad en situaciones reales. El segundo tipo de propuestas emplea métodos numéricos para optimizar la colocación de sensores considerando varios objetivos o un área entera. Los métodos propuestos en esta tesis encajan dentro de esta categoría. Por último, existen métodos que utilizan técnicas de selección de sensores para obtener configuraciones óptimas. Entre las distintas propuestas encontramos varias deficiencias, como la simplificación del modelo de error de la medida para obtener expresiones fácilmente tratables, la consideración de un solo criterio de precisión de la localización, colocación de un número determinado y fijo de sensores, o su despliegue en áreas simples que no presenten problemas de oclusiones. Nuestra primera aportación trata de solucionar la consideración de un único criterio de precisión, que normalmente es el determinante o la traza de la matriz de covarianza o información de la estimación. Cada métrica obtenida de estas matrices tiene un significado práctico distinto, y la consideración de solo una de ellas puede dar lugar a soluciones que presenten deficiencias en las otras, como la obtención de elipses de error muy alargadas. Nuestra propuesta implica el uso de algoritmos evolutivos multifunción que optimicen varias de estas métricas, como el error cuadrático medio en todo el área, la isotropía de la solución, y la máxima desviación que puede aparecer. Esto nos permite tener un conjunto de soluciones dadas en un frente de Pareto, que permitirán al gestor de la red de sensores visualizar las posibles soluciones y elegir entre ellas según las necesidades. También permite obtener colocaciones que mejoren la convergencia de algunos estimadores. La segunda contribución de la tesis se ocupa de la colocación de sensores en zonas más complejas, donde existan obstáculos que provoquen oclusiones a algunos sensores. De esta manera, podemos introducir el problema de intentar cubrir la mayor cantidad de puntos del espacio con el número mínimo de sensores necesario para calcular la posición de un objetivo. Dicho número influirá en el porcentaje de área cubierto y en la precisión obtenida, además de aumentar el coste del sistema. Debido a esto, también será un objetivo a optimizar junto a la cobertura y la incertidumbre de la posición estimada. Para llevar a cabo esta optimización se propone una mejora sobre el algoritmo utilizado en la aportación anterior basada en el uso de subpoblaciones y añadiendo operadores genéticos que modifiquen el número de sensores según la cobertura y condensación en los distintos puntos de la zona a cubrir. Cada uno de los capítulos dedicado a las aportaciones descritas contiene resultados y conclusiones que confirman el buen funcionamiento de los métodos propuestos. Finalmente, la tesis concluye con una lista de propuestas que serán estudiadas en un futuro

    Sistema de posicionamiento óptimo de micrófonos en entornos cerrados basado en optimización multi-objetivo para tareas de localización

    Get PDF
    En este trabajo se ha implementado y evaluado en Matlab un sistema de posicionamiento óptimo de sensores, genéricos o micrófonos, para la localización de objetivos en un entorno cerrado. La ubicación óptima se obtiene mediante un algoritmo genético, mono-objetivo o multi-objetivo, diseñado e implementado en este trabajo, que minimiza el error de localización para sistemas basados en TDOA o SRP, utilizando el modelo acústico de fuente-imagen con y sin obstáculos. Todo el sistema está gobernado con una GUI de Matlab que permite agilizar el uso de las funciones y modificar fácilmente los parámetros. Para la validación del sistema se ha llevado a cabo una experimentación exhaustiva en entornos simulados en Matlab.This work outlines the features and functioning of a specifically created MATLAB-developed system which allows obtaining the optimal positioning of sensors or microphone arrays for the localization of objectives in a closed environment. This optimal positioning is obtained thanks to a mono-objective or multi-objective genetic algorithm that minimizes localization errors for TDOA or SRP-based systems, using the image-source acoustic model with or without obstacles. The whole system is being ruled by a MATLAB graphic interface which allows to accelerate the usage of functions and easily modify all of their parameters. To validate the system a complete experimentation has been carried out in Matlab simulated environments. Keywords: Localization, SRP, optimal positioning of sensors, microphone arrays, multi-objective optimization.Máster Universitario en Ingeniería de Telecomunicación (M125

    Data-Driven Sensor Selection Method Based on Proximal Optimization for High-Dimensional Data With Correlated Measurement Noise

    Full text link
    The present paper proposes a data-driven sensor selection method for a high-dimensional nondynamical system with strongly correlated measurement noise. The proposed method is based on proximal optimization and determines sensor locations by minimizing the trace of the inverse of the Fisher information matrix under a block-sparsity hard constraint. The proposed method can avoid the difficulty of sensor selection with strongly correlated measurement noise, in which the possible sensor locations must be known in advance for calculating the precision matrix for selecting sensor locations. The problem can be efficiently solved by the alternating direction method of multipliers, and the computational complexity of the proposed method is proportional to the number of potential sensor locations when it is used in combination with a low-rank expression of the measurement noise model. The advantage of the proposed method over existing sensor selection methods is demonstrated through experiments using artificial and real datasets
    corecore