7 research outputs found

    Sampling and Reconstruction of Signals on Product Graphs

    Full text link
    In this paper, we consider the problem of subsampling and reconstruction of signals that reside on the vertices of a product graph, such as sensor network time series, genomic signals, or product ratings in a social network. Specifically, we leverage the product structure of the underlying domain and sample nodes from the graph factors. The proposed scheme is particularly useful for processing signals on large-scale product graphs. The sampling sets are designed using a low-complexity greedy algorithm and can be proven to be near-optimal. To illustrate the developed theory, numerical experiments based on real datasets are provided for sampling 3D dynamic point clouds and for active learning in recommender systems.Comment: 5 pages, 3 figure

    Greedy Search Algorithms for Unsupervised Variable Selection: A Comparative Study

    Full text link
    Dimensionality reduction is a important step in the development of scalable and interpretable data-driven models, especially when there are a large number of candidate variables. This paper focuses on unsupervised variable selection based dimensionality reduction, and in particular on unsupervised greedy selection methods, which have been proposed by various researchers as computationally tractable approximations to optimal subset selection. These methods are largely distinguished from each other by the selection criterion adopted, which include squared correlation, variance explained, mutual information and frame potential. Motivated by the absence in the literature of a systematic comparison of these different methods, we present a critical evaluation of seven unsupervised greedy variable selection algorithms considering both simulated and real world case studies. We also review the theoretical results that provide performance guarantees and enable efficient implementations for certain classes of greedy selection function, related to the concept of submodularity. Furthermore, we introduce and evaluate for the first time, a lazy implementation of the variance explained based forward selection component analysis (FSCA) algorithm. Our experimental results show that: (1) variance explained and mutual information based selection methods yield smaller approximation errors than frame potential; (2) the lazy FSCA implementation has similar performance to FSCA, while being an order of magnitude faster to compute, making it the algorithm of choice for unsupervised variable selection.Comment: Submitted to Engineering Applications of Artificial Intelligenc

    Sensor resource management with evolutionary algorithms applied to indoor positioning

    Get PDF
    Premio Extraordinario de Doctorado de la UAH en el a帽o acad茅mico 2016-2017Esta tesis pretende contribuir a la mejora de la gesti贸n de recursos en sistemas de sensores aplicados a localizaci贸n en interiores. Mediante esta gesti贸n pueden abordarse dos temas, la colocaci贸n de estos sensores y su uso 贸ptimo una vez colocados, centr谩ndose la tesis en el primero de ellos. Durante la tesis se considera el uso de un sistema de posicionamiento en interiores basado en se帽ales infrarrojas con medida de diferencia de fase. Estas medidas de fase son posteriormente transformadas en distancias, con lo cual nuestro problema es el de trilateraci贸n hiperb贸lica utilizando medidas de diferencia de distancia. Aunque se describe un modelo para el error en diferencia de distancias del enlace infrarrojo, podemos abstraernos de este y simplemente considerar que utilizamos medidas de diferencia de distancia que est谩n normalmente distribuidas con una varianza dada por el modelo usado. De hecho, el trabajo expuesto en esta tesis podr铆a ser usado con cualquier otro sistema del cual obtengamos un modelo de los errores de medida, ya sea empleando adem谩s trilateraci贸n esf茅rica o angulaci贸n. La gran mayor铆a de trabajos que mejoran la precisi贸n de un sistema de posicionamiento colocando sensores optimizan funciones de coste basadas en el l铆mite inferior de Cram茅r-Rao, enfoque que adoptamos tambi茅n en este trabajo. En el cap铆tulo de la tesis dedicado al estado del arte hacemos un repaso de las diferentes propuestas existentes, que concluye explicando qu茅 pretendemos aportar sobre las contribuciones existentes en la literatura cient铆fica. En resumen, podemos clasificar las propuestas actuales en tres clases. La primera de ellas trata de determinar una configuraci贸n 贸ptima para localizar un objetivo, normalmente utilizando el determinante de la matriz de informaci贸n de Fisher o la diluci贸n de la precisi贸n. Estos m茅todos pueden obtener expresiones anal铆ticas que proporcionan una explicaci贸n sobre como intervienen las caracter铆sticas de los sensores y su colocaci贸n en la precisi贸n obtenida. Sin embargo, carecen de aplicabilidad en situaciones reales. El segundo tipo de propuestas emplea m茅todos num茅ricos para optimizar la colocaci贸n de sensores considerando varios objetivos o un 谩rea entera. Los m茅todos propuestos en esta tesis encajan dentro de esta categor铆a. Por 煤ltimo, existen m茅todos que utilizan t茅cnicas de selecci贸n de sensores para obtener configuraciones 贸ptimas. Entre las distintas propuestas encontramos varias deficiencias, como la simplificaci贸n del modelo de error de la medida para obtener expresiones f谩cilmente tratables, la consideraci贸n de un solo criterio de precisi贸n de la localizaci贸n, colocaci贸n de un n煤mero determinado y fijo de sensores, o su despliegue en 谩reas simples que no presenten problemas de oclusiones. Nuestra primera aportaci贸n trata de solucionar la consideraci贸n de un 煤nico criterio de precisi贸n, que normalmente es el determinante o la traza de la matriz de covarianza o informaci贸n de la estimaci贸n. Cada m茅trica obtenida de estas matrices tiene un significado pr谩ctico distinto, y la consideraci贸n de solo una de ellas puede dar lugar a soluciones que presenten deficiencias en las otras, como la obtenci贸n de elipses de error muy alargadas. Nuestra propuesta implica el uso de algoritmos evolutivos multifunci贸n que optimicen varias de estas m茅tricas, como el error cuadr谩tico medio en todo el 谩rea, la isotrop铆a de la soluci贸n, y la m谩xima desviaci贸n que puede aparecer. Esto nos permite tener un conjunto de soluciones dadas en un frente de Pareto, que permitir谩n al gestor de la red de sensores visualizar las posibles soluciones y elegir entre ellas seg煤n las necesidades. Tambi茅n permite obtener colocaciones que mejoren la convergencia de algunos estimadores. La segunda contribuci贸n de la tesis se ocupa de la colocaci贸n de sensores en zonas m谩s complejas, donde existan obst谩culos que provoquen oclusiones a algunos sensores. De esta manera, podemos introducir el problema de intentar cubrir la mayor cantidad de puntos del espacio con el n煤mero m铆nimo de sensores necesario para calcular la posici贸n de un objetivo. Dicho n煤mero influir谩 en el porcentaje de 谩rea cubierto y en la precisi贸n obtenida, adem谩s de aumentar el coste del sistema. Debido a esto, tambi茅n ser谩 un objetivo a optimizar junto a la cobertura y la incertidumbre de la posici贸n estimada. Para llevar a cabo esta optimizaci贸n se propone una mejora sobre el algoritmo utilizado en la aportaci贸n anterior basada en el uso de subpoblaciones y a帽adiendo operadores gen茅ticos que modifiquen el n煤mero de sensores seg煤n la cobertura y condensaci贸n en los distintos puntos de la zona a cubrir. Cada uno de los cap铆tulos dedicado a las aportaciones descritas contiene resultados y conclusiones que confirman el buen funcionamiento de los m茅todos propuestos. Finalmente, la tesis concluye con una lista de propuestas que ser谩n estudiadas en un futuro
    corecore