52 research outputs found
Deterministic Annealing and Nonlinear Assignment
For combinatorial optimization problems that can be formulated as Ising or
Potts spin systems, the Mean Field (MF) approximation yields a versatile and
simple ANN heuristic, Deterministic Annealing. For assignment problems the
situation is more complex -- the natural analog of the MF approximation lacks
the simplicity present in the Potts and Ising cases. In this article the
difficulties associated with this issue are investigated, and the options for
solving them discussed. Improvements to existing Potts-based MF-inspired
heuristics are suggested, and the possibilities for defining a proper
variational approach are scrutinized.Comment: 15 pages, 3 figure
Adaptive Softassign via Hadamard-Equipped Sinkhorn
Softassign is a crucial step in several popular algorithms for graph matching
or other learning targets. Such softassign-based algorithms perform very well
for small graph matching tasks. However, the performance of such algorithms is
sensitive to a parameter in the softassign in large-scale problems, especially
when handling noised data. Turning the parameter is difficult and almost done
empirically. This paper constructs an adaptive softassign method by delicately
taking advantage of Hadamard operations in Sinkhorn. Compared with the previous
state-of-the-art algorithms such as the scalable Gromov-Wasserstein Learning
(S-GWL), the resulting algorithm enjoys both a higher accuracy and a
significant improvement in efficiency for large graph matching problems. In
particular, on the protein network matching benchmark problems (1004 nodes),
our algorithm can improve the accuracy from by the S-GWL to ,
at the same time, it can achieve 3X+ speedup in efficiency
amsrpm: Robust Point Matching for Retention Time Aligment of LC/MS Data with R
Proteomics is the study of the abundance, function and dynamics of all proteins present in a living organism, and mass spectrometry (MS) has become its most important tool due to its unmatched sensitivity, resolution and potential for high-throughput experimentation. A frequently used variant of mass spectrometry is coupled with liquid chromatography (LC) and is denoted as "LC/MS". It produces two-dimensional raw data, where significant distortions along one of the dimensions can occur between different runs on the same instrument, and between instruments. A compensation of these distortions is required to allow for comparisons between and inference based on different experiments. This article introduces the amsrpm software package. It implements a variant of the Robust Point Matching (RPM) algorithm that is tailored for the alignment of LC and LC/MS experiments. Problem-specific enhancements include a specialized dissimilarity measure, and means to enforce smoothness and monotonicity of the estimated transformation function. The algorithm does not rely on pre-specified landmarks, it is insensitive towards outliers and capable of modeling nonlinear distortions. Its usefulness is demonstrated using both simulated and experimental data. The software is available as an open source package for the statistical programming language R.
Graph matching using position coordinates and local features for image analysis
Encontrar las correspondencias entre dos imágenes es un problema crucial en el campo de la visión por ordenador i el reconocimiento de patrones. Es relevante para un amplio rango de propósitos des de aplicaciones de reconocimiento de objetos en las áreas de biometría, análisis de documentos i análisis de formas hasta aplicaciones relacionadas con la geometría desde múltiples puntos de vista tales cómo la recuperación de la pose, estructura desde el movimiento y localización y mapeo.
La mayoría de las técnicas existentes enfocan este problema o bien usando características locales en la imagen o bien usando métodos de registro de conjuntos de puntos (o bien una mezcla de ambos). En las primeras, un conjunto disperso de características es primeramente extraído de las imágenes y luego caracterizado en la forma de vectores descriptores usando evidencias locales de la imagen. Las características son asociadas según la similitud entre sus descriptores. En las segundas, los conjuntos de características son considerados cómo conjuntos de puntos los cuales son asociados usando técnicas de optimización no lineal. Estos son procedimientos iterativos que estiman los parámetros de correspondencia y de alineamiento en pasos alternados.
Los grafos son representaciones que contemplan relaciones binarias entre las características. Tener en cuenta relaciones binarias al problema de la correspondencia a menudo lleva al llamado problema del emparejamiento de grafos. Existe cierta cantidad de métodos en la literatura destinados a encontrar soluciones aproximadas a diferentes instancias del problema de emparejamiento de grafos, que en la mayoría de casos es del tipo "NP-hard".
El cuerpo de trabajo principal de esta tesis está dedicado a formular ambos problemas de asociación de características de imagen y registro de conjunto de puntos como instancias del problema de emparejamiento de grafos. En todos los casos proponemos algoritmos aproximados para solucionar estos problemas y nos comparamos con un número de métodos existentes pertenecientes a diferentes áreas como eliminadores de "outliers", métodos de registro de conjuntos de puntos y otros métodos de emparejamiento de grafos.
Los experimentos muestran que en la mayoría de casos los métodos propuestos superan al resto. En ocasiones los métodos propuestos o bien comparten el mejor rendimiento con algún método competidor o bien obtienen resultados ligeramente peores. En estos casos, los métodos propuestos normalmente presentan tiempos computacionales inferiores.Trobar les correspondències entre dues imatges és un problema crucial en el camp de la visió per ordinador i el reconeixement de patrons. És rellevant per un ampli ventall de propòsits des d’aplicacions de reconeixement d’objectes en les àrees de biometria, anàlisi de documents i anàlisi de formes fins aplicacions relacionades amb geometria des de múltiples punts de vista tals com recuperació de pose, estructura des del moviment i localització i mapeig.
La majoria de les tècniques existents enfoquen aquest problema o bé usant característiques locals a la imatge o bé usant mètodes de registre de conjunts de punts (o bé una mescla d’ambdós). En les primeres, un conjunt dispers de característiques és primerament extret de les imatges i després caracteritzat en la forma de vectors descriptors usant evidències locals de la imatge. Les característiques son associades segons la similitud entre els seus descriptors. En les segones, els conjunts de característiques son considerats com conjunts de punts els quals son associats usant tècniques d’optimització no lineal. Aquests son procediments iteratius que estimen els paràmetres de correspondència i d’alineament en passos alternats.
Els grafs son representacions que contemplen relacions binaries entre les característiques. Tenir en compte relacions binàries al problema de la correspondència sovint porta a l’anomenat problema de l’emparellament de grafs. Existeix certa quantitat de mètodes a la literatura destinats a trobar solucions aproximades a diferents instàncies del problema d’emparellament de grafs, el qual en la majoria de casos és del tipus “NP-hard”.
Una part del nostre treball està dedicat a investigar els beneficis de les mesures de ``bins'' creuats per a la comparació de característiques locals de les imatges.
La resta està dedicat a formular ambdós problemes d’associació de característiques d’imatge i registre de conjunt de punts com a instàncies del problema d’emparellament de grafs. En tots els casos proposem algoritmes aproximats per solucionar aquests problemes i ens comparem amb un nombre de mètodes existents pertanyents a diferents àrees com eliminadors d’“outliers”, mètodes de registre de conjunts de punts i altres mètodes d’emparellament de grafs.
Els experiments mostren que en la majoria de casos els mètodes proposats superen a la resta. En ocasions els mètodes proposats o bé comparteixen el millor rendiment amb algun mètode competidor o bé obtenen resultats lleugerament pitjors. En aquests casos, els mètodes proposats normalment presenten temps computacionals inferiors
Gromov-Wasserstein Averaging of Kernel and Distance Matrices
International audienceThis paper presents a new technique for computing the barycenter of a set of distance or kernel matrices. These matrices, which define the interrelationships between points sampled from individual domains, are not required to have the same size or to be in row-by-row correspondence. We compare these matrices using the softassign criterion , which measures the minimum distortion induced by a probabilistic map from the rows of one similarity matrix to the rows of another; this criterion amounts to a regularized version of the Gromov-Wasserstein (GW) distance between metric-measure spaces. The barycenter is then defined as a Fréchet mean of the input matrices with respect to this criterion, minimizing a weighted sum of softassign values. We provide a fast iterative algorithm for the resulting noncon-vex optimization problem, built upon state-of-the-art tools for regularized optimal transportation. We demonstrate its application to the computation of shape barycenters and to the prediction of energy levels from molecular configurations in quantum chemistry
The Unbalanced Gromov Wasserstein Distance: Conic Formulation and Relaxation
Comparing metric measure spaces (i.e. a metric space endowed with
aprobability distribution) is at the heart of many machine learning problems.
The most popular distance between such metric measure spaces is
theGromov-Wasserstein (GW) distance, which is the solution of a quadratic
assignment problem. The GW distance is however limited to the comparison of
metric measure spaces endowed with a probability distribution.To alleviate this
issue, we introduce two Unbalanced Gromov-Wasserstein formulations: a distance
and a more tractable upper-bounding relaxation.They both allow the comparison
of metric spaces equipped with arbitrary positive measures up to isometries.
The first formulation is a positive and definite divergence based on a
relaxation of the mass conservation constraint using a novel type of
quadratically-homogeneous divergence. This divergence works hand in hand with
the entropic regularization approach which is popular to solve large scale
optimal transport problems. We show that the underlying non-convex optimization
problem can be efficiently tackled using a highly parallelizable and
GPU-friendly iterative scheme. The second formulation is a distance between
mm-spaces up to isometries based on a conic lifting. Lastly, we provide
numerical experiments onsynthetic examples and domain adaptation data with a
Positive-Unlabeled learning task to highlight the salient features of the
unbalanced divergence and its potential applications in ML
- …