Con el nombre Statistical Matching se identifican un conjunto de técnicas que posibilitan
integrar información obtenida mediante encuestas independientes con unidades muestrales
distintas. El objetivo es obtener un fichero de datos sintético con información plausible para
ítems provenientes de distintas fuentes. Método: El Matching parte de la existencia de variables
comunes entre los ficheros, usualmente, variables sociodemográficas. Este bloque de información
común se emplea para imputar los ítems específicos de las encuestas. Resultados: Explicita-
mos las fases principales del Statistical Matching y las aplicamos a las encuestas PISA 2012
y TALIS 2013 de España. Proporcionamos pautas para una validación de los resultados. En
todas las fases se ha utilizado el software libre R. Conclusiones: La potencialidad de Statistical
Matching es enorme en tanto que posibilita enlazar ficheros de origen distinto. Las técnicas de
Statistical Matching son accesibles gracias al desarrollo de diversos paquetes de R. Su aplicación
en Ciencias Sociales puede ser solución a multitud de problemas metodológicos y contribuir a
un mejor conocimiento de la realidad socialStatistical matching methods are aimed at the integration of information collected through
multiple sources, usually, surveys drawn from some target population. As opposed to record linkage
methods -where we search for identical units-, in statistical matching we search for similar units
in order to find statistical relations across databases. Methods: Statistical matching is feasible
provided that the independent surveys share a common block of variables. A particular solution is
based on imputation methods for missing data: first, the distinct files are concatenated (i.e. rows
and columns are joined together to form a unique file); next, empty cells corresponding to non-
observed values are interpreted as missing data, and they are imputed according to observed data.
Results: The fundamental concepts of statistical matching are shown, and the process is illustrated
with the PISA (2012) and TALIS (2013) educational studies with Spain’s data. Imputations are
carried out using mice package from the free R software. A first validation of the results is perfor-
med. Conclusions: Statistical matching offers high potential benefits for the social sciences since it
enables to relate information from independent information sources. These techniques can now be
applied with relative ease thanks to the development of tools such as R computing environment