    Online signature verification algorithms and development of signature international standards

    The science of biometrics is based on discovering the identities of human beings by investigating their physical and behavioural traits. Of the many different biometric traits, i.e. fingerprint, iris, vascular, etc... the handwritten signature is still one of the most accepted techniques. Advancing progress in identification applications has led to widespread demand for new generation ID documents, such as electronic passports and citizen cards, which contain additional biometric information required for more accurate user recognition. This can be achieved by embedding dynamic signature features within the documentation. However, this would result in two significant drawbacks that must be addressed, these are: Memory Capacity and Computational Load. These problems and the increasing demand for standardized biometric verifications systems have motivated the research work performed in this Thesis. In order to achieve this, an attempt to reduce the information involved in verification processes is performed using feature selection criteria of the signature biometric data. Such reduced information content not only satisfies the memory capacity restrictions but also provides much more efficient use of the verification algorithms. In particular, two novel methods in the signature context, based on Principal Component Analysis and Hellinger Distance, are proposed here. The performance of the optimized features set obtained has been analyzed using two different verification algorithms. By reducing the sample size it has been observed that the error rates are maintained sufficiently low and the results obtained are in agreement with the current state of the art for signature techniques. It will be shown that in some cases that feature selection does not provide an adequate reduction solution, where a different strategy has been analyzed to achieve the aforementioned problems. A direct consequence of the widespread nature of biometric verification has led to demands for standardized protocols to improve interoperability. The work presented throughout this Thesis has considered current ISO/IEC signature standard data formats. It has been observed that the current compact data formats, 19794-7 Compact Format and 19794-11, do not meet the requirements of modern data formats. In particular, 19794-7 Compact Format, although having good compression ratios, has been found to imply an inadmissible loss in information. This problem has been solved by defining a new near-lossless compression data format based on lossless compression algorithms, and proposing different enhanced strategies to store signature data. This new data format achieves the same compression ratio, but without losing any relevant information. In addition, the problems found in the 19794-11CD2 regarding the lack of compression and information loss have been addressed. A new data format structure has been proposed, where the lack of compression is solved by reducing the data stored, avoiding duplicated data and providing a new singular point definition. This new structure has provided improved compression ratios, and, at the same time, carries more information. The two new data format definitions were presented to the ISO/IEC SC37 WG3 experts and accepted as the new third subformat “Compression Format” within the 19794-7 and the new committee draft for the 197974-11 CD3. ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------En la sociedad actual existe la necesidad de verificar la identidad de usuarios de una manera automática y segura, sobre todo teniendo en cuenta las nuevas posibilidades que el comercio electrónico ha originado. Desgraciadamente todas estas nuevas posibilidades electrónicas de acceso a distintos servicios, también han incrementado las probabilidades de actividades delictivas como la usurpación de identidad. La biometría ha demostrado ser una tecnología válida para la verificación de identidades, ya que ofrece un alto nivel de seguridad a la vez que resulta cómoda al usuario. De hecho su uso ya ha sido probado con éxito para tales fines en distintos contextos, siendo uno de los más comunes y conocidos su aplicación en la nueva generación de documentos de identidad electrónicos, tales como el Documento Nacional de Identidad Electrónico (DNIe) así como en los nuevos pasaportes electrónicos. Estas nuevas generaciones de documentos de identidad incorporan técnicas biométricas que permiten a los usuarios la autenticación de su identidad en procesos remotos. Junto con estas ventajas de la tecnología biométrica, la capacidad de almacenamiento y procesado de datos por parte de los nuevos documentos de identidad hace posible la incorporación de la información dinámica que posee la firma manuscrita. Esta información puede ser utilizada para la verificación de la identidad de los usuarios de una manera muy familiar, ya que el uso de la firma manuscrita para la verificación de identidades está muy extendido. No obstante, a la hora de incluir esta información dentro de este tipo de dispositivos, se deben tener en cuenta dos limitaciones significativas. En primer lugar, hay que examinar las necesidades de almacenamiento indispensables para guardar los datos obtenidos de la firma manuscrita capturada así como para el patrón del usuario. En segundo lugar, hay que considerarla baja potencia de cálculo de estos dispositivos a la hora de desarrollar algoritmos de verificación. Del mismo modo, se debe tener en cuenta que los documentos de identidad se diseñan para ser usados en una gran variedad de escenarios, tanto a nivel nacional como internacional. Por esta razón el uso de normas internacionales que garanticen su interoperabilidad se hace un requisito indispensable. Partiendo de lo expuesto anteriormente, la presente Tesis Doctoral se ha centrado en mejorar la viabilidad de sistemas automáticos de verificación de firma dinámica manuscrita en entornos con fuertes limitaciones tanto en capacidad de almacenamiento de datos como en capacidad de computación. A su vez, se ha llevado a cabo un análisis exhaustivo de los actuales formatos de datos definidos en las norma internacional “19794 Biometric data interchange formats” existentes para firma manuscrita dinámica (parte 7 y 11 de esta norma), para contrastar como pueden llegar a afectar dichos formatos al rendimiento de los algoritmos de verificación. Los aspectos anteriormente indicados sobre las necesidades de almacenamiento y de computación han sido abordados a través de técnicas de selección de características probadas en dos implementaciones de algoritmos de verificación de firma basados en Modelado de Mezcla de Gausianas (designado por sus siglas en inglés “GMM”) y Alineamiento Dinámico Temporal (designado por sus siglas en inglés “DTW”). En concreto, las técnicas de selección de características empleadas han sido el Ratio de Fisher (cuyas siglas en inglés son FR), el Análisis de Componentes Principales (cuyas siglas en inglés son PCA), la combinación de ambas y por último, la distancia de Hellinger (cuyas siglas en inglés son HD). La primera de ellas es una técnica muy extendida en la literatura de firma manuscrita, mientras que las otros dos, PCA y HD, no se ha encontrado ninguna constancia de haber sido utilizada anteriormente en entornos de firma manuscrita. Los resultados han desvelado que la técnica PCA genera una selección de características más óptima que la técnica FR, mejorando las tasas de error de los algoritmos utilizados. Además, la combinación de esta técnica (PCA) con la técnica FR ha obtenido mejores resultados que aplicadas de manera individual. Por su parte, HD también ha demostrado su utilidad en el ámbito de la firma manuscrita dinámica, obteniendo mejores resultados que las técnicas expuestas anteriormente sobre todo en el caso del algoritmo DTW en el que el solapamiento de distribuciones de las características entre firmas genuinas y las firmas falsas es bajo. A la vista de estos resultados, con las técnicas de selección de características propuestas se ha logrado cumplir con los objetivos de reducir las necesidades tanto de espacio de almacenamiento como de capacidad computacional, manteniendo tasas de error acordes con el estado del arte. Cabe destacar que para el algoritmo GMM desarrollado se han propuesto dos vectores de características, uno formado por 28 elementos y otro de tan solo 13 elementos para entornos con limitaciones más extremas. A su vez, el algoritmo GMM implementado también ha demostrado ser robusto frente al número de funciones Gausianas que lo forman, obteniendo resultados en línea con el estado del arte para combinaciones de sólo cuatro funciones Gausianas. Estos dos resultados (el bajo número de elementos en el vector de características y el bajo número de funciones Gausianas) conllevan que tanto el modelo de usuario, como las firmas capturadas, requieran un mínimo espacio de almacenamiento. Del mismo modo, hacen que la carga computacional sea mucho menor que la de los algoritmos basados en GMM publicados con anterioridad. Con respecto al algoritmo DTW planteado, se ha propuesto un vector de características formado tan solo por seis elementos, obteniendo de nuevo bajas tasas de error tanto para falsificaciones aleatorias, como, especialmente, para falsificaciones entrenadas. Estos resultados una vez más muestran que las técnicas de selección de características han respondido satisfactoriamente. Pero a pesar de que el número de elementos del vector de características es muy bajo, no se han podido reducir las necesidades ni de espacio, ni de complejidad de cálculo, dado que para el algoritmo DTW todavía se incluye información de la presión. Sin embargo, estos objetivos han sido cubiertos mediante el análisis efectuado en relación con el número de puntos que se requieren para el almacenamiento tanto de las firmas capturas como para el del patrón de usuario. Las pruebas realizadas han puesto de manifiesto que submuestreando las firmas capturadas de manera que estén formadas sólo por 256 puntos, es suficiente para asegurar que los niveles de error obtenidos por los algoritmos se mantengan en niveles dentro del estado del arte de los algoritmos DTW. Incluso, bajando el número de puntos hasta la cifra de 128 se ha visto que aún se consiguen tasas de error aceptables. Además del estudio a nivel algorítmico de la viabilidad de implementación de algoritmos de firma manuscrita dinámica, esta Tesis Doctoral se ha también se ha enfocado en la mejora de las actuales normas internacionales de formato de datos existentes para firma manuscrita dinámica, teniendo por objetivo incrementar sus posibilidades de uso en dispositivos tales como documentos de identidad. Inicialmente, se ha realizado un estudio de la viabilidad del uso de estas normas internacionales (proyectos 19794-7 y 19794-11 del subcomité SC37 dentro de la organización ISO/IEC) en cuanto a tamaño de la muestra examinando varias bases de datos públicas de firma dinámica. De este análisis se ha concluido que el formato compacto definido en el proyecto 19794-7 presenta un ratio de compresión del 56% comparado con el formato completo. Por otro lado, el proyecto 19794-11 que se definía como un formato de compresión de datos para firma manuscrita, presentó ratios de compresión negativos, indicando que en lugar de tener un menor tamaño de muestra, este formato incrementa el tamaño en comparación con las firmas almacenadas siguiendo el formato completo 19794-7. A su vez, se ha mostrado como la compresión de datos, tanto en el formato compacto 19794-7 como en el formato 19794-11, tiene un impacto en el rendimiento de los algoritmos, incrementando sus tasas de error. Esto es debido a la información que se pierde en el proceso de compresión de los datos. Para resolver la perdida de rendimiento de los algoritmos cuando se usa el formato de datos compacto definido dentro del proyecto 19794-7, se han presentado dos nuevos formatos de datos. Estos formatos , denominados formatos de datos comprimidos, se basan en algoritmos de compresión de datos sin pérdida de información. Se ha llevado a cabo la evaluación de distintos algoritmos de estas características, así como distintas opciones de reordenación de los datos de la firma manuscrita para maximizar la compresión obtenida gracias a los algoritmos de compresión. Dentro de los formatos de datos sugeridos, se ha planteado un formato de datos comprimido que presenta los mismos ratios de compresión que el formato compacto 19794-7, pero sin incurrir en ninguna pérdida de datos, por lo que no presenta ningún impacto en las tasas de error de los algoritmos de verificación. Asimismo, también se ha propuesto un formato de datos comprimido con mínima perdida de información, mejorando las tasas de compresión, sin influir de nuevo en el rendimiento de los algoritmos de verificación. Este formato comprimido de datos con reducidas pérdidas tiene además la capacidad de ajustar el nivel de información perdida, lo que resulta una importante característica teniendo en cuenta las espectaculares resoluciones (tanto espaciales como temporales) que los dispositivos de captura presentan en la actualidad. Estas altas resoluciones conllevan un aumento importante en el tamaño de las muestras capturas, que puede ser minimizado con el uso de este formato comprimido con pérdidas. Ambos formatos de datos comprimidos, con y sin perdidas, fueron presentados a la comunidad internacional dentro del subcomité ISO/IEC SC37, proponiendo su inclusión en el proyecto 19794-7. Esta petición fue aceptada por los expertos internacionales de firma manuscrita, convirtiéndose el formato de datos comprimidos en el tercer subformato dentro de esta norma internacional. La publicación de esta norma con la inclusión de las contribuciones mencionadas está planificada para el año 2012. Con respecto al proyecto 19794-11CD2, se analizó el uso de una nueva estructura de datos que solucionara los problemas de la falta de compresión a través de la eliminación de información duplicada, almacenando menos datos y redefiniendo los puntos singulares en los que está basada la segmentación. Además, para aumentar aún más las tasas de compresión obtenidas, diferentes estrategias de eliminación de puntos espurios fueron tratadas. A su vez, para mejorar la calidad de la información almacenada dentro de este formato de datos, se ha estudiado la posibilidad de recrear los datos contenidos en el formato completo partiendo de los datos almacenados en esta parte 19794-11. Mediante estos análisis, se han obtenido tasas de compresión menores que los presentados por el formato compacto 19794-7. Esta nueva definición para el proyecto 19794-11 también se presentó al subcomité SC37, siendo igualmente aceptada por los expertos internacionales en firma manuscrita y adoptada en la nueva revisión del proyecto 19794-11CD3. La publicación de este proyecto como norma internacional se espera para 2013

    Mixing Biometric Data For Generating Joint Identities and Preserving Privacy

    Biometrics is the science of automatically recognizing individuals by utilizing biological traits such as fingerprints, face, iris and voice. A classical biometric system digitizes the human body and uses this digitized identity for human recognition. In this work, we introduce the concept of mixing biometrics. Mixing biometrics refers to the process of generating a new biometric image by fusing images of different fingers, different faces, or different irises. The resultant mixed image can be used directly in the feature extraction and matching stages of an existing biometric system. In this regard, we design and systematically evaluate novel methods for generating mixed images for the fingerprint, iris and face modalities. Further, we extend the concept of mixing to accommodate two distinct modalities of an individual, viz., fingerprint and iris. The utility of mixing biometrics is demonstrated in two different applications. The first application deals with the issue of generating a joint digital identity. A joint identity inherits its uniqueness from two or more individuals and can be used in scenarios such as joint bank accounts or two-man rule systems. The second application deals with the issue of biometric privacy, where the concept of mixing is used for de-identifying or obscuring biometric images and for generating cancelable biometrics. Extensive experimental analysis suggests that the concept of biometric mixing has several benefits and can be easily incorporated into existing biometric systems

    Intensity Based Non-rigid Registration of 3D Whole Mouse Optical and MR Image Volumes

    Novel magnetic resonance (MR) imaging techniques can be validated using accurate co-registration with histology. Whole-animal histological sections allow for simultaneous analysis of multiple tissues, and may also aid in registration by providing contextual information and structural support to tissues which if isolated from the body would be difficult to register. This thesis explores the feasibility of co-registration between whole mouse histology with 3D MR images using an intermediate optical image volume acquired during tissue sectioning. Of the two transformations required for this approach, 3D co-registration of MR and optical images is more challenging to perform due to changes in contrast, slice orientation, and resolution between these modalities. Here, an automated non-rigid registration technique utilizing mutual information is proposed to accurately register 3D whole mouse optical and MR images as a first step towards automated registration of histology. Validation of this technique was accomplished through calculation of post-registration target registration error

    Data driven approaches for investigating molecular heterogeneity of the brain

    It has been proposed that one of the clearest organizing principles for most sensory systems is the existence of parallel subcircuits and processing streams that form orderly and systematic mappings from stimulus space to neurons. Although the spatial heterogeneity of the early olfactory circuitry has long been recognized, we know comparatively little about the circuits that propagate sensory signals downstream. Investigating the potential modularity of the bulb’s intrinsic circuits proves to be a difficult task as termination patterns of converging projections, as with the bulb’s inputs, are not feasibly realized. Thus, if such circuit motifs exist, their detection essentially relies on identifying differential gene expression, or “molecular signatures,” that may demarcate functional subregions. With the arrival of comprehensive (whole genome, cellular resolution) datasets in biology and neuroscience, it is now possible for us to carry out large-scale investigations and make particular use of the densely catalogued, whole genome expression maps of the Allen Brain Atlas to carry out systematic investigations of the molecular topography of the olfactory bulb’s intrinsic circuits. To address the challenges associated with high-throughput and high-dimensional datasets, a deep learning approach will form the backbone of our informatic pipeline. In the proposed work, we test the hypothesis that the bulb’s intrinsic circuits are parceled into distinct, parallel modules that can be defined by genome-wide patterns of expression. In pursuit of this aim, our deep learning framework will facilitate the group-registration of the mitral cell layers of ~ 50,000 in-situ olfactory bulb circuits to test this hypothesis

    Comportement moteur induit visuellement et spontané chez la larve du poisson zèbre

    Behavior is often conceived as resulting from a stimulus-response association. Under this paradigm, understanding the nervous system is reduced to finding the relation between a sensory input and a motor output. Yet, in naturally behaving animals, motor actions influence sensory perceptions just as much as the other way around. Animals are continuously relying on sensory feedback to adjust motor commands. On the other hand, behavior is not only induced by the sensory environment, but can be generated by the brain's rich internal dynamics. My goal is to understand the sensory-motor dialogue by monitoring large brain regions, yet, with a single-neuron resolution. To tackle this question, I have used zebrafish larva to study visually induced and internally driven motor behaviors. Zebrafish larvae have a small and transparent body. These features enable using large-scale optical methods, such as selective plane illumination microscopy (SPIM), to record brain dynamics. In order to study goal-driven navigation in conditions compatible with imaging, I developed a visual virtual reality system for zebrafish larva. The visual feedback can be chosen to be similar to what the animal experiences in natural conditions. Alternatively, alteration of the visual feedback can be used to study how the brain adapts to perturbations. For this purpose, I first generated a library of free-swimming behaviors from which I learned the relationship between the trajectory of the larva and the shape of its tail. I then use this technique to infer the intended displacements of head-fixed larvae. The visual environment was updated accordingly. In the virtual environment, larvae were capable of maintaining the proper speed and orientation in the presence of whole-field motion and produced fine changes in orientation and position required to capture virtual preys. I demonstrate the sensitivity of larvae to visual feedback by updating the visual world only after the discrete swimming episodes. This feedback perturbation induced a decay in the performance of prey capture behavior, suggesting that larva rely on real-time visual feedback during swimming. Behavior can also be induced by the internal dynamics of the brain. In the absence of salient sensory cues, zebrafish larva spontaneously produces stereotypical tail movements, similar to those produced during goal-driven navigation. After having developed a new method to classify tail movements, I analyzed the sequence of spontaneously generated tail movements. The latter switched between period of quasi-rhythmic activity and long episodes of rest. Moreover, consecutive movements were more similar when executed at short time intervals (~10s). In order to study the mechanisms responsible for the spontaneous decisions to move, I coupled SPIM to tail movement analysis. Using dimensionality reduction, I identified clusters of neurons predicting the direction of spontaneous turn movements but not their timings. This Preliminary result suggests that distinct pathways could be responsible for the timing (when) and the selection (what) of spontaneous actions. Together, the results shed light on the role of feedback and internal dynamics in shaping behaviors and open the avenue for investigating complex sensorimotor process in simple systems.Le comportement animal est souvent conçu comme résultant d'une association entre un stimulus et une réponse. Selon cette vision, comprendre le cerveau revient à dénouer les liens entre les entrées sensorielles et les sorties motrices. Toutefois, dans des conditions naturelles, l'influence entre l'action motrice et la perception sensorielle est réciproque. Les animaux utilisent constamment les rétroactions sensorielles causées par leurs actions pour ajuster les commandes motrices. Par ailleurs, le comportement n'est pas seulement une réponse à l'environnement sensoriel mais peut être généré par l'activité endogène du cerveau. Afin de comprendre le dialogue sensorimoteur en observant de larges régions cérébrales à une résolution cellulaire, j'ai étudié les comportements induits et spontanés chez la larve du poisson-zèbre. Les atouts de la larve du poisson zèbre sont sa petit taille et sa transparence. On peut utiliser des méthodes d'imagerie fonctionnelle optique, comme la microscopie par nappe laser, afin d'enregistrer l'activité dans une large portion des neurones. Afin d'étudier le comportement de navigation chez la larve dans des conditions compatibles avec l'observation du cerveau, j'ai développé un système de réalité virtuelle visuelle pour la larve du poisson zèbre. L'environnement visuel est mis à jour en fonction des mouvements du poisson. Cette rétroaction peut être choisie comme étant similaire à la rétroaction visuelle que le poisson expérimente en nage libre. En modifiant la rétroaction visuelle naturelle, on peut étudier la manière dont la larve s'adapte aux perturbations. Dans cette optique, j'ai d'abord généré une librairie de mouvements de nage libre. A partir de celle-ci, j'ai extrait la relation entre la trajectoire de la larve et la cinématique de ses mouvements de queue. Cette relation permet de décoder les intentions de déplacements chez une larve dont la tête est restreinte dans un gel et de mettre à jour un environnement visuel selon ses mouvements de queue. Dans un environnement virtuel, la larve parvient à contrôler son orientation et sa vitesse afin de suivre un mouvement d'ensemble ou bien à générer une séquence de mouvements nécessaires à atteindre une cible mobile. Lorsque la rétroaction visuelle n'est pas mise à jour continuellement mais à la fin de chaque mouvement, on observe que les mouvements sont alors plus longs. Cette faible perturbation réduit significativement le succès des déplacements du poisson vers des cibles virtuelles. Le comportement peut aussi résulter de l'activité endogène du cerveau. En absence de stimulus externe, la larve produit des mouvements stéréotypés similaires à ceux produits lorsqu'elle navigue en réponse à un stimulus. Après avoir établit une nouvelle méthode de classification des mouvements de queue, j'ai analysé la séquence des mouvements générés spontanément. Ces séquences sont composées de successions quasi rythmiques qui alternent avec de longues périodes de repos. Les mouvements consécutifs sont davantage similaires lorsqu'ils s’enchaînent rapidement (~10s). Afin d'étudier les mécanismes neuronaux responsables de la décision d'effectuer un mouvement spontané, j'ai couplé l’imagerie par nappe laser à l'analyse des mouvements. Des résultats préliminaires mettent en évidence des groupes de neurones dont l'activité prédit la direction des mouvements des virages. Deux groupes repartis bilatéralement oscillent en opposition de phase et l'état de cet oscillateur avant un mouvement prédit sa direction. Les neurones responsables de la décision du type de mouvement à effectuer spontanément sont différents des neurones qui contrôlent le timing de leur déclenchement. Ensemble, ces résultats éclairent les processus de rétroaction et de dynamique interne qui façonnent le comportement et ouvre la voie à l'étude de processus sensorimoteurs complexes dans des systèmes simples

    Fast Neuronal Imaging using Objective Coupled Planar Illumination Microscopy

    Complex computations performed by the brain are produced by activities of neuronal populations. There is a large diversity in the functions of each individual neuron, and neuronal activities occur in the time scale of milliseconds. In order to gain a fundamental understanding of the neuronal populations, one has to measure activity of each neuron at high temporal resolution, while investigating enough neurons to encapsulate the neuronal diversity. Traditional neurotechniques such as electrophysiology and optical imaging are constrained by the number of neurons whose activities can be simultaneously measured or the speed of measuring such activities. We have developed a novel light-sheet based technique called Objective Coupled Planar Illumination: OCPI) microscopy which is capable of measuring simultaneous activities of thousands of neurons at high speeds. In this thesis I pursue the following two aims: * Improve OCPI microscopy by enhancing the spatial resolution deeper in tissue. Tissue inhomogeneity and refractive index mismatch at the surface of the tissue lead to optical aberrations. We have compensated for such aberrations by: 1) miniaturizing the OCPI illumination optics, so as to enable more vertical imaging of the tissue,: 2) correcting for the angular defocus caused by the refraction at the immersion fluid/tissue interface, and: 3) applying adaptive optics to correct for higher order optical aberrations. The improvement in the depth at which one can image tissue will enable the measurement of activities of neuronal populations in cortical areas. * Measure the diversity in the expression pattern of VSNs responsive to sulfated steroids. Nodari et al. have identified sulfated steroids as a novel family of ligands which activate vomeronasal sensory neurons: VSNs). Due to the experimental constraints, it has not been possible to obtain a comprehensive understanding of the number, location and functional characteristics of the sulfated steroid responsive VSNs. Applying OCPI microscopy and calcium imaging to simultaneously image thousands of VSNs, we show that the sulfated steroid responsive neurons: 1) have unique ligand preferences,: 2) are predominantly present in the apical regions of the VNO, and: 3) that the choice of expression of a receptor type is not purely stochastic