12 research outputs found

    MIME: A Gesture-Driven Computer Interface

    Get PDF
    MIME (Mime Is Manual Expression) is a computationally efficient computer vision system for recognizing hand gestures. The system is intended to replace the mouse interface on a standard personal computer to control application in a more intuitive manner. The system is implemented in C code with no hardware-acceleration and tracks hand motion at 30 fps on a standard PC. Using a simple two-dimensional model of the human hand, MIME employs a highly-efficient, single-pass algorithm to segment the hand and extract its model parameters from each frame in the video input. The hand is tracked from one frame to the next using a constant-acceleration Kalman filter. Tracking and feature extraction is remarkably fast and robust even when the hand is placed above difficult backdrops such as a typical cluttered desktop environment. Because of the efficient coding of the gesture tracking, adequate CPU power remains to run standard applications such as web browsers and presentations

    MMX-Accelerated Real-Time Hand Tracking System

    Get PDF
    We describe a system for tracking real-time hand gestures captured by a cheap web camera and a standard Intel Pentium based personal computer with no specialized image processing hardware. To attain the necessary processing speed, the system exploits the Multi-Media Instruction set(MMX) extensions of the Intel Pentium chip family through software including. the Microsoft DirectX SDK and the Intel Image Processing and Open Source Computer Vision (OpenCV) libraries. The system is based on the Camshift algorithm (from OpenCV) and the compound constant acceleration Kalman filter algorithms. Tracking is robust and efficient and can track hand motion at 30 fps

    Low-Cost Real-Time Gesture Recognition

    Get PDF
    A major impediment to developing real-time computer vision systems has been the computational power and level of skill required to process video streams in real-time. This has meant that many researchers have either analysed video streams off-line or used expensive dedicated hardware acceleration techniques. Recent software and hardware developments have greatly eased the development burden of realtime image analysis leading to the development of portable systems using cheap PC hardware and software exploiting the Multimedia Extension (MMX) instruction set of the Intel Pentium chip. This paper describes the implementation of a computationally efficient computer vision system for recognizing hand gestures using efficient coding and MMX-acceleration to achieve real-time performance on low cost hardware

    A parallel implementation of 3D Zernike moment analysis

    Get PDF
    Zernike polynomials are a well known set of functions that find many applications in image or pattern characterization because they allow to construct shape descriptors that are invariant against translations, rotations or scale changes. The concepts behind them can be extended to higher dimension spaces, making them also fit to describe volumetric data. They have been less used than their properties might suggest due to their high computational cost. We present a parallel implementation of 3D Zernike moments analysis, written in C with CUDA extensions, which makes it practical to employ Zernike descriptors in interactive applications, yielding a performance of several frames per second in voxel datasets about 2003 in size. In our contribution, we describe the challenges of implementing 3D Zernike analysis in a general-purpose GPU. These include how to deal with numerical inaccuracies, due to the high precision demands of the algorithm, or how to deal with the high volume of input data so that it does not become a bottleneck for the system

    Projective Curvature and Integral Invariants

    Get PDF
    The original publication is available at www.springerlink.comIn this paper, an extension of all Lie group actions on R2 to coordinates defined by potentials is given. This provides a new solution to the equivalence problems of curves under the projective group and two of its subgroups. The potentials correspond to integrals of higher and higher order producing an infinite number of independent integral invariants. Applications to computer vision are discussed

    MOMENTOS DE LOS LÍMITES GEOMÉTRICOS Y SU APLICACIÓN AL CONTROL DE CALIDAD AUTOMATIZADO EN LA INDUSTRIA

    Get PDF
    In this research the performance of the Chen's Improved (Boundary) Moments is carefully compared to that of the traditional (Massive) Moments. To achieve this investigation, the pattern recognition power of the former is thoroughly assessed against that of the latter. The boundary moments are evaluated by two methods, in the first by edge-tracing, in the second method the edge pixels are considered as though they are met when sweeping the image space. It is concluded that the computation of the Boundary Moments by sweeping the image space associates minimum computational complexity to a high enough object classification efficiency, thus they may be used in lieu of the traditional moments.En esta investigación se lleva a cabo una detallada comparación de la performance de los Momentos Mejorados (de Borde), de C.C. Chen, con los Momentos Masivos tradicionales, para ejecutar este examen, el poder de reconocimiento de objetos de los primeros es cuidadosamente comparado con aquella de los últimos. Los Momentos de Borde son evaluados usando dos métodos, en el primero, mediante Trazado de Bordes, y en el segundo, mediante Barrido de Imagen. Se concluye que el cálculo de los Momentos de Borde mediante Barrido de Imagen, asocia una Complejidad Computacional mínima a una suficientemente alta eficiencia en la clasificación de objetos, pudiendo entonces ser usados en lugar de los Momentos Tradicionales

    Image matching of firearm fingerprints

    Get PDF
    A spent cartridge case exhibits characteristic markings (firearm fingerprint) that can be used to identify the type and possibly make of weapon in which the cartridge was fired. This report details research into the use of discriminant analysis for the purpose of matching spent rim-fire cartridge cases to specific make and model firearms. The discrimination and classification are based on several scalar shape parameters for the two-dimensional silhouette of the firing pin (FP) impression-- shape factor calculated from the second order moment of inertia, G factor calculated from the distance transform, and the P2A factor- as well as the distance between the centre of the cartridge case and the centroid of the FP impression, and the orientation of the principal centroidal axes associated with the FP impression. Classification results for two case studies are detailed: (i) 3 different make/model weapons producing different shaped FP impressions, and (ii) 5 different make/model weapons each producing a rectangular FP impression

    Mètode d'extracció multiparamètrica de característiques de textura orientat a la segmentació d'imatges

    Get PDF
    Tal com es veurà en el següent capítol d'antecedents, existeixen formes molt variades d'afrontar l'anàlisi de textures però cap d'elles està orientada al càlcul en temps real (video rate). Degut a la manca de mètodes que posin tant d'èmfasi en el temps de processat, l'objectiu d'aquesta tesi és definir i desenvolupar un nou mètode d'extracció de característiques de textura que treballi en temps real. Per aconseguir aquesta alta velocitat d'operació, un altre objectiu és presentar el disseny d'una arquitectura específica per implementar l'algorisme de càlcul dels paràmetres de textura definits, així com també l'algorisme de classificació dels paràmetres i la segmentació de la imatge en regions de textura semblant.En el capítol 2 s'expliquen els diversos mètodes més rellevants dins la caracterització de textures. Es veuran els mètodes més importants tant pel que fa als enfocaments estadístics com als estructurals. També en el mateix capítol se situa el nou mètode presentat en aquesta tesi dins els diferents enfocaments principals que existeixen. De la mateixa manera es fa una breu ressenya a la síntesi de textures, una manera d'avaluar quantitativament la caracterització de la textura d'una imatge. Ens centrarem principalment, en el capítol 3, en l'explicació del mètode presentat en aquest treball: s'introduiran els paràmetres de textura proposats, la seva necessitat i definicions. Al ser paràmetres altament perceptius i no seguir cap model matemàtic, en aquest mateix capítol s'utilitza una tècnica estadística anomenada anàlisi discriminant per demostrar que tots els paràmetres introdueixen suficient informació per a la separabilitat de regions de textura i veure que tots ells són necessaris en la discriminació de les textures.Dins el capítol 4 veurem com es tracta la informació subministrada pel sistema d'extracció de característiques per tal de classificar les dades i segmentar la imatge en funció de les seves textures. L'etapa de reconeixement de patrons es durà a terme en dues fases: aprenentatge i treball. També es presenta un estudi comparatiu entre diversos mètodes de classificació de textures i el mètode presentat en aquesta tesi; en ell es veu la bona funcionalitat del mètode en un temps de càlcul realment reduït. S'acaba el capítol amb una anàlisi de la robustesa del mètode introduint imatges amb diferents nivells de soroll aleatori. En el capítol 5 es presentaran els resultats obtinguts mitjançant l'extracció de característiques de textura a partir de diverses aplicacions reals. S'aplica el nostre mètode en aplicacions d'imatges aèries i en entorns agrícoles i sobre situacions que requereixen el processament en temps real com són la segmentació d'imatges de carreteres i una aplicació industrial d'inspecció i control de qualitat en l'estampació de teixits. Al final del capítol fem unes consideracions sobre dos efectes que poden influenciar en l'obtenció correcta dels resultats: zoom i canvis de perspectiva en les imatges de textura.En el capítol 6 es mostrarà l'arquitectura que s'ha dissenyat expressament per al càlcul dels paràmetres de textura en temps real. Dins el capítol es presentarà l'algorisme per a l'assignació de grups de textura i es demostrarà la seva velocitat d'operació a video rate.Finalment, en el capítol 7 es presentaran les conclusions i les línies de treball futures que es deriven d'aquesta tesi, així com els articles que hem publicat en relació a aquest treball i a l'anàlisi de textures. Les referències bibliogràfiques i els apèndixs conclouen el treball

    Concept lattices : a tool for primitives selection ?

    Get PDF
    In this paper, we present the problem of noisy images recognition and in particular the stage of primitives selection in a classification process. This selection stage appears after segmentation and statistical describers extraction on documentary images are realized. We describe precisely the use of decision tree in order to harmonize and compare it with another less studied method based on a concept lattice.Dans ce papier, nous présentons la problématique de la reconnaissance d'images détériorées et plus particulièrement l'étape de sélection de primitives au sein d'un traitement de classification supervisée. Cette étape de sélection a lieu après que la segmentation et l'extraction des descripteurs statistiques sur des images documentaires aient été réalisées. Nous exposons en détail l'utilisation d'un arbre de décision, afin de l'harmoniser puis la comparer avec une approche moins étudiée utilisant un treillis de Galois
    corecore