6 research outputs found

    Vidéosurveillance intelligente pour la détection de chutes chez les personnes ùgées

    Get PDF
    Les pays industrialisĂ©s comme le Canada doivent faire face au vieillissement de leur population. En particulier, la majoritĂ© des personnes ĂągĂ©es, vivant Ă  domicile et souvent seules, font face Ă  des situations Ă  risques telles que des chutes. Dans ce contexte, la vidĂ©osurveillance est une solution innovante qui peut leur permettre de vivre normalement dans un environnement sĂ©curisĂ©. L’idĂ©e serait de placer un rĂ©seau de camĂ©ras dans l’appartement de la personne pour dĂ©tecter automatiquement une chute. En cas de problĂšme, un message pourrait ĂȘtre envoyĂ© suivant l’urgence aux secours ou Ă  la famille via une connexion internet sĂ©curisĂ©e. Pour un systĂšme bas coĂ»t, nous avons limitĂ© le nombre de camĂ©ras Ă  une seule par piĂšce ce qui nous a poussĂ© Ă  explorer les mĂ©thodes monoculaires de dĂ©tection de chutes. Nous avons d’abord explorĂ© le problĂšme d’un point de vue 2D (image) en nous intĂ©ressant aux changements importants de la silhouette de la personne lors d’une chute. Les donnĂ©es d’activitĂ©s normales d’une personne ĂągĂ©e ont Ă©tĂ© modĂ©lisĂ©es par un mĂ©lange de gaussiennes nous permettant de dĂ©tecter tout Ă©vĂ©nement anormal. Notre mĂ©thode a Ă©tĂ© validĂ©e Ă  l’aide d’une vidĂ©othĂšque de chutes simulĂ©es et d’activitĂ©s normales rĂ©alistes. Cependant, une information 3D telle que la localisation de la personne par rapport Ă  son environnement peut ĂȘtre trĂšs intĂ©ressante pour un systĂšme d’analyse de comportement. Bien qu’il soit prĂ©fĂ©rable d’utiliser un systĂšme multi-camĂ©ras pour obtenir une information 3D, nous avons prouvĂ© qu’avec une seule camĂ©ra calibrĂ©e, il Ă©tait possible de localiser une personne dans son environnement grĂące Ă  sa tĂȘte. ConcrĂȘtement, la tĂȘte de la personne, modĂ©lisĂ©e par une ellipsoide, est suivie dans la sĂ©quence d’images Ă  l’aide d’un ïŹltre Ă  particules. La prĂ©cision de la localisation 3D de la tĂȘte a Ă©tĂ© Ă©valuĂ©e avec une bibliothĂšque de sĂ©quence vidĂ©os contenant les vraies localisations 3D obtenues par un systĂšme de capture de mouvement (Motion Capture). Un exemple d’application utilisant la trajectoire 3D de la tĂȘte est proposĂ©e dans le cadre de la dĂ©tection de chutes. En conclusion, un systĂšme de vidĂ©osurveillance pour la dĂ©tection de chutes avec une seule camĂ©ra par piĂšce est parfaitement envisageable. Pour rĂ©duire au maximum les risques de fausses alarmes, une mĂ©thode hybride combinant des informations 2D et 3D pourrait ĂȘtre envisagĂ©e.Developed countries like Canada have to adapt to a growing population of seniors. A majority of seniors reside in private homes and most of them live alone, which can be dangerous in case of a fall, particularly if the person cannot call for help. Video surveillance is a new and promising solution for healthcare systems to ensure the safety of elderly people at home. Concretely, a camera network would be placed in the apartment of the person in order to automatically detect a fall. When a fall is detected, a message would be sent to the emergency center or to the family through a secure Internet connection. For a low cost system, we must limit the number of cameras to only one per room, which leads us to explore monocular methods for fall detection. We ïŹrst studied 2D information (images) by analyzing the shape deformation during a fall. Normal activities of an elderly person were used to train a Gaussian Mixture Model (GMM) to detect any abnormal event. Our method was tested with a realistic video data set of simulated falls and normal activities. However, 3D information like the spatial localization of a person in a room can be very useful for action recognition. Although a multi-camera system is usually preferable to acquire 3D information, we have demonstrated that, with only one calibrated camera, it is possible to localize a person in his/her environment using the person’s head. Concretely, the head, modeled by a 3D ellipsoid, was tracked in the video sequence using particle ïŹlters. The precision of the 3D head localization was evaluated with a video data set containing the real 3D head localizations obtained with a Motion Capture system. An application example using the 3D head trajectory for fall detection is also proposed. In conclusion, we have conïŹrmed that a video surveillance system for fall detection with only one camera per room is feasible. To reduce the risk of false alarms, a hybrid method combining 2D and 3D information could be considered

    Détection automatique de chutes de personnes basée sur des descripteurs spatio-temporels (définition de la méthode, évaluation des performances et implantation temps-réel)

    Get PDF
    Nous proposons une méthode supervisée de détection de chutes de personnes en temps réel, robusteaux changements de point de vue et d environnement. La premiÚre partie consiste à rendredisponible en ligne une base de vidéos DSFD enregistrées dans quatre lieux différents et qui comporteun grand nombre d annotations manuelles propices aux comparaisons de méthodes. Nousavons aussi défini une métrique d évaluation qui permet d évaluer la méthode en s adaptant à la naturedu flux vidéo et la durée d une chute, et en tenant compte des contraintes temps réel. Dans unsecond temps, nous avons procédé à la construction et l évaluation des descripteurs spatio-temporelsSTHF, calculés à partir des attributs géométriques de la forme en mouvement dans la scÚne ainsique leurs transformations, pour définir le descripteur optimisé de chute aprÚs une méthode de sélectiond attributs. La robustesse aux changements d environnement a été évaluée en utilisant les SVMet le Boosting. On parvient à améliorer les performances par la mise à jour de l apprentissage parl intégration des vidéos sans chutes enregistrées dans l environnement définitif. Enfin, nous avonsréalisé, une implantation de ce détecteur sur un systÚme embarqué assimilable à une caméra intelligentebasée sur un composant SoC de type Zynq. Une démarche de type Adéquation AlgorithmeArchitecture a permis d obtenir un bon compromis performance de classification/temps de traitementWe propose a supervised approach to detect falls in home environment adapted to location andpoint of view changes. First, we maid publicly available a realistic dataset, acquired in four differentlocations, containing a large number of manual annotation suitable for methods comparison. We alsodefined a new metric, adapted to real-time tasks, allowing to evaluate fall detection performance ina continuous video stream. Then, we build the initial spatio-temporal descriptor named STHF usingseveral combinations of transformations of geometrical features and an automatically optimised setof spatio-temporal descriptors thanks to an automatic feature selection step. We propose a realisticand pragmatic protocol which enables performance to be improved by updating the training in thecurrent location with normal activities records. Finally, we implemented the fall detection in Zynqbasedhardware platform similar to smart camera. An Algorithm-Architecture Adequacy step allowsa good trade-off between performance of classification and processing timeDIJON-BU Doc.électronique (212319901) / SudocSudocFranceF

    Implementing a multi-model estimation method

    Get PDF
    This work is realized within the scope of a general attempt to understand parametric adaptation, regarding visual perception. The key idea is to analyze how we may use multi-model parametric estimation as a 1st step towards categorization. More generally, the goal is to formalize how the notion of ``objects'' or ``events'' in an application may be reduced to a choice in a hierarchy of parametric models used to estimate the underlying data categorization. These mechanisms are to be linked with what occurs in the cerebral cortex where object recognition corresponds to a parametric neuronal estimation (see for instanced Page 2000 for a discussion and Freedman et al 2001 for an example regarding the primate visual cortex). We thus hope to bring here an algorithmic element in relation with the ``grand-ma'' neuron modelization. We thus revisit the problem of parameter estimation in computer vision, presented here as a simple optimization problem, considering (i) non-linear implicit measurement equations and parameter constraints, plus (ii) robust estimation in the presence of outliers and (iii) multi-model comparisons. Here, (1) a projection algorithm based on generalizations of square-root decompositions allows an efficient and numerically stable local resolution of a set of non-linear equations. On the other hand, (2) a robust estimation module of a hierarchy of non-linear models has been designed and validated. A step ahead, the software architecture of the estimation module is discussed with the goal of being integrated in reactive software environments or within applications with time constraints

    Implementing a multi-model estimation method

    Get PDF
    This work is realized within the scope of a general attempt to understand parametric adaptation, regarding visual perception. The key idea is to analyze how we may use multi-model parametric estimation as a 1st step towards categorization. More generally, the goal is to formalize how the notion of ``objects'' or ``events'' in an application may be reduced to a choice in a hierarchy of parametric models used to estimate the underlying data categorization. These mechanisms are to be linked with what occurs in the cerebral cortex where object recognition corresponds to a parametric neuronal estimation (see for instanced Page 2000 for a discussion and Freedman et al 2001 for an example regarding the primate visual cortex). We thus hope to bring here an algorithmic element in relation with the ``grand-ma'' neuron modelization. We thus revisit the problem of parameter estimation in computer vision, presented here as a simple optimization problem, considering (i) non-linear implicit measurement equations and parameter constraints, plus (ii) robust estimation in the presence of outliers and (iii) multi-model comparisons. Here, (1) a projection algorithm based on generalizations of square-root decompositions allows an efficient and numerically stable local resolution of a set of non-linear equations. On the other hand, (2) a robust estimation module of a hierarchy of non-linear models has been designed and validated. A step ahead, the software architecture of the estimation module is discussed with the goal of being integrated in reactive software environments or within applications with time constraints

    Analyse adaptative du mouvement dans des séquences monoculaires non calibrées

    No full text
    Part of the robotic vision framework, this thesis focuses on uncalibrated monocular video sequence analysis, taking singular physical cases into account (camera models, internal camera parameter evolution, object displacements, scene structure) that leads to specific equations. Singularities may allow us to retrieve more movement or structure elements than general equations. Moreover, numerical precision is improved as the number of parameters decreases. Thus, the detection and the proper management of geometric and kinematic properties of those singular cases are fundamental. The complete study of all singular cases in a pair of images, or a video sequence, is computationally intractable and requires an appropriately adapted algorithm. The implementation of the theoretical study is based on the ArgĂšs robotic system. The system is able to determine the specific movement from a pair of images and computes the related parameters

    Les piliers perceptuels du cinĂ©ma d’animation

    Get PDF
    Toute discipline devrait reposer sur des bases thĂ©oriques solides ; mais ce n’est pas nĂ©cessairement le cas des Ă©tudes en animation. Au mieux, la pratique est encadrĂ©e par douze « principes » d’animation codifiĂ©s dans The Illusion of Life (1985) par deux animateurs de Disney, Ollie Johnson et Frank Thomas. Parmi ces principes, certains s’appliquent au cinĂ©ma en gĂ©nĂ©ral ou sont techniques ; alors que d’autres visent l’essentiel artistique de l’animation : comment produire des mouvements fluides, expressifs et crĂ©dibles. Les principes sont utilisĂ©s parce qu’ils fonctionnent ; mais personne du domaine n’a tentĂ© de dĂ©terminer les mĂ©canismes perceptifs qui expliqueraient pourquoi ils fonctionnent. Pire, la seule « thĂ©orie » gĂ©nĂ©ralement acceptĂ©e par le milieu prĂ©tend toujours que la « persistance rĂ©tinienne » explique la perception de mouvement au cinĂ©ma; et cette thĂ©orie a Ă©tĂ© dĂ©montrĂ©e fausse, il y a plus de quarante ans. Le premier objectif de cette thĂšse est d’identifier et de dĂ©crire les phĂ©nomĂšnes perceptifs sur lesquels l’art de l’animation repose ; et, deuxiĂšmement, de structurer ces connaissances avec de nouveaux concepts qui seront utiles sur le plan pratique, thĂ©orique et pĂ©dagogique. Cette thĂšse se veut transdisciplinaire et mobilise un ensemble important de connaissances hĂ©tĂ©roclites, traitantĂ  la fois de la vision et du cinĂ©ma. Le premier chapitre donne un aperçu des grandes thĂ©ories psychologiques et cinĂ©matographiques auxquelles nous nous rĂ©fĂ©rerons. Ensuite, les concepts psychophysiques et anatomiques Ă©lĂ©mentaires de la vision seront dĂ©crits au chapitre 2. Le chapitre 3 vise Ă  dĂ©mystifier la « thĂ©orie » de la persistance visuelle. Nous rappelons que l’Ɠil et la rĂ©tine se bornent Ă  transmettre une suite d’images au cortex qui utilise une sĂ©rie de procĂ©dĂ©s pour percevoir le mouvement. Au chapitre 4, nous Ă©tudierons deux types de mouvements animĂ©s (mouvement apparent de longue portĂ©e et de courte portĂ©e) et prĂ©senterons les axiomes qui les gouvernent. Le chapitre 5 amorce la deuxiĂšme partie de la thĂšse oĂč nous faisons le lien entre les mĂ©canismes de la vision et les principes d’animation de Disney. Nous prĂ©sentons un modĂšle de notre invention qui distingue une hiĂ©rarchie de cinq paliers perceptuels en animation : 1) le mouvement apparent (dĂ©crit prĂ©cĂ©demment) ; 2) le mouvement inanimé ; 3) le mouvement animé ; 4) le mouvement Ă©mouvant (c’est-Ă -dire les Ă©motions et performances) ; et 5) le monde (Umwelt) animĂ©. Ensuite, nous examinons quelques autres « principes » qui visent Ă  maximiser la qualitĂ© visuelle d’une animation, en particulier : la cadence, le tempo, et le principe de l’étirement et de la compression. Poursuivant dans cette voie, le chapitre 6 explore la question : « Ă  quel degrĂ© une animation doit-elle ĂȘtre rĂ©aliste pour fonctionner ? ». D’abord, nous explorerons le rĂŽle de l’exagĂ©ration (principe no 10), typique des cartoons ; puis les diffĂ©rences fondamentales entre un mouvement « animĂ© » effectuĂ© par une entitĂ© vivante, et les mouvements passifs associĂ©s aux objets « inanimĂ©s ». Il se trouve qu’une expĂ©rience positive repose sur une harmonisation perceptive des diffĂ©rents Ă©lĂ©ments d’un film en portant une attention particuliĂšre Ă  l’apparence des yeux des personnages, car des divergences de style peuvent provoquer le phĂ©nomĂšne de la « vallĂ©e de l’étrangetĂ© ». Enfin, au dernier chapitre, nous proposons quatre nouveaux concepts pratiques pour guider les animateurs Ă  crĂ©er des animations et des univers expressifs et convaincants. Ces derniers sont : 1) la molette de l’exagĂ©ration, 2) la pyramide de l’exagĂ©ration, 3) la cape de la crĂ©dibilitĂ© et 4) l’Umwelt animĂ©. Nous terminons la thĂšse en suggĂ©rant qu’il n’est plus suffisant pour l’animation de suivre des principes pratiques sans vraiment les comprendre. Il est grand temps que l’animation, Ă  la fois comme art et comme champ d’études, s’intĂ©resse aux principes et illusions qui l’animent
    corecore