123 research outputs found

    DĂ©tection des mauvaises herbes dans les cultures de bleuets nains

    Get PDF

    Modélisation des métadonnées multi sources et hétérogÚnes pour le filtrage négatif et l'interrogation intelligente de grands volumes de données : application à la vidéosurveillance

    Get PDF
    En raison du dĂ©ploiement massif et progressif des systĂšmes de vidĂ©osurveillance dans les grandes mĂ©tropoles, l'analyse a posteriori des vidĂ©os issues de ces systĂšmes est confrontĂ©e Ă  de nombreux problĂšmes parmi lesquels: (i) l'interopĂ©rabilitĂ©, due aux diffĂ©rents formats de donnĂ©es (vidĂ©os) et aux spĂ©cifications des camĂ©ras propres Ă  chaque systĂšme ; (ii) le grand temps d'analyse liĂ© Ă  l'Ă©norme quantitĂ© de donnĂ©es et mĂ©tadonnĂ©es gĂ©nĂ©rĂ©es ; et (iii) la difficultĂ© Ă  interprĂ©ter les vidĂ©os qui sont parfois Ă  caractĂšre incomplet. Face Ă  ces problĂšmes, la nĂ©cessitĂ© de proposer un format commun d'Ă©change des donnĂ©es et mĂ©tadonnĂ©es de vidĂ©osurveillance, de rendre le filtrage et l'interrogation des contenus vidĂ©o plus efficaces, et de faciliter l'interprĂ©tation des contenus grĂące aux informations exogĂšnes (contextuelles) est une prĂ©occupation incontournable. De ce fait, cette thĂšse se focalise sur la modĂ©lisation des mĂ©tadonnĂ©es multi sources et hĂ©tĂ©rogĂšnes afin de proposer un filtrage nĂ©gatif et une interrogation intelligente des donnĂ©es, applicables aux systĂšmes de vidĂ©osurveillance en particulier et adaptables aux systĂšmes traitant de grands volumes de donnĂ©es en gĂ©nĂ©ral. L'objectif dans le cadre applicatif de cette thĂšse est de fournir aux opĂ©rateurs humains de vidĂ©osurveillance des outils pour les aider Ă  rĂ©duire le grand volume de vidĂ©o Ă  traiter ou Ă  visionner et implicitement le temps de recherche. Nous proposons donc dans un premier temps une mĂ©thode de filtrage dit "nĂ©gatif", qui permet d'Ă©liminer parmi la masse de vidĂ©os disponibles celles dont on sait au prĂ©alable en se basant sur un ensemble de critĂšres, que le traitement n'aboutira Ă  aucun rĂ©sultat. Les critĂšres utilisĂ©s pour l'approche de filtrage nĂ©gatif proposĂ© sont basĂ©s sur une modĂ©lisation des mĂ©tadonnĂ©es dĂ©crivant la qualitĂ© et l'utilisabilitĂ©/utilitĂ© des vidĂ©os. Ensuite, nous proposons un processus d'enrichissement contextuel basĂ© sur les mĂ©tadonnĂ©es issues du contexte, et permettant une interrogation intelligente des vidĂ©os. Le processus d'enrichissement contextuel proposĂ© est soutenu par un modĂšle de mĂ©tadonnĂ©es extensible qui intĂšgre des informations contextuelles de sources variĂ©es, et un mĂ©canisme de requĂȘtage multiniveaux avec une capacitĂ© de raisonnement spatio-temporel robuste aux requĂȘtes floues. Enfin, nous proposons une modĂ©lisation gĂ©nĂ©rique des mĂ©tadonnĂ©es de vidĂ©osurveillance intĂ©grant les mĂ©tadonnĂ©es dĂ©crivant le mouvement et le champ de vue des camĂ©ras, les mĂ©tadonnĂ©es issues des algorithmes d'analyse des contenus, et les mĂ©tadonnĂ©es issues des informations contextuelles, afin de complĂ©ter le dictionnaire des mĂ©tadonnĂ©es de la norme ISO 22311/IEC 79 qui vise Ă  fournir un format commun d'export des donnĂ©es extraites des systĂšmes de vidĂ©osurveillance. Les expĂ©rimentations menĂ©es Ă  partir du framework dĂ©veloppĂ© dans cette thĂšse ont permis de dĂ©montrer la faisabilitĂ© de notre approche dans un cas rĂ©el et de valider nos propositions.Due to the massive and progressive deployment of video surveillance systems in major cities, a posteriori analysis of videos coming from these systems is facing many problems, including the following: (i) interoperability, due to the different data (video) formats and camera specifications associated to each system; (ii) time-consuming nature of analysis due to the huge amount of data and metadata generated; and (iii) difficulty to interpret videos which are sometimes incomplete. To address these issues, the need to propose a common format to exchange video surveillance data and metadata, to make video content filtering and querying more efficient, and to facilitate the interpretation of content using external (contextual) information is an unavoidable concern. Therefore, this thesis focuses on heterogeneous and multi-source metadata modeling in order to propose negative filtering and intelligent data querying, which are applicable to video surveillance systems in particular and adaptable to systems dealing with large volumes of data in general. In the applicative context of this thesis, the goal is to provide human CCTV operators with tools that help them to reduce the large volume of video to be processed or viewed and implicitly reduce search time. We therefore initially propose a so-called "negative" filtering method, which enables the elimination from the mass of available videos those that it is know in advance, based on a set of criteria, that the processing will not lead to any result. The criteria used for the proposed negative filtering approach are based on metadata modeling describing video quality and usability/usefulness. Then, we propose a contextual enrichment process based on metadata from the context, enabling intelligent querying of the videos. The proposed contextual enrichment process is supported by a scalable metadata model that integrates contextual information from a variety of sources, and a multi-level query mechanism with a spatio-temporal reasoning ability that is robust to fuzzy queries. Finally, we propose a generic metadata modeling of video surveillance metadata integrating metadata describing the movement and field of view of cameras, metadata from content analysis algorithms, and metadata from contextual information, in order to complete the metadata dictionary of the ISO 22311/IEC 79 standard, which aims to provide a common format to export data extracted from video surveillance systems. The experiments performed using the framework developed in this thesis showed the reliability of our approach in a real case and enabled the validation of our proposals

    Analyse de détections concomitantes pour l'aide à la navigation interactive dans de grandes collections de vidéos

    Get PDF
    Qu'il s'agisse de la camĂ©ra d'un smartphone ou d'une camĂ©ra de surveillance, les dispositifs d'enregistrement vidĂ©o sont de plus en plus rĂ©pandus et les quantitĂ©s de vidĂ©os disponibles ne cessent de croĂźtre. Cette surabondance de donnĂ©es disponibles est une Ă©pĂ©e Ă  double tranchant : plus les vidĂ©os de la scĂšne dont on dispose sont nombreuses et variĂ©es, plus elles offrent une information riche et complĂšte, mais plus elles nĂ©cessitent de temps pour ĂȘtre traitĂ©es. Dans de nombreuses applications, comme par exemple une enquĂȘte policiĂšre, les premiĂšres heures d’investigation sont dĂ©cisives. Or la visualisation exhaustive de toutes les vidĂ©os par un opĂ©rateur humain est une tĂąche pĂ©nible, peu efficace, longue et coĂ»teuse. Cette thĂšse propose d'explorer plusieurs pistes dans le but d’automatiser la recherche d’information dans des vidĂ©os. Plus prĂ©cisĂ©ment, nous cherchons Ă  identifier parmi une collection de vidĂ©os celles issues de camĂ©ras prĂ©sentant un recouvrement partiel de leurs champs de vue. Pour rĂ©aliser cette tĂąche, nous avons Ă©galement mis en oeuvre une mĂ©thode de navigation interactive entre les vidĂ©os. Ainsi, dans ce contexte, trois contributions principales sont apportĂ©es. Tout d'abord, nous proposons une mĂ©thode permettant de dĂ©terminer quelles vidĂ©os ont leurs champs de vue qui se recouvrent et offrent ainsi diffĂ©rents points de vue d'un mĂȘme endroit. Pour ce faire, nous dĂ©tectons la prĂ©sence d'objets dans les vidĂ©os au cours du temps, les caractĂ©risons par une catĂ©gorie et une apparence et regroupons les vidĂ©os qui prĂ©sentent de façon concomitante des objets de mĂȘme catĂ©gorie aux apparences similaires. Cependant, il arrive que des objets aient des apparences similaires bien qu'ils soient issus de paires de camĂ©ras dont les champs de vue ne se croisent pas, ce qui cause des erreurs dans les groupements de vidĂ©os. Pour y remĂ©dier, nous proposons un mĂ©canisme d'apprentissage actif, oĂč le programme peut solliciter l'opĂ©rateur sur des cas difficiles pour apprendre Ă  trouver les groupements de camĂ©ras qui prĂ©sentent du recouvrement dans leurs champs de vue. Nous enrichissons Ă©galement les critĂšres employĂ©s en considĂ©rant l'arriĂšre-plan en plus des objets apparaissant dans la vidĂ©o. Nous montrons que les groupements de vidĂ©os obtenus par la coopĂ©ration entre l'homme et la machine sont meilleurs que ceux obtenus via notre approche prĂ©cĂ©dente, entiĂšrement automatisĂ©e. Enfin, nous proposons une mĂ©thode de navigation au sein d'un groupe de vidĂ©os observant un mĂȘme endroit. Depuis une vidĂ©o courante, l'approche proposĂ©e permet aux utilisateurs de tracer une trajectoire requĂȘte et les redirige vers une autre vidĂ©o dans laquelle cette trajectoire est plus longue, plus dĂ©taillĂ©e et donc mieux observable. Nous apprenons pour cela des cartes de correspondances entre rĂ©gions de chaque vidĂ©o et les utilisons pour reformuler la trajectoire tracĂ©e par l'utilisateur en son Ă©quivalent dans les autres vues. Afin de valider nos approches, nous identifions plusieurs jeux de donnĂ©es pertinents dans notre contexte. Cependant, le nombre de camĂ©ras dont les champs de vue se recouvrent est gĂ©nĂ©ralement limitĂ©. Nous proposons donc un jeu de donnĂ©es multivues que nous avons annotĂ© et qui contient 25 camĂ©ras disposĂ©es sur un campus universitaire dont 19 prĂ©sentent du recouvrement. Les rĂ©sultats obtenus au travers de nos trois contributions sont encourageants

    Cognition, Affects et Interaction

    No full text
    International audienceCet ouvrage rassemble les travaux d’études et de recherche effectuĂ©s dans le cadre du cours «Cognition, Affects et Interaction » que nous avons animĂ© au 1er semestre 2015-2016. Cette deuxiĂšme Ă©dition de cours poursuit le principe inaugurĂ© en 2014 : aux cours magistraux donnĂ©s sur la thĂ©matique "Cognition, Interaction & Affects" qui donnent les outils mĂ©thodologiques des composantes de l’interaction socio-communicative, nous avons couplĂ© une introduction Ă  la robotique sociale et un apprentissage actif par travail de recherche en binĂŽmes. Le principe de ces travaux d’études et de recherche est d’effectuer une recherche bibliographique et de rĂ©diger un article de synthĂšse sur un aspect de l’interaction homme-robot. Si plusieurs sujets ont Ă©tĂ© proposĂ©s aux Ă©tudiants en dĂ©but d’annĂ©e, certains binĂŽmes ont choisi d’aborder l’interaction avec un angle original qui reflĂšte souvent les trajectoires de formation variĂ©s des Ă©tudiants en sciences cognitives (ingĂ©nierie, sociologie, psychologie, etc). Le rĂ©sultat dĂ©passe nos espĂ©rances : le lecteur trouvera une compilation d’articles argumentĂ©s de maniĂšre solide, rĂ©digĂ©s de maniĂšre claire et prĂ©sentĂ©s avec soin. Ces premiĂšres «publications» reflĂštent les capacitĂ©s singuliĂšres de rĂ©flexion de cette promotion en nette augmentation par rapport Ă  l’annĂ©e prĂ©cĂ©dente. Nous espĂ©rons que cette sĂ©rie d’ouvrages disponibles sous HAL puisse servir de point d’entrĂ©e Ă  des Ă©tudiants ou chercheurs intĂ©ressĂ©s Ă  explorer ce champ de recherches pluri-disciplinaire
    • 

    corecore