3 research outputs found
Improving content based image retrieval by identifying least and most correlated visual words
In this paper, we propose a model for direct incorporation of im- age content into a (short-term) user profile based on correlations between visual words and adaptation of the similarity measure. The relationships between visual words at different contextual levels are explored. We introduce and compare var- ious notions of correlation, which in general we will refer to as image-level and proximity-based. The information about the most and the least correlated visual words can be exploited in order to adapt the similarity measure. The evaluation, preceding an experiment involving real users (future work), is performed within the Pseudo Relevance Feedback framework. We test our new method on three large data collections, namely MIRFlickr, ImageCLEF, and a collection from British National Geological Survey (BGS). The proposed model is computation- ally cheap and scalable to large image collections
Computer vision models in surveillance robotics
2009/2010In questa Tesi, abbiamo sviluppato algoritmi che usano lâinformazione visiva per eseguire, in tempo reale, individuazione, riconoscimento e classificazione di oggetti in movimento, indipendentemente dalle condizioni ambientali e con lâaccurattezza migliore.
A tal fine, abbiamo sviluppato diversi concetti di visione artificial, cioè l'identificazione degli oggetti di interesse in tutta la scena visiva (monoculare o stereo), e la loro classificazione.
Nel corso della ricerca, sono stati provati diversi approcci, inclusa lâindividuazione di possibili candidati tramite la segmentazione di immagini con classificatori deboli e centroidi, algoritmi per la segmentazione di immagini rafforzate tramite informazioni stereo e riduzione del rumore, combinazione di popolari caratteristiche quali quelle invarianti a fattori di scala (SIFT) combinate con informazioni di distanza.
Abbiamo sviluppato due grandi categorie di soluzioni associate al tipo di sistema usato. Con camera mobile, abbiamo favorito lâindividuazione di oggetti conosciuti tramite scansione dellâimmagine; con camera fissa abbiamo anche utilizzato algoritmi per lâindividuazione degli oggetti in primo piano ed in movimento (foreground detection).
Nel caso di âforeground detectionâ, il tasso di individuazione e classificazione aumenta se la qualitaâ degli oggetti estratti eâ alta. Noi proponiamo metodi per ridurre gli effetti dellâombra, illuminazione e movimenti ripetitivi prodotti dagli oggetti in movimento.
Un aspetto importante studiato eâ la possibilitaâ di usare algoritmi per lâindividuazione di oggetti in movimento tramite camera mobile.
Soluzioni efficienti stanno diventando sempre piuâ complesse, ma anche gli strumenti di calcolo per elaborare gli algoritmi sono piuâ potenti e negli anni recenti, le architetture delle schede video (GPU) offrono un grande potenziale. Abbiamo proposto una soluzione per architettura GPU di una gestione delle immagini di sfondo, al fine di aumentare le prestazioni di individuazione.
In questa Tesi abbiamo studiato lâindividuazione ed inseguimento di persone for applicazioni come la prevenzione di situazione di rischio (attraversamento delle strade), e conteggio per lâanalisi del traffico. Noi abbiamo studiato questi problemi ed esplorato vari aspetti dellâindividuazione delle persone, gruppi ed individuazione in scenari
affollati.
Comunque, in un ambiente generico, eâ impossibile predire la configurazione di oggetti che saranno catturati dalla telecamera. In questi casi, eâ richiesto di âastrarre il concettoâ di oggetti. Con questo requisito in mente, abbiamo esplorato le proprietaâ dei metodi stocastici e mostrano che buoni tassi di classificazione possono essere ottenuti a condizione che lâinsieme di addestramento sia abbastanza grande.
Una struttura flessibile deve essere in grado di individuare le regioni in movimento e riconoscere gli oggetti di interesse. Abbiamo sviluppato una struttura per la gestione dei problemi di individuazione e classificazione.
Rispetto ad altri metodi, i metodi proposti offrono una struttura flessibile per lâindividuazione e classificazione degli oggetti, e che puoâ essere usata in modo efficiente in diversi ambienti interni ed esterni.XXII Cicl
A framework for automated landmark recognition in community contributed image corpora
Any large library of information requires efficient ways to organise it and methods that allow people to access information efficiently and collections of digital images are no exception. Automatically creating high-level semantic tags based on image content is difficult, if not impossible to achieve accurately. In this thesis a framework is presented that allows for the automatic creation of rich and accurate tags for images with landmarks as the main object. This framework uses state of the art computer vision techniques fused with the wide range of contextual information that is available with community contributed imagery.
Images are organised into clusters based on image content and spatial data associated with each image. Based on these clusters different types of classifiers are* trained to recognise landmarks contained within the images in each cluster. A novel hybrid approach is proposed combining these classifiers with an hierarchical matching approach to allow near real-time classification and captioning of images containing landmarks