Search CORE

1 research outputs found

Efficient Image Tagging

Author: Procházka Václav
Publication venue: Vysoké učení technické v Brně. Fakulta informačních technologií
Publication date: 01/01/2013
Field of study

Tato práce se zabývá efektivním tagováním fotografií. Konkrétně se zaměřuje na uspořádání jednotlivých fotografií tak, aby tvořily shluky podle svých vlastností a usnadnily tak výběr podobných fotografií, kterým uživatel může efektivně přiřazovat společné tagy zároveň. K tomuto účelu jsou v práci zkoumány známé techniky zobrazování kolekcí fotografií podle jejich vlastností a s tím související metody redukce dimenzionality. Ze zmiňovaných jsou vybrány a otestovány nejvhodnější možnosti. Tato práce navrhuje nový způsob zobrazování kolekcí fortografií na 2D obrazovce, která kombinuje použití časové osy a seskupování podle podobnosti (Timeline projekce). Pro optimální projekci uskupení v mnohorozměrném prostoru příznakových vektorů na 2-rozměrnou obrazovku je v této práci použita metoda redukce dimenzionality nazvaná t-Distributed Stochastic Neighbour Embedding (t-SNE). Jsou popsány různé modifikace t-SNE a způsoby, jak ji kombinovat s časovou osou, a zvolená modifikace je implementována formou webového rozhraní a kvalitativně vyhodnocena experimentem. Na závěr jsou navrženy možnosti pokračování výzkumu.This thesis investigates efficient manual image tagging approaches. It specifically focuses on organising images into clusters depending on their content, and thus on simplifying the selection of similar photos. Such selections may be efficiently tagged with common tags. The thesis investigates known techniques for visualisation of image collections according to the image content, together with dimensionality reduction methods. The most suitable methods are considered and evaluated. The thesis proposes a novel method for presenting image collections on 2D displays which combines a timeline with similarity grouping (Timeline projection). This method utilizes t-Distributed Stochastic Neighbour Embedding (t-SNE) for otpimally projecting groupings in high dimensional feature spaces onto the low-dimensional screen. Various modifications of t-SNE and ways to combine it with the timeline are discussed and chosen combination is implemented as a web interface and is qualitatively evaluated in a user study. Possible directions of further research on the subject are suggested.

Digital library of Brno University of Technology

National Repository of Grey Literature