4 research outputs found

    Contributions to the Content-Based Image Retrieval Using Pictorial Queris

    Get PDF
    L'acc茅s massiu a les c脿meres digitals, els ordinadors personals i a Internet, ha propiciat la creaci贸 de grans volums de dades en format digital. En aquest context, cada vegada adquireixen major rellev脿ncia totes aquelles eines dissenyades per organitzar la informaci贸 i facilitar la seva cerca.Les imatges s贸n un cas particular de dades que requereixen t猫cniques espec铆fiques de descripci贸 i indexaci贸. L'脿rea de la visi贸 per computador encarregada de l'estudi d'aquestes t猫cniques rep el nom de Recuperaci贸 d'Imatges per Contingut, en angl猫s Content-Based Image Retrieval (CBIR). Els sistemes de CBIR no utilitzen descripcions basades en text sin贸 que es basen en caracter铆stiques extretes de les pr貌pies imatges. En contrast a les m茅s de 6000 lleng眉es parlades en el m贸n, les descripcions basades en caracter铆stiques visuals representen una via d'expressi贸 universal.La intensa recerca en el camp dels sistemes de CBIR s'ha aplicat en 脿rees de coneixement molt diverses. Aix铆 doncs s'han desenvolupat aplicacions de CBIR relacionades amb la medicina, la protecci贸 de la propietat intel路lectual, el periodisme, el disseny gr脿fic, la cerca d'informaci贸 en Internet, la preservaci贸 dels patrimoni cultural, etc. Un dels punts importants d'una aplicaci贸 de CBIR resideix en el disseny de les funcions de l'usuari. L'usuari 茅s l'encarregat de formular les consultes a partir de les quals es fa la cerca de les imatges. Nosaltres hem centrat l'atenci贸 en aquells sistemes en qu猫 la consulta es formula a partir d'una representaci贸 pict貌rica. Hem plantejat una taxonomia dels sistemes de consulta en composada per quatre paradigmes diferents: Consulta-segons-Selecci贸, Consulta-segons-Composici贸-Ic貌nica, Consulta-segons-Esbo莽 i Consulta-segons-Il路lustraci贸. Cada paradigma incorpora un nivell diferent en el potencial expressiu de l'usuari. Des de la simple selecci贸 d'una imatge, fins a la creaci贸 d'una il路lustraci贸 en color, l'usuari 茅s qui pren el control de les dades d'entrada del sistema. Al llarg dels cap铆tols d'aquesta tesi hem analitzat la influ猫ncia que cada paradigma de consulta exerceix en els processos interns d'un sistema de CBIR. D'aquesta manera tamb茅 hem proposat un conjunt de contribucions que hem exemplificat des d'un punt de vista pr脿ctic mitjan莽ant una aplicaci贸 final

    Contributions to the content-based image retrieval using pictorial queries

    Get PDF
    Descripci贸 del recurs: el 02 de novembre de 2010L'acc茅s massiu a les c脿meres digitals, els ordinadors personals i a Internet, ha propiciat la creaci贸 de grans volums de dades en format digital. En aquest context, cada vegada adquireixen major rellev脿ncia totes aquelles eines dissenyades per organitzar la informaci贸 i facilitar la seva cerca. Les imatges s贸n un cas particular de dades que requereixen t猫cniques espec铆fiques de descripci贸 i indexaci贸. L'脿rea de la visi贸 per computador encarregada de l'estudi d'aquestes t猫cniques rep el nom de Recuperaci贸 d'Imatges per Contingut, en angl猫s Content-Based Image Retrieval (CBIR). Els sistemes de CBIR no utilitzen descripcions basades en text sin贸 que es basen en caracter铆stiques extretes de les pr貌pies imatges. En contrast a les m茅s de 6000 lleng眉es parlades en el m贸n, les descripcions basades en caracter铆stiques visuals representen una via d'expressi贸 universal. La intensa recerca en el camp dels sistemes de CBIR s'ha aplicat en 脿rees de coneixement molt diverses. Aix铆 doncs s'han desenvolupat aplicacions de CBIR relacionades amb la medicina, la protecci贸 de la propietat intel路lectual, el periodisme, el disseny gr脿fic, la cerca d'informaci贸 en Internet, la preservaci贸 dels patrimoni cultural, etc. Un dels punts importants d'una aplicaci贸 de CBIR resideix en el disseny de les funcions de l'usuari. L'usuari 茅s l'encarregat de formular les consultes a partir de les quals es fa la cerca de les imatges. Nosaltres hem centrat l'atenci贸 en aquells sistemes en qu猫 la consulta es formula a partir d'una representaci贸 pict貌rica. Hem plantejat una taxonomia dels sistemes de consulta en composada per quatre paradigmes diferents: Consulta-segons-Selecci贸, Consulta-segons-Composici贸-Ic貌nica, Consulta-segons-Esbo莽 i Consulta-segons-Il路lustraci贸. Cada paradigma incorpora un nivell diferent en el potencial expressiu de l'usuari. Des de la simple selecci贸 d'una imatge, fins a la creaci贸 d'una il路lustraci贸 en color, l'usuari 茅s qui pren el control de les dades d'entrada del sistema. Al llarg dels cap铆tols d'aquesta tesi hem analitzat la influ猫ncia que cada paradigma de consulta exerceix en els processos interns d'un sistema de CBIR. D'aquesta manera tamb茅 hem proposat un conjunt de contribucions que hem exemplificat des d'un punt de vista pr脿ctic mitjan莽ant una aplicaci贸 final

    Semantics of video shots for content-based retrieval

    Get PDF
    Content-based video retrieval research combines expertise from many different areas, such as signal processing, machine learning, pattern recognition, and computer vision. As video extends into both the spatial and the temporal domain, we require techniques for the temporal decomposition of footage so that specific content can be accessed. This content may then be semantically classified - ideally in an automated process - to enable filtering, browsing, and searching. An important aspect that must be considered is that pictorial representation of information may be interpreted differently by individual users because it is less specific than its textual representation. In this thesis, we address several fundamental issues of content-based video retrieval for effective handling of digital footage. Temporal segmentation, the common first step in handling digital video, is the decomposition of video streams into smaller, semantically coherent entities. This is usually performed by detecting the transitions that separate single camera takes. While abrupt transitions - cuts - can be detected relatively well with existing techniques, effective detection of gradual transitions remains difficult. We present our approach to temporal video segmentation, proposing a novel algorithm that evaluates sets of frames using a relatively simple histogram feature. Our technique has been shown to range among the best existing shot segmentation algorithms in large-scale evaluations. The next step is semantic classification of each video segment to generate an index for content-based retrieval in video databases. Machine learning techniques can be applied effectively to classify video content. However, these techniques require manually classified examples for training before automatic classification of unseen content can be carried out. Manually classifying training examples is not trivial because of the implied ambiguity of visual content. We propose an unsupervised learning approach based on latent class modelling in which we obtain multiple judgements per video shot and model the users' response behaviour over a large collection of shots. This technique yields a more generic classification of the visual content. Moreover, it enables the quality assessment of the classification, and maximises the number of training examples by resolving disagreement. We apply this approach to data from a large-scale, collaborative annotation effort and present ways to improve the effectiveness for manual annotation of visual content by better design and specification of the process. Automatic speech recognition techniques along with semantic classification of video content can be used to implement video search using textual queries. This requires the application of text search techniques to video and the combination of different information sources. We explore several text-based query expansion techniques for speech-based video retrieval, and propose a fusion method to improve overall effectiveness. To combine both text and visual search approaches, we explore a fusion technique that combines spoken information and visual information using semantic keywords automatically assigned to the footage based on the visual content. The techniques that we propose help to facilitate effective content-based video retrieval and highlight the importance of considering different user interpretations of visual content. This allows better understanding of video content and a more holistic approach to multimedia retrieval in the future

    Micro-, Meso- and Macro-Dynamics of the Brain

    Get PDF
    Neurosciences, Neurology, Psychiatr
    corecore