6 research outputs found

    A Novel Image Retrieval Based on a Combination of Local and Global Histograms of Visual Words

    Get PDF
    Content-based image retrieval (CBIR) provides a sustainable solution to retrieve similar images from an image archive. In the last few years, the Bag-of-Visual-Words (BoVW) model gained attention and significantly improved the performance of image retrieval. In the standard BoVW model, an image is represented as an orderless global histogram of visual words by ignoring the spatial layout. The spatial layout of an image carries significant information that can enhance the performance of CBIR. In this paper, we are presenting a novel image representation that is based on a combination of local and global histograms of visual words. The global histogram of visual words is constructed over the whole image, while the local histogram of visual words is constructed over the local rectangular region of the image. The local histogram contains the spatial information about the salient objects. Extensive experiments and comparisons conducted on Corel-A, Caltech-256, and Ground Truth image datasets demonstrate that the proposed image representation increases the performance of image retrieval

    Tekrarlı Ortalama Yardımıyla Renk İndirgeme ve Görüntü Erişimi

    Get PDF
    Sayısal görüntülerden oluşan bir veri tabanından sorgulanan bir görüntünün aynısının veya benzerlerinin getirilmesi süreci görüntü erişimi olarak tanımlanır. Her ne kadar sayısal görüntü piksellerden oluşuyor olsa da sorgulama piksel düzeyinde değil, sayısal görüntüleri temsil eden vektörler düzeyinde yapılmaktadır. Görüntülerin vektörler ile temsil edilmesi özellik çıkarma süreci olarak adlandırılır ve içerik tabanlı görüntü erişiminin (İTGE) en önemli aşamasıdır. Özellik vektörünün temsil kabiliyetinin düşük olması sistemin performansının da düşük olması demektir. Gri ölçekli görüntülerin histogramları en tipik özellik vektörleridir. Diğer taraftan renkli görüntülerde üç ayrı kanal mevcut olduğundan, görüntüyü temsil edebilecek histogram üç boyutlu bir dizi oluşturur ki bu durum sistemin hesap maliyetini oldukça artıracaktır. Bu nedenle araştırmacılar renkli görüntülerdeki renk sayısını azaltma veya renk indirgeme yaklaşımını tercih etmişlerdir. Vektör kuantalama olarak adlandırılan renk indirgeme sürecinde ise her zaman aynı sonucu üretmek mümkün olmamıştır. Bunun nedeni ise bazı algoritmaların başlangıçta rastgele üretilen renk vektörleri ile çözüm aramalarıdır. Linde-Buzo-Gray (LBG), K-ortalamalar ve bulanık c-ortalamalar algoritmaları bu tür çözüm yaklaşımlarına tipik örneklerdir. Bu çalışmada tekrarlı ortalama tabanlı renk indirgeme yaklaşımı kullanılarak yeni bir görüntü erişim metodu önerilmiştir. Önerilen stratejide, öncelikle her bir renk kanalının histogramı üzerinden tekrarlı bir şekilde ortalamalar hesaplanmış ve çok seviyeli eşikler elde edilmiştir. Elde edilen eşikler kullanılarak RGB renk uzayı alt prizmalar şeklinde dilimlenmiştir. Oluşan alt prizmalar içinde kalan pikseller aynı sınıfa atanmış ve ilgili sınıftaki piksellerin ortalamaları kullanılarak renk indirgemesi yapılmıştır. Sınıf indisleri ve ilgili sınıflara tahsis edilen piksel sayıları yardımıyla tek boyutlu histogram elde edilmiştir. Son aşamada ise elde edilen sınıf tabanlı histogram özellik vektörü olarak atanmış ve içerik tabanlı görüntü erişimi gerçekleştirilmiştir. Önerilen algoritma ve LBG algoritması ile sonuçlar alınmış ve karşılaştırmalar yapılmıştır

    Efficient Retrieval of Images with Irregular Patterns using Morphological Image Analysis: Applications to Industrial and Healthcare datasets

    Full text link
    Image retrieval is the process of searching and retrieving images from a database based on their visual content and features. Recently, much attention has been directed towards the retrieval of irregular patterns within industrial or medical images by extracting features from the images, such as deep features, colour-based features, shape-based features and local features. This has applications across a spectrum of industries, including fault inspection, disease diagnosis, and maintenance prediction. This paper proposes an image retrieval framework to search for images containing similar irregular patterns by extracting a set of morphological features (DefChars) from images; the datasets employed in this paper contain wind turbine blade images with defects, chest computerised tomography scans with COVID-19 infection, heatsink images with defects, and lake ice images. The proposed framework was evaluated with different feature extraction methods (DefChars, resized raw image, local binary pattern, and scale-invariant feature transforms) and distance metrics to determine the most efficient parameters in terms of retrieval performance across datasets. The retrieval results show that the proposed framework using the DefChars and the Manhattan distance metric achieves a mean average precision of 80% and a low standard deviation of 0.09 across classes of irregular patterns, outperforming alternative feature-metric combinations across all datasets. Furthermore, the low standard deviation between each class highlights DefChars' capability for a reliable image retrieval task, even in the presence of class imbalances or small-sized datasets.Comment: 35 pages, 5 figures, 19 tables (17 tables in appendix), submitted to Special Issue: Advances and Challenges in Multimodal Machine Learning 2nd Edition, Journal of Imaging, MDP

    Content Based Image Retrieval Using Embedded Neural Networks with Bandletized Regions

    No full text
    One of the major requirements of content based image retrieval (CBIR) systems is to ensure meaningful image retrieval against query images. The performance of these systems is severely degraded by the inclusion of image content which does not contain the objects of interest in an image during the image representation phase. Segmentation of the images is considered as a solution but there is no technique that can guarantee the object extraction in a robust way. Another limitation of the segmentation is that most of the image segmentation techniques are slow and their results are not reliable. To overcome these problems, a bandelet transform based image representation technique is presented in this paper, which reliably returns the information about the major objects found in an image. For image retrieval purposes, artificial neural networks (ANN) are applied and the performance of the system and achievement is evaluated on three standard data sets used in the domain of CBIR