3 research outputs found

    Быстрая классификация JPEG-изображений

    Full text link
    Среди различных видов классификаций мультимедиа изображений наиболее значимой и наиболее сложной является задача их семантической классификации [1,2]. По статистическим оценкам в мультимедийных базах данных большинство изображений (до 80%) представлены в JPEG формате или производных от него (JFIF, SPIFF, JBIG, JPEG-EXIF, MPEG). Формат сжатия JPEG обеспечивает значительную экономию ресурсов, как при хранении, так и при обработке зрительных образов, что и определяет его широкую распространенность. Поэтому разработка эффективных методов семантической классификации JPEG-изображений является в настоящее время весьма актуальной задачей. В предлагаемом подходе используются три основные идеи: 1) для классификации изображений используется спектральное признаковое пространство, формируемое стандартной процедурой блочного кодирования JPEG-формата, что позволяет производить классификацию без восстановления изображения. 2) Семантика полного изображения является производной от семантики сегментов изображения, что позволяет реализовать экономную иерархическую процедуру классификации. 3) Исключаются какие-либо априорные предположения о конфигурации семантического класса в пространстве признаков, классификация выполняются по достоверным прецедентам базы данных, что позволяет ограничиться достаточно простыми метрическими методами классификации. В результате выполнения проекта были разработаны алгоритмы адаптивной сегментации изображений, алгоритмы информативной оценки системы первичных признаков и формирования сложных вторичных признаков, алгоритмы нечеткой метрической классификации сегментов изображения, алгоритмы нечеткой семантической классификации видеообразов по результатам сегментной классификации. Алгоритмы реализованы в программной среде МАТЛАБ и представляют собой интерактивную программу накопления, обучения и классификации видеоданных представленных в JPEG-формате. Проведенные тестовые испытания в целом подтверждают эффективность предложенных подходов. Разработанные алгоритмы могут быть использованы для семантической классификации при достаточной представительности базы данных. Надежность распознавания может быть улучшена добавлением уровня онтологий и расширением вторичного признакового пространства.Between different kinds of classifications the most complex task is the semantic classification of video patterns [1,2]. Accordingly to statistic estimations in multimedia data bases the majority of images (until 80 percents) are represented in JPEG format or in derivations from one. JPEG compressing format provides the significant resource economy the both storing and processing of video images and it determinates its widely propagation. Therefore the developing of effective methods of semantic classification for JPEG images is presentday task. In the project the three main ideas are used. 1) The spectral indication space formed with standard JPEG procedure is used for image classification. It permits to make classification without full image restoration. 2) The semantic of a total image is carried out from image segment semantics that permits to realize the economic hierarchical classification procedure. 3) Any a priory suppositions about point locations of a semantic class are excluded. It permits to use the enough simple metric classification methods. In the project there were developed the algorithms of adaptive image segmentation, the algorithms of informative estimation of primary indications and the algorithms of forming complex second indications, the algorithms of fuzzy metric classification for image segments, the algorithms fuzzy image semantic classification on base of the image segment classification. All algorithms are realized in program MATHLAB media and ones represent the interactive program for accumulation, teaching and classification of JPEG-images. The carried out experiments confirm the effectiveness of supposed methods. Developed algorithms may be used for semantic classification in condition of representative data base. The reliability of image recognition may be increased with adding of ontology level and extending the space of second indications

    Indexing, learning and content-based retrieval for special purpose image databases

    Get PDF
    This chapter deals with content-based image retrieval in special purpose image databases. As image data is amassed ever more effortlessly, building efficient systems for searching and browsing of image databases becomes increasingly urgent. We provide an overview of the current state-of-the art by taking a tour along the entir

    Human-Centered Content-Based Image Retrieval

    Get PDF
    Retrieval of images that lack a (suitable) annotations cannot be achieved through (traditional) Information Retrieval (IR) techniques. Access through such collections can be achieved through the application of computer vision techniques on the IR problem, which is baptized Content-Based Image Retrieval (CBIR). In contrast with most purely technological approaches, the thesis Human-Centered Content-Based Image Retrieval approaches the problem from a human/user centered perspective. Psychophysical experiments were conducted in which people were asked to categorize colors. The data gathered from these experiments was fed to a Fast Exact Euclidean Distance (FEED) transform (Schouten & Van den Broek, 2004), which enabled the segmentation of color space based on human perception (Van den Broek et al., 2008). This unique color space segementation was exploited for texture analysis and image segmentation, and subsequently for full-featured CBIR. In addition, a unique CBIR-benchmark was developed (Van den Broek et al., 2004, 2005). This benchmark was used to explore what and how several parameters (e.g., color and distance measures) of the CBIR process influence retrieval results. In contrast with other research, users judgements were assigned as metric. The online IR and CBIR system Multimedia for Art Retrieval (M4ART) (URL: http://www.m4art.org) has been (partly) founded on the techniques discussed in this thesis. References: - Broek, E.L. van den, Kisters, P.M.F., and Vuurpijl, L.G. (2004). The utilization of human color categorization for content-based image retrieval. Proceedings of SPIE (Human Vision and Electronic Imaging), 5292, 351-362. [see also Chapter 7] - Broek, E.L. van den, Kisters, P.M.F., and Vuurpijl, L.G. (2005). Content-Based Image Retrieval Benchmarking: Utilizing Color Categories and Color Distributions. Journal of Imaging Science and Technology, 49(3), 293-301. [see also Chapter 8] - Broek, E.L. van den, Schouten, Th.E., and Kisters, P.M.F. (2008). Modeling Human Color Categorization. Pattern Recognition Letters, 29(8), 1136-1144. [see also Chapter 5] - Schouten, Th.E. and Broek, E.L. van den (2004). Fast Exact Euclidean Distance (FEED) transformation. In J. Kittler, M. Petrou, and M. Nixon (Eds.), Proceedings of the 17th IEEE International Conference on Pattern Recognition (ICPR 2004), Vol 3, p. 594-597. August 23-26, Cambridge - United Kingdom. [see also Appendix C
    corecore