13 research outputs found
Steerable Discrete Cosine Transform
In image compression, classical block-based separable transforms tend to be
inefficient when image blocks contain arbitrarily shaped discontinuities. For
this reason, transforms incorporating directional information are an appealing
alternative. In this paper, we propose a new approach to this problem, namely a
discrete cosine transform (DCT) that can be steered in any chosen direction.
Such transform, called steerable DCT (SDCT), allows to rotate in a flexible way
pairs of basis vectors, and enables precise matching of directionality in each
image block, achieving improved coding efficiency. The optimal rotation angles
for SDCT can be represented as solution of a suitable rate-distortion (RD)
problem. We propose iterative methods to search such solution, and we develop a
fully fledged image encoder to practically compare our techniques with other
competing transforms. Analytical and numerical results prove that SDCT
outperforms both DCT and state-of-the-art directional transforms
Spatial intra-prediction based on mixtures of sparse representations
Abstract-In this paper, we consider the problem of spatial prediction based on sparse representations. Several algorithms dealing with this problem can be found in the literature. We propose a novel method involving a mixture of sparse representations. We first place this approach into a probabilistic framework and then derive a practical procedure to solve it. Comparisons of the rate-distortion performance show the superiority of the proposed algorithm with regard to other stateof-the-art algorithms
Graph Spectral Image Processing
Recent advent of graph signal processing (GSP) has spurred intensive studies
of signals that live naturally on irregular data kernels described by graphs
(e.g., social networks, wireless sensor networks). Though a digital image
contains pixels that reside on a regularly sampled 2D grid, if one can design
an appropriate underlying graph connecting pixels with weights that reflect the
image structure, then one can interpret the image (or image patch) as a signal
on a graph, and apply GSP tools for processing and analysis of the signal in
graph spectral domain. In this article, we overview recent graph spectral
techniques in GSP specifically for image / video processing. The topics covered
include image compression, image restoration, image filtering and image
segmentation
Sub-pixel gradient ๋ฅผ ํ์ฉํ compound ์์ ์์ถ
ํ์๋
ผ๋ฌธ (๋ฐ์ฌ)-- ์์ธ๋ํ๊ต ๋ํ์ : ์ ๊ธฐยท์ปดํจํฐ๊ณตํ๋ถ, 2014. 2. ๊น์ํ.์ปดํจํฐ ์ฑ๋ฅ๊ณผ ๋คํธ์ํฌ ์๋๊ฐ ๋ฐ์ ํจ์ ๋ฐ๋ผ ์ปดํจํฐ ํ๋ฉด์ ํ์๋๋ compound image ์ ๊ธฐ์ ์ ๋ค์ํ ์ ์ก ํ๊ฒฝ์์ ๋น๋์ค ๋ฐ ์๋ฐฉํฅ ์๋น์ค๊ฐ ๊ฐ๋ฅํด์ก๋ค. ๊ทธ๋ฌ๋ compound image๋ ๋ค์ํ ์ข
๋ฅ์ ์์์ด ๋ณตํฉ์ ์ผ๋ก ๋ํ๋๊ธฐ ๋๋ฌธ์ ์์์ ์ข
๋ฅ๋ฅผ ๋ช
ํํ ๊ตฌ๋ถํ๊ณ ๊ฐ ์ข
๋ฅ์ ๋ง๋ ์์ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐฉ์์ด ํ์ํ๊ฒ ๋๋ค. ์์์ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐฉ์์ด ๋ณต์กํด ์ง์๋ก ์๋ฒ์ ํด๋ผ์ด์ธํธ์ ์ฑ๋ฅ ๋ถ๊ท ํ์ ๋ฐ์ดํฐ๋ฅผ ์ํํ ์์ฑ/์ฌํ ํ์ง ๋ชปํ๋ ๋ฌธ์ ๋ฅผ ๊ฐ์ง ์ ์๋ค.
Compound image ์ ๋ถ๋ฅ๋ ํ
์คํธ๋ก ๊ตฌ์ฑ๋ ๋ถ๋ถ์ ๋ํ์ฌ ๋ค๋ฅธ ์ข
๋ฅ์ ์์์ผ๋ก ๋ถ๋ฅํ์ง ์์์ผ ํ๋ค. ์ด๋ ๋ธ๋ก ๋จ์๋ก ๊ตฌ๋ถํ์ฌ ๋ถ๋ฅํ๋ ๋ฐฉ๋ฒ์์ ์ธ์ ํ ๋ธ๋ก๊ฐ์ ์๋ก ๋ค๋ฅธ ์ฝ๋ฉ ๋ฐฉ๋ฒ์ ์ ์ฉํ๊ฒ ๋๋ฉด ์ฌ๋์ด ๋๋ผ๋ ์์์ ํ์ง์ ๋ฎ์์ง๊ฒ ๋๋ค. ๋ณธ ์ฐ๊ตฌ์์๋ ์ด๋ฌํ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๊ธฐ ์ํด์ ํ
์คํธ์ ์์ฑ๊ณผ์ ์ ์ญ์ด์ฉํ sub-pixel gradient ๋ธ๋ก ๋ถ๋ฅ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. ํํ ๋์คํ๋ ์ด์์๋ ํ
์คํธ์ ๋ถ๋๋ฌ์์ ํํํ๊ธฐ ์ํ์ฌ sub-pixel ๋จ์๋ก ์ปฌ๋ฌ์ ๋ณํ๋์ ์กฐ์ ํ๊ฒ ๋๋ค. ์ด๋ฅผ whole-pixel์ ๋จ์๋ก ์์์ ๊ตฌ๋ถํ๊ฒ ๋๋ฉด, ํ
์คํธ์ ์์ญ์ ๋ช
ํํ๊ฒ ๊ตฌ๋ถํ์ง ๋ชปํ๋ค. ๋ณธ ์ฐ๊ตฌ์๋ sub-pixel gradient ๋ธ๋ก ๋ถ๋ฅ ๋ฐฉ๋ฒ์ ํตํ์ฌ ํ
์คํธ๋ก ๊ตฌ์ฑ๋ ์์ญ๊ณผ ํ
์คํธ๊ฐ ์๋ ์์ญ์ ๋ํ ํ๋จ์ด ์ ํํ ์ด๋ฃจ์ด์ง์ ์คํ์ ํตํ์ฌ ํ์ธํ์๋ค.
ํ
์คํธ์ ์ฝ๋ฉ๋ฐฉ๋ฒ ์ค ์์ค ์์ถ๋ฐฉ๋ฒ์ ํ
์คํธ๋ก ๊ตฌ์ฑ๋ ์์์ด ๋์ ์ฃผํ์๋ฅผ ๊ฐ์ง๋ ์์์ด๊ธฐ ๋๋ฌธ์ ์์ํ๋ ๋ณํ๊ณผ์ ์ ๊ฑฐ์น๊ฒ ๋๋ฉด ์์์ ์์ค์ด ์ปค์ง๊ฒ ๋๋ค. ํ์ง๋ง ๋ฌด ์์ค ์์ถ ๋ฐฉ๋ฒ์ ๋์ ๋ฐ์ดํฐ ๋์ ๊ฐ์ง๊ฒ ๋๊ณ , ์์ ์ ์ก ์๋๊ฐ ๋์์ ธ์ผ ํ๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ค. ๋ณธ ์ฐ๊ตฌ์์๋ sub-pixel gradient ๋ฐฉ๋ฒ์ ์ด์ฉํ ํ
์คํธ ์์ญ์ ๋ํ ์ฝ๋ฉ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. ํ
์คํธ ์์์ด ๊ฐ์ง๋ ํน์ฑ์ ์ด์ฉํ์ฌ ์์์์ ๋ฐ์ํ๋ ๊ธฐ์ธ๊ธฐ์ ๋ํ์ฌ ์ฝ๋ฉ์ ์งํํ๋ค. ์ด๋ฅผ ํตํ์ฌ ์์์ ์์ค์ ์ค์ด๊ณ ํ
์คํธ์ ๊ฐ๋
์ฑ์ ๋์ผ ์ ์๋ค. ๋์ผํ ์์ถ๋ฅ ์์ ๋ค๋ฅธ ์์ถ ์๊ณ ๋ฆฌ์ฆ์ ๋นํ์ฌ ํ
์คํธ์ ํ์ง๊ณผ ๊ฐ๋
์ฑ์ด ๋ฐ์ด๋จ์ ํ์ธํ์๋ค.
Compound image๋ ์์ฐ ์์๊ณผ๋ ๋ค๋ฅด๊ฒ ์์ง์์ด ๋จ์ํ๊ณ ๋
ธ์ด์ฆ๊ฐ ์๋ค๋ ํน์ฑ์ ๊ฐ์ง๋ค. ์ด๋ ๊ธฐ์กด์ ์์ง์ ์ถ์ ๋ฐฉ๋ฒ์ ๋นํ์ฌ ๋ณต์ก๋๊ฐ ๋ฎ์ ๋ฐฉ๋ฒ์ ๊ฐ๋ฅํ๊ฒ ํ๋ค. ๋ณธ ์ฐ๊ตฌ์์๋ ์ด๋ฌํ compound image์ ์์ ํน์ฑ์ ์ด์ฉํ ๊ทธ๋ฃน ์์ง์ ์ถ์ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. ํฝ์
์ ์์ง์์ ํ์ธํ๊ธฐ ์ ์ ์์์ ๋ถ๋ฅ์ ๋ฐ๋ผ ๋ถ๋ฅ๋ ์์ญ์ ์์ง์์ ๋จผ์ ํ์
ํ๊ณ ์ด๋ฅผ ํตํ์ฌ ์ต์ข
์ ์ธ ์์ง์์ ์ถ์ ํ๊ฒ ๋๋ค. ๊ทธ๋ฃน ์์ง์ ์ถ์ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋ฉด ๊ธฐ์กด์ ํ์์์ญ ๋ฐฉ๋ฒ๊ณผ ๋น๊ตํ์ฌ ํ์ ์์ญ์ ์ต์ํ ํ ์ ์์ผ๋ฉฐ, ๋ณต์ก๋๋ฅผ ๋ฎ์ถ ์ ์์์ ์คํ์ ํตํ์ฌ ํ์ธํ์๋ค.์ด ๋ก i
์ฐจ ๋ก iii
๊ทธ๋ฆผ ๋ชฉ์ฐจ vi
ํ ๋ชฉ ์ฐจ ix
์ 1์ฅ ์ ๋ก 1
1.1 ์ฐ๊ตฌ ๋ฐฐ๊ฒฝ 1
1.2 ์ฐ๊ตฌ ๋ด์ฉ 4
1.3 ๋
ผ๋ฌธ ๊ตฌ์ฑ 6
์ 2์ฅ ํ
์คํธ ์์ฑ๊ณผ์ ๋ฐ ๊ธฐ์กด์์ถ๋ฐฉ๋ฒ 7
2.1 ํ
์คํธ ์์ฑ๊ณผ์ 7
2.2 ํ์ค ์์ ์์ถ ๋ฐฉ๋ฒ 14
2.3 H.264 inter prediction 16
2.4 Compound image ์ ์์ถ ์๊ณ ๋ฆฌ์ฆ 19
์ 3์ฅ Sub-pixel gradient ๋ธ๋ก ๋ถ๋ฅ ๋ฐฉ๋ฒ 23
3.1 Background & Text color extraction 28
3.2 Text De-colorization 32
3.3 ๋ธ๋ก ๋ถ๋ฅ ์คํ ๊ฒฐ๊ณผ 38
์ 4์ฅ Sub-pixel Gradient text ๋ธ๋ก ์ฝ๋ฉ ๋ฐฉ๋ฒ 46
4.1 Gradient fitting process 51
4.2 Text Coding 56
4.2.1 Gradient๋ก ๊ตฌ์ฑ๋ ๋ถ๋ถ์ ์ฝ๋ฉ๋ฐฉ๋ฒ 56
4.2.2 Gradient๊ฐ ์๋ ๋ถ๋ถ์ ์ฝ๋ฉ๋ฐฉ๋ฒ 57
4.2.3 local min/max ๊ฐ ์์ธก 57
4.2.4 Whole-pixel ์ฝ๋ฉ 59
4.2.5 ํ์ง enhancement 60
4.3 ํ
์คํธ ์ฝ๋ฉ ๋์ 64
4.3.1 ํ
์คํธ ์ฝ๋ฉ ์
๋ ฅ 65
4.3.2 Whole-pixel ์ฝ๋ฉ 1 66
4.3.3 ์ญ๋ฐฉํฅ Sub-pixel gradient ์ฝ๋ฉ 1 67
4.3.4 Local minimum ์ฝ๋ฉ 1 69
4.3.5 ์๋ฐฉํฅ gradient ์ฝ๋ฉ 1 70
4.3.6 Local maximum ์ฝ๋ฉ 1 71
4.3.7 ์ญ๋ฐฉํฅ gradient ์ฝ๋ฉ 2 72
4.3.8 Local minimum ์ฝ๋ฉ 2 73
4.3.9 ์๋ฐฉํฅ gradient ์ฝ๋ฉ 2 74
4.3.10 Whole-pixel ์ฝ๋ฉ 2 75
4.4 ํ
์คํธ ๋ธ๋ก ์ฝ๋ฉ ์คํ ๊ฒฐ๊ณผ 77
์ 5์ฅ ๊ทธ๋ฃน ์์ง์ ์ถ์ ๋ฐฉ๋ฒ 88
5.1 Block Grouping 94
5.2 Group Matching 97
5.3 Group motion vector calculation 101
5.4 ๊ทธ๋ฃน ์์ง์ ์ถ์ ๋ฐฉ๋ฒ ์คํ ๊ฒฐ๊ณผ 104
์ 6์ฅ ๊ฒฐ ๋ก 109
์ฐธ ๊ณ ๋ฌธ ํ 112
Abstract 119Docto