• 제목/요약/키워드: DCT Domain

검색결과 262건 처리시간 0.036초

DCT 영역 영상 크기 조절 방법들에 대한 PSNR 비교 (PSNR Comparison of DCT-domain Image Resizing Methods)

  • 김도년;최윤식
    • 한국통신학회논문지
    • /
    • 제29권10C호
    • /
    • pp.1484-1489
    • /
    • 2004
  • 비디오 프레임의 크기를 축소하거나 확대할 때, 응용에 따라서는 입력 및 출력이 8${\times}$8 블록 DCT 계수들로 구성되도록 할 필요가 있다. 선형 변환이고 유니터리(unitary) 변환의 일종인 DCT에는 행렬 곱셈에 대한 분배 법칙이 성립한다. 이러한 사실을 이용하여 두가드, 묵허지, 박 등은DCT 영역에서 비디오 프레임들의 크기를 축소하는 방법들을 제안하였다. 이러한 방식으로 영상을 축소 후 확대하면 원 영상의 저 주파수 DCT 계수들이 잘 보존된다. 즉, 원 상(축소되기 전의 영상)과 예측된 영상(축소 후 확대된 영상)의 차이를 부호화 해야 되는 경우 부호화 효율이 매우 높아진다. 이러한 것은 스케일러빌러터를 이용한 비디오 부호화에 바람직한 사실이다. 본 논문에서는 이전의 방식들의 연장선 상에서 가로 세로 각각 2:1로 축소하고 다시 2:1로 확대할 때 DCT 블록의 크기를 다양이 하였다. 실험에 의하면 DCT 블록 크기를 크게 할수록 PSNR 값이 커짐을 알 수 있었다. 그러나, 계산상의 복잡도 역시 커질 것으로 예상된다. 본 논문의 실험 결과는 압축 영역 영상 축소 및 확대를 위한 고속 알고리즘 개발에 중요한 데이터가 될 것으로 생각한다.

DMB 서비스를 위한 DCT 기반 MPEG-2/H.264 비디오 트랜스코더 시스템 구조 (DCT-domain MPEG-2/H.264 Video Transcoder System Architecture for DMB Services)

  • 이주경;권순영;박성호;김영주;정기동
    • 정보처리학회논문지B
    • /
    • 제12B권6호
    • /
    • pp.637-646
    • /
    • 2005
  • DMB 서비스를 위해 제공되는 대부분의 비디오 컨텐츠는 MPEG-2 규격으로 압축된 채 제공되므로 실제 서비스를 위해서 H.264 규격으로 트랜스코딩을 수행해야 한다. 현재 사용되는 트랜스코딩 방식은 MPEG-2 비트열(bit-stream)의 디코딩과 H.264 규격으로의 인코딩 과정을 연속적으로 수행하는 픽셀 기반 직렬 구조형 (CPDT, Cascaded Pixel-Domain Transcoding Architecture)이다. 이 방식은 두 표준의 소스 코드를 수정 없이 사용할 수 있으므로 구현이 용이하지만 변환을 위한 처리 시간이 길고 디코딩과 인코딩을 반복하므로 화질의 열화가 발생 할 수 있다. 본 논문에서는 MPEG-2로 압축된 비디오 비트열을 H.264로 트랜스크딩 할 때 변환 시간을 향상할 수 있는 DCT 기반의 열린 회로형 트랜스코더 구조(DCT-OPEN)와 변환시간은 CPDT와 유사하지만 화질면에서 우수한 DCT 기반 닫힌 회로형 트랜스코더(DCT-CLOSED) 구조를 제안한다. 제안된 구조에서는 CPDT 방식과 달리 압축 과정의 중간 단계인 DCT(Discrete Cosine Transform)를 이용하여 변환을 수행한다. 이때, MPEG-2와 H.264의 DCT 단위와 방법이 상이하므로 [l, 2]에서 제안된 방식을 이용하여 DCT 간의 변환을 수행한다. 제안된 구조의 성능 평가를 위해 MPEG-2 TM5하 H.264 JM8 코덱을 수정하여 다양한 구조를 구현하였으며 실험 결과 DCT-OPEN의 경우 CPDT에 비하여 계산 복잡도에서 우수하지만 PSNR 성능은 낮게 나타났으며 DCT-CLOSED의 경우 계산 복잡도는 높으나 화질에서 우수한 것으로 나타났다.

Retinex 이론을 이용한 DCT 압축 영역에서의 적응 영상 향상 (Adaptive Image Enhancement in the DCT Compression Domain Using Retinex Theory)

  • 전선동;김상희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.913-914
    • /
    • 2008
  • This paper presents a method of adaptive image enhancement with dynamic range compression and contrast enhancement. The dynamic range compression is to adaptively enhance the dark area using illumination component of DCT compression block. The contrast enhancement is to modify the image contrast using retinex theory that uses the HVS properties. The block artifacts and other noises, caused by processing in the compression domain, were removed by after processing.

  • PDF

DCT 변환 계수를 이용한 축소/확대 (Upsampling and Downsampling using DCT Coefficients)

  • 박일철;권구락
    • 한국정보통신학회논문지
    • /
    • 제15권8호
    • /
    • pp.1714-1719
    • /
    • 2011
  • 각종 시각 매체들이 발달함에 따라 대부분의 영상들은 고화질의 영상을 사용하고 있다. 그 만큼 전송할 때 많은 용량을 전송해야 하기 때문에 압축된 형태를 지향하고 있으며 이뿐만 아니라 소형기기의 디스플레이 장치에 알맞은 영상을 제공해야 하는 필요성이 제기되고 있다. 본 논문에서는 DCT 영역에서 영상을 축소/확대하여 계산 량을 줄이면서 디스플레이 장치에 알맞은 영상 크기 조절 방법을 제시한다. 제안하는 방법은 DCT 영역에서 영상의 해상도를 조절할 수 있기 때문에 기존의 방법들에 비해 높은 PSNR 값을 보인다.

주파수 영역에서 에너지 확률을 이용한 얼굴 특징 추출 (Facial Feature Extraction Using Energy Probability in Frequency Domain)

  • 최진;정윤수;김기현;유장희
    • 대한전자공학회논문지SP
    • /
    • 제43권4호
    • /
    • pp.87-95
    • /
    • 2006
  • 본 논문에서는 얼굴 영상의 에너지 분포 특성을 이용한 새로운 특정추출 방법을 제안한다. 제안된 방법은 얼굴 영상의 에너지 확률과 에너지 랩을 이용해서 데이터 차원이 축소된 유효정보의 추출 및 유효정보의 LDA 해석에 기반을 둔다. 일반적으로, 얼굴 영상은 고유한 에너지 분포 특성을 가지고 있다. 그러나 기존의 많은 DCT 기반 방법들은 이러한 얼굴 영상의 특성을 효과적으로 이용하지 못하는 단점이 있다. 제안된 방법은 이러한 기존 방법의 단점을 개선하기 위해 다음의 3단계 방법을 사용한다. 먼저, DCT 도메인에서 얼굴의 에너지 확률 개념을 정의하고, 이러한 에너지 확률로부터 얼굴의 에너지 맵을 생성한다. 마지막으로, 에너지 확률 지도에 위치한 주파수 계수들에 대한 LDA 적용 및 해석을 통하여 특정 벡터 추출 및 인식을 수행한다. 제안된 방법은 ETRI 데이터베이스에서 96.8%, ORL 데이터베이스에서 100%의 인식률을 보인다. 실험을 통하여 인식 성능의 개선뿐만 아니라, 특정 벡터의 차원 축소에도 효과가 있음을 알 수 있다.

DCT 영역에서 DV 방식을 MPEG-2로 변환부호화 (Transcoding DV into MPEG-2 in the DCT domain)

  • 김도년;윤범식;최윤식
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1998년도 학술대회
    • /
    • pp.121-126
    • /
    • 1998
  • DV(Digital Video) 영상 압축 방식에서 MPEG-2로 변환할 때 처리단계를 줄이기 위하여 DCT 영역에서 변환하였다. DV 방식의 색차신호 포맷인 4:1:1에서 4:2:2로 변환하고, 2-4-8 DCT 모드를 변환할 때 행렬을 이용하여 변환함으로써 중간과정을 줄였으며, DCT 영역에서 MPEG-2의 율 제어를 구현하였다. DV에서 만든 DCT 계수를 이용하여, 단계적으로 움직임 추정을 함으로써 전역탐색 블록 매칭 방식보다 처리 속도를 개선하였다.

  • PDF

신호 방향을 고려한 영상 화질 개선 (Image Enhancement Using Signal Direction)

  • 신동인;김원하
    • 대한전자공학회논문지SP
    • /
    • 제49권4호
    • /
    • pp.32-39
    • /
    • 2012
  • 본 논문에서는 DCT 영역에서 영상 신호의 방향과 변화의 크기에 따라 신호의 에너지를 조절하여 영상의 화질을 안정적으로 개선하는 방법을 개발한다. 이를 위하여 DCT 영역에서 영상 신호의 gradient를 측정하여 gradient의 방향과 크기로 영상의 sharpness, 국부 명암대비, 전역 명암대비에 해당하는 주파수 성분들의 에너지를 조절한다. 제안하는 기법은 기존의 기법들과 비교하여 블록화, 울림화 현상 발생과 잡음 증폭 없이 가장 우수한 화질로 향상시키는 것을 실험으로 보여준다.

CRT-Based Color Image Zero-Watermarking on the DCT Domain

  • Kim, HyoungDo
    • International Journal of Contents
    • /
    • 제11권3호
    • /
    • pp.39-46
    • /
    • 2015
  • When host images are watermarked with CRT (Chinese Remainder Theorem), the watermark images are still robust in spite of the damage of the host images by maintaining the remainders in an unchanged state within some range of the changes that are incurred by the attacks. This advantage can also be attained by "zero-watermarking," which does not change the host images in any way. This paper proposes an improved zero-watermarking scheme for color images on the DCT (Discrete Cosine Transform) domain that is based on the CRT. In the scheme, RGB images are converted into YCbCr images, and one channel is used for the DCT transformation. A key is then computed from the DC and three low-frequency AC values of each DCT block using the CRT. The key finally becomes the watermark key after it is combined four times with a scrambled watermark image. When watermark images are extracted, each bit is determined by majority voting. This scheme shows that watermark images are robust against a number of common attacks such as sharpening, blurring, JPEG lossy compression, and cropping.

2D Adjacency Matrix Generation using DCT for UWV contents

  • Li, Xiaorui;Lee, Euisang;Kang, Dongjin;Kim, Kyuheon
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.39-42
    • /
    • 2016
  • Since a display device such as TV or signage is getting larger, the types of media is getting changed into wider view one such as UHD, panoramic and jigsaw-like media. Especially, panoramic and jigsaw-like media is realized by stitching video clips, which are captured by different camera or devices. In order to stich those video clips, it is required to find out 2D Adjacency Matrix, which tells spatial relationships among those video clips. Discrete Cosine Transform (DCT), which is used as a compression transform method, can convert the each frame of video source from the spatial domain (2D) into frequency domain. Based on the aforementioned compressed features, 2D adjacency Matrix of images could be found that we can efficiently make the spatial map of the images by using DCT. This paper proposes a new method of generating 2D adjacency matrix by using DCT for producing a panoramic and jigsaw-like media through various individual video clips.

  • PDF

정현파 패턴의 상관관계를 이용한 강인한 워터마킹 (A robust watermarking method using the correlation of the sinusoidal pattern)

  • 김상범;원치선
    • 대한전자공학회논문지SP
    • /
    • 제45권1호
    • /
    • pp.22-28
    • /
    • 2008
  • 본 논문에서는 특정 DCT계수를 조작하였을 때 공간영역에서 생성되는 정현파 패턴을 워터마크로 활률한다. 즉, 특정 DCT 계수를 워터마크 비트에 따라 변경하여 결과적으로 정현파 패턴이 삽입되도록 하고, 삽입된 워터마크는 공간영역에서 상관관계를 이용하여 검출할 수 있다. 제안된 알고리즘은 추가적인 싱크 비트 삽입 없이도 영상의 공간싱크의 변화를 어느 정도 감지 할 수 있으며 다양한 StirMark공격에 강인함을 실험결과를 통해 확인하였다.