• 제목/요약/키워드: DCT Domain

검색결과 262건 처리시간 0.024초

Shuffled Discrete Sine Transform in Inter-Prediction Coding

  • Choi, Jun-woo;Kim, Nam-Uk;Lim, Sung-Chang;Kang, Jungwon;Kim, Hui Yong;Lee, Yung-Lyul
    • ETRI Journal
    • /
    • 제39권5호
    • /
    • pp.672-682
    • /
    • 2017
  • Video compression exploits statistical, spatial, and temporal redundancy, as well as transform and quantization. In particular, the transform in a frequency domain plays a major role in energy compaction of spatial domain data into frequency domain data. The high efficient video coding standard uses the type-II discrete cosine transform (DCT-II) and type-VII discrete sine transform (DST-VII) to improve the coding efficiency of residual data. However, the DST-VII is applied only to the Intra $4{\times}4$ residual block because it yields relatively small gains in the larger block than in the $4{\times}4$ block. In this study, after rearranging the data of the residual block, we apply the DST-VII to the inter-residual block to achieve coding gain. The rearrangement of the residual block data is similar to the arrangement of the basis vector with a the lowest frequency component of the DST-VII. Experimental results show that the proposed method reduces the luma-chroma (Cb+Cr) BD rates by approximately 0.23% to 0.22%, 0.44% to 0.58%, and 0.46% to 0.65% for the random access, low delay B, and low delay P configurations, respectively.

Facial Feature Extraction Based on Private Energy Map in DCT Domain

  • Kim, Ki-Hyun;Chung, Yun-Su;Yoo, Jang-Hee;Ro, Yong-Man
    • ETRI Journal
    • /
    • 제29권2호
    • /
    • pp.243-245
    • /
    • 2007
  • This letter presents a new feature extraction method based on the private energy map (PEM) technique to utilize the energy characteristics of a facial image. Compared with a non-facial image, a facial image shows large energy congestion in special regions of discrete cosine transform (DCT) coefficients. The PEM is generated by energy probability of the DCT coefficients of facial images. In experiments, higher face recognition performance figures of 100% for the ORL database and 98.8% for the ETRI database have been achieved.

  • PDF

H.264/AVC SVC에서 DCT 기반의 계층 간 잔여 신호 예측 구조 (DCT-domain Inter-layer Residual Prediction Architecture in H.264/AVC SVC)

  • 강진미;김성인;정기동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (D)
    • /
    • pp.580-584
    • /
    • 2007
  • H.264/AVC SVC에서는 공간적 확장성을 지원하기 위하여 계층 간 예측 방법을 새롭게 도입하였다. 계층 간 예측은 하위 계층의 움직임 정보, 텍스처 정보, 잔여 신호 정보를 이용하여 계층 간 중복성을 제거하는 방법이다. 따라서 상위 계층의 부호화 효율을 높이는 반면, 복호화 과정에서는 하위 계승의 잔여 신호 정보를 픽셀 단위까지 복원하여 계산 복잡도가 높아지는 문제점이 있다. 본 논문에서는 이러한 H.264/AVC SVC에서 복호화 과정의 계산 복잡도를 줄이기 위하여 DCT 기반의 잔여 신호 예측 구조를 제안하였다. H.264/AVC SVC에서 픽셀 기반의 잔여 신호 예측 구조와 제안하는 구조의 연산 수를 계산하여 계산 복잡도를 비교한 결과 약 33%의 개선이 이루어졌다.

  • PDF

유한상태 분류 벡터 양자기를 이용한 라플라시안 피라미드 부호화 기법 (Lplacian Pyramid Coding Technique using a Finite State-Classified Vector Quantizer)

  • 박섭형;이상욱
    • 대한전자공학회논문지
    • /
    • 제26권10호
    • /
    • pp.1561-1570
    • /
    • 1989
  • In this paper, we propose an image coding scheme which combines the Laplacian pyramid structure and a hierarchical finite state classified vector quantizer in the DCT domain, namely FSDCT-CTQ. First, an optimal bit allocation problem for fixed rates DCT-CVQ on the Laplacian pyramid structure is described. In an asymptotic case, with an optimal bit allocation, a coding gain over scalar quantization of each Laplacian plane is derived. Second, it is experimentallhy shown that the Laplacian pyramid structure provides a considerable codng gain in the sense of total MMSE (minimum mean squared error). Finally, we propose an FS-DCT-CVQ which exploits the hierarchicla correlation between the Laplacian planes. Simulation results on real images show that the proposed coding scheme can reconstruct an image with 30.33 dB at 0.192 bpp, 32.45 dB at 0.385 bpp, respectively.

  • PDF

DCT 공간에서 크기를 변환하는 방법을 사용하는 고속 매체변환기 (A Fast Video Transcoder Using DCT-Domain Resizing Algorithm)

  • 한재웅;채병조;오승준;정광수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.799-801
    • /
    • 2001
  • 본 논문에서는 대역폭이 보장되지 않는 네트워크 상에서 비디오 서비스를 제공하기 위한 매체변환 방법 중 비디오 프레임 크기를 변환시켜 비트율을 효율적으로 제어하는 방법을 제안한다. H.263으로 부호화된 스트림을 DCT 공간에서 크기를 변환시킴으로써 완전 복호화 후 다시 부호화하는 과정에서 생기는 계산량을 대폭 감소시켜 보다 효율적인 방법으로 비트율을 제어할 수 있다. 움직임 정보뿐만 아니라 이전 프레임과의 차이값을 다시 사용하기 위해 크기변환 후 H.263 표준의 향상된 예측 모드 (Advanced Prediction Mode)를 사용하여 화질열화도 최소화한다. 실험결과 화질면에서는 블록화 현상(Block Artifact)이 크게 감소하였고, 프레임이 진행됨에 따라 PSNR은 낮아졌지만, 매체변환은 기존의 방법에 비해 라론 속도로 이루어 질 수 있었다.

  • PDF

OCT 기반 H.264 transcoder를 위한 half-pixel 보정 기법 (Half-Pixel Correction for H.264 Transcoding in the OCT domain)

  • 권순영;임성렬;정기동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.364-366
    • /
    • 2005
  • 최신 동영상 압축 표준인 H.264는 압축 효율을 높이기 위해 기존의 표준과는 다른 1/2 화소 생성 방법을 사용한다. 그러므로 기존의 동영상 압축표준으로 압축된 비트열을 DCT 상에서 H.264로 트랜스코딩(transcoding)하기 위해서는 추가적인 보정 작업이 필요하다. 본 논문에서는 MPEG-2로 압축된 비트열을 DCT 상에서 H.264로 트랜스코딩 할 때 두 표준 간 1/2 화소 값의 차이를 보정하는 기법을 제안한다. 제안된 1/2 화소 보정 기법에서는 DCT 상태의 창조 프레임을 이용하여 두 표준 간의 차이 값을 구하여 입력으로 들어온 블록의 값에 더하여 보정한다. 픽셀 기반에서 보정하는 기법과 성능을 비교한 결과 제안하는 기법이 화질 면에서 우수하며 움직임이 빠른 비디오의 경우 계산량이 높아지는 것으로 나타났다.

  • PDF

3진 BCH (Bose - Chaudhuri - Hocquenghem) 코드를 이용하는 스테가노그라피 기법 (Ternary Bose - Chaudhuri - Hocquenghem (BCH) with t = 2 code for steganography)

  • ;최용수
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권6호
    • /
    • pp.461-469
    • /
    • 2016
  • 본 논문에서는 t = 2인 3진 BCH 코드를 기반으로 하는 새로운 스테가노그라피 방법을 제시한다. 제안 된 방법에서는 JPEG 영상으로부터 추출된 DCT 계수들에 데이터 은닉을 하기 위해 t = 2인 강력한 BCH 코드를 사용하였다. 제안하는 데이터 은닉 기술은 삼진 BCH 코드(t=2인 경우)에서 다양한 해결책을 찾기 위한 접근으로 제안된 룩업테이블을 사용하였다. 고안된 룩업 테이블 접근법은 데이터 은닉을 위해 수정이 필요한 DCT 계수들의 위치를 빠르고 효율적으로 연산 가능하게 하였다. 제시된 데이터 은닉 기술은 삼진 BCH 코드를 이용하는 최초의 스테가노그라피 기술이다. 실험 결과를 통해 이진 BCH 코드에 비해 삼진 BCH 코드를 사용하는 것이 우수함을 명확하게 증명하였다.

구매자-판매자 워터마킹 프로토콜상에서 DCT 기반의 방향성 적응 워터마킹 (A Direction-Adaptive Watermarking Technique Based on 2DCT in the Buyer-Seller Watermarking Protocol)

  • 성택영;권기창;이석환;권기룡;우종호
    • 한국멀티미디어학회논문지
    • /
    • 제17권7호
    • /
    • pp.778-786
    • /
    • 2014
  • Buyer-seller watermarking protocol is one of the copyright protection techniques which combine a cryptographic protocol used in electronic commerce with a digital wetermarking scheme aiming at proving the ownership of multimedia contents and preventing the illegal reproduction and redistribution of digital contents. In this paper, it is proposed a new watermarking scheme in an encrypted domain in an image that is based on the block-DCT framework. In order to implement watermarking scheme in a public-key cryptosystem, it is divided that frequency coefficients exist as real number into integer and decimal layer. And the decimal layer is modified integer type through integral-processing. Also, for robustness and invisibility required in watermarking scheme, it is designed a direction-adaptive watermarking scheme based on locally edge-properties of each block in an image through analyzing distribution property of the frequency coefficients in a block using JND threshold.

이산 코사인 변환 공간에서의 주파수에 따른 광-적응 효과 최소 인지 왜곡 임계치 모델링 (Luminance-Adaptation Effect Just-Noticeable-Distortion Modeling according to Frequency in The DCT Domain)

  • 배성호;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.95-98
    • /
    • 2012
  • 본 논문에서는 DCT 변환 공간상의 배경휘도와 주파수를 고려한 2차원의 개선된 광-적응 효과(luminance adaptation: LA) JND 모델을 제안한다. 기존의 LA JND 모델은 배경 휘도가 중간점인 회색에 가까울수록 JND가 낮고, 배경 휘도가 어두워지거나 밝아질수록 JND 값이 증가하는 U자형의 1차원 함수형태를 보였다. 그러나 기존 LA JND 모델은 주파수에 따른 영향이 반영되지 않았기 때문에 DCT와 같은 주파수 공간상 JND 모델로는 부정확 한 단점이 있다. 본 논문에서는 주파수와 배경휘도에 따른 2차원 LA JND 모델을 제안한다. 주파수에 따른 LA JND 값을 실제 실험을 통해 획득하였다. 실험 방법은 9가지 크기의 배경 휘도가 다르고 공간적 복잡도가 없는 균일한 영상을 대상으로 $8{\times}8$ 실수형 DCT를 수행한 다음, 15가지 경우의 주파수 크기가 다른 계수들에 대해 사람이 인지 할 때 까지 노이즈를 증가시켜서 JND 값을 찾는 방식을 사용하였다. 실험 결과 4 cpd(cycle per degree) 보다 작은 주파수 대역 에서는 기존의 LA JND 모델과 유사한 결과를 얻었지만 4 cpd보다 큰 주파수 대역에서는 오히려 배경휘도가 작은 값을 가질수록 JND가 감소하는 형태를 보였다. 수행한 실험 결과를 반영하여 주파수가 반영된 2차원 LA JND 모델을 제안한다.

  • PDF

DCT/CPCM복합 감축방식의 성능에 관한 연구 (On the Performance of CDT/DPCM Hybrid Coding)

  • 안재형;김남철;김재균
    • 대한전자공학회논문지
    • /
    • 제20권4호
    • /
    • pp.47-54
    • /
    • 1983
  • DCT/DPCM 복합 감축방식(hybrid coding)에서 주요 시스템 변수에 따른 성능 변화가 평균 자승오차와 주관검사(subjective test)를 기준으로 해서 연구되었다. 검토된 시스템 변수는 DCT 변환계수의 예측상수, 블록 양자기의 평준화 계수 및 비트배정등이다. 그리고 적응식 감축방식의 특성도 비교 검토되었다. 실험결과로는 영상의 공분체 모델을 근거로 하는 비트 기정 및 적응방식이 실시간 처리에 편리할 뿐만 아니라, 낮은 비트율에서는 매우 유리한 방법임이 확인되었다.

  • PDF