A Study on Image Coding using the Human Visual System and DCT

시각특성과 DCT를 이용한 영상부호화에 관한 연구

  • 남승진 (연세대학교 전자공학과) ;
  • 최성남 (연세대학교 전자공학과) ;
  • 전중남 (충북대학교 전자계산학과) ;
  • 박규태 (연세대학교 전자공학과)
  • Published : 1992.04.01

Abstract

In this paper, an adaptive cosine transform coding scheme which incorporate human visual properties into the coding scheme is investigated. Human vision is relatively sensitive to mid-frequency band, and insensitive to very low and very high frequency band. These property was mathematically modelled with MTF(Modulation Transfer Function) through many psychovisual experiment. DCT transforms energy in spatial domain into frequency domain, so can exploit the MTF very efficiently. Another well-known visual characteristics is spatial masking effect that visibility of noise is less in regions of high activity than in regions of low activity. Proposed coding scheme imploys quantization matrix which represent the properties of these spatial frequency response of human vision, and adaptively quality of an image. To compute the activity index of an image block, simple operation is performed in spatial domain, and according to activity index. block of low activity region is more exactly quantized relatively than that of high activity region. Results showed that, at low bit rate, the subjective quality of the reconstructed images by proposed coding scheme is acceptible than that of coding scheme without HVS properties.

본 논문에서는 인간의 시각특성을 반영한 적응 DCT 영상 부호화에 관하여 연구하였다. 인간의 시각은 특정한 중간 주파수 대역에 가장 민감하며, 저주파 대역과 고주파 대역에 대하여 상대적으로 덜 민감하다. 이러한 특성은 많은 심리시각적 실험을 통하여 MTF(Modulation transfer function)라는 수식으로 모델링되었다. DCT는 공간영역의 에너지를 주파수 영역으로 변환하므로 MTF를 효율적으로 이용할 수 있다. 또한 시각의 공간 마스킹 특성에 의하여 변화가 많은 영역의 잡음은 변화가 적은 영역의 잡음에 비하여 인간의 시각에 덜 민감하다. 제안된 부호화 방법은 시각의 공간주파수 반응 특성을 양자화 행렬로 채택하였으며, 영상의 변화도에 따라 변환 블럭을 차등양자화 함으로써 주관적 화질의 향상을 꾀하였다. 각 블럭의 변화도를 측정하기 위한 방법으로 공간 영역에서 간단한 연산을 행하였으며, 이에 따라 변화가 적은 블럭을 상대적으로 정확하게 양자화하였다. 실험결과 낮은 비트율에서 시각특성을 반영한 제안된 부호화 방법이 주관적으로 우수한 성능을 보임을 확인하였다.

Keywords