Low Complexity Video Encoding Using Turbo Decoding Error Concealments for Sensor Network Application

센서네트워크상의 응용을 위한 터보 복호화 오류정정 기법을 이용한 경량화 비디오 부호화 방법

  • Ko, Bong-Hyuck (School of Information and Communication Engineering, Sungkyunkwan University) ;
  • Shim, Hyuk-Jae (School of Information and Communication Engineering, Sungkyunkwan University) ;
  • Jeon, Byeung-Woo (School of Information and Communication Engineering, Sungkyunkwan University)
  • 고봉혁 (성균관대학교 정보통신공학부) ;
  • 심혁재 (성균관대학교 정보통신공학부) ;
  • 전병우 (성균관대학교 정보통신공학부)
  • Published : 2008.01.25

Abstract

In conventional video coding, the complexity of encoder is much higher than that of decoder. However, as more needs arises for extremely simple encoder in environments having constrained energy such as sensor network, much investigation has been carried out for eliminating motion prediction/compensation claiming most complexity and energy in encoder. The Wyner-Ziv coding, one of the representative schemes for the problem, reconstructs video at decoder by correcting noise on side information using channel coding technique such as turbo code. Since the encoder generates only parity bits without performing any type of processes extracting correlation information between frames, it has an extremely simple structure. However, turbo decoding errors occur in noisy side information. When there are high-motion or occlusion between frames, more turbo decoding errors appear in reconstructed frame and look like Salt & Pepper noise. This severely deteriorates subjective video quality even though such noise rarely occurs. In this paper, we propose a computationally extremely light encoder based on symbol-level Wyner-Ziv coding technique and a new corresponding decoder which, based on a decision whether a pixel has error or not, applies median filter selectively in order to minimize loss of texture detail from filtering. The proposed method claims extremely low encoder complexity and shows improvements both in subjective quality and PSNR. Our experiments have verified average PSNR gain of up to 0.8dB.

종래의 움직임보상 변환 부호화 기술은 부호화기가 복호화기에 비해 매우 복잡한 구조를 갖는다. 하지만 센서네트워크와 같은 에너지 제한 환경을 위한 경량화 부호화기의 필요성이 대두됨에 따라 부호화기 복잡도와 에너지소비의 대부분을 차지했던 움직임 예측/보상과정을 없애기 위한 새로운 부호화 구조에 대한 연구가 이루어져 왔다. Wyner-Ziv 코딩 기술은 이를 가능하게 하는 대표적인 기술로서 터보 코드와 같은 채널 코드를 이용하여 프레임과 보조정보 사이의 잡음을 제거하여 영상을 복원한다. 이때 부호화기는 단순히 현재 프레임에 대한 패리티 정보만을 생성할 뿐 프레임간의 유사성을 이용하는 어떠한 과정도 수행하지 않기 때문에 매우 간단한 구조를 갖게 된다. 하지만 Wyner-Ziv 코딩 구조에서는 잡음이 많은 보조영상을 이용하여 복호화 할 경우 터보 코드의 복호화 오류가 발생한다. 이러한 복호화 오류는 특히 영상 간 움직임이 많거나 occlusion이 존재하는 경우 더 많이 발생하여 마치 복원된 영상에 Salt & Pepper 같은 잡음이 나타난다. 이러한 잡음은 비록 그 발생빈도는 적지만 복원된 영상의 주관적인 화질을 상당히 떨어뜨린다. 본 논문은 심볼단위의 Wyner-Ziv 코딩구조하의 초경량 부호화 기술과, 잘못된 필터 적용으로 영상의 texture를 손상시키는 경우를 최소하기 위하여 복호화 시 각 화소에 터보 코드 복호화 오류가 있는지 여부를 판단하여 선택적으로 미디언 필터를 적용시키는 기술을 제안한다. 제안된 방법은 종래의 움직임보상 변환 부호화 기술과 비교하여 현저하게 연산량이 감소된 경량화 부호화 기술로서 터보 코드 복호화 오류로 발생하는 잡음과 영상의 texture를 구분하여 필터를 적용함으로써 복원된 영상의 주관적인 화질과 PSNR을 동시에 개선한다. 실험결과 PSNR의 경우 평균 최고 약 0.8dB에 달하는 성능이득 효과를 보였다.

Keywords

References

  1. J. D. Slepian and J. K. Wolf, "Noiseless coding of correlated information sources," IEEE Transactions on Information Theory, vol. IT-19, pp. 471-480, July 1973
  2. A. Wyner and J. Ziv, "The rate-distortion function for source coding with side information at the decoder," IEEE Trans. Information Theory, vol. 22, pp. 1-10, July 1976 https://doi.org/10.1109/TIT.1976.1055508
  3. A. Aaron, S. Rane, R. Zhang, and B. Girod, "Wyner-Ziv coding for video: Applications to compression and error resilience," Proc. of IEEE Data Compression Conference, DCC-2003, Snowbird, UT, March 2003
  4. R. Puri and k. Ramchandran, "PRISM: A new robust video coding architecture based on distributed compression principles," in Proc. Allerton Conference on communication, Control, and Computing, Allerton, IL, October, 2002
  5. J. Ascenso, C. Brites, and F. Pereira, "Improving frame interpolation with spatial motion smoothing for pixel domain distributed video coding," 5th EURASIP Conference on Speech and Image Processing, Multimedia Communications and Services, Slovak Republic, July 2005
  6. L. Alparone, M. Barni, F. Bartolini, and V.Cappellini, "Adaptively weighted vector-medin filters for motion fiels smothing," Proc. of IEEE ICASSP, Georgia, USA, May 1996
  7. L. R. Bahl, J. Cocke, F. Jelinek, and J. Raviv, "Optimal decoding of linear codes for minimizing symbol error rate," IEEE Trans. Information Theory, pp 284-287, March 1974
  8. S.S. Pietrobon, "Implementation and performance of a turbo/map decoder," International Journal of Satellite Communications, vol. 16, pp. 23-46, 1998 https://doi.org/10.1002/(SICI)1099-1247(199801/02)16:1<23::AID-SAT590>3.0.CO;2-W
  9. W. Koch and A. Baier, "Optimum and sub-optimum detection of coded data distributed by time varying inter-symbol interference," Globecom '90, San Diego, USA, pp. 1679-1684, December 1990
  10. A. J. Viterbi, "Error bounds for convolutional codes and an asymptotically optimum decoding algorithm," IEEE Transactions on Information Theory, vol. IT-13, pp. 260-269, April 1967
  11. A. Avudainayagam, J. M. Shea, and D. Wu, "Hyper-tellis decoding of pixel-domain Wyner-Ziv video coding," Globecom '2005, St.Louis, USA, November 2005
  12. J. Ascenso, C. Brites, and F. Pereira, "Motion compensated refinement for low complexity pixel based distributed video coding," Proc. of IEEE International Conference on Advanced Video and Signal Based Surveillance, Como, Italy, September 2005
  13. 박운기, 이상희, 전병우, "효과적인 잡음 제거를 위한 간략한 전처리 방법," 방송공학회논문지 제6권 제2호, pp. 139-147, 2001