A Fast SAD Algorithm for Area-based Stereo Matching Methods

영역기반 스테레오 영상 정합을 위한 고속 SAD 알고리즘

  • 이우영 (건아정보기술(주) 건아부속연구소) ;
  • 김정길 (남서울대학교 컴퓨터학과)
  • Received : 2012.07.06
  • Accepted : 2012.07.23
  • Published : 2012.09.30

Abstract

Area-based stereo matchng algorithms are widely used for image analysis for stereo vision. SAD (Sum of Absolute Difference) algorithm is one of well known area-based stereo matchng algorithms with the characteristics of data intensive computing application. Therefore, it requires very high computation capabilities and its processing speed becomes very slow with software realization. This paper proposes a fast SAD algorithm utilizing SSE (Streaming SIMD Extensions) instructions based on SIMD (Single Instruction Multiple Data) parallism. CPU supporing SSE instructions has 16 XMM registers with 128 bits. For the performance evaluation of the proposed scheme, we compare the processing speed between SAD with/without SSE instructions. The proposed scheme achieves four times performance improvement over the general SAD, which shows the possibility of the software realization of real time SAD algorithm.

스테레오 비전 분야에서 영역 기반의 영상 정합은 스테레오 영상 분석을 위한 대표적인 방법이다. SAD (Sum of Absolute Difference) 알고리즘은 영역 기반 정합 알고리즘의 한 종류로서 대규모 데이터 집약적 계산을 요구하여 소프트웨어 방식을 사용할 경우 처리속도가 매우 느리게 된다. 본 논문에서는 소프트웨어 기반 SIMD (Single Instruction Multiple Data) 병렬 기법인 SSE (Streaming SIMD Extensions) 명령어를 이용한 고속 SAD 알고리즘을 제안한다. SSE 명령어를 지원하는 CPU는 16개의 128비트 크기의 XMM 레지스터를 보유하여 SIMD 명령어 집합 확장을 가능하게 하였다. 제안하는 소프트웨어 기반 병렬 고속화 기법의 성능 측정을 위하여 일반적 SAD를 이용한 영상 정합 알고리즘과 SSE 명령어를 사용한 알고리즘의 수행 속도차이를 측정하였다. 제안하는 기법은 일반적 SAD 알고리즘보다 평균 4배의 성능 향상의 결과를 보임으로 소프트웨어 기반 고속병렬 처리를 통한 실시간 스테레오 비전 응용분야에 효과적으로 적용될 수 있음을 보였다.

Keywords

References

  1. Jongsu Yi, Jaehwa Park, and JunSeong Kim, A Platform-Based SoC Design for Real-Time Stereo Vision, Journal of Semiconductor Technology and Science, Vol. 12, No. 2, June 2012, pp. 212-218. https://doi.org/10.5573/JSTS.2012.12.2.212
  2. P. Muralidhar, C. B. Rama Rao, and I. Ranjith Kumar, Efficient Architecture for Variable block size Motion Estimation of H.264 Video Encoder, 2012 International Conference on Solid-State and Integrated Circuit (ICSIC 2012), pp. 1-6.
  3. Cheong Ghil Kim, Vason P. Sirni, and Shin Dug Kim, "High Performance Coprocessor Architecture for Real-Time Dense Disparity Map," 정보처리학회 논문지, 제14-A권 제5호, 2007. 10, pp. 301-308.
  4. 박장호, 최현준, 박성호, 서영호, 김동욱, "효율적인 SAD 연산을 위한 하드웨어 구현에 대한 연구" 2008년도 한국방송공학회 학술대회, 2008.11, 223-226
  5. 이정수, 양승구, 김준성, 실시간 스테레오 비젼 시스템을 위한 SAD 정합연산기 설계, 전자공학회지 제 45권 제1호 통권 제319호, 2008. 1, pp.55-61.
  6. C. G. Kim, H. S. Kim, S. H. Kang, S. D. Kim and G. H. Han, An Acceleration Processor for Data Intensive Scientific Computing, IEICE Trans. on Information and Systems, Vol. E87-D, 2004. 7, pp.1766-1773.
  7. 유희재, 정선태, 정수환, 2007. 12, VLIW 기반 고성능 DSP에서의 SAD 알고리즘 최적화 스케쥴링 , 한국 콘텐츠학회 논문지 제 7권 제 12호, pp. 262-272.
  8. Cheong Ghil Kim, "Evaluation of Image Pre-processing using Subword Parallelism," 2010년도 한국산업정보학회 춘계학술대회 논문집, pp 93-94, 2010. 05.
  9. http://vasc.ri.cmu.edu/idb/html/stereo/index.html