DOI QR코드

DOI QR Code

Stereo Matching Using Distance Trasnform and 1D Array Kernel

거리변환과 1차원 배열을 이용한 적응적 스테레오 정합

  • Received : 2016.03.04
  • Accepted : 2016.04.19
  • Published : 2016.04.30

Abstract

A stereo matching method is one of the ways to obtain a depth value from two dimensional images. This method estimates the depth value of target images using stereo images which have two different viewpoints. In the result of stereo matching, the depth value is represented by a disparity value. The disparity means a distance difference between a current pixel in one side of stereo images and its corresponding point in the other side of stereo images. The stereo matching in a homogeneous region is always difficult to find corresponding points because there are no textures in that region. In this paper, we propose a novel matching equation using the distance transform to estimate accurate disparity values in the homogeneous region. The distance transform calculates pixel distances from the edge region. For this reason, pixels in the homogeneous region have specific values when we apply this transform to pixels in that region. Therefore, the stereo matching method using the distance transform improves the matching accuracy in the homogeneous regions. In addition, we also propose an adaptive matching cost computation using a kernel of one dimensional array depending on the characteristic of regions in the image. In order to aggregate the matching cost, we apply a cross-scale cost aggregation method to our proposed method. As a result, the proposed method has a lower average error rate than that of the conventional method in all regions.

스테레오 정합 방법은 2차원 영상으로부터 깊이정보를 얻는 여러 가지 방법들 중 하나다. 이 방법은 서로 다른 두 시점을 갖는 스테레오 영상을 이용해 영상 속 객체 및 배경의 깊이를 예측한다. 이때 물체의 깊이 값은 한 시점의 영상 속 화소들과 다른 시점 영상에 있는 대응점들 사이의 거리 차이인 변위값에 의해 결정된다. 본 논문은 평탄한 영역 속 각 화소의 대응점을 잘 찾기 위해 거리변환을 이용한 새로운 정합비용 함수를 제안한다. 거리변환은 영상 속 각 화소가 경계 영역으로부터 얼만큼 떨어져있는지 계산해준다. 따라서 평탄한 영역에 있는 화소에 거리변환을 적용하면 특정값을 갖는 화소로 변환할 수 있기 때문에 이 영역에서의 대응점 탐색 정확도를 높일 수 있다. 또한, 정합비용을 계산하는 과정에서 1차원 배열을 이용해 영상의 영역별 특성에 따라 정합 방법이 적응적으로 적용되도록 한다. 최적의 대응점을 찾기 위한 정합비용들의 종합 과정에는 교차 계층 구조를 이용한 종합 방법이 사용된다. 그 결과, 평탄한 영역을 포함한 모든 영역에서 기존의 방법보다 더 정확한 변위값을 얻었다.

Keywords

References

  1. E. T. Baek and Y. S. Ho, "Stereo image composition using poisson object editing," J. KICS, vol. 39A, no. 8, pp. 453-458, Aug. 2014. https://doi.org/10.7840/kics.2014.39A.8.453
  2. D. Scharstein, View synthesis using stereo vision, Springer-Verlag, 1999.
  3. Y. S. Kang and Y. S. Ho, "An efficient image rectification method for parallel multi-camera arrangement," IEEE Trans. Consumer Electron., vol. 57, no. 3, pp. 1041-1048, Aug. 2011. https://doi.org/10.1109/TCE.2011.6018853
  4. J. I. Jung and Y. S. Ho, "Improved polynomial model for multi-view image color correction," J. KICS, vol. 38C, no. 10, pp. 881-886, Nov. 2013. https://doi.org/10.7840/kics.2013.38C.10.881
  5. Y. S. Kang and Y. S. Ho, "Low-resolution depth map upsampling method using depth-discontinuity information," J. KICS, vol. 38C, no. 10, pp. 875-880, Nov. 2013. https://doi.org/10.7840/kics.2013.38C.10.875
  6. K. Zheng, Y. Fang, D. Min, L. Sun, S. Yang, S. Yan, and Q. Tian, "Cross-scale cost aggregation for stereo matching," IEEE Conf. Computer Vision and Pattern Recognition, pp. 1590-1597, Columbus, USA, Jun. 2014.
  7. C. Rhemann, A. Hosni, M. Bleyer, C. Rother, and M. Gelautz, "Fast cost-volume filtering for visual correspondence and beyond," IEEE Conf. Computer Vision and Pattern Recognition, pp. 3017-3028, Colorado, USA, Jun. 2011.
  8. Y. J. Chang and Y. S. Ho, "Pixel based cost computation using weighted distance information for cross-scale stereo matching," Electronic Imaging, pp. 1-6, San Francisco, USA, Feb. 2016.
  9. G. Borgefors, "Distance transformations in digital images," Computer Vision, Graphics, and Image Processing, vol. 34, no. 3, pp. 344-371, Jun. 1986. https://doi.org/10.1016/S0734-189X(86)80047-0
  10. W. S. Jang and Y. S. Ho, "Discontinuity preserving disparity estimation with occlusion handling," J. Visual Commun. and Image Representation, vol. 25, no. 7, pp. 1595-1603, Oct. 2014. https://doi.org/10.1016/j.jvcir.2014.07.005
  11. D. Scharstein, R. Szeliski, and R. Zabih, "A taxonomy and evaluation of dense two-frame stereo correspondence algorithms," Int. J. Computer Vision, vol. 47, no. 1, pp. 7-42, Apr. 2002. https://doi.org/10.1023/A:1014573219977
  12. D. Scharstein and R. Szeliski, "High-accuracy stereo depth maps using structured light," IEEE Conf. Computer Vision and Pattern Recognition, pp. 195-202, Madison, USA, Jun. 2003.
  13. J. Canny, "A computational approach to edge detection," IEEE Trans. Pattern Anal. and Machine Intell., vol. PAMI-8, no. 6, pp. 679-698, Nov. 1986. https://doi.org/10.1109/TPAMI.1986.4767851