DOI QR코드

DOI QR Code

A Study on Genetic Algorithm and Stereo Matching for Object Depth Recognition

물체의 위치 인식을 위한 유전 알고리즘과 스테레오 정합에 관한 연구

  • Hong, Seok-Keun (Dept of Control & Instrumentation Engineering., National Korea Maritime University) ;
  • Cho, Seok-Je (Division of Computer.Control and Electronic Communications, National Korea Maritime University)
  • 홍석근 (한국해양대학교 대학원) ;
  • 조석제 (한국해양대학교 컴퓨터.제어.전자통신공학부)
  • Published : 2008.06.30

Abstract

Stereo matching is one of the most active research areas in computer vision. In this paper, we propose a stereo matching scheme using genetic algorithm for object depth recognition. The proposed approach considers the matching environment as an optimization problem and finds the optimal solution by using an evolutionary strategy. Accordingly, genetic operators are adapted for the circumstances of stereo matching. An individual is a disparity set. Horizontal pixel line of image is considered as a chromosome. A cost function is composed of certain constraints which are commonly used in stereo matching. Since the cost function consists of intensity, similarity and disparity smoothness, the matching process is considered at the same time in each generation. The LoG(Laplacian of Gaussian) edge is extracted and used in the determination of the chromosome. We validate our approach with experimental results on stereo images.

스테레오 정합은 스테레오 시각 분야에서 가장 활발히 연구되는 분야이다. 본 논문에서는 물체의 위치 인식을 위한 유전 알고리즘을 이용한 스테레오 정합을 제안한다. 정합 환경을 최적화 문제로 간주하고 진화 전략을 이용하여 최적해를 탐색한다. 따라서, 유전 연산자는 스테레오 정합에 맞게 설계하였고 개체는 변위집단을 대표한다. 영상의 수평화소라인을 염색체로 간주하였다. 비용함수는 스테레오 정합에서 사용하는 일반적인 제약조건들의 조합이다. 비용함수가 명암도, 유사도, 변위 평활성으로 구성되었기 때문에 정합을 시도할 때 매 세대마다 이 모든 요소들을 한번에 다룬다. 염색체를 정의하기 위해 LoG연산자로 경계선을 추출하였으며 실험을 통하여 제안한 방법을 검증하였다.

Keywords

References

  1. 진강규(2000), "유전 알고리즘과 그 응용", 교우사
  2. 주재흠, 오종규, 설성욱, 이철훈, 남기곤(1999), "에지 정보를 강조한 동적계획법에 의한 스테레오 정합" 대한전자공학회논문지, vol. 36, no. 10, pp. 123-131
  3. 홍석근(2008), "경계선 정보와 유전 알고리즘을 이용한 스테레오 정합", 한국해양대학교 학위논문
  4. Fusiello, A., Roberto, V. and Trucco, E.(1997), "Effecient Stereo with Multiple Windowing," Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR '97), pp. 858-868
  5. Gong, M. and Yang, M.(2005). "Fast Unambiguous Stereo Matching Using Reliability-Based Dynamic Programming," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 27, No. 6, pp. 998-1003 https://doi.org/10.1109/TPAMI.2005.120
  6. Gonzalez, R. and Woods, R.(2002), "Digital Image Processing", Prentice Hall
  7. Hirschmuller, H.(2008), "Stereo Processing by Semiglobal Matching and Mutual Information," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 30, No.2, pp. 328-341 https://doi.org/10.1109/TPAMI.2007.1166
  8. Lee, Kwang, Y., and Mohamed, P. S.(2002), "A Real-Coded Genetic Algorithm Involving a Hybrid Crossover Method for Power Plant Control System Design," Proceedings of the 2002 Congress on Evolutionary Computation CEC2002, pp. 1069-1074
  9. Medioni, G. and Nevatia, R.(1985), "Segment-based Stereo Matching," Computer Vision and Graphics Image Process, pp. 2-18
  10. Scharstein, D. and Szeliski, R.(2002), "A Taxonomy and Evaluation of Dense Two-Frame Stereo Correspondence Algorithms," International Journal of Computer Vision, pp. 7-42
  11. Tsin, Y., Kang, S., and Szeliski, R.(2006), "Stereo Matching with Linear Superposition of Layers," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 28, No.2, pp. 290-301 https://doi.org/10.1109/TPAMI.2006.42
  12. Zitnick, L. and Kanade, T.(2000), "A Cooperative Algorithm for Stereo Matching and Occlusion Detection," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No.7, pp. 675-684 https://doi.org/10.1109/34.865184