사용자-객체 상호작용을 위한 복잡 배경에서의 객체 인식

  • 발행 : 2014.02.28

초록

사용자-객체 상호작용을 위해서는 영상 내 객체의 종류와 위치를 정확하게 파악하여 사용자가 객체에 관련된 행동을 취할 경우, 그에 맞는 상호작용을 수행해야 한다. 이러한 객체인식에 널리 사용되는 지역 불변 특징량 기반의 방법론은 복잡한 배경이나 균일 물체에 대하여 잘못된 매칭으로 인식률이 저하된다. 본고에서는 이를 해결하기 위해, 컬러와 깊이 근접도 기반 깊이 계층을 나누고, 복잡 배경으로부터 생기는 잘못된 특징점 대응을 최소화 하기 위해 각 깊이 계층과 인식 물체 영상간의 특징점 대응을 수행한다. 또한, 각 깊이 계층영역에서 색상 히스토그램 재투영으로 객체의 위치를 추정하고 추정 영역과 인식 물체 영상간의 생상 및 깊이 유사도를 판단한다. 최종적으로, 복잡 배경 효과를 최소화한 특징점 대응의 수, 색상 및 컬러 유사도를 고려하여 신뢰도를 측정하여 객체를 인식하게 되며, 이를 통해 복잡한 배경에서도 사용자와 객체간의 유연한 상호작용이 가능해진다.

키워드

과제정보

연구 과제 주관 기관 : 미래창조과학부

참고문헌

  1. David G. Lowe. 2004. Distinctive Image Features from Scale-Invariant Keypoints. Int. J. Comput. Vision 60, 2 (November 2004), 91-110. https://doi.org/10.1023/B:VISI.0000029664.99615.94
  2. Herbert Bay, Andreas Ess, Tinne Tuytelaars, and Luc Van Gool. 2008. Speeded-Up Robust Features (SURF). Comput. Vis. Image Underst. 110, 3 (June 2008), 346-359. https://doi.org/10.1016/j.cviu.2007.09.014
  3. Stein, A. N. & Hebert, M. (2005). Incorporating Background Invariance into Feature-Based Object Recognition.. WACV/MOTION (p./pp. 37-44), : IEEE Computer Society. ISBN: 0-7695-2271-8 WACV/ MOTIONS, vol. 1, jan. 2005, pp. 37 .44.
  4. S. Kim, K.-J. Yoon, and I.-S. Kweon, "Object recognition using a generalized robust invariant feature and gestalt's law of proximity and similarity," Pattern Recognition, vol. 41, no. 2, pp. 726.741, 2008.
  5. J. Stuckler and S. Behnke, "Combining depth and color cues for scaleand viewpoint-invariant object segmentation and recognition using random forests," in IROS, oct. 2010, pp. 4566 .4571.
  6. A. Bar-Hillel, D. Hanukaev, and D. Levi, "Fusing visual and range imaging for object class recognition," in Computer Vision (ICCV), 2011 IEEE International Conference on, nov. 2011, pp. 65 .72.
  7. K. Saenko, S. Karayev, Y. Jia, A. Shyr, A. Janoch, J. Long, M. Fritz, and T. Darrell, "Practical 3-d object detection using category and instance-level appearance models," in IROS, sept. 2011, pp. 793.800.
  8. G. R. Bradski, "Computer vision face tracking for use in a perceptual user interface," 1998.
  9. E. R. Dougherty, "Probability and statistics for the engineering, computing and physical sciences," 1990.
  10. Lai, K.; Liefeng Bo; Xiaofeng Ren; Fox, D., "A large-scale hierarchical multi-view RGB-D object dataset," Robotics and Automation (ICRA), 2011 IEEE International Conference on , vol., no., pp.1817,1824, 9-13 May 2011 doi: 10.1109/ICRA.2011.5980382
  11. Martin A. Fischler and Robert C. Bolles. 1981. Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography. Commun. ACM 24, 6 (June 1981)
  12. Choi, S.; Kim, T. & Yu, W. (2009), Performance Evaluation of RANSAC Family., in 'BMVC' , British Machine Vision Association.