Combined Image Retrieval System using Clustering and Condensation Method

클러스터링과 차원축약 기법을 통합한 영상 검색 시스템

  • Lee Se-Han (Mobile Handset R&D Center, Mobile Communication Company, LG Electronics Inc.) ;
  • Cho Jungwon (Department of Computer Education, Cheju National University) ;
  • Choi Byung-Uk (Division of Information and Communications, Hanyang University)
  • 이세한 (LG전자 MC 사업본부 단말연구소) ;
  • 조정원 (제주대학교 컴퓨터교육과) ;
  • 최병욱 (한양대학교 정보통신대학)
  • Published : 2006.01.01

Abstract

This paper proposes the combined image retrieval system that gives the same relevance as exhaustive search method while its performance can be considerably improved. This system is combined with two different retrieval methods and each gives the same results that full exhaustive search method does. Both of them are two-stage method. One uses condensation of feature vectors, and the other uses binary-tree clustering. These two methods extract the candidate images that always include correct answers at the first stage, and then filter out the incorrect images at the second stage. Inasmuch as these methods use equal algorithm, they can get the same result as full exhaustive search. The first method condenses the dimension of feature vectors, and it uses these condensed feature vectors to compute similarity of query and images in database. It can be found that there is an optimal condensation ratio which minimizes the overall retrieval time. The optimal ratio is applied to first stage of this method. Binary-tree clustering method, searching with recursive 2-means clustering, classifies each cluster dynamically with the same radius. For preserving relevance, its range of query has to be compensated at first stage. After candidate clusters were selected, final results are retrieved by computing similarities again at second stage. The proposed method is combined with above two methods. Because they are not dependent on each other, combined retrieval system can make a remarkable progress in performance.

본 논문에서는 전체 차원으로 데이터베이스 내의 모든 영상에 대해 순차적인 검색을 했을 때의 상세 검색 결과와 동일한 적합성을 유지하면서 검색 속도를 훨씬 더 향상시킬 수 있는 통합 검색 시스템을 제안한다. 통합 검색 시스템은 적합성을 유지하는 서로 다른 두 독립적인 시스템이 병합되어 있다. 하나는 특징 벡터 차원 축약을 이용한 2단계 검색 시스템이고 나머지 하나는 이진 트리 클러스터링을 이용한 2단계 검색 시스템이다. 각각의 방법은 1단계에서 상세 검색에서의 검색 결과를 항상 포함하는 후보 영상들을 추출하고, 추출된 후보 영상들을 대상으로 2단계 검색에서 전체 차원으로 재 검색을 한다 그러므로 각 방법과 통합 검색 방법은 모두 상세 검색을 수행했을 때와 동일한 검색 결과를 얻게 된다. 특징 벡터 차원 축약을 이용한 2단계 검색 방법은 Cauchy- Schwartz 부등식의 성질을 이용하여 특징 벡터를 차원 축약하여 검색에 사용하는 방법이다. 이때 전체 검색 시간을 최소로 하는 최적 차원 축약율이 존재하게 되고, 이를 후보 영상 추출을 위한 1차 검색에 적용하게 된다. 이진 트리 클러스터링을 이용한 2단계 검색 방법은 재귀적인 2-means 클러스터링을 통해 각 클러스터의 반경이 동일하게 동적으로 분할하는 방법이다. 동일한 적합성 유지를 위해 유사도 기준이 보정된 질의를 통해 1단계 검색에서 후보 클러스터를 추출하고, 2단계 검색에서 후보 클러스터 내의 영상을 대상으로 최종 결과 영상들을 얻게 된다. 통합 검색 방법은 위의 두 검색 방법을 통합한 것으로 서로 독립적인 두 방법을 동시에 적용함으로써 검색 시스템의 성능을 훨씬 더 향상시킬 수 있다 제안하는 방법은 상세 검색의 적합성을 유지하면서도 검색 속도를 훨씬 더 향상시킬 수 있음이 실험을 통해 입증되었다.

Keywords

References

  1. B.S. Manjunath, Philippe Salembier, Thomas Silora, Introduction to MPEG-7 Multimedia Content Description Interface, John Willy & Sons Ltd., 2002
  2. http;//www.lgcit.com/MIGR/cmip/hmmd/hmmd.html
  3. H. Samet, The Design and Analysis of Spatial Data Structures, Addison Wesley, 1989
  4. J. Barros, J. French, W. Martin, P. Kelley, and M. Cannon, 'Using the Triangle Inequality to reduce the number of comparisons required for Similarity-based Retrieval,' In IS&T/SPIE-Storage and Retrieval for Still Image and Video Databases, volume IV, Jan. 1996
  5. Andrew Berman and Linda G. Shapiro, 'Selecting Good Keys for Triangle-Inequality-Based Pruning Algorithms,' In IEEE International Workshop on Content-based Access of Image and Video Databases, 1997 https://doi.org/10.1109/CAIVD.1998.646029
  6. Benjamin Bustos, Gonzalo Navarro, Edgar Chavez, 'Pivot Selection Techniques for Proximity Searching in Metric Spaces,' In Proc. of the XXI Conference of the Chilean Computer Science Society (SCCC'01), pp 33-40. IEEE CS Press, 2001 https://doi.org/10.1109/SCCC.2001.972629
  7. Vittorio Castelli, Lawrence D. Bergman, Image Databases Search and Retrieval of Digital Imagery, John Wiley & Sons Inc., 2002
  8. B.Y. Bonnlander and AS. Weigend, 'Selecting input variables using mutual information and nonparametric density estimation,' Proceedings of International Symposium on Artificial Neural Networks, ISANN94, Tainan, Taiwan, December 15-17, pp. 312- 321, 1994
  9. M. Beatty and B.S. Manjunath, 'Dimensionality reduction using multidimensional scaling for content-based retrieval,' Proceedings of IEEE International Conference Image Processing, ICIP '97 Santa Barbara, Calif., pp. 835-838, October 1997 https://doi.org/10.1109/ICIP.1997.638626
  10. C. Faloutsos and K.-I. Lin, 'FastMap: a fast algorithm for indexing, data-mining, and visualization of traditional and multimedia data sets,' Proceedings of 1995 ACM SIGMOD International Conference on Management of Data, San Jose, Calif., pp. 163-174, May 1995
  11. A Califano and R. Mohan, 'Multidimensional indexing for recognizing visual shapes,' Proceedings of IEEE Computer Vision and Pattern Recognition, CVPR '91, pp. 28-34, June 1991 https://doi.org/10.1109/CVPR.1991.139656
  12. H. Wolfson, 'Model-based object recognition by geometric hashing,' Proceedings of 1st European Conference Computer Vision, Antibes, France, pp. 526-536, April 1990
  13. 이근섭, '웨이블릿 변환을 이용한 객체 기반의 이미지 검색 시스템,' 한양대학교 석사학위논문, 2001
  14. 조정원, 최병욱, '특징벡터의 차원축약 기법을 이용한 2단계 내용기반 이미지검색 시스템,' 한국통신학회논문지, 제28권, 제7C호, pp. 719-725. 2003. 7
  15. Jung-Won Cho, Seung-Do Jeong, Geun-Seop Lee, Sung-He Cho, and Byung-Uk Choi, 'A New Fast Image Retrieval Using the Condensed Two-stage Search Method,' IEICE Trans. on Commun., Vol. E86-B, No. 12, December 2003
  16. 이세한, 이주호, 조정원, '영상 검색의 속도 향상을 위한 차원 축소율 최적화,' 대한전자공학회 하계종합학술대회 논문집, 제26권 제 1호, pp. 1515-1518, 2003
  17. 조정원, 최병욱, '특징벡터의 클러스터링 기법을 통한 2단계 내용기반 이미지검색 시스템,' 전자공학회논문지, 제40권, CI편 제3호, pp. 45-54, 2003. 5
  18. Kishan Mehrotra, Chilukuri K. Mohan and Sanjay Ranka, Elements of Artificial Neural Networks, The MlT press, 1997
  19. D.E. Rumelhart and D. Zipser., 'Feature discovery by competitive learning,' Cognitive Science, 9:75-112, 1985 https://doi.org/10.1207/s15516709cog0901_5
  20. L, Xu, A. Krzyzak, and W. Oia., 'Rival penalized competitive learning for clustering analysis, RBF net, and curve detection,' IEEE trans. on Neural Networks, 4(4):636-649, 1993 https://doi.org/10.1109/72.238318
  21. P.N. Yianilos., 'Data structures and algorithms for nearest neighbor search in general metric spaces,' Proc. of the 4th Annual ACM-SIAM Symp. on Discrete Algorithms, pp. 311-321, 1993
  22. Yong Rui, Thomas S. Huang, and Shih-Fu Chang, 'Image Retrieval: Current Techniques, Promising Directions and Open Issues,' Journal of Visual Communication and Image Representation, Vol. 10, no. 4, pp. 39-62, April 1999 https://doi.org/10.1006/jvci.1999.0413
  23. Alberto Del Bimbo, Visual Information Retrieval, Morgan Kaufmann Inc., 1999