An Empirical Study of Base Pivot Choosing Method for Approximate Word Searching

근사 단어 검색 효율성 개선을 위한 기준 Pivot 선택방법 실험적 연구

  • Yoon, Tai-Jin (Pusan National University Dept of Computer Science & Engineering) ;
  • Chung, Woo-Keun (Pusan National University Dept of Computer Science & Engineering) ;
  • Cho, Hwan-Gue (Pusan National University Dept of Computer Science & Engineering)
  • 윤태진 (부산대학교 정보컴퓨터공학부) ;
  • 정우근 (부산대학교 정보컴퓨터공학부) ;
  • 조환규 (부산대학교 정보컴퓨터공학부)
  • Published : 2010.06.30

Abstract

한글 근사 단어 검색 시스템은 사용자의 오류를 포함한 검색 질의에 효과적으로 대응할 수 있는 방법이나 검색 속도가 매우 느려서 실제 사용에 큰 어려움이 있다. 일반적으로 DNA 검색에 사용하는 서열 정렬 기법을 사용할 경우 데이터 베이스의 모든 문자열과 비교가 이루어져야 하기 때문에 많은 검색 시간이 걸리게 된다. 이것을 해결하기 위해 우리는 편집거리가 metric space를 만족하는 성질을 이용한 한글 근사단어 검색 시스템을 사용하여 실제 서열정렬을 사용하여 비교가 필요한 후보 단어를 거르게 된다. 이 한글 근사 단어 검색 시스템에서 가장 중요한 것은 기준축의 역할을 하는 Base-Pivot의 선택 방법이다. 본 논문에서는 이 Base-Pivot의 효율적인 선택방법을 실험을 통해서 분석하도록 한다.

Keywords