Improved Information Retrieval System Using Multi word Based On Association Ratio

연관률 기반 복합어를 이용한 개선된 정보검색 시스템

  • 이병희 (아주대학교 정보통신 전문대학원) ;
  • 최종필 (아주대학교 정보 및 컴퓨터 공학부) ;
  • 박승규 (아주대학교 정보통신 전문대학원) ;
  • 김민구 (아주대학교 정보 및 컴퓨터 공학부)
  • Published : 2004.10.01

Abstract

복합어의 추출은 정보 검색 및 온톨로지 분야의 연구에 있어서 중요한 비중을 차지하고 있다. 이 분야의 연구는 언어학적인 필터링 및 통계적 기법에 기반 한 연구와 최근의 문맥정보 및 사전 점보를 이용하는 기법 등으로 구분될 수 있다. 복합어를 정보 검색 및 온톨로지 분야에 응용하기 위해서는 복합어의 정확한 추출뿐만 아니라 그 복합어가 문서를 표현할 수 있는 정도를 측정하는 기법이 필요하다. 특히 정보검색 분야에서는 추출된 복합어에 대해 어떻게 가중치를 부여할 것인 가가 중요한 문제이다. 본 논문에서는 연관률(Association Ratio)에 기반 하여 복합어를 추출하고, 추출된 복합어에 대친 적절한 가중치를 부여함으로써 검색 시스템의 성능을 향상시킬 수 있는 방법을 제안한다.

Keywords