한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)
- 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
- /
- Pages.21-31
- /
- 1996
- /
- 2005-3053(pISSN)
통계적 명사패턴 분류를 이용한 복합명사 검색 모델
A Compound Term Retrieval Model Using Statistical Noun-Pattern Categorization
- Park, Young-C. (Dept. of Computer Science Koread Advanced Institute of Science and Technology) ;
- Choi, Key-Sun (Dept. of Computer Science Koread Advanced Institute of Science and Technology)
- 발행 : 1996.10.11
초록
복합명사는 한국어에서 가장 빈번하게 나타나는 색인어의 한 형태로서, 영어권 중심의 정보검색 모델로는 다루기가 어려운 언어 현상의 하나이다. 복합명사는 2개 이상의 단일어들의 조합으로 이루어져 있고, 그 형태 또한 여러 가지로 나타나기 때문에 색인과 검색의 큰 문제로 여겨져 왔다. 본 논문에서는 복합명사의 어휘적 정보를 단위명사들의 통계적 행태(statistical behavior)에 기반 하여 자동 획득하고, 이러한 어휘적 정보를 검색에 적용하는 모텔을 제시하고자 한다. 본 방법은 색인시의 복합명사 인식의 어려움과 검색시의 형태의 다양성을 극복하는 모델로서 한국어를 포함한 동양권의 언어적 특징을 고려한 모델이다.
키워드