Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)
- 2005.07b
- /
- Pages.448-450
- /
- 2005
- /
- 1598-5164(pISSN)
Korean-Japanese Cross Lingual Information Retrieval Based on Bi-gram Indexing
바이그램 색인에 기반한 한-일 교차언어검색
- Lee Gyu-Chan (Knowledge & Language Engineering Lab, Pohang University of Science and Technology) ;
- Kang In-Su (Knowledge & Language Engineering Lab, Pohang University of Science and Technology) ;
- Na Seung-Hoon (Knowledge & Language Engineering Lab, Pohang University of Science and Technology) ;
- Lee Jong-Hyeok (Knowledge & Language Engineering Lab, Pohang University of Science and Technology)
- 이규찬 (포항공과대학교 지식 및 언어공학 연구실) ;
- 강인수 (포항공과대학교 지식 및 언어공학 연구실) ;
- 나승훈 (포항공과대학교 지식 및 언어공학 연구실) ;
- 이종혁 (포항공과대학교 지식 및 언어공학 연구실)
- Published : 2005.07.01
Abstract
교차언어검색 시스템은 다양한 언어자원을 필요로 한다. 여기서는 한-일 대역어 사전과 일본어 문서의 바이그램 색인만을 이용해서 교차언어검색을 수행하는 방법을 제시한다. 한국어로 된 자연어 질의에서 형태소분석기 등의 도움 없이 간단하게 일본어 대역어 리스트를 생성할 수 있는 방법과, 검색의 성능을 올릴 수 있도록 대역어에 가중치를 부여하는 방법을 제안한다. 그리고 실험을 통해 제시한 방법을 평가하고 분석한다.
Keywords