Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2002.10e
- /
- Pages.40-46
- /
- 2002
- /
- 2005-3053(pISSN)
Word Alignment Using Chinese-Korean Linguistic Contrastive Information
중-한 대조분석정보를 이용한 단어정렬
- Li, Jin-Ji ;
- Kim, Dong-Il ;
- Lee, Jong-Hyeok (Department of Computer Science and Engineering, Division of Electrical and Computer Engineering, Pohang University of Science and Technology, and Advanced Information Technology Research Center(AITrc))
- 리금희 (중국 길림성 연길시 연변과학기술대학교) ;
- 김동일 (중국 길림성 연길시 연변과학기술대학교) ;
- 이종혁 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과, 첨단정보기술 연구센터)
- Published : 2002.10.11
Abstract
본 논문에서는 범용 병렬코퍼스에서도 적용할 수 있는 단어정렬의 방법을 제안한다. 단어 단위로 정렬된 병렬코퍼스는 자연언어처리의 다양한 분야에 도움을 준다. 예를 들면 변환기반의 기계번역에서 변환패턴의 구축, MWTU(Multi Word Translation Unit)의 자동추출, 사전 구축, 의미 중의성 해소 등 분야에 적용된다. 중한 병렬 코퍼스의 단어정렬은 서로 다른 어족간의 관계의 규명을 포함하고 있기 때문에 본 논문에서는 통계적인 모델보다 중한 대역어 사전, 단일어 시소러스, 품사정보 및 언어학적 대조분석 정보 등 기존에 있는 리소스를 이용하여 재현율과 정확률을 높이는 방법에 대해 제시한다. 성능 평가를 위해 중앙일보에서 임의로 추출한 500개 대응문장을 이용하여 실험한 결과 82.2%의 정확률과 64.8%의 재현율을 보였다.
Keywords