한국인지과학회:학술대회논문집 (Proceedings of the Korean Society for Cognitive Science Conference)
- 한국인지과학회 2000년도 한글 및 한국어 정보처리
- /
- Pages.309-314
- /
- 2000
자동 정렬을 통한 영한 복합어의 역어 추출
Extraction of English-Korean Compound Noun Translation through Automatic Alignment Method
초록
본 논문에서는 양국어로 된 병렬 코퍼스로부터 복합어의 역어를 추출하기 위한 정렬 방법을 제시한다. 여기에서는 개념어에 대한 양국어 공기정보를 사용하여 기본 정렬을 하고, 인접한 개념어로 정렬의 단위를 확장했다. 또한 재추정 기법을 사용하여 대역 확률을 계산함으로써 보다 높은 정확률을 얻을 수 있었다. 본 논문에서 제안한 방법을 적용하여 139,265개의 영어 어절로 이루어진 우루과이 라운드 영한 병렬 코퍼스에 대해서 실험한 결과 2,290개의 대역어쌍을 얻었고, 그 정확률은 74%였다.
키워드