한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)
- 한국정보처리학회 2013년도 춘계학술발표대회
- /
- Pages.307-310
- /
- 2013
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
이국어 병렬말뭉치와 중간언어를 활용한 이국어 사전 자동구축
Automatic bilingual lexicon construction via bilingual parallel corpus and pivot language
- Seo, Hyeong-Won (Dept of Computer Science, Korea Maritime University) ;
- Kwon, Hong-Seok (Dept of Computer Science, Korea Maritime University) ;
- Kim, Jae-Hoon (Dept of Computer Science, Korea Maritime University)
- 발행 : 2013.05.10
초록
본 논문은 한국어-스페인어와 한국어-불어 간의 양방향 이국어 사전(Bi-directional bilingual lexicon)을 자동으로 구축하기 위한 새로운 방법을 제안한다. 일반적으로 한국어와 스페인어/불어 간의 병렬 말뭉치를 직접적으로 구축하기에는 어려움에 따르기 때문에, 영어를 중심언어로 하는 영어(EN)-한국어(KR)/스페인어(ES)/불어(FR) 병렬 말뭉치를 이용하여 문맥 벡터를 만들고 그들 간의 유사도를 계산하는 변형된 문맥 벡터 방법을 제안한다. 영어는 다른 언어와의 이국어 병렬 말뭉치가 비교적 많이 공개되어 있기 때문에 이 방법을 이용하면 비교적 쉽게 KR-ES와 KR-FR 양방향 이국어 사전을 구축할 수 있다. 본 논문에서 제안한 방법으로 실험해본 결과 최고 85%(ES
키워드