Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)
- 2002.04b
- /
- Pages.502-504
- /
- 2002
- /
- 1598-5164(pISSN)
Target Word Selection using Word Similarity based on Latent Semantic Structure in English-Korean Machine Translation
잠재의미구조 기반 단어 유사도에 의한 역어 선택
Abstract
본 논문에서는 대량의 말뭉치에서 추출된 잠재의미에 기반하여 단어간 유사도를 측정하고 이를 영한 기계 번역에서의 역어선택에 적용한다. 잠재의미 추출을 위해서는 latent semantic analysis(LSA)와 probabilistic LSA(PLSA)를 이용한다. 주어진 단어의 역어 선택시 기본적으로 연어(collocation) 사전을 검색하고, 미등록 단어의 경우 등재된 단어 중 해당 단어와 유사도가 높은 항목의 정보를 활용하며 이 때
Keywords