Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2017.10a
- /
- Pages.67-70
- /
- 2017
- /
- 2005-3053(pISSN)
Roman-to-Korean Conversion System for Korean Company Names Based on Sequence-to-sequence learning
Sequence-to-sequence 모델을 이용한 로마자-한글 상호(商號) 표기 변환 시스템
- Kim, Tae-Hyun (SaraminHR, SaraminLAB) ;
- Jung, Hyun-Guen (SaraminHR, SaraminLAB) ;
- Kim, Jae-Hwa (SaraminHR, SaraminLAB) ;
- Kim, Jeong-Gil (SaraminHR, SaraminLAB)
- Published : 2017.10.13
Abstract
상호(商號)란 상인이나 회사가 영업 활동을 위해 자기를 표시하는데 쓰는 명칭을 말한다. 일반적으로 국내 기업의 상호 표기법은 한글과 로마자를 혼용함으로 상호 검색 시스템에서 단어 불일치 문제를 발생시킨다. 본 연구에서는 이러한 단어 불일치 문제를 해결하기 위해 Sequence-to-sequence 모델을 이용하여 로마자 상호를 이에 대응하는 한글 상호로 변환하고 그 후보들을 생성하는 시스템을 제안한다. 실험 결과 본 연구에서 구축한 시스템은 57.82%의 단어 정확도, 90.73%의 자소 정확도를 보였다.