• 제목/요약/키워드: statistical romanization

검색결과 1건 처리시간 0.017초

한글-로마자 인명 변환의 통계적 순위 추천 시스템 (Statistical Ranking Recommendation System of Hangul-to-Roman Conversion for Korean Names)

  • 이정훈;김민호;권혁철
    • 정보과학회 논문지
    • /
    • 제44권12호
    • /
    • pp.1269-1274
    • /
    • 2017
  • 본 논문에서는 한글-로마자 인명 변환을 다루며, 기존에 사용되고 있는 다양한 표기를 인정하고 인명 변환의 사용 빈도에 따라 결과를 제공함을 목표로 한다. 한글-로마자 인명 표기가 다양해진 이유는 크게 두 가지이다. 첫째로 국내외에서 만들어진 다양한 표기법의 무분별한 사용이며, 둘째로 현행표기법에서의 관습적인 표기를 허용하기 때문이다. 이런 이유로 한글 인명 하나에도 다양한 로마자 표기가 가능해졌다. 시스템에서는 400만 명의 인명 데이터를 통계 사전으로 구축하여 변환한다. 첫 단계에서는 성씨의 매칭과정을 통해 인명 유무를 판단하고, 두 번째 단계에서는 이름 전체를 통계사전에서 비교하여 변환한다. 마지막 단계에서는 이름의 음절을 비교 후 변환하여 결과를 사용 빈도에 따라 순위로 제공한다. 본 논문에서는 기존의 웹에서 서비스 중인 시스템과 비교하여 성능을 측정하였으며, 타 시스템에 비해서 다소 높은 성능을 보였다.