• 제목/요약/키워드: 한글-로마자 인명 변환

검색결과 3건 처리시간 0.021초

한글-로마자 인명 변환의 통계적 순위 추천 시스템 (Statistical Ranking Recommendation System of Hangul-to-Roman Conversion for Korean Names)

  • 이정훈;김민호;권혁철
    • 정보과학회 논문지
    • /
    • 제44권12호
    • /
    • pp.1269-1274
    • /
    • 2017
  • 본 논문에서는 한글-로마자 인명 변환을 다루며, 기존에 사용되고 있는 다양한 표기를 인정하고 인명 변환의 사용 빈도에 따라 결과를 제공함을 목표로 한다. 한글-로마자 인명 표기가 다양해진 이유는 크게 두 가지이다. 첫째로 국내외에서 만들어진 다양한 표기법의 무분별한 사용이며, 둘째로 현행표기법에서의 관습적인 표기를 허용하기 때문이다. 이런 이유로 한글 인명 하나에도 다양한 로마자 표기가 가능해졌다. 시스템에서는 400만 명의 인명 데이터를 통계 사전으로 구축하여 변환한다. 첫 단계에서는 성씨의 매칭과정을 통해 인명 유무를 판단하고, 두 번째 단계에서는 이름 전체를 통계사전에서 비교하여 변환한다. 마지막 단계에서는 이름의 음절을 비교 후 변환하여 결과를 사용 빈도에 따라 순위로 제공한다. 본 논문에서는 기존의 웹에서 서비스 중인 시스템과 비교하여 성능을 측정하였으며, 타 시스템에 비해서 다소 높은 성능을 보였다.

한국어 음운 현상과 단어 유형을 고려한 한글-로마자 변환 시스템 구현 (An Implementation of Hangul Romanization System Based on Korean Phonotactic Rules and Categories of Words)

  • 박수호;김광영;;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.376-378
    • /
    • 2001
  • 본 논문은 새로 개정된 국어의 로마자 표기법(2000.7.7. 고시)에 따른 로마자 자동 변한 시스템의 구조와 변환 알고리즘을 제시한다. 특히 새 로마자 표기에 따른 규칙을 반영하여 사용자가 쉽고 편리하게 사용할 수 있도록 인명, 고유명사, 행정구역, 일반, 학술응용의 5개 항목으로 나누어 변환할 수 있게 했다. 또한 로마자표기에 적용한 표준 한글 음운변동 규칙과 로마자 표기의 원칙에 따른 5가지 변환 규칙을 도움말로 보여준다. 그리고 로마자 표기 원칙에 따라 발음상 혼동의 우려가 있는 부호의 규칙성을 조사하여 로마자 자동 변한 시스템에 적용함으로써 새 로마자 표기에서 발생할 수 있는 혼동을 제거하여 로마자 변환 시스템의 정확성을 높였다.

  • PDF

한글 로마자 자동 표기 시스템 설계 및 구현 ( 전사법(轉寫法) 기계적 변환에 관한 연구 ) (The design and implementation of automatic translation system for hangul's romanization ( A study on mechanic conversion using transcription ))

  • 김홍섭;박종섭;이현걸
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.437-447
    • /
    • 1993
  • 국제 협약에 따라 한글에 관한 정보는 로마자로 표기해야 한다. 우리나라는 1959년 2월 로마자 표기법'을 제정, 수차례 개정을 통해 1983년 6월 문교부(Ministry Of Education)안을 발표했으나, 표지판, 역명, 교과서, 공공문서들에서 활용되었지만, 영자신문, 외국 학술지등은 M-R( Mccune-Reishauer ) 표기법을, 인명, 신문 및 방송매체 등은 혼합표기방식을 사용함으로써 인(人). 지명(地名), ID, 대표어등 정보 검색시 혼란을 야기시켰고, 개정안에 따를 표기 정정으로 수백억원에 가까운 예산을 낭비하였으며, 최근 ISO(International Standard Organization)에서는 남북한 단일화 및 기계적 변환을 요구하고 있으나, 반달표 표기곤란, 편리성 결여, 북한의 주장등의 사유로 제정등을 거론하고 있는 실정에 있다. 잘 쓰지 않는 ASCII 코드 중에서 반달점 폰트를 제작하고 단어, 문장, 문서를 STRING으로 받아 알고리즘화된 음운법칙을 적용하여 소리글자로 변환하고 MOE테이블에서 대응글자를 참조하여 기계적 변환이 가능하도록 하였으며, 세련된 디자인, 풀다운 팝업방식을 채택, 2HD 1장으로 국내최초로 개발하였다.

  • PDF