• 제목/요약/키워드: 한글로마자

검색결과 37건 처리시간 0.024초

Sequence-to-sequence 모델을 이용한 로마자-한글 상호(商號) 표기 변환 시스템 (Roman-to-Korean Conversion System for Korean Company Names Based on Sequence-to-sequence learning)

  • 김태현;정현근;김재화;김정길
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.67-70
    • /
    • 2017
  • 상호(商號)란 상인이나 회사가 영업 활동을 위해 자기를 표시하는데 쓰는 명칭을 말한다. 일반적으로 국내 기업의 상호 표기법은 한글과 로마자를 혼용함으로 상호 검색 시스템에서 단어 불일치 문제를 발생시킨다. 본 연구에서는 이러한 단어 불일치 문제를 해결하기 위해 Sequence-to-sequence 모델을 이용하여 로마자 상호를 이에 대응하는 한글 상호로 변환하고 그 후보들을 생성하는 시스템을 제안한다. 실험 결과 본 연구에서 구축한 시스템은 57.82%의 단어 정확도, 90.73%의 자소 정확도를 보였다.

  • PDF

한글-로마자 인명 변환의 통계적 순위 추천 시스템 (Statistical Ranking Recommendation System of Hangul-to-Roman Conversion for Korean Names)

  • 이정훈;김민호;권혁철
    • 정보과학회 논문지
    • /
    • 제44권12호
    • /
    • pp.1269-1274
    • /
    • 2017
  • 본 논문에서는 한글-로마자 인명 변환을 다루며, 기존에 사용되고 있는 다양한 표기를 인정하고 인명 변환의 사용 빈도에 따라 결과를 제공함을 목표로 한다. 한글-로마자 인명 표기가 다양해진 이유는 크게 두 가지이다. 첫째로 국내외에서 만들어진 다양한 표기법의 무분별한 사용이며, 둘째로 현행표기법에서의 관습적인 표기를 허용하기 때문이다. 이런 이유로 한글 인명 하나에도 다양한 로마자 표기가 가능해졌다. 시스템에서는 400만 명의 인명 데이터를 통계 사전으로 구축하여 변환한다. 첫 단계에서는 성씨의 매칭과정을 통해 인명 유무를 판단하고, 두 번째 단계에서는 이름 전체를 통계사전에서 비교하여 변환한다. 마지막 단계에서는 이름의 음절을 비교 후 변환하여 결과를 사용 빈도에 따라 순위로 제공한다. 본 논문에서는 기존의 웹에서 서비스 중인 시스템과 비교하여 성능을 측정하였으며, 타 시스템에 비해서 다소 높은 성능을 보였다.

문화속의 과학 - 간편하고 능률적인 표기법은 국제정보통신용 로마자를

  • 이현복
    • 과학과기술
    • /
    • 제32권4호통권359호
    • /
    • pp.12-12
    • /
    • 1999
  • 로마자 표기법은 우리말을 한글이 아닌 로마자로 적는 법을 말한다. 현재 우리가 쓰고 있는 로마자 표기법은 발음 위주의 표기를 하고 부호가 잡다하여 컴퓨터로 쉽게 입력할 수 없는 단점을 갖고 있다. 그래서 필자는 간편하고 능률적인 국제 정보통신용 로마자 표기법을 제안한다.

  • PDF

한글의 로마자표기법과 한글 정보자원 목록업무에 관한 연구 (A Study on the Korean Romanization Systems and Cataloging Korean Information Resources)

  • 오경묵
    • 한국도서관정보학회지
    • /
    • 제36권4호
    • /
    • pp.27-44
    • /
    • 2005
  • 현재 정부의 표준로마자 표기 방식인 문화관광부(2000)표기법은 도서관사회에서 대부분 이용자들은 아직 익숙치 못한 방식인 반면에, 국제적으로 학계 및 도서관이용자들에게 잘 알려져 있는 표기는 Mccune-Reischauer 표기방식이라고 할 수 있다. 한글로마자표준이 전환되는 것이 정부의 방침에도 불구하고 국내$\cdot$외 도서관계에 그동안 변환문제가 꾸준하게 제기되고 논의되었어도 이를 구체화시키기에는 실질적으로 여러 가지 난제가 있다. 새로운 표기방식이 학계 및 정보서비스 업계에 도입되기 위해서는 표기법의 변천과정과 각 표기법의 특징, 한국서지목록작성 상의 여러 가지 문제점 등에 대한 충분한 이해가 선행되어야 함으로 이러한 사항들을 중점적으로 연구하였다.

  • PDF

다중 언어 인명 검색에 관한 연구 (A Study on a Multilingual name Retrieval)

  • 조영화;송재용;류근호
    • 한국정보처리학회논문지
    • /
    • 제5권9호
    • /
    • pp.2271-2280
    • /
    • 1998
  • 이 논문은 로마자 표기 한글 인명의 효율적 검색 방안의 제시와 규칙기반 다중 언어 인명 검색 시스템의 설계에 관한 것이다. 기존의 서지 정보 검색 시스템이나 논문 검색 시스템에서 사람마다 제각기 표기되고 있는 로마자표기 한글 인명을 효율적으로 검색하는데 상당한 어려움이 따랐다. 예를 들어, 한글 인명 "홍길동"의 로마자 표기는 "Hong, gildong", "Gildong Hong", "Hong Kil dong", "Hong kil-dong"등 철자나 표기 양식이 매우 다양하다.이 논문에서는 이렇게 다양하게 표기되는 로마자 표기 한글 인명을 효율적으로 검색하기 위해 규칙기반을 이용한 질의 확장법을 제안하고 질의분류기, 예외처리기, 질의확장기, 질의실행기, 예외규정집, 규칙기반으로 구성된 다중 언어 인명 검색 시스템을 설계한다. 또한 인명생성기의 구현과 실행을 통해 규칙기반 질의 확장법의 효율적 검색 가능성을 보이도록 한다.

  • PDF

한국인명의 로마자표기 형식에 대한 연구 (A Research on the Format for Romanization of Korean Personal Name)

  • 김성원;김정우
    • 정보관리연구
    • /
    • 제43권2호
    • /
    • pp.199-222
    • /
    • 2012
  • 한국인들의 국제활동 증대에 따라 외국인들과의 접촉이 증가하였으며 활동의 주체인 한국인 개인을 외국인이 식별해야 하는 필요가 증대되고 있다. 개인을 식별해주는 것은 개인의 이름(personal name)이며, 한글(Hangeul, Korean alphabet)을 모르는 외국인이 한국인을 식별할 수 있도록 하려면 한국인명을 로마자로 표기하는 음성번역(phonetic translation)이 필요하다. 한국인명의 로마자표기 실태를 보면 다양한 형식이 혼용되고 있어 혼돈이 벌어지고 있다. 한국인명을 로마자로 표기하는 과정에서 발생하는 혼돈은 크게 한국인명을 표기하기 위한 로마자 자모의 선택과 표기형식의 상이함에서 비롯된다. 본 연구는 한국인명의 로마자표기를 위한 형식을 검토하여 최적안을 제안하는 것을 목적으로 하였다. 이를 위해 한국과 서구간의 인명 구조와 사용관행의 차이를 살펴보고, 한국인명의 로마자표기의 의미와 관련쟁점을 정리하였으며, 현재 사용되고 있는 다양한 표기형식을 유형화하였다. 이를 기반으로 한국인명의 로마자표기에 사용되고 있는 다양한 형식을 검토하고 최적안이라 판단되는 표기형식을 제안하였다.

한국어 로마자 변환기 개발에 관한 연구 (Development of Romanization System of Korean)

  • 윤방원;정태충
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.378-380
    • /
    • 2000
  • 본 논문은 한국어 로마자의 표준안 확립을 위하 로마자 변환 테이블을 정리 및 종합하고 이를 실제 변환기로 개발하는데 필요한 과정에 대해 기술하였다. 테이블 구성을 위해 국어의 표준 발음의 전체 구성을 분석하고, 불필요한 규칙이 있거나 없을 경우의 규칙을 추가, 삭제하여, 상충이 있을 경우 우선 순위에 의해 규칙을 선택하여 규칙을 수정하여 적용하였다. 이렇게 생성된 표준 발음 테이블은 한글을 받아 적용한 수 표기별 자음과 모음의 테이블을 통해 로마자로 변환한다. 일관성 없는 규칙, 표준화의 설득력 및 홍보의 미숙등과 같은 과제로 활용의 예가 적었던 한국어 로마자 변환기는 공공기관의 지명 및 문화재 로마자의 표준화 등에 사용될 수 있으며, 인터넷을 통한 웹 로마자 사전 제작을 통하여 표준화의 문제에 가장 중요한 객관적인 지표로서 활용될 수 있다.[3]

  • PDF

국어 로마자 전사표기 웹 컴포넌트 설계 및 구현 (The design and implementation of Web Component for Korean to Roman transcription)

  • 김홍섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제9권4호
    • /
    • pp.71-76
    • /
    • 2004
  • 개정된 국어 로마자 표기법의 기계적 변환을 위하여 웹 기반하의 컴포넌트를 설계하고 구현하였다. 특히 음운법칙을 적용하여 소리글자로 변환 후 로마자 표기로 자동 변환하는 과정과 전사법 변환에 관한 알고리즘을 제시한다. 컴포넌트는 웹 서버의 스크립트 메커니즘에 의해 작동하도록 하였고, 예외어 사전 등은 웹 서버 내부 혹은 외부에서 지원하는 보조 기능으로 설계하였으며, 전체적인 시스템 구조는 UML 명세서와 의사 코드를 이용하여 작성하였다. 제안된 구조는 웹 컴포넌트 형태의 캡슐화 서비스를 제안함으로써 소프트웨어 개발의 경제성, 라이브러리 재사용 및 확장성 등을 향상시킬 수 있을 것으로 기대된다.

  • PDF

한글 로마자 자동 표기 시스템 설계 및 구현 ( 전사법(轉寫法) 기계적 변환에 관한 연구 ) (The design and implementation of automatic translation system for hangul's romanization ( A study on mechanic conversion using transcription ))

  • 김홍섭;박종섭;이현걸
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.437-447
    • /
    • 1993
  • 국제 협약에 따라 한글에 관한 정보는 로마자로 표기해야 한다. 우리나라는 1959년 2월 로마자 표기법'을 제정, 수차례 개정을 통해 1983년 6월 문교부(Ministry Of Education)안을 발표했으나, 표지판, 역명, 교과서, 공공문서들에서 활용되었지만, 영자신문, 외국 학술지등은 M-R( Mccune-Reishauer ) 표기법을, 인명, 신문 및 방송매체 등은 혼합표기방식을 사용함으로써 인(人). 지명(地名), ID, 대표어등 정보 검색시 혼란을 야기시켰고, 개정안에 따를 표기 정정으로 수백억원에 가까운 예산을 낭비하였으며, 최근 ISO(International Standard Organization)에서는 남북한 단일화 및 기계적 변환을 요구하고 있으나, 반달표 표기곤란, 편리성 결여, 북한의 주장등의 사유로 제정등을 거론하고 있는 실정에 있다. 잘 쓰지 않는 ASCII 코드 중에서 반달점 폰트를 제작하고 단어, 문장, 문서를 STRING으로 받아 알고리즘화된 음운법칙을 적용하여 소리글자로 변환하고 MOE테이블에서 대응글자를 참조하여 기계적 변환이 가능하도록 하였으며, 세련된 디자인, 풀다운 팝업방식을 채택, 2HD 1장으로 국내최초로 개발하였다.

  • PDF

한글과 로마자를 메타폰트로 생성하기 위한 UFO2xMF 시스템 (UFO2xMF system for generating Korean and Roman characters based on Metafont)

  • 노신현;최재영
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제24권2호
    • /
    • pp.88-92
    • /
    • 2018
  • 글자의 외곽선 정보가 포함된 UFO 파일을 Metafont로 변환하기 위해 'UFO2MF'와 '한글 메타폰트 생성기'가 연구되었다. 두 가지 연구사례는 외곽선 편집 방식을 이용하여 Metafont 코드로 구성된 폰트파일을 생성할 수 있지만, 'UFO2MF'는 외곽선 정보인 기준점과 조절점 중에 기준점만을 사용하므로 원만한 곡선을 표현할 수 없으며, '한글 메타폰트 생성기'는 글자의 곡선을 자유롭게 표현할 수 있지만 한글 글자만을 대상으로 변환하기 때문에 확장성이 부족하다. 본 논문에서는 한글과 로마자를 모두 외곽선 정보에서 Metafont 코드로 변환할 수 있는 UFO2xMF 시스템을 제안한다. UFO2xMF는 외곽선 정보를 Metafont 코드로 변환하는 과정에서 글자의 스타일을 변화시킬 수 있는 속성 값들을 적용할 수 있다. 또한 글자에 기준선과 무게중심선을 적용하여 한글과 로마자뿐만 아니라 다양한 언어의 글자들도 Metafont 코드로 변환할 수 있는 호환성 높은 시스템이다.