• 제목/요약/키워드: 표기

검색결과 1,208건 처리시간 0.027초

한국어 자모 Viable Prefix를 이용한 외래어 표기 교정 기법 (Transliteration Correction Method using Korean Alphabet Viable Prefix)

  • 권순호;권혁철
    • 정보처리학회논문지B
    • /
    • 제18B권2호
    • /
    • pp.87-92
    • /
    • 2011
  • 한국어 문서에서 외래어 표기는 한 단어에 대해 한 개만 존재하는 것이 아니라 여러 개의 다른 표기로 사용되고 있다. 이러한 표기상 불일치는 하나의 단어가 다른 개념으로 인식되어 정보 검색 시스템의 성능 저하의 원인이 된다. 따라서 정보 검색 시스템에서는 다양한 외래어 표기에 대해 같은 개념으로 인식하여 검색할 수 있도록 외래어 표기법에 맞는 외래어 표기로 교정하는 전처리가 필요하다. 본 논문에서는 질의어로 외래어가 입력되면, 이를 근거로 외래어 표기법에 맞는 외래어 표기로 교정해주는 방법을 제안한다. 제안하는 기법은 한국어 자모의 viable prefix를 이용하여 후보 외래어 표기를 생성하는 가상 트리를 작성하고 불필요한 외래어를 가지치기함으로써 검색 정확도를 높이고 속도를 개선한다.

한국인명의 로마자표기 형식에 대한 연구 (A Research on the Format for Romanization of Korean Personal Name)

  • 김성원;김정우
    • 정보관리연구
    • /
    • 제43권2호
    • /
    • pp.199-222
    • /
    • 2012
  • 한국인들의 국제활동 증대에 따라 외국인들과의 접촉이 증가하였으며 활동의 주체인 한국인 개인을 외국인이 식별해야 하는 필요가 증대되고 있다. 개인을 식별해주는 것은 개인의 이름(personal name)이며, 한글(Hangeul, Korean alphabet)을 모르는 외국인이 한국인을 식별할 수 있도록 하려면 한국인명을 로마자로 표기하는 음성번역(phonetic translation)이 필요하다. 한국인명의 로마자표기 실태를 보면 다양한 형식이 혼용되고 있어 혼돈이 벌어지고 있다. 한국인명을 로마자로 표기하는 과정에서 발생하는 혼돈은 크게 한국인명을 표기하기 위한 로마자 자모의 선택과 표기형식의 상이함에서 비롯된다. 본 연구는 한국인명의 로마자표기를 위한 형식을 검토하여 최적안을 제안하는 것을 목적으로 하였다. 이를 위해 한국과 서구간의 인명 구조와 사용관행의 차이를 살펴보고, 한국인명의 로마자표기의 의미와 관련쟁점을 정리하였으며, 현재 사용되고 있는 다양한 표기형식을 유형화하였다. 이를 기반으로 한국인명의 로마자표기에 사용되고 있는 다양한 형식을 검토하고 최적안이라 판단되는 표기형식을 제안하였다.

문화속의 과학 - 간편하고 능률적인 표기법은 국제정보통신용 로마자를

  • 이현복
    • 과학과기술
    • /
    • 제32권4호통권359호
    • /
    • pp.12-12
    • /
    • 1999
  • 로마자 표기법은 우리말을 한글이 아닌 로마자로 적는 법을 말한다. 현재 우리가 쓰고 있는 로마자 표기법은 발음 위주의 표기를 하고 부호가 잡다하여 컴퓨터로 쉽게 입력할 수 없는 단점을 갖고 있다. 그래서 필자는 간편하고 능률적인 국제 정보통신용 로마자 표기법을 제안한다.

  • PDF

영문판 전자지도서비스를 위한 지명 영문표기의 세부기준과 원칙에 관한 연구 (Research on Principles to Transcribe Geographical Names in English for English Version Electronic Map Service)

  • 이미숙;안종욱
    • Spatial Information Research
    • /
    • 제21권5호
    • /
    • pp.53-61
    • /
    • 2013
  • 본 연구는 영문판 전자지도 서비스를 위한 지명 영문표기의 세부기준과 원칙을 제시하는데 연구목적이 있다. 이를 위하여 국내에서 지명의 영문표기를 위해 활용하고 있는 지침과 국외 전자지도서비스에서의 한국지명의 영문표기 현황을 살펴보았다. 현황조사 결과 국내 외에서 지명의 영문표기방식이 통일되어 있지 않아 혼란을 야기함을 알 수 있었다. 이렇게 혼용되고 있는 지명의 영문표기 방식 중에서 외국인이 이해하기 쉽고 선호하는 표기방식을 파악하기 위하여 외국인을 대상으로 지명의 영문표기방식의 선호도를 조사하였다. 조사결과 외국인은 로마자만 표기하는 것보다는 로마자와 의미역을 병기하는 것을 선호하는 것으로 나타났다. 이러한 선호도 조사 결과를 반영하여 본 연구에서는 우리나라 지명을 자연지명, 인공지명, 행정지명으로 구분하여 각 지명별로 영문표기의 기준과 원칙을 제시하였다.

한자어의 표기정보와 음운정보 처리 (Processing of Orthography and Phonology in Reading Sino-Korean Words)

  • 이광오;배성봉;남기춘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.63-72
    • /
    • 2005
  • 한자어의 처리에서 나타나는 표기중복의 효과가 표기 처리에 기인한 것인지 음운 처리에 기인한 것인지를 결정하기 위하여 두 개의 실험을 실시하였다. 실험 1에서는, 점화어-표적어의 관계를 표기불일치(음운일치), 음운불일치(표기일치), 음운-표기일치, 무 관련의 네 가지로 조작하였다 또한, 음운규칙에 따른 차이를 알아보기 위해서 유음화, 비음화, 연음화의 세 가지 규칙이 자극의 구성에 이용되었다. 점화어의 제시방식은 차폐점화와 SOA 200ms의 두 가지가 사용되었다. 음변화의 종류 및 점화어 제시방식에 관계없이, 음운불일치조건에서의 반응 양상이 음운-표기일치조건에서의 반응 양상과 유사하게 나타났다. 이것은 선행연구에서 나타난 표기중복의 효과가 음운처리에 의한 것이 아님을 시사하는 것으로 해석되었다. 실험 1에서는 표적어에 음변화 규칙이 적용되었으나 실험 2에서는 점화어에 음변화 규칙이 적용되었다. 실험 2의 결과, 음운 불일치의 효과는 나타나지 않았으나, 표기불일치의 효과는 유의하게 나타났다 실험 1과 2의 결과는 한자어 처리에서 음운정보가 아니라 표기정보의 우선성을 지지하였다.

  • PDF

BIT 표기법을 활용한 한국어 개체명 인식 (Korean Named Entity Recognition Using BIT Representation)

  • 윤호;김창현;천민아;박호민;남궁영;최민석;김재균;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.190-194
    • /
    • 2019
  • 개체명 인식이란 주어진 문서에서 개체명의 범위를 찾고 개체명을 분류하는 것이다. 최근 많은 연구는 신경망 모델을 이용하며 하나 이상의 단어로 구성된 개체명을 BIO 표기법으로 표현한다. BIO 표기법은 개체명이 시작되는 단어의 표지에 B(Beginning)-를 붙이고, 개체명에 포함된 그 외의 단어의 표지에는 I(Inside)-를 붙이며, 개체명과 개체명 사이의 모든 단어의 표지를 O로 간주하는 방법이다. BIO 표기법으로 표현된 말뭉치는 O 표지가 90% 이상을 차지하므로 O 표지에 대한 혼잡도가 높아지는 문제와 불균형 학습 문제가 발생된다. 본 논문에서는 BIO 표기법 대신에 BIT 표기법을 제안한다. BIT 표기법이란 BIO 표기법에서 O 표지를 T(Tag) 표지로 변환하는 방법이며 본 논문에서 T 표지는 품사 표지를 나타낸다. 실험을 통해서 BIT 표기법이 거의 모든 경우에 성능이 향상됨을 확인할 수 있었다.

  • PDF

공동주택의 상세주소 표기 표준화 모형 개발 : 대구시 중구를 사례로 (Developing standardized model for detailed address writing of apartment housing : A case of Jung-gu, Daegu)

  • 전우진;김준현
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2010년도 추계학술대회
    • /
    • pp.379-383
    • /
    • 2010
  • 본 논문은 현재 공동주택에서는 주소를 표기할 때 지번 뒤에 상세주소를 표기하여 단지 내에서 개별적으로 일관성 없는 세부주소로 사용하고 있는 문제점을 보완하기 위해 상세주소 표기 표준화 모형을 제시하였다. 공동주택별로 그 표기방식이 다양해 같은 동을 가동, 101동, 1동, A동, 에이동 등으로 사용하고 있었으며, 같은 층, 호를 지하1층, 지1호, 비01호, B01호,B1호, 1호, F02호 등과 같이 다양하게 표기하는 등, 비정형화로 인한 문제점이 제기 되고 있다. 비정형화로 인한 위치검색 및 위치파악 등의 애로사항으로 행정업무의 자료호환 등의 문제점이 발생하고 있어 표준화된 모형개발이 현실적으로 요구됨에 따라 본 연구에서는 공동주택인 아파트, 연립주택, 다세대주택을 중심으로 상세주소 표기 건축물에 대한 전문가 설문조사를 실시하여 상세주소의 표기방식에 대한 표준화 모형을 개발하였다.

  • PDF

복수 음운 정보를 이용한 영.한 음차 표기 (English-to-Korean Transliteration using Multiple Unbounded Overlapping Phonemes)

  • 강인호;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.50-54
    • /
    • 1999
  • 본 연구에서는 기존의 한정된 길이의 영어 또는 한글의 발음 단위를 이용하던 자동 음차 표기 방식과 달리, 학습 데이터에서 추출한 임의 길이의 음운 패턴을 사용하는 방법을 제안한다. 통계적 정보에 기반하여 추출한 음차 표기 패턴과 외래어 표기 규칙에 기반하여 기술한 음차 표기 패턴을 위치와 길이에 관계없이 사용하여 주어진 영어 단어의 한글 음차 표기를 얻어낸다. 제안하는 방법은 먼저 주어진 영어 단어의 가능한 모든 발음 단위를 기준으로 한글 표기 네트워크를 만든 후, 학습 데이터에서 추출한 음운 패턴을 교차 적용시켜 네트워크 각 노드의 가중치를 결정한다. 가중치가 결정된 네트워크에서 가중치의 합이 가장 좋은 경로를 찾아냄으로 해서 음차 표기를 수행한다. 본 연구에서 제안하는 방법으로 실험을 한 결과 자소 단위 86.5%, 단어 단위 55.3%의 정확률을 얻을 수 있었다.

  • PDF

한국어 자모 혼동행렬 기반 유사 외래어 표기 검출 기법 (Equivalent Writing of Loanwords Detection Method based on Korean Alphabet Confusion Matrix)

  • 권순호;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.433-436
    • /
    • 2010
  • 최근 한국어 문서에는 한국어뿐만 아니라 외래어 표기 등이 혼합되어 사용되고 있다. 외래어 표기는 한 단어에 대해 한 개만 존재하는 것이 아니라 여러 개의 다른 표기로 사용되고 있다. 이러한 표기상 불일치는 하나의 단어가 다른 개념으로 인식되어 정보검색 시스템의 성능 저하의 원인이 된다. 따라서 정보검색 시스템의 성능 향상을 위해 여러 외래어 표기를 같은 개념으로 인식하는 시스템이 필요하다. 본 논문에서는 한국어 자모 혼동행렬을 기반으로 한 유사 외래어 표기 검출 기법을 제안한다. 제안한 기법에 따라 유사 외래어 표기를 검출해줌으로써 정보검색 시스템의 성능을 향상할 수 있다.

페트리넷을 이용한 한글-로마자 표기 변환표 생성에 관한 연구 (A Study on Creation of Hangeu-Romanization Conversion Table Using Petri-Nets)

  • 김경징;최영규;이상범
    • 정보처리학회논문지B
    • /
    • 제9B권6호
    • /
    • pp.827-834
    • /
    • 2002
  • 본 논문에서는 개정된 로마자 표기법에 일치하는 한글의 로마자 표기 생성을 위한 한글-로마자 표기 변환표의 생성에 관한 연구를 수행하였다. 로마자 표기법의 근간이 되는 표준 발음법과 로마자 표기법을 수학적으로 분석하기 위하여 페트리넷 모델을 이용한 자연 언어의 수학적 분석 방법을 도입하였다. 페트리넷 모델을 이용한 분석의 방법으로 한글 로마자 표기 변환 표를 생성하기 위한 방안과 로마자 표기법의 페트리 넷 모델링을 통하여 그 실질적인 예를 보여 한국어의 수학적 모델링 방안과 적용방법을 제시한다. 생성된 한글-로마자 표기 변환표를 검증하기 위하여 윈도우 기반 응용 프로그램을 개발하고 로마자 표기 용례사전의 로마자 표기와 응용 프로그램의 결과를 비교하였다.