• 제목/요약/키워드: 한자 문자

검색결과 68건 처리시간 0.022초

인쇄체 문서의 문자영역에서 한글과 한자의 구별에 관한 연구 (A Study on Classification into Hangeul and Hanja in Text Area of Printed Document)

  • 심상원;이성범;남궁재찬
    • 한국통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.802-814
    • /
    • 1993
  • 본 논문에서는 문서인식시스템의 문자인식부에서 각 문자를 인식하기 위한 전처리 단계인 한글과 한자를 구별하는 알고리즘을 제안한다. 본 연구에서는 문자의 구별에 큰 영향을 미치고, 쓰기형태와 글자체에 따라서 변동을 흡수할 수 있는 9가지의 한자 특성을 제안하고, 문자의 크기에 영향을 받지 않고 문자를 구별할 수 있도록 문자 크기에 따른 비율을 제안된 각 특성에 반영하여 문자의 구별을 행하였다. 입력된 문서 제안한 9가지의 한자 구조적 특성을 조사하여, 한글과 한자로 구별한다. KS-C5601의 한글 2350자와 한자 4888자의 고딕, 명조체에 대하여, 실험결과는 인쇄 표본, 신문, 학회지, 잡지 교재에서 각각 98.8%, 92%, 96%, 98%, 98%을 얻었다.

  • PDF

정보 시스템의 유니코드 기반 한자 검색 지원 (Support on Ideograph Characters Search of Unicode Based Information System)

  • 윤소영
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.375-391
    • /
    • 2007
  • 현재 유니코드 CJK 한자코드는 부수 기준 배열방식을 따르고 있어 한자의 한글음가를 기준으로 하는 우리의 문자생활 방식과 차이가 있으며, 우리나라 고유한자나 동형이음어, 이두문자, 그리고 이체자 관계 등을 모두 수록하고 있지 않아 정보시스템에 그대로 적용하기에는 무리가 있다. 따라서 유니코드 기반 정보시스템의 정확한 한자표현 및 한자검색을 위해서는 한자를 포함하는 자료에 대한 정확한 이해를 바탕으로 여러 가지 지원방안을 마련해야 한다. 이러한 측면에서 역사분야 정보검색시스템에서는 한글음가 및 한국에서만 사용되는 동형이음어 처리를 위한 한자-한글음가 사전, 본래 한자의 음가와 다르게 읽히는 한자를 위한 특수용어사전, 이형자와이체자를 위한 이체자사전, 그리고 유니코드 CJK 통합한자에 등록되어 있지 않은 한자를 위한 신출 한자목록을 지원하고 있다.

A Study on CC Processor for NAVTEX System

  • Fuwen Pang;Wenli Sun;Se-Mo Chung;Tchang-Hee Hong
    • 한국항해학회지
    • /
    • 제22권3호
    • /
    • pp.1-8
    • /
    • 1998
  • 한자는 복잡한 상형문자로서 자모문자와 비교하여 볼 때, 문자의 처리, 프로그램의 작성 및 전송에 있어서 많은 차이점이 있다. 지금까지 NAVTEX프로그램중 한자 전송의 관건적인 기술을 해결하지 못하고 있다. 따라서, 본 논문에서는 NAVTEX프로그램중의 한자처리 방법을 모색 하고자 하였으며, 이러한 프로그램을 이용하면 NAVTEX 단말기에서 바로 한자를 인쇄할 수 있게 될 것으로 기대된다.

  • PDF

중국어 NAVTEX 수신기를 위한 Telegraphic Code 처리방법 (A Processing Method on Telegraphic Code for Chinese NAVTEX Receiver)

  • Fuwen pang;Wenli Sun;Tchang-Hee Hong
    • 한국항해학회지
    • /
    • 제24권4호
    • /
    • pp.313-317
    • /
    • 2000
  • 한자는 복잡한 상형문자로서 표음문자와 비교하여 볼 때, 문자의 처리, 프로그램의 작성 및 전송에 있어서 많은 차이점이 있다. 지금까지 NAVTEX 프로그램중 한자 전송의 핵심적인 기술을 해결하지 못하고 있다. 따라서, 본 논문에서는 NAVTEX 프로그램중 한자처리 방법을 모색을 하고자 하였으며, 이러한 프로그램을 이용하면 NAVTEX단말기에서 바로 한자를 인쇄할 수 있게 될 것으로 기대된다.

  • PDF

AMI/HDB-3 회선부호화와 한·중·일 한자 유니코드 체계 고찰 (Consideration of CJK Joint Hanja Unicode when is used in AMI/HDB-3 Line Coding)

  • 태동진;홍완표
    • 한국전자통신학회논문지
    • /
    • 제8권7호
    • /
    • pp.1011-1015
    • /
    • 2013
  • 본 논문은 한중일통합 한자 유니코드 부호 집합체계가 원천부호화규칙에 위배되는 정도를 분석하였다. 본 연구에서는 한중일통합 한자의 유니코드 중에서 사용빈도 수가 높은 문자 150개를 대상으로 하여 연구하였다. 이 한중일통합 한자 150개 문자의 사용 빈도율은 한중일통합 한자 유니코드 전체 사용빈도율의 약 50%에 해당된다. 본 연구에서는 한중일통합 한자 유니코드를 AMI회선부호화 방식과 HDB-3 스크램블링 방식을 사용할 경우를 대상으로 하였다. 분석결과 150개의 문자중 원천부호화 규칙에 위배되는 문자는 총 77개 였다. 이들 문자들의 사용 빈도율에 의한 원천부호화 규칙 위배율은 약28%였다. 결과적으로 이 원천부호화 규칙에 위배되는 문자들을 사용빈도가 낮고 원천부호화 규칙에 부합되는 문자부호로 대체 할 때, 회선부호기에서의 회선부호 처리율을 약37%만큼 개선시킬 수 있음을 나타냈다.

DP 정합을 이용한 필기체 한자 인식 (Recognition of Handwriting Chinese Characters Based on DP matching)

  • 전상엽;권희용
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.285-288
    • /
    • 2004
  • 온라인 필기체 한자는 동일인의 동일 문자조차도 회수, 획순 및 형태의 변화가 다양할 뿐만 아니라 인식 대상이 방대하여 인식이 매우 어렵다. 또한 한자는 기본 자소의 조합에 의한 글자가 아닌 각각의 글자가 독립적으로 이루어져 있어 연속된 획들 간의 관련도를 파악하기 어렵고 획수도 1획에서 28획까지 다양하게 분포를 한다. 따라서 본 연구에서는 대분류 단계로 시작획 비교를 하고 이어진 세분류 단계에서 문자의 특징으로 방향코드와 특이점을 추출해내고 획수를 고려하여 DP 정합을 하는 2단계 인식 시스템을 제안하였다. 이로써 최적의 속도로 입력한 문자를 찾아낼 수 있도록 하였다.

  • PDF

고성능 한자 인식 시스템 (High Performance Recognition System for Chinese Character)

  • 안성옥;주기호
    • 공학논문집
    • /
    • 제1권1호
    • /
    • pp.59-64
    • /
    • 1997
  • 2000개 이상의 많은 한자들이 신문이나 책들의 출판물에서 매일 사용되고 있다. 한자는 문자의 복잡성과 방대한 양으로 인하여 문자인식에 많은 어려움이 있다. 본 논문은 고성능 한자 인식 시스템을 제안하고 한자의 특성을 고려한 새로운 문자 분류기법을 개발하였다.

  • PDF

유니코드 3.0 한자 입력시스템 (A Chinese Character(Hanja) Input System Based on Unicode 3.0)

  • 윤지헌;변정용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.375-377
    • /
    • 2000
  • 인터넷의 급속한 보급은 인간 생활의 많은 부분을 바꾸어 놓고있는데, 가장 대표적인 예로 전자상거래와 온라인 문서를 들 수 있다. 전자상거래와 온라인 문서는 과거 자국의 문자위주 PC통신상에서만 이루어지고 있었지만 현재는 대부분이 인터넷과 연동되어있다. 따라서 전자상거래와 온라인 문서 등을 전세계 사람들이 이용하기 위해서 만국 공통의 코드가 필요하게 되었다. 이러한 요구로 ISO10646 코드가 제정되고 발전하여 현재의 유니코드 3.0에 이르게 되었다. 유니코드 3.0에는 세계각국의 문자가 포함되어있고, 한국, 중국, 일본 등 한자문화권에서 공통적으로 많이 사용하는 한자 2만 7천여자도 포함되어있다. 이것은 과거 국내 표준인 완성형 한자 4천 8백여자와 비교하면 무척 많은 양이라 할 수 있다. 이러한 유니코드의 출현으로 국내외의 고문헌과 법전 등의 한자가 포함된 각종 문서를 인터넷상에서 제공할 수 있지만, 현재 유니코드 한자를 입력하기위한 방법은 MS Word2000의 한자 입력기만 있고 다른 운영체제나 인터넷 환경에서는 거의 전무한 상태이다. 본 논문에서는 운영체제에 독립적으로 작동하는 유니코드 한자입력시스템에 관하여 연구 개발하였다.

  • PDF

인쇄체 한글 및 한자의 인식에 관한 연구 (A Study on the Printed Korean and Chinese Character Recognition)

  • 김정우;이세행
    • 한국통신학회논문지
    • /
    • 제17권11호
    • /
    • pp.1175-1184
    • /
    • 1992
  • 본 논문에서는 한자를 포함하는 한글 문서 인식을 위한 인쇄체 한글, 한자의 구분과 인식 방법에 대하여 연구하였다. 제안된 한글, 한자 구분 방법은 한글의 수직모음과 수평모음의 구조적 특징을 이용하였다. 한글은 6가지 형태로 분류하고 분류된 각 형태에 대하여 세선화 과정을 거치지 않고 모음 우선추출에 의한 자모분리를 행하고 분리된 자음에 대하여 변형된 교차거리 특징을 이용하여 인식하였다. 한자에 대해서는 획교차수의 평균치를 이용하여 전체 한자 대상문자에 대해 분류를 하였으며, 문자의 획교차수와 흑점비율 특징을 이용하여 인식하였다. 한글과 한자의 구분에서는 90.5%의 분류율을 얻었다. 한글인식에 있어서는 대상문자 명조체 2512자에 대하여 90.0%의 형태 분류율을 얻었다. 인식 결과 실험 데이타 1278자에 대하여 92.2%의 인식율을 얻었다. 한자인식에 있어서는 대상문자 4585자에 대하여 분류한 결과 최대밀집 구간은 124자로서 약 1/40 정도로 분류되었음을 알 수 있었고, 인식실험 결과 89.2%의 인식율을 얻었다.

  • PDF

"삼국시대의 한자음" 펴낸 유창균 교수

  • 강철주
    • 출판저널
    • /
    • 통권80호
    • /
    • pp.4-5
    • /
    • 1991
  • 훈민정음 창제 이전 우리 문자생활의 주요한 도구였던 한자가 우리나라에 언제쯤 도입됐으며, 한자음이 우리말로 토착음화하는 과정으 어떠했는가에 논의의 초점을 두고 있는 이 책은, 고대한자음에 관련된 이제까지의 학계 통설에 대한 가장 본격적인 비판을 담은 성실한 연구성과라는 점에서 특히 주목을 끈다.

  • PDF