• Title/Summary/Keyword: Hangul Code

Search Result 72, Processing Time 0.022 seconds

Issues in KS Complete Type Hangul Code (현행 KS 완성형 한글 코드의 문제점)

  • Kim, Choong-Hoe
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.21-28
    • /
    • 1989
  • 국내에 컴퓨터가 처음 도입된 이후부터 컴퓨터의 한글 처리 문제는 '과연 컴퓨터에서 한글 처리가 가능할까?'하는 의구심에서부터 시작하여 그동안 한글 처리 방식이 각양각색으로 N 바이트나, 3 바이트, 7 비트 2 바이트 완성형, 8 비트 2 바이트 완성형, 8 비트 2 바이트 조합형이니 하여 난립하여 왔다. 이로 말미암아 소프트웨어의 호환은 물론 한글 문서의 호환마저 불가능하여 사용자가 겪는 불편이란 이루 말할 수 없을 뿐 아니라 정보화시대에 정보 교환을 가로막는 장애 요소로 등장하게 된 것이다. 이런 배경 속에서 자연스럽게 한글 코드의 표준화의 중요성을 인식하게 되어 정부에서는 1987년 3월 '정보 교환용 부호에 관한 한글 공업 규격' (KS C-5601-1987)을 새로 정하게 되었다. 그러나 한글의 가장 뛰어난 조합에 의한 확장성을 무시한 '2 바이트 완성형'을 채택 2,350 자의 한글로 제한을 해 놓았기 때문에 제 나라 국어도 재대로 표현할 수 없는 절름발이 한글이 되고 말았다. 이와 같은 결합이 있는 한글을 이제 교육용 컴퓨터에서까지 채택함에 이르러 우리의 지혜를 모아야 할 때라고 생각하면서 문제를 제기하고자 한다.

  • PDF

Entropy Reduction for the Code of Hangul Data Compression (한글 데이터 압축코드를 위한 엔트로피 감소)

  • Lee, Jae-Young;Sung, Koeng-Mo;Lee, Chong-Kak
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.54-57
    • /
    • 1989
  • 본 논문에서는 정보원의 집합이 여러개의 부집합으로 나누어지며 정보 발생 방법은 이들 부집합을 순서적으로 선택한 후 그 부집합에서 확률에 따라 원소를 발생시키는 성질을 갖는 정보원을 인코딩할 때 데이타를 압축시킬 수 있는 엔트로피 감소 모델을 제시하였다. 방법은 정보를 전송하는 과정에서 정보원이 갖고있는 성질에 관한 정보를 제외시킴으로서 평균 정보량 즉 엔트로피를 줄이는 것이다. 이와 같은 원리로 인코딩을 하면 데이타를 압축시킬수 있다.

  • PDF

An Optimal Hangul Code System For The Korean Language Processing (한국어 정보처리를 위한 최적화 한글 코드에 관한 연구)

  • Byun, Jeong-Yong
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.39-43
    • /
    • 1989
  • 컴퓨터에 의한 한글정보처리의 주체는 한글이며, 객체는 그 처리도구인 컴퓨터라는 전제하에서 한글문자의 개별성에 의한 주체적 파악을 통하여, 한국어 정보처리에 최적한 코드로의 개선안을 제안한다. 개선안의 구체적 대상 범주로서 최근의 한국어 정보처리의 응용분야인 자연언어처리, 문자인식, 음성 인식 및 합성, 전자출판등이 점차 확대되어 가고 있다는 관점에서 보아서 기존의 코드가 가지고 있는 문제점을 분석하고 이들에 최적한 코드는 무엇이며 어떠한 성격을 가져야 하며, 그들이 기존의 코드가 중요시하던 처리효율이나 저장 효율의 문제에 어떠한 영향을 미치는지에 대하여 해당 알고리즘을 개발하고 이들에 대한 평가를 해보인다.

  • PDF

A Study on Hangul Text File Management and Effective Code Conversion (한글 문서화일의 관리와 효과적인 코드변환에 관한 연구)

  • Yun, Ho-Sang;Shon, Jin-Gon;Hwang, Chong-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.191-196
    • /
    • 1989
  • 한글 문서화일을 작성할 때 한글코드로서 일반적으로 많이 사용되는 것은 2 Byte 완성형 코드와 2 Byte 조합형 코드이다. 이 두 코드체제는 각각 내제된 장점이 있으며 이로 인하여 많은 논란이 되어 왔으나, 두 코드체제를 이용하여 작성되는 한글 문서 화일은 여전히 늘어나고 있는 것이 현 실정이다. 이러한 배경에서 한글 문서화일의 코드변환에 관해서는 계속 연구되어 왔고 현재 여러종류의 변환프로그램이 실용화되어 있다. 본 논문에서는 기존의 변환프로그램에서 한글 문서화일을 화일 단위로 변환시키는 것을 표시난 (tag field) 개념을 도입하여 디스크 단위로 변환시킬 수 있도록 개선된 변환프로그램을 제시하였다. 아울러 코드변환시 변환이 필요한 화일을 쉽게 찾을 수 있도록 한글 문서화일에 대하여 그 작성 코드의 종류를 표시할 수 있는 DOS 명령어를 제시하였다.

  • PDF

A Study of the framework of search patterns for Hangul characters and its relationship with Hangout code for Hangout Character based Index (한글 글자 단위 인덱스를 위한 검색 유형 정의 및 한글 부호계와의 연관성에 관한 연구)

  • Lee, Jung-Hwa;Lee, Jong-Min;Kim, Seong-Woo
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2007.06a
    • /
    • pp.327-330
    • /
    • 2007
  • 본 논문에서는 한글 인덱스를 구현할 때 글자 단위를 기본으로 하는 경우 적용될 수 있는 검색유형 (search pattern) 들은 어떠한 것들이 존재할 수 있는지에 대해 살펴보고, 검색 알고리즘에 적용시켜 본다. 이 때 부호계와의 연관성과 효율성을 따져보기 위해서 $KS\;{\times}\;1001$의 두 바이트 조합형과 두 바이트 완성형, 그리고 유니코드 3.0의 조합형 부호계와 완성형 부호계 등 여러가지 부호계를 사용할 때에 대해 기본 검색 알고리즘을 적용해 본다.

  • PDF

Application of Structure Code Sequence for HMM Network-Based Hangul Recognizer (HMM 네트워크 기반의 한글 인식기를 위한 구조 특성열의 적용)

  • Ha, Jin-Young
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.345-350
    • /
    • 1998
  • 온라인 필기 한글 인식 연구 중 HMM 네트워크를 기반으로 한 방법이 흘려 쓴 한글 인식에 있어서 우수한 성능을 보여주고 있다. 하지만, 또박또박 쓴 정서체 한글 인식에 대해서는 때때로 예측하지 못한 결과를 출력하기도 한다. 필기자가 정성 들여 필기했을 경우 보다 일관성 있는 인식 결과를 출력할 수 있는 것이 중요하다. 또한 계산 능력이 떨어질 수밖에 없는 휴대용 컴퓨터에서의 활용을 위해 인식 속도의 향상도 필요하다. 따라서 본 논문에서는 정서체 인식률 및 인식 속도 개선을 위해 16-방향 체인코드 대신 구조적 정보를 포함하는 새로운 코딩 방식을 제안하고자 한다.

  • PDF

A Design and Implementation of Hangul Mail System (한글 전자우편시스템의 설계 및 구현)

  • 김종상;김영호
    • Journal of the Korean Institute of Telematics and Electronics
    • /
    • v.22 no.4
    • /
    • pp.8-15
    • /
    • 1985
  • This paper describes the design of Korean electronic Mail system which is installed at DECnet in Seoul National University computer center. In our system we introduce facilities for command processing and naming service in Korean, which was impossible in most mail systems. We emphasize flexibility in the design of Message Transfer Agent, for there are numer-ous code representions for Korean language.

  • PDF

The Probabilities and Entropies of HANGUL Elements including the sopace (공백소를 포함한 한글 자소발생 확률과 엔트로피)

  • 안수길;안지환
    • Journal of the Korean Institute of Telematics and Electronics
    • /
    • v.17 no.2
    • /
    • pp.23-28
    • /
    • 1980
  • The foundation of information theory mainly established by C. E. Shannon , opened the way to profuse studies on the linguistics of various languages. The statistics of Korean letters composed of elements and space are analyzed. The Korean alphabetic elements including the space have their probabilities . And information techniques can be applied to them. This paper extended the previous statistics of Korean letters to include the space. We have also calculated the entropies and redundancy for the case. The result can be used to modify the evaluation of Korean letter information processing devices and used as the basis for letter coding method for eventual future information processors.

  • PDF

AN EFFICIENT CODING METHODS FOR THE TWO COMPOSITION TYPES OF THE KOREAN ALPHABET ON A MASPAR MACHINE

  • Min, Yong-Sik
    • Journal of applied mathematics & informatics
    • /
    • v.5 no.1
    • /
    • pp.191-200
    • /
    • 1998
  • There are two types of composition systems for the Korean alphabet: a combined system and a composite system. This paper decribes an efficient coding method for both of these two types. Using this coding method with the combined system yields about 10.5% code-length savings per a Korean character while it yields about 45% savings with the composite system. In other words the coding method produces a better result(i.e. 34.5% better) with the composite system than with the combined system. The simulation has been performed on a MasPar machine having 64 processors. The results show that the combined system achieved a 45.851-fold speedup while the composite system achieved a 47.274-fold speedup.

A Method of Improving Hangul Code Systems Embedded in UCS (국제 문자 부호계에 포함된 한글 부호계의 개선 방안)

  • 변정용
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.192-194
    • /
    • 1998
  • 현행 국제문자부호계(KS C 5700-1995)에는 세 가지 종류의 한글 부호계인 완성 음절형, 자소형, 자모형이 포함되어 있으며, 이들을 적용할 때 구현 수준에 따라서 표현이 불가능하거나 혼합 부호계 표현으로 혼란이 일어날 소지가 매우 크다. 뿐만 아니라 완성 음절형 부호계를 주된 부호계로 삼고 있기 때문에 이런 기반 위에서 국어정보처리를 하는 것은 불가능하며, 옛 한글 표현은 수준을 달리하였을 때 가능하다. 본 논문은 국제문자보호계에 세가지 한글 부호계를 분석 평가하여 이들이 함께 존재할 필요성이 있는지 여부와 제정자의 관점 그리고 각각의 한계점과 파생될 문제점을 검토하고 국제문자 보호계의 바른 나아갈 바에 대하여 2 가지 방안을 모색한다.

  • PDF