DOI QR코드

DOI QR Code

A study on Code System of Latin Character to Improve Transmission Efficiency in Data Communications

데이터통신 전송효율과 라틴어 부호 체계 고찰

  • 홍완표 (한세대학교 정보통신공학과)
  • Received : 2012.06.13
  • Accepted : 2012.08.09
  • Published : 2012.08.31

Abstract

This paper proposes the revised Roman character code system using Unicode 3.0. The background of the paper is whether the Latin character code system th using in the world in Unicode V.3 is proper or not in the side of the transmission efficiency in data communications. In data communications, when the consecutive 4 bits or 8 bits of "0" bit from the information devices input into the line coder, its consecutive "0" bits are scrambled to the predetermined bit patterns to avoid the syncronization loss. The paper was based on the statistical data for the using frequency of the alphabet letter and the proposed rule for characters coding in [1]. The paper was focused to improve of Unicode itself and UTF-8 code system. As a result of the paper, when the proposed coding systems for Latin character in Unicode 3.0 itself and UTF-8 code system, the scrambler efficiency using HDB-3 in the line coder of the data transmission system could be improved about 3645 ~ 31400% and 480 ~ 1700% respectively.

본 논문은 국제표준 문자부호 체계인 유니코드(Unicode) 3.0에 포함된 라틴어 문자에 관한 새로운 부호 체계를 제시하였다. 이 연구의 시작 배경은 Unicode 3.0의 라틴어 부호 체계가 데이터통신의 전송효율 측면에서 적정한가에 대한 것이었다. 데이터통신을 할 때, 4개 또는 8개 이상의 연속 "0"의 비트가 단말 정보기기로 부터 회선부호화 장치에 입력 될 수 있다. 이 경우에 그 비트열은 스크램블링 과정을 거쳐 연속 "0"이 아닌 비트열로 변경된다. 그러므로 단말 정보기기에서 처리되는 0 문자, 기호 등의 부호 체계에 따라서 데이터통신의 회선부호기 운용이 달라지게 된다. 즉, 데이터통신의 전송효율에 영향을 주게 된다. 이러한 관점에서 본 논문은 [1]에서 제시된 ($4{\times}4$)hexa 원천 부호화 규칙과 영어 문자의 사용빈도 통계를 적용하여 유니코드와 UTF-8의 라틴어 부호 체계에 대한 개선방안을 제시하였다. 그 결과 본 연구에서 제시한 개선된 유니코드와 UTF-8 라틴어 부호 체계를 적용할 경우, 회선부호기의 스크램블러 운용효율이 유니코드를 통신용으로 사용할 경우 최소 3645%에서 최대 31400%, 제시된 UTF-8 부호 체계를 적용할 경우 최소 480%에서 최대 1700%까지 개선되는 것으로 나타났다.

Keywords

References

  1. 홍완표, "데이터 전송 효율을 고려한 4비트행x4비트열 2 바이트 문자 부호화 규칙에 관한 연구", 한국항행학회논문지, 제15권, 제5호, pp. 749-756, 10월, 2011년.
  2. American Standards Association, "American Code (July 6, 1999). for Information Interchange", ASA X3.4- 1963, 17 June, 1963.
  3. American National Standards Institute, "American National Standard for Information Systems-Coded Character Sets 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII)", ANSI X3.4-1986, Inc., 26 March 1986.
  4. RFC 20 "ASCII format for Network Interchange" October 1969 (http://tools.ietf.org/html/rfc20)
  5. http://en.wikipedia.org/wiki/EBCDIC
  6. http://en.wikipedia.org/wiki/Unicode
  7. 산업자원부 기술표준원, "정보 교환용 부호계 (한글 및 한자) 부속서 3. 보조 부호계(2바이트 조합형 부호계", KS X 1001 : 2004. 2004년 12월 28일 개정.
  8. 산업자원부 기술표준원, "KS C 5601 : 1987 (1987년 고침) : 정보 교환용 부호(한글 및 한자)", 2004년 12월 28일 개정.
  9. ITU-T Recommendation G.703, "Physical/ electrical characteristics of hierarchical digital interfaces" pp. 24-41, Oct. 1998.
  10. TTA Standard, "Test Method for Telecommunication Terminal Equipment" TTAS. KO-05.0028/R1, pp306-451, Revised on 23 Dec. 2004.
  11. Behrouz A. Forouzan, "Data communications" McGraw Hill Korea, pp. 132-134. 2008.
  12. Behrouz A. Forouzan, "Data communications" McGraw Hill Korea, p.1031. 2007.
  13. Behrouz A. Forouzan, "Data communications" McGraw Hill Korea, p1032. 2007.
  14. http://en.wikipedia.org/wiki/Unicode_plane
  15. http://en.wikipedia.org/wiki/Unicode#Versions
  16. http://100.naver.com/100.nhn?docid=780033, 위기언어, 네이버 백과사전
  17. http://oxforddictionaries.com/words/what-is-the-frequency-of-the-letters-of-the-alphabet-in-english
  18. http://www.world-english.org/english500.htm
  19. 홍완표, "데이터 전송효율을 고려한 3x4비트 1바이트 문자부호화 규칙에 관한 연구" 한국전자통신학회논문지, 6권, 4호, pp. 499-504, 08, 2011.
  20. 홍완표, "데이터통신 전송효율과 ASCII 부호 체계 고찰" 한국전자통신학회논문지, 6권, 5호, pp. 657-664, 10, 2011.