• Title/Summary/Keyword: 한글 코드

Search Result 150, Processing Time 0.172 seconds

Building Multilingual Information Structure in Korean Environment (한글 환경에서의 다국어정보 환경구축)

  • Jeong, Hwi-Woong;Yoon, Ae-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.198-203
    • /
    • 1998
  • 인터넷은 다양한 언어로 구성된 정보를 사용자들에게 제공해 준다. 따라서 인터넷 환경상의 정보 다국어화는 앞으로도 점차 가속화될 것으로 보인다. 그러나 각 국가별 지역 코드는 다국어 정보화를 가로막는 하나의 걸림돌이 되고 있다. 본 논문에서는 실사용자(end-user)와 개발자(developer) 환경에서 발생하는 다국어 지원의 문제점에 대해 알아보고, 이를 부산대학교 언어 정보 연구실에서 연구중인 다국어 지원 방법과 연관하여 특히 웹 환경에서 다국어가 동시에 지원될 수 있는 방안에 관해 연구하였다. 한글 환경에서 다국어가 원활히 지원되기 위해서는 유니코드 도입과 함께 다국어 입력 알고리즘이 개발되어야 하며, 이에 따른 다국어 입력 컨트롤 및 라이브러리 개발이 선행되어야 한다. 또한 웹 환경에서도 KS-C-5601 기반이 아닌 Unicode 기반 웹 환경 구축이 진행되어야 할 것이다.

  • PDF

High-Speed Korean Address Searching System for Efficient Delivery Point Code Generation (효율적인 순로코드 발생을 위한 고속 한글 주소검색 시스템 개발)

  • Kim, Gyeong-Hwan;Lee, Seok-Goo;Shin, Mi-Young;Nam, Yun-Seok
    • The KIPS Transactions:PartD
    • /
    • v.8D no.3
    • /
    • pp.273-284
    • /
    • 2001
  • A systematic approach for interpreting Korean addresses based on postal code is presented in this paper. The implementation is focused on producing the final delivery point code from various types of address recognized. There are two stages in the address interpretation : 1) agreement verification between the recognized postal code and upper part of the address and 2) analysis of lower part of the address. In the agreement verification procedure, the recognized postal code is used as the key to the address dictionary and each of the retrieved addresses is compared with the words in the recognized address. As the result, the boundary between the upper part and the lower part is located. The confusion matrix, which is introduced to correct possible mis-recognized characters, is applied to improve the performance of the process. In the procedure for interpreting the lower part address, a delivery code is assigned using the house number and/or the building name. Several rules for the interpretation have been developed based on the real addresses collected. Experiments have been performed to evaluate the proposed approach using addresses collected from Kwangju and Pusan areas.

  • PDF

Letter Keying Codes for MFC Telephone Sets( I ) (전자식 전화기를 이용한 문자 입력용 코드( I ))

  • Kim, Eung-In;Lee, Jong-Rak
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.271-283
    • /
    • 1992
  • 이 논문에서는 전자식 전화기를 이용하여 문자를 입력할 수 있는 코드를 제안하였다. 기존의 문자 입력 방식들과 새로이 고안된 입력 방식을 입력 속도, 수용할 수 있는 문자의 수 및 입력시의 모호성 발생 여부를 판단 기준으로 비교하고 시험하여 새로운 방식이 더 우월함을 입증하였다. 이 방식에 기초하여 한글자모, 영문자를 전화기의 문자판에 배치하고, 그 배치가 최적인지를 검증하기 위해 각각의 배치에 대해 여러가지 시험을 실시하여 표준 $4{\times}3$형의 전화기 자판에 최적인 문자 코드 배치를 선택하였다.

  • PDF

A Design of the Java Library for Combined Hangul Regular Expression (조합형 한글 정규식 Java 라이브러리 설계)

  • Jeong, Jae-Yong;Woo, Gyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.31-34
    • /
    • 2015
  • 현재의 한글 정규식은 완성형 한글에 맞춰 글자단위로 사용할 수밖에 없으므로 사용이 불편하다. 따라서 이러한 불편함을 해결하기 위해 자모단위로 처리 가능한 조합형 한글 정규식 Java 라이브러리를 설계하였다. 조합형 한글 정규식 Java 라이브러리를 통해서 단순히 '가'로 시작하는 글자가 아니라 'ㄱ'으로 시작하는 글자나, 종성이 없는 단어 등을 처리할 수 있으며 기존의 정규식 문법 또한 사용할 수 있다. 이를 위해서 초성, 중성, 종성 각각에 조건을 주는 규칙을 한글 정규식 문법에 추가하였으며, 기존의 Java 정규식 라이브러리와 해당 라이브러리에서 이용하는 유니코드 표현상에서의 한글 인코딩 특징을 이용하였다.

Digital Watermark Generation Algorithm Embedding Hangul Text (한글 텍스트가 내장된 디지털 워터마크 생성 알고리즘)

  • Cho, Dae-Jea;Kim, Hyun-ki
    • The KIPS Transactions:PartB
    • /
    • v.10B no.5
    • /
    • pp.485-490
    • /
    • 2003
  • In this paper, we propose the possibility of introducing chaotic sequences into digital watermarking systems as potential substitutes to commonly used pseudo noise sequences. Chaotic sequences have several good properties including the availability of a great number of them, the ease of their generation, as well as their sensitive dependence on their initial conditions. And the quantization does not destroy the good property. So this paper proposes a method that transforms Hangul text to chaotic sequence. And we presents how the Hangul text is expressed by an implied data and the implied data is regenerated into the original text. In this paper, we use this implied Hangul text for watermarking.

P-HDNS : A New Scheme to Support Multilingual Domain Names (한글도메인이름을 지원하기 위한 Proxy HDNS 구현)

  • Kim, Weon;Chin, Yong-Ohk
    • Journal of the Korean Institute of Telematics and Electronics C
    • /
    • v.36C no.12
    • /
    • pp.1-10
    • /
    • 1999
  • Given a domain, client applications over the Internet are in support of the DNS (Domain Name System) to get its corresponding IP address. Currently, only domain names expressed by ASCII code are recognized over the Internet. This enforces the usage of ASCII domain names even in countries which use languages based on multilingual code other than ASCII code. In this paper, we present a methodology to support multilingual domain names on top of the existing DNS. The methodology is based on code translation of domain names in multilingual code into ASCII code via UTF5. We implement a gateway, called Proxy Hangul DNS (P-HDNS) based on the proposed methodology. This paper presents the principles of the methodology and the implementation details of P-HDNS.

  • PDF

An Implementation Method for The Phonemic and Syllabic Character Attributes of Hangul Character (한글 문자의 음소 및 음절 문자 특성의 구현 방안)

  • Byun, Jeong-Yong;Kang, Jin-Gon
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.288-294
    • /
    • 1994
  • 훈민정음 해례에 따르면 한글문자는 음소 및 음절 문자 특성을 가지고 있다. 이러한 특성들을 컴퓨터 시스템에서 구현함에 있어서 야기되어 왔던 각종 문제를 분석한 다음 이들 문제들에 대하여 한글문자의 특성을 제약함이 없이 컴퓨터에 대한 기술을 개발함으로써 해결책을 모색한다. 본 논문은 훈민정음 해례에서 밝힌 한글 문자의 음소 및 음절 문자 특성에 따라서 기존의 코드 체계를 평가하며, 그리고 이들에 대한 구현 방안을 제시하고자 한다. 또한 이러한 특성을 반영한 한글 입출력들인 '셔블'을 개발하고 이에 대한 검증을 시도하였다.

  • PDF

A Study on an On-line Handwritten Hangul Character Recognition by Identifying Relative Positions of Strokes (획 상대 위치 판별을 통한 온라인 필기체 한글 문자 인식에 관한 연구)

  • 정진국;김수인;남궁재찬
    • The Journal of Information Technology and Database
    • /
    • v.4 no.2
    • /
    • pp.65-78
    • /
    • 1998
  • 본 논문에서는 획 상대위치 판별을 통한 온라인 필기체 한글 문자 인식에 관하여 연구하였다. 한글을 구성하는 획을 인식하기 위하여 각 획의 시작부분과 끝부분의 방향코드를 이용하였으며, 인식된 획들을 바탕으로 각 획들간의 상대위치 정보를 이용하여 자소를 인식하였다. 온라인 필기체 한글의 경우 획의 모양과 크기가 필기자에 따라 불규칙하게 변하므로 획의 모양보다는 획의 위치를 인식에 더 중요한 자료로 삼아 인식을 행하였다. 6,000자의 온라인 필기체 한글 문자에 대하여 실험한 결과, 문자당 평균인식속도 0.034초, 획 인식률 92.3%와 문자 인식률 94.6%를 보였다. 본 실험의 결과로서 온라인 필기체 인식시스템을 구성함에 있어서 획의 시작 부분과 끝부분의 진행방향이 획인식의 중요 요소임과 획들간의 상대적 위치가 한글 문자 인식에 있어서 중요한 요소임을 밝혔다.

A Study on Compression and Decompression of Bit Map Data by NibbleRLE Code (니블 RLE 코드에 의한 비트 맵 데이타의 압축과 복원에 관한 연구)

  • Jo, Gyeong-Yeon
    • The Transactions of the Korea Information Processing Society
    • /
    • v.2 no.6
    • /
    • pp.857-865
    • /
    • 1995
  • In this paper, a nibble RLE(Run Length Encoding) code for real time compression and decompression of Hanguel bit map font and printer data is proposed. The nibble RLE code shows good compression ratio in complete form Hangeul Myoungjo and Godik style bit map font and printer output bit map data. And two ASICs seperating compression and decompression are designed and simulated on CAD to verify the proposed code. The 0.8 micron CMOS Sea of Gate is used to implement the ASICs in amount of 2, 400 gates, and these are running at 25MHz. Therefore, the proposed code could be implemented with simple hardware and performs 100M bit/sec compression and decomression at maximum, it is good for real time applications.

  • PDF