• Title/Summary/Keyword: Hangul Code

Search Result 72, Processing Time 0.022 seconds

Character based Hangeul search using Location-specific Character Frequency

  • Lee, Jung-Hwa;Lee, Jong-Min;Kim, Seong-Woo
    • Journal of information and communication convergence engineering
    • /
    • v.7 no.3
    • /
    • pp.345-350
    • /
    • 2009
  • Hangul search functionality, including dictionary search is used in many Hangeul applications. Existing research of hangeul search method is the study of using hangeul syllable as a basic unit. However when you consider the characteristics of Hangul, the research of using hangeul character as a basic unit is needed. In this paper we propose the character based hangeul search method using the location-specific frequency information and verify the effectiveness of the proposed method through the experiments.

A Study of developing an Old-Hangul Editor supporting the international standard Hangul code (ISO 10646 부호계를 이용한 옛한글 문서 편집기 개발에 관한 연구)

  • Lee, Jung-Hwa;Kim, Kyong-Sok
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.427-436
    • /
    • 1993
  • 국제 표준화 기구 (ISO) 에서는 1992년에 국제 표준 글자 부호계 ISO 10646을 확정하였는데, 거기에 들어 있는 국제 표준 한글 부호계는 새로운 조합형과 완성형 두 가지로 이루어져 있으며, 새로운 조합형은 옛한글까지 완벽하게 지원할 수 있다. 그러나 아직까지 이 새로운 조합형의 실용성에 대한 실증적인 연구가 없었다. 본 논문에서는, 새로운 조합형 한글 부호계를 지원하는 옛 한글 문서 편집기 개발 과정을 살펴보고, 또한 편집기 개발을 통하여 확인한 다음 두 가지 점에 대해서도 살펴보겠다. 첫째, 새로운 조합형을 써서 한글 정보 처리를 하는 데 아무 문제가 없으며, 둘째, 새로운 조합형으로 옛 한글을 지원할 수 있다는 사실을 확인할 수 있었다. 옛 한글 문서 편집기의 성공적인 개발로, 이 때까지 어려움을 겪었던 옛 한글 자료의 전산화가 가능하게 되어, 우리의 고전에 대한 연구가 활발해질 것으로 예상한다.

  • PDF

An Anti-Forensic Technique for Hiding Data in NTFS Index Record with a Unicode Transformation (유니코드 변환이 적용된 NTFS 인덱스 레코드에 데이터를 숨기기 위한 안티포렌식 기법)

  • Cho, Gyu-Sang
    • Convergence Security Journal
    • /
    • v.15 no.7
    • /
    • pp.75-84
    • /
    • 2015
  • In an "NTFS Index Record Data Hiding" method messages are hidden by using file names. Windows NTFS file naming convention has some forbidden ASCII characters for a file name. When inputting Hangul with the Roman alphabet, if the forbidden characters for the file name and binary data are used, the codes are convert to a designated unicode point to avoid a file creation error due to unsuitable characters. In this paper, the problem of a file creation error due to non-admittable characters for the file name is fixed, which is used in the index record data hiding method. Using Hangul with Roman alphabet the characters cause a file creation error are converted to an arbitrary unicode point except Hangul and Roman alphabet area. When it comes to binary data, all 256 codes are converted to designated unicode area except an extended unicode(surrogate pairs) and ASCII code area. The results of the two cases, i.e. the Hangul with Roman alphabet case and the binary case, show the applicability of the proposed method.

A Roman Representation Code System of Hangul Characters (한글문자의 로마문자 표기코드)

  • Kang, Joo-Sang
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.91-101
    • /
    • 1995
  • 한글문자를 기계화하기 위하여 로마문자로 표기하는 코드체계에 대하여 살펴본다. 이 표기코드는 로마문자의 대문자와 소문자를 이용하며 영문 OS 상에서의 한글사용, 음성학적 연구, 합리한 한글자판, 한글고어 연구 등에서 다른 코드보다 합리적이다. 또한 이 코드체계는 새로운 표준코드로서도 우수한 잠재성을 가지고 있다.

  • PDF

A Study on Hangul Code Conversion Interface (한글 코드 변환 인터페이스에 관한 연구)

  • Yun, Ho-Sang;Baik, Doo-Kwon;Hwang, Chong-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1990.11a
    • /
    • pp.39-46
    • /
    • 1990
  • 최근 컴퓨터의 발달로 인하여 많은 부분에서 컴퓨터가 사용되고 있다. 그러나 컴퓨터가 한글 사용을 전혀 고려하지 않고 개발되었기 때문에 한글 사용에 많은 문제점이 발생하였다. 본 논문에서는 컴퓨터에서 한글의 사용에 있어서의 문제점을 고찰해보고 이를 해결하기 위하여 한글 코드변환 인터페이스를 연구하였다.

  • PDF

Reserches to divided Hangul Spelling for Program based on Uni-Code (유니 코드를 바탕으로 한 프로그램 상에서의 한글 자/모 구별 방법에 따른 연구)

  • 권훈;김정희;곽호영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.781-783
    • /
    • 2004
  • 본 논문에서는 컴퓨터 상에서의 처리되는 한글 코드 중 유니코드를 이용한 한글 입력방법을 분석하여, 이를 일련의 프로그램에서 초ㆍ중ㆍ종성에 따라 자/모음을 분리, 구별하는 방법을 제안하고, 이에 따라, 제안된 방법을 적용한 구현 프로그램을 통해 정확한 자/모음 분리를 할 수 있었으며, 한글 입력에서의 정확도와 신뢰도 향상 및 단어에 따른 정확한 조사판별이 가능해 짐을 알 수 있었다. 또한, 제안방법에 따른 통계적 데이터를 가지고 각종 분야에 적용이 가능하게 됨을 알 수 있었다.

  • PDF

Words for Numbers and Transcoding Processes Reflected by ERPs during Mental Arithmetic (수 연산과정에서 ERP로 확인된 숫자어휘와 부호변환 과정)

  • Kim, Choong-Myung;Kim, Dong-Hwee
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.11 no.2
    • /
    • pp.689-695
    • /
    • 2010
  • The effect of the code conversion process of Korean script (Hangul), also known as words for numbers, was investigated using event-related potentials (ERPs) during mental arithmetic operations. Study subjects were asked to determine whether the arithmetic results of a given target stimuli were correctly matched. Visual inspection and statistics of mean ERPs showed stimulus type-dependent processing rather than task-dependent processing. Results of addition and multiplication tasks revealed that the overall temporal profiles of the Arabic numerals were similar to the Hangul words for numbers. The only exception to this observation was a delayed positive-slope peak occurring around 300 ms, which was likely related to the encoding process of Hangul words for numbers to Arabic-digits, defined as a 'transcoding-related potential.' Source analysis confirmed that the topography of different waveforms for the two conditions was attributed to a single dipole located in the left temporo-parietal area; this area is known to be involved in Hangul words for number processing. These results suggest that the initial processing for encoding words for numbers was followed by arithmetic operations without direct access of internal number representation. Korea Academia-Industrial cooperation Society. The Korea Academia-Industrial cooperation Society. The Korea Academia-Industrial cooperation Society. The Korea Academia-Industrial cooperation Society.

A study on the korean standard code for information interchange (한국공업규격 한자코드에 대한 고찰)

  • 이춘택
    • Journal of Korean Library and Information Science Society
    • /
    • v.25
    • /
    • pp.295-338
    • /
    • 1996
  • The findings from this study are summarized as follows : 1. It is questionable to define the term "Hanja" as "the Chinese Character used independently or used along with Hangul. 2. It is found to be a problem that the validity and objectivity in the selection of Hanja are lacking. 3. It is also a problem that there is neither principles nor consistency in styling of characters. 4. The system of arrangement has problems, too. The adoption of arrangement of Hanja by its Korean pronunciation results in lots of errors and mistakes. Besides, mistaken strokes and radicals produced considerable errors in the arrangement of Hanja. 5. The omission of the abbreviated Hanja in the Code can be considered to neglect the current trend of increased use of them. 6. The issue concerned with the Japanese-origin Hanja is that several number of Hanja deemed unnecessary are included.y are included.

  • PDF

A Study of the Hangul Processing in the EUC framework (EUC 틀안의 한글 처리 연구)

  • Kim, Yong-Ho;Yun, Hong-Won;Kim, Kyong-Sok
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.415-425
    • /
    • 1993
  • 본 논문은 국내 표준 한글 부호계와 국제 표준 한글 부호계를 유닉스의 EUC 틀 안에서 수용하는 방안을 제안한다. EUC (Extended Unix Code)는 4 개의 코드 셀 (Code Set)를 지원하는데, 그 중 3 개의 코드 ???V은 멀티바이트를 지원한다. EUC 에서는, ASCII 를 빼고는 모두 MSB (most significant bit) 가 1 이어야 한다. 이러한 제약 조건 아래서, KSC 5601 완성형 한글 부호계, 두 바이트 조합형 한글 부호계, 그리고 1992 년에 국제 표준으로 확정된 ISO 10646 의 새로운 조합형과 완성형 소리마디를 EUC 틀안에서 종합적으로 지원하는 방안을 검토해 본 결과, 짧게는 새로운 조합형과 KSC 5601을 지원하되, 길게는 새로운 조합형으로 나가는 것이 바람직하다는 결론을 얻었다.

  • PDF

Recognition of Various Printed Hangul Images by using the Boundary Tracing Technique (경계선 기울기 방법을 이용한 다양한 인쇄체 한글의 인식)

  • Baek, Seung-Bok;Kang, Soon-Dae;Sohn, Young-Sun
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.13 no.1
    • /
    • pp.1-5
    • /
    • 2003
  • In this paper, we realized a system that converts the character images of the printed Korean alphabet (Hangul) to the editable text documents by using the black and white CCD camera, We were able to abstract the contours information of the character which is based on the structural character by using the boundary tracing technique that is strong to the noise on the character recognition. By using the contours information, we recognized the horizontal vowels and vertical vowels of the character image and classify the character into the six patterns. After that, the character is divided to the unit of the consonant and vowel. The vowels are recognized by using the maximum length projection. The separated consonants are recognized by comparing the inputted pattern with the standard pattern that has the phase information of the boundary line change. We realized a system that the recognized characters are inputted to the word editor with the editable KS Hangul completion type code.