• Title/Summary/Keyword: 한자처리

Search Result 67, Processing Time 0.032 seconds

Hangul-Hanja Transfer for Terminology (전문용어 한글-한자 자동 변환)

  • 황금하;배선미;최기선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.886-888
    • /
    • 2004
  • 기존의 한글-안자 변환에서는 문맥정보와 통계정보를 고려하지 않는 사전기반의 단어단위 변환 방법을 사용한 반면, 본 논문에서는 언어모델 밀 변환모델을 이용한 문장단위의 한자 자동변환 방법을 제안하고. 사전 미등록어와 복합어의 한글-한자 변환을 위하여 단어분할을 변환의 숨김 과정으로 처리하는 통합모델을 사용하였다. 실험 결과, 전문용어의 한글-한자 변환에서 제한된 한자 데이터를 이용하여 기존의 사전기반 변환보다 나은 결과를 얻을 수 있었다.

  • PDF

A Generation of Hangul Index Term from Hanja Term (한자용어로부터 한글색인어의 생성)

  • Choi, Suk-Doo
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.51-58
    • /
    • 1996
  • 한자(漢子)로 기술된 용어를 한글로 자동변환하여 색인어로 사용하는 경우에 한글의 음운체계나 해당 시스템의 색인정책에 맞지 않는 일이 생기게 된다. 이런 문제가 생기는 원인은 해당 한자에 대응하는 정확한 한글을 입력하지 않고 변환하였을 경우, 해당 한자의 음이 없거나 한자와의 음운체계가 달라 생기는 경우 및 별도의 색인정책이 있는 경우 등을 생각할 수 있다. 본고에서는 KS C 5601 표준코드(이하 표준코드라 한다)를 기준으로 한자(漢子)의 다음자(多音子)를 조사하였다. 다음자(多音子)가 포함되어 있는 사전용어와 다음자(多音子)파일을 이용하여 매핑파일을 구축함과 동시에 매핑파일을 보완함으로써 한자(漢子)로 기술된 용어의 바른 한글음을 자동생성하여 색인어로 사용할 수 있는 방안에 대하여 논한다.

  • PDF

CJK Chinese Character-Korean Character Conversion Keyword Domain Name System in Software Defined Network (소프트웨어 정의 네트워크를 이용한 한중일 한자-한국어 변환 키워드 도메인 이름 시스템)

  • Lee, SeungHun;Cho, SungChol;Xue, Yuanyuan;Lu, Kai;Xiang, Tiange;Han, Sunyoung
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.339-342
    • /
    • 2019
  • 본 논문에서는 소프트웨어 정의 네트워크를 이용한 한중일 한자-한국어 변환 키워드 도메인 이름 시스템을 제안하였다. 한자 체계를 주로 사용하는 한국, 중국, 일본에서 세 나라의 한자 수량이 너무 많기 때문에 우선 한국, 중국, 일본이 공용으로 사용하는 한자 체계인 CJK808을 가지고 연구하였다. 연구를 통해 CJK808 한자 체계에서 각 나라의 한자 특징도 많이 발견하였고, 그 중에서 표준자와 이체자의 다양성이 더욱 두드러졌다. SDN을 이용함으로써 관리 측면에서 다양한 이점을 얻을 수 있다. 제안하는 시스템을 통하여 사용자들은 한국, 중국, 일본 한자를 입력하면 SDN에서 관리하는 도메인 네임 서버를 통해 IP 주소를 얻을 수 있다.

  • PDF

Stroke Extraction of Chinese Character using Mechanism of Optical Neural Field (시각신경 메커니즘을 이용한 한자 획의 분리 및 추출)

  • Son, Jin-U;Lee, Uk-Jae;Lee, Haeng-Se
    • The Transactions of the Korea Information Processing Society
    • /
    • v.1 no.3
    • /
    • pp.311-318
    • /
    • 1994
  • In this paper, a new stroke extraction method of Chinese character base on the human optical field(the Receptive Field of Cell) is proposed. In processing the feature extraction of the chinese character, needed are more perfect extraction methods for separated informations and its data base. This method can be applied to processing neural cell using conventional feature extraction mechanism in the optical boundary of retina and cerebrum. With this method, its applicability and effectiveness were demonstrated extracting strokes from Chinese character.

  • PDF

Hangul-Hanja Translator Based on Semantic Analysis (의미 분석에 기반을 둔 한글-한자 변환 시스템)

  • Jung, Il-Hyung;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.85-93
    • /
    • 1992
  • 본 논문은 한글-한자 변환에 있어서 여러 대응 한자를 갖는 동형이의어의 모호성 해소 방법을 제안한다. 기존의 변환 방법은 사용자의 개입으로 이루어지므로, 사용자에게 많은 부담을 주고 변환 효율을 떨어뜨린다. 한자선택에 있어서 동형이의어 문제의 근본적 해결을 위해, 본 시스템에서는 의미 분석을 이용한 한글-한자 변환기를 제안한다. 이를 위해 격문법과 관련어 지식 베이스(thesaurus)를 사용한다. 격문법을 사용하여 서술어를 중심으로 관련된 격틀의 의미를 분석한다. 그리고 합성어의 경우에 합성어의 구성 형태에 따라 격문법을 사용하거나 관련어 지식 베이스에서의 의미 근접성을 사용한다. 본 논문은 이와 같이 의미 분석 및 개념 정보를 기반으로 하는 동형이의어의 모호성 해결 방안을 제시하고 이를 반영한 한글-한자 변환 시스템의 설계 및 구현에 관하여 기술한다.

  • PDF

Differences of Reading the Pure Hangul Text and the Hangul Plus Hanja Text in Reading Speed, Comprehension, and Memory (한글 전용과 국한 혼용의 언어 심리학적 고찰(I): 읽기 시간, 이해, 기억에서의 차이)

  • Nam, Ki-Chun;Kim, Tae-Hoon;Lee, Kyung-In;Park, Young-Chan;Seo, Kwang-Jun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.469-476
    • /
    • 1997
  • 본 연구는 한글 전용과 한자 혼용이 글의 이해 속도, 이해 정도, 내용의 기억에 어떤 영향을 미치는 가를 조사하기 위해 실시되었다. 한글 전용론과 한자 혼용론은 각각 나름대로의 논리를 가지고 서로 논쟁을 펼쳐왔다. 먼저 한글전용론의 주장을 살펴보면, 한자는 배우기 어렵고 쓰기도 불편해 쉽게 익힐 수 있는 한글을 사용해야 하며, 한자를 사용함으로 인해서 순 우리말의 발전이 방해를 받고, 글자 생활의 기계화와 출판 문화의 발달에 있어 한자는 이것을 어렵게 한다는 것이다. 반면에, 한자혼용론의 주장에 따르면, 한자말은 한자로 적을 때 그 의미의 파악이 빠르고 정확하고, 우리말 어휘의 절반 이상을 한자어가 차지하고 있으므로 한자를 가르치는 것이 국어교육의 지름길이고, 우리말에는 동음이의어가 많아서 한글로만 적을 경우 그 뜻을 식별하기 어렵고, 한자는 각 글자가 모두 뜻을 가지고 있으므로, 각각을 조합하여 새로운 의미의 단어를 쉽게 만들 수 있음은 물론이고 한글로 쓸 경우 길게 쓰여져야만 하는 것을 짧게 쓸 수 있다는 장점을 가지고 있으며, 한자를 쓰지 않으면 우리의 전통 문화를 이어 받을 수 없으며 한자를 공통으로 쓰고 있는 동양문화권에서도 고립을 초래할 수 있다는 것이다. 이렇게 한글전용과 한자혼용에 대한 의견이 다양한 만큼 우리나라의 한자에 대한 정책도 그 갈피를 잡지 못하고 계속 바뀌어 왔다. 독립이후 정부에서는 법령과 훈령 등으로 모든 공문서에서의 한자사용을 금지하고 일반 사회의 문자 생활에도 한글을 전용할 것을 권고하지만 이 지침은 결국 공문서에만 한정되어 왔고 후에는 이것조차도 유명무실해졌다. 또한 중고등학교의 한자교육 정책도 수차례 변화되어 한글만을 배운 세대가 사회에 나와 여전히 한자가 사용되고 있어 적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.

  • PDF

The Effects of Visual and Phonological Similarity on Hanja Word Recognition (시각 형태 정보와 소리 정보가 한자 단어 재인에 미치는 영향)

  • Nam, Ki-Chun
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.244-252
    • /
    • 1995
  • 본 연구는 한자를 이용하여 시각 정보 (Visual Information)와 음성 정보(Phonological Information)가 단어 재인과 단어 명명 과정에 어떻게 영향을 주는 지를 조사하기 위하여 실시되었다. 기존의 영어를 이용한 연구에서는 시각 정보와 음성 정보를 독립적으로 조작할 수 없었기에 두 요소가 단어 재인에 어떤 영향을 주는 지를 살피는데 어려움이 있었다. 그러나 한자단어를 이용하면 시각 정보와 음성 정보를 독립적으로 조작할 수 있기 때문에 영어 단어를 사용하는 것보다 유리하다. 본 실험에서는 한자 단어를 이용하여 점화 단어 (Prime Word)와 목표 단어(Target Word)간의 시간간격(SOA)을 100 ms, 200 ms, 750 ms, 그리고 2000 ms로 변화시키면서 시간이 흐름에 따라 시각적 유사성과 음성적 유사성에 의한 점화 효과(Priming Effect)가 어떻게 변화하는 지를 조사하였다. 이 실험 결과에 의하면, 100 ms 조건에서는 시각적 유사성에 의한 점화 효과만 있었다. 그러나, 200 ms, 750 ms, 2000 ms 조건들에서는 시각적 유사성뿐만 아니라 음성적 유사성에 의해서도 점화효과가 있었다. 이와 같은 실험 결과는 최초의 한자 단어의 어휘 접근 (Lexical Access)이 시각 정보에 의해 결정됨을 보여주고 있다.

  • PDF

A Study on a Method of Selecting Variant Groups to be Reviewed for LGR (Label Generation Rule) of Internet Top-Level Hanja Domain (인터넷 최상위 한자 도메인의 국제 생성 규칙(LGR)을 위한 검토 대상 이체자 묶음 선정 방안 연구)

  • Kim, Kyongsok
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.5 no.1
    • /
    • pp.7-16
    • /
    • 2016
  • This paper discusses a method of selecting variant groups to be reviewed for LGR (Label Generation Rule) of Internet Top-Level Hanja Domain. The most difficult problem in setting up LGR of Internet Top-Level Hanja Domain is how to treat Hanja variants. If domains containing variants (e.g.: 東海國) are directed to different addresses, confusion will arise. Therefore, it is desirable that such domains are directed to the same address. Since variant groups of Korea and China are not same, we need to unify variant groups of Korea and China. In the process of reviewing 3093 Chinese variant groups, the author found that Korea does not need to review Chinese variant groups which include no or just one Korean Hanja character. Korea only need to review Chinese variant groups which include two or more Korean Hanja characters. By doing so, the author could reduce the number of Chinese variant groups to be reviewed by Korea from 3093 to 303, which is only one-tenth of the original number of Chinese variant groups. After Korea finishes reviewing 303 Chinese variant groups selected according to the method suggested in this paper, the job of setting up LGR of Internet Top-Level Hanja domain will be accelerated by negotiating with China.

A Study on Korean Language Information Processing (한국어 정보처리에 관한 연구)

  • Park, Dong-Soon;Maeng, Seung-Ryeol
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.161-167
    • /
    • 1989
  • 점차 언어정보 처리가 컴퓨터 응용에서 차지하는 비중이 커지고 컴퓨터 응용 확대 위해서는 효과적인 언어처리가 필수적 과제로 부각되고 있다. 한국어는 영어문화권 언어와는 다른 독특한 특성을 가지고 있기 때문에 이률 처리하기 독창적인 기술개발이 요구된다. 본 논문에서는 언어정보 처리의 개념과 모델을 소개하고, 보다 근원적으로 한국어 정보를 처리하기 위해 연구되어야 할 분야를 살펴보았다. 또한 한국어 정보처리를 위해서 선행되어야 하고 가장 기본적인 한국어 정보처리인 한글처리 방식에 대하여 논하였다. 본 논문에 포함된 한글, 한자코드, 한글, 한자 처리방식, O.S 한글화 지침은 언어정보처리의 시스템 요소와 입출력에 관한 연구과제이다.

  • PDF