• 제목/요약/키워드: 한자처리

검색결과 67건 처리시간 0.026초

한자표기동음이철어(漢子表記同音異綴語)의 재인과정(再認過程) (Word recognition process of Chinese homophone)

  • 박태진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.228-235
    • /
    • 1989
  • 한자표기동음이철어의 어휘접근과정을 탐색하기 위해 두개의 실험들이 수행되었다. 피험자들은 한자표기 동음이철어(점화어)의 표기상 관련된 의미나 음운상 관련된 의미 각각의 연상어(한글표기표적어)에 대해 어휘판단을 하였다. 실험 I 은 200ms SOA 와 1000ms SOA 에서 두 의미들의 활성화의 시간경로를 탐색했는데, 그 결과 두 의미들이 동시에 인출 되며 어휘의미에 대한 접근이 음운표상에 의해 매개됨이 밝혀졌다. 실험 II 에 따르면 주의할당에 의한 손실이 음운상 관련된 의미에 있어서만 가능하였다. 긴 SOA에서는 통제처리가 작용하지만 철자상 관련된 의미에 대한 통제는 불가능한 것으로 판단되었다.

  • PDF

중국의 외래어 표기를 한자와 병음 대신 한글로 쓰면 좋은 이유 증명 (The reasons why it is good to write Chinese loanwords in Korean instead of Chinese characters and Hànyǔ pīnyīn)

  • 정태충
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.639-643
    • /
    • 2022
  • 한글이 우수한 글자라는 의견에 세계 대부분의 학자들이 동의하고 있다. 한글 자모의 단순성과 직교성(규칙성)으로 인해 표현할 수 있는 발음의 수도 제일 많고 읽고 쓰고 배우기도 쉽다는 점을 누구나 인정하기 때문이다. 구한말과 1950년대에 중국도 한글표기를 사용할 뻔 했다는 이야기도 있다. 그러나 그들은 한자를 사용하되 단순화 하는 방법과 병음을 사용하는 것으로 결론이 났고 현재 그렇게 사용하고 있다. 그런데 중국인들이 외래어를 다루는 것을 보면 많이 고생한다는 생각이 든다. 외래어 표기를 한글로 사용한다면 외래어를 위한 한자 단어를 만들 필요가 없고 외래어를 표현하고 배우고 읽고 쓰는데 훨씬 더 효과적으로 할 수 있고, 원음 재현율이 매우 개선된다. 또한' 글자의 길이가 짧아지고 더 멀리서도 인식되는 장점도 있다. 본 논문은 그것을 보여준다. 본 논문에서는 영어 원단어, 한국어 표기, 중국어 표기, 병음 표기, 중국어 발음 한글 표기 등을 비교해서 한글이 유리함을 보여주고자 한다. 결론적으로 외국단어를 한자나 한자의 병음으로 표현하는 것보다 한글로 표현하는 것이 중국어를 사용하는 모든 사람들에게 큰 도움이 될 것이다. 물론 그들이 한글을 읽고 쓰는 것을 배우는 부담은 있지만 몇일만 배우면 평생의 문제를 해결하게 되는 문제이므로 큰 부담은 아니라고 본다.

  • PDF

AMI/HDB-3 회선부호화와 한·중·일 한자 유니코드 체계 고찰 (Consideration of CJK Joint Hanja Unicode when is used in AMI/HDB-3 Line Coding)

  • 태동진;홍완표
    • 한국전자통신학회논문지
    • /
    • 제8권7호
    • /
    • pp.1011-1015
    • /
    • 2013
  • 본 논문은 한중일통합 한자 유니코드 부호 집합체계가 원천부호화규칙에 위배되는 정도를 분석하였다. 본 연구에서는 한중일통합 한자의 유니코드 중에서 사용빈도 수가 높은 문자 150개를 대상으로 하여 연구하였다. 이 한중일통합 한자 150개 문자의 사용 빈도율은 한중일통합 한자 유니코드 전체 사용빈도율의 약 50%에 해당된다. 본 연구에서는 한중일통합 한자 유니코드를 AMI회선부호화 방식과 HDB-3 스크램블링 방식을 사용할 경우를 대상으로 하였다. 분석결과 150개의 문자중 원천부호화 규칙에 위배되는 문자는 총 77개 였다. 이들 문자들의 사용 빈도율에 의한 원천부호화 규칙 위배율은 약28%였다. 결과적으로 이 원천부호화 규칙에 위배되는 문자들을 사용빈도가 낮고 원천부호화 규칙에 부합되는 문자부호로 대체 할 때, 회선부호기에서의 회선부호 처리율을 약37%만큼 개선시킬 수 있음을 나타냈다.

중국어 음성합성을 위한 지진 벡터 기반 실시간 미등록어 처리 (Real-time Unknown Word Identification Using Support Vector Machine For Chinese Text-to-Speech)

  • 하주홍;정옥;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.267-272
    • /
    • 2003
  • 음성 합성 시스템 구축에 있어서 입력 텍스트를 정확한 발음 표기로 변환하는 것은 매우 중요하다. 중국어에는 하나의 한자가 의미나 사용에 따라 다르게 발음되는 다음자(polyphony)들이 존재한다. 다음자의 처리는 상당히 복잡한 문제이기 때문에 본 논문에서는 그 중 가장 발음에 영향을 미치는 요소인 인명과 지명에 대한 미등록어 처리를 수행했다. 무엇보다 실시간 음성 합성 시스템을 위해서는 처리 속도의 향상이 요구된다. 따라서 본 연구에서는 미등록어 후보 구간 선정을 선행하고, 선정된 후보에 대해 추정하는 두 단계로 진행하였다. 후보 구간 선정은 단일 한자 단어(monosyllable word)의 확률과 간단한 패턴들을 이용한다. 최종 선정된 후보의 미등록어 추정은 SVM(Support Vector Machine)을 기반으로 실시하였다.

  • PDF

확률적 VQ 네트워크와 계층적 구조를 이용한 인쇄체 한자 인식 (The Recognition of Printed Chinese Characters using Probabilistic VQ Networks and hierarchical Structure)

  • 이장훈;손영우;남궁재찬
    • 한국정보처리학회논문지
    • /
    • 제4권7호
    • /
    • pp.1881-1892
    • /
    • 1997
  • 본 논문에서는 확률적 VQ 네트워크와 계층적 구조를 가지는 다단계 인식기를 이용한 인쇄체 한자 인식 방법을 제안한다. 대용량 신경망은 구현하기가 매우 어렵기 때문에 모듈화된 신경망을 이용하였으며, 이 과정에서 발생되는 문제점을 확률적 신경망 모델을 이용으로 제거하였다. 또한 엔트로피 이론을 적용하여 오인식률이 높은 혼동 문자쌍에 대하여 재분류를 수행하였다. 실험대상은 KSC5601 코드의 한자 4,888자 중, 동자이음문자를 제외한 4,619자로 하였으며, 학습 데이타와 실험 데이타에 대하여 실험결과, 각각 평균 99.33%, 92.83%의 인식률과 초당 4-5자의 인식속도를 얻음으로써 본 방법의 유효성을 보였다.

  • PDF

한국어(韓國語) 규칙(規則) 음성(音聲) 합성(合成) 시스템의 구현(具現) (The Design and Implementation of Korean Text-to-Speech Conversion System on a Rule-Based Framework)

  • 손영택;김용갑;송본달랑
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.141-148
    • /
    • 1993
  • 본고는, 한글 한자가 혼용된 입력 텍스트를 음성으로 변환 출력하는 포르만트 음성 합성 방식 즉, 한국어 규칙 음성 합성(이하에는 KTTS[Korean Text To Speech System]이라고 함)의 전반적인 처리 흐름에 대하여 소개한다. 특히, 입력 텍스트에 있어서, 한자 또는 각종 부호의 한글 변환 기능, 음성 출력용 문법 정보 추출에 필요한 입력문의 해석 및 구문경계 설정 기능, 또한 음소 기호 변환 및 파라메터 값 생성과 변경 처리기능을 중심으로 설명하고자 한다. 또한 본 시스템의 완성과 더불어 실시하였던 청취 실험 평가 결과에 대하여 덧붙이겠다.

  • PDF

오프라인 인쇄체 문장부호, 일본 문자, 영문자, 한자 인식에서의 오인식 문자 교 정에 관한 연구 (A study on the Character Correction of the Wrongly Recognized Sentence Marks, Japanese, English, and Chinese Character in the Off-line printed Character Recognition)

  • 이병희;김태균
    • 한국정보처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.184-194
    • /
    • 1997
  • 최근 상용 오프라인 문자 인식시스템들이 계속 발표되고 있다. 본 눈문에서는 적 은 메모리와 빠른 시간내에 검색이 가능한 자기조직화 구조를 가진 단어 사전을 구축 하고 검색하는 알고리즘을 제시하며 오프라인 문자 인식 시스템을 이용하여 오인식 교정의 측면에서 문장부호, 영문자, 한자를 인식한 후에 나온 오인식된 문자들을 수 집하여 오인식 형태를 제분류하였다. 영문자에 대해서는 영문자의 오인식 형태와 오 인식의 예들을 조사하고 오인식이 자주 일어나는 글자에 대해 오인식 혼동 테이블을 작성하였으며 25,145개의 영어 단어가 입력된 자기조직화된 영어 단어 사전을 가지고 교정을 행하여 0.5%의 인식률 향상을 가져왔다. 한자에 대해서도 영문자와 마찬가지 로 오인식 행태를 조사하고 혼동 테이블을 작성하였으며 34,593개의 단어가 입력된 자기조직화된 한자 단어 사전을 이용하여 교정을 행하여 인식률을 6.1% 향상시켰다.

  • PDF

WWW에서 대화형 원격 한자학습 시스템 (Interactive chinese Character Distance Learning System on the WWW)

  • 강종규;박상우;김현숙;김계환;진성일
    • 한국정보처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.698-708
    • /
    • 1997
  • WWW 상에서 원격교육 서버를 구축하고 서비스 하기 위해서 기존의 멀티미디어 데 이터의 전송 및 처리가 다운로드 방식이 아닌 실시간 처리 방식이 요구된다. 본 연구 에서는 이러한 요구를 만족하기 위해 원격교육을 위한 동영상(AVI)와 음성(WAV)같은 멀티미디어 데이터를 분산환경에서 실시간으로 처리할 수 있는 실시간처리 모듈을 개발하여 MuX(Mulitimeida I/O Server)에 추가하고 이를WWW와 접목시켜 하이퍼텍스트 및 동영상 데이터를 실시간으로 서비스 할 수 있는 실시간 WWW서버를 개발하였으며, 이에 기반한 실시간 대화형 한자학습을 위한 원격교육 시스템을 연구 개발하였다.

  • PDF

국내 도서관 한자검색의 문제점에 관한 연구 (A study on the problem of library Chinese character searching system in korean libraries)

  • 최세종;박성혁;서주리;황성진;이창훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1179-1181
    • /
    • 2013
  • 본 논문에서는 국내 도서관의 한자검색의 문제점에 대해 집중적으로 분석해 보았으며, 특히 간체자와 이체자의 문제점에 대하여 유니코드와 관련시켜 해결방안을 모색해 보았다. 간체자와 이체자를 정자로 인식하지 못 하는 문제점이 나타나는데 이는 매핑테이블을 이용하여 해결할 수 있을 것이다.

고전 자료 디지털화사업에서의 신출한자 처리 개선방안 (Improvement plan for 'Newly found ideographs(新出漢字)' in the digitalizing business of the old Korean documents)

  • 이정화
    • 한국한의학연구원논문집
    • /
    • 제10권1호
    • /
    • pp.1-14
    • /
    • 2004
  • As entering the information age of the 21st century, Korea is actively processing many digitalizing businesses related to information source of the Korean academic science at the government level based on the Korean advanced digital technologies, which makes them more evolved through the internet networks in Korea. The definition of 'Newly found ideographs(新出漢字)' are made by researching and extracting from the old Chinese documents through the digitalizing process and they are not registered yet among the block of Unicode & extended Chinese characters those are existent international standard. Presently Korea is in the middle of brisk developing computerized old documents in the huge scale. Meanwhile, the international standard of Chinese characters in mostly Asian countries where using them is processing and developing by IRG. Therefore, Korean processing works is very important which are included extracting precisely 'Newly found ideographs' founded from building its database, organizing as an international standard code, submitting the International organization and finally registering as the best standard code.

  • PDF