• 제목/요약/키워드: 한자

검색결과 438건 처리시간 0.022초

중국어 음성합성을 위한 지진 벡터 기반 실시간 미등록어 처리 (Real-time Unknown Word Identification Using Support Vector Machine For Chinese Text-to-Speech)

  • 하주홍;정옥;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.267-272
    • /
    • 2003
  • 음성 합성 시스템 구축에 있어서 입력 텍스트를 정확한 발음 표기로 변환하는 것은 매우 중요하다. 중국어에는 하나의 한자가 의미나 사용에 따라 다르게 발음되는 다음자(polyphony)들이 존재한다. 다음자의 처리는 상당히 복잡한 문제이기 때문에 본 논문에서는 그 중 가장 발음에 영향을 미치는 요소인 인명과 지명에 대한 미등록어 처리를 수행했다. 무엇보다 실시간 음성 합성 시스템을 위해서는 처리 속도의 향상이 요구된다. 따라서 본 연구에서는 미등록어 후보 구간 선정을 선행하고, 선정된 후보에 대해 추정하는 두 단계로 진행하였다. 후보 구간 선정은 단일 한자 단어(monosyllable word)의 확률과 간단한 패턴들을 이용한다. 최종 선정된 후보의 미등록어 추정은 SVM(Support Vector Machine)을 기반으로 실시하였다.

  • PDF

한국어 정보처리에 관한 연구 (A Study on Korean Language Information Processing)

  • 박동순;맹승렬
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.161-167
    • /
    • 1989
  • 점차 언어정보 처리가 컴퓨터 응용에서 차지하는 비중이 커지고 컴퓨터 응용 확대 위해서는 효과적인 언어처리가 필수적 과제로 부각되고 있다. 한국어는 영어문화권 언어와는 다른 독특한 특성을 가지고 있기 때문에 이률 처리하기 독창적인 기술개발이 요구된다. 본 논문에서는 언어정보 처리의 개념과 모델을 소개하고, 보다 근원적으로 한국어 정보를 처리하기 위해 연구되어야 할 분야를 살펴보았다. 또한 한국어 정보처리를 위해서 선행되어야 하고 가장 기본적인 한국어 정보처리인 한글처리 방식에 대하여 논하였다. 본 논문에 포함된 한글, 한자코드, 한글, 한자 처리방식, O.S 한글화 지침은 언어정보처리의 시스템 요소와 입출력에 관한 연구과제이다.

  • PDF

민족 수학의 뿌리

  • 박용범
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제12권
    • /
    • pp.377-386
    • /
    • 2001
  • 역사의 시작은 어디인지 아득하지만 일반적으로 문헌을 통한 과학적인 신뢰성을 갖게 되는 실질적인 방법이 원칙이다. 하지만 이런 연구가 거의 전무한 우리 수학의 뿌리에 대한 연구는 문헌 연구가 그 기반을 이룰 것이다. 따라서 본 연구자는 우리 역사의 뿌리를 수학적 관점에서 한 분야로서 여러 기존의 문헌을 중심으로 특히 사학 연구를 활용하여 수학의 뿌리를 찾으려고 하며, 민족 신화(단군신화) 이전의 경전인 천부경(天符經)의 사상을 기초로 한 동양 사상과 철학의 배경으로 그 위상을 세우고자 한다. 결코 우리 민족의 우수성과 고난의 시절에서 많은 상황적 변화로서 와전되어 있는 부분도 있지만 이를 해석한 여러 문헌을 논리적으로 체계화하려는데 초점을 두고 있다. 주로 신라 시대의 석학인 최치원 선생에 의해 천부경 81자의 한자로 구성되어 해석한 사실에 주목해야한다. 특히 한민족의 언어가 아닌 한자로 우리의 언어와 사상이 기록되어 있고, 이 민족의 침입으로 인한 민족 문화의 말살이 걸림돌이 되고 있다. 그럼에도 불구하고 현재에 어려움을 인식하고 연구가 수행되었음을 부인할 수 없다. 따라서 본 연구는 우리 민족 수학의 뿌리를 찾아 민족의 수학사를 인식하는 계기를 주고, 자주적인 민족 정서의 수학 교육에 첫 걸음을 내딛는데 연구의 필요성과 목적이 있다.

  • PDF

임계 획 밀도를 이용한 한글, 한자, 영문구분 (A Distinction of the Korean Character, Chinese Character and English Character using the Threshold Stroke Density)

  • 원남식
    • 한국산업정보학회논문지
    • /
    • 제5권4호
    • /
    • pp.32-38
    • /
    • 2000
  • 다중 문자 환경의 문서인식 시스템에서 문자를 인식하기 전에 문자의 종류를 먼저 구분하는 것은 인식률의 향상에 중요한 요인이 된다. 각 나라의 문자는 그 문자마다 고유의 구성상의 다양한 특징을 가진다. 본 연구에서는, 문자를 구분하기 위한 방법으로 획 밀도 값을 이용하였고, 대상 문자는 한글, 영문과 한자로 하였다. 다양한 형태의 활자가 사용되는 문서에 적용하기 위해 입력 데이터는 정규화 과정을 거친 후 처리되었다. 제안된 방법은 80% 이상의 높은 확률로 구분이 가능함을 실험 결과로써 입증하였다.

  • PDF

천자문과 로제 시소러스 범주체계 비교 (Category Comparison between Thousand-Character Text and Roget's Thesaurus)

  • 김상락;양재군;배재학
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-89
    • /
    • 2008
  • 본 논문에서는 천자문과 로제 시소러스의 어휘 분류체계를 분석하였다. 전처리 작업으로서 천자문과 로제 시소러스를 데이터베이스화 하였다. 그리고 분석 작업의 용이성과 연구의 효율성을 높이기 위해서 천자문 대응 로제 시소러스 검색 시스템을 개발하였다. 연구결과 로제 시소러스 총 39개 과(Section) 가운데에서 'Creative Thought' 과를 제외하고 대부분의 과가 천자문 한자와 관련성을 가지는 것으로 나타났다. 'Space in General', 'Dimensions', 'Matter in General' 3개의 과가 가장 높은 대응률을 보였다. 상관계수값도 약 0.94로 나타나 천자문 한자와 로제 시소러스의 범주 관련성이 아주 높다는 사실을 발견하였다.

  • PDF