• 제목/요약/키워드: 단어 발음

검색결과 153건 처리시간 0.031초

한글 입술 움직임과 얼굴 표정 동기화를 위한 얼굴 애니메이션 편집기 (Face Animation Editor for the Korean Lip_Sync and Face Expression)

  • 송미영;조형제
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.451-454
    • /
    • 2000
  • 본 논문은 한글 단어에 따른 한글 발음에 적합한 입술의 움직임을 자동 생성하며 또한 단어에 적절한 얼굴 보정을 생성할 수 있는 입순 움직임과 얼굴 표정을 동기화하는 3차인 일관애니메이션 편집기를 구축하였다. 얼굴 애니메이션 편집기에서 얼굴 표정은 근육 기반 모델 방법으로 정의된 각 얼굴 부위별 근육에 따라 가중치를 조절하여 생성하여 입술 움직임은 텍스트 구동 방법으로 음소에 따른 정의된 입모양 연속적으로 표현하여 동작한다. 또한 이렇게 생성된 얼굴 표정을 저장관리한다. 따라서 3차원 얼굴 애니메이션 편집기는 6가지의 기본 얼굴 표정을 자동적으로 생성할 수 있으며 또한 입력 단어에 적합하도록 각 얼굴 부위별 근육 움직임을 편집한 수 있다. 이렇게 생성된 얼굴 표정들은 데이터베이스에 저장관리할 수 있으며 컴퓨터 대화시 자동적으로 입력 단어에 적합한 입술의 움직임과 얼굴 표정을 동기화하여 자연스러운 3차원 얼굴 애니메이션을 표현할 수 있다.

  • PDF

음소 HMM을 이용한 Keyword Spotting 시스템에서의 Non-Keyword 모델에 관한 연구 (A Study on the Non-keyword Models in the Keyword Spotting System using the Phone-Based Hidden Markov Models)

  • 이활림
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.83-87
    • /
    • 1995
  • Keyword Spotting 이란 음성인식의 한 분야로서 입력된 음성에서 미리 정해진 특정단어 또는 복수 개의 단어들 중 어느 것이 포함되어 있는지의 여부를 찾아내고 이 단어를 식별해 내는 작업을 의미한다. 음소모델을 이용하여 Keyword Spotting 시스템을 구성할 경우 새로운 keyword의 추가 또는 변경이 필요할 때 단순히 그 발음사전에 따라 음소모델들을 연결시킴으로써 keyword 모델을 구성할 수 있으므로 단어모델에 의한 방법에 비해 장점이 있다. 본 논문에서는 triphone을 기본단위로 하는 HMM 에 의해 keyword 모델을 구성하고, non-keyword 모델 및 silence 모델을 함께 사용하는 keyword spotting 시스템을 구성하였다. 이러한 시스템에서 non-keyword 모델은 keyword와 keyword가 아닌 음성을 구분 지어주는 역할을 하므로 인식성능의 향상을 위해서는 적절한 non-keyword 모델의 선택이 필요하다. 본 논문에서는 10개의 state를 갖는 단일모델, 조음방법에 의해 음소들을 clustering 한 모델, 그리고 통계적 방법에 의해 음소들을 clustering 한 모델들을 각각 non-keyword 모델로 사용하여 그 성능을 비교하였다. 6개의 keyword를 대상으로 한 화자독립 keyword spotting 실험결과, 통계적 방법에 의해 음소들을 6 또는 7개의 그룹으로 clustering 한 방법이 가장 우수한 인식성능을 나타냈다.

  • PDF

시간동기형 Viterbi 알고리즘과 HMM에 기반한 음성의 자동 세그멘테이션 (Auto-Segmentation of Unsegmented Speech based on HMM and Time-Synchronous Viterbi Algorithm)

  • 오세진;황철준;김범국;정호열;정현열
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.592-594
    • /
    • 2001
  • 본 연구에서는 음성인식에 있어서 음향모델의 고정도화를 위해 통계적 방법인 HMM과 시간동기형 Viterbi 알고리즘을 기반으로 한 세그멘트되지 않은 음성의 자동 세그멘테이션에 관한 연구를 수행하였다. 본 연구에서는 소량의 세그멘트된 음성에 대해 연속분포형 HMM 기본모델을 작성한 후 이를 표준패턴으로 사용하고, 세그멘트되지 않은 입력음성의 특징 피라미터에 대해 시간동기형 Viterbi 알고리즘의 프레임마다 최대가 되는 지점을 최적경계로 설정하고, 앞에서 구현 최적 경계 정보와 언어학적 지식인 발음사전 정보를 이용하여 음성을 세그멘테이션 하는 것이다. 본 연구와의 비교를 위해 HTK를 이용하여 위와 동일한 과정을 수행하였다. 이렇게 구한 음성의 세그멘테이션 정보를 이용하여 연속분포형 HMM 기본모델과 HTK의 CHMM 기본모델을 각각 작성한 후, 국어공학센터(KLE) 단어 데이터에 대해 단어인식 성능을 평가하였다. 실험결과, KLE 452 남성과 여성에 대해, 본 연구실 인식 시스템은 화자독립 단어인식률 89.4%, 85.1%, HTK의 화자독립 단어인식률 85.1%, 81.9%를 각각 얻었다.

  • PDF

말하는 닭의 발성 특성 분석 (Vocal Analysis of Talking Rooster)

  • 견두헌;배명진
    • 한국음향학회지
    • /
    • 제29권2호
    • /
    • pp.125-132
    • /
    • 2010
  • 예로부터 사람의 말을 흉내 낼 수 있는 동물들은 특별한 대우를 받고 있다. 이러한 동물은 앵무새를 비롯한 매우 극소수에 해당하며, 닭이 사람의 목소리를 내는 경우는 지금까지 알려진 바가 없다. 본 논문에서는 최근 화제가 된 한국과 키르기스스탄의 말하는 닭의 발성 특성을 살펴보고, 발음 통계와 실제 음원을 분석하였다. 분석결과 닭이 실제로 사람과 대화를 하는 것은 아니지만, 닭의 날개를 잡을 경우 "안돼," "아니야" 등의 한글 발음을 하는 것으로 확인하였으며, 키르기스스탄의 닭 역시 사람과 매우 유사한 발음을 하는 것으로 확인되었다. 청음 설문조사 결과에서도 대부분의 사람이 닭이 말하는 단어를 인지하였으며, 닭이 내는 소리로 판단한사람은 없었다. 이처럼 닭이 사람의 발음을 할수 있는 이유는, 선천적인 발음기관과 발성시의 기질적 특정이 일반 닭과 현저히 다르며, 사람에게 붙잡힐 때 긴장에 따른 성대/발성 특성 변화때문으로 판단된다.

음성인식 후처리를 위한 음가-표기 변환표 생성에 관한 연구 (A Study on Phonetic Value - Transcription Look-Up Table Generation for Postprocessing of Voice Recognition)

  • 김경징;최영규;이상범
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권5호
    • /
    • pp.585-594
    • /
    • 2002
  • 본 논문에서는 음성인식의 후처리를 위한 음가-표기 변환표의 생성과 구현에 관한 연구를 수행하였다. 음절 단위 음가를 인식하는 음성인식 시스템을 위한 후처리를 위하여 인식된 음가로 발음되는 표기 집합을 생성하는 표기 집합 생성기를 설계 구현하였다. 표준 발음법을 페트리넷으로 모델링하여 생성된 표기-음가 변환표를 기반으로 음가표기 변환표를 생성하였다. 음가-표기 변환표가 올바른 표기 집합을 생성함을 보이기 위하여 표기 집합 생성기를 설계 구현하고, 표준 발음법 예제와 발음법 사전에서 무작위로 추출된 단어에 대하여 실험한 결과 발성 이전의 표기가 포함된 올바른 표기 집합이 생성됨을 입증하였다.

  • PDF

무제한 음성합성 시스팀을 위한 전처리과정 (A Preprocessing for the Unlimited Korean Text to Speech System)

  • 강용범
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.334-337
    • /
    • 1994
  • 본 논문에서는 형식형태소 사전 및 1300여 단어의 발음예외 사전을 이용하여 무제한 dam성합성을 위한 전처리과정을 구현하였으며, 문자열 정형화부, 형식셩태소 중심의 문장분석 및 자소단위의 음운변동과정에 관하여 논한다.

  • PDF

단어열 패턴 매칭과 Recurrent Neural Network를 이용한 하이브리드 음성 인식 오류 수정 방법 (Hybrid ASR Error Correction Using Word Sequence Pattern and Recurrent Neural Network)

  • 최준휘;류성한;이규송;박선영;유환조;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.129-132
    • /
    • 2015
  • 본 논문에서는 단어열 패턴과 리커런트 신경망을 이용한 하이브리드 음성 인식 오류 수정 방법을 제안한다. 음성 인식 결과 문장에서 음성 인식 오류 단어가 발견되었을 경우에 첫째로 단어열 패턴과 그 패턴의 발음열 점수를 통해 1차적 수정을 하고 적절한 패턴을 찾지 못하였을 경우 음절단위로 구성된 Recurrent Neural Network를 통해 단어를 음절단위로 생성하여 2차적으로 오류를 수정한다. 해당 방법론을 한국어로 된 음성 인식 오류와 그 정답 문장으로 구성된 TV 가이드 영역 말뭉치를 바탕으로 성능을 평가하였고, 기존의 단순 단어열 패턴 기반의 음성 인식 오류 수정보다 성능이 향상되었음을 볼 수 있었다. 이 방법론은 음성 인식 오류와 정답의 말뭉치가 필요 없이 옳은 문장으로만 구성된 일반 말뭉치만으로 훈련이 가능하여, 음성 인식 엔진에 의존적이지 않는 강점이 있다.

  • PDF

중국의 외래어 표기를 한자와 병음 대신 한글로 쓰면 좋은 이유 증명 (The reasons why it is good to write Chinese loanwords in Korean instead of Chinese characters and Hànyǔ pīnyīn)

  • 정태충
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.639-643
    • /
    • 2022
  • 한글이 우수한 글자라는 의견에 세계 대부분의 학자들이 동의하고 있다. 한글 자모의 단순성과 직교성(규칙성)으로 인해 표현할 수 있는 발음의 수도 제일 많고 읽고 쓰고 배우기도 쉽다는 점을 누구나 인정하기 때문이다. 구한말과 1950년대에 중국도 한글표기를 사용할 뻔 했다는 이야기도 있다. 그러나 그들은 한자를 사용하되 단순화 하는 방법과 병음을 사용하는 것으로 결론이 났고 현재 그렇게 사용하고 있다. 그런데 중국인들이 외래어를 다루는 것을 보면 많이 고생한다는 생각이 든다. 외래어 표기를 한글로 사용한다면 외래어를 위한 한자 단어를 만들 필요가 없고 외래어를 표현하고 배우고 읽고 쓰는데 훨씬 더 효과적으로 할 수 있고, 원음 재현율이 매우 개선된다. 또한' 글자의 길이가 짧아지고 더 멀리서도 인식되는 장점도 있다. 본 논문은 그것을 보여준다. 본 논문에서는 영어 원단어, 한국어 표기, 중국어 표기, 병음 표기, 중국어 발음 한글 표기 등을 비교해서 한글이 유리함을 보여주고자 한다. 결론적으로 외국단어를 한자나 한자의 병음으로 표현하는 것보다 한글로 표현하는 것이 중국어를 사용하는 모든 사람들에게 큰 도움이 될 것이다. 물론 그들이 한글을 읽고 쓰는 것을 배우는 부담은 있지만 몇일만 배우면 평생의 문제를 해결하게 되는 문제이므로 큰 부담은 아니라고 본다.

  • PDF

한국어 통합 교재에 나타난 발음 내용의 비교 분석 (Comparative Analysis on Pronunciation Contents in Korean Integrated Textbooks)

  • 박은하
    • 한국콘텐츠학회논문지
    • /
    • 제18권4호
    • /
    • pp.268-278
    • /
    • 2018
  • 본 연구는 한국어 통합 교재를 대상으로 발음 교육의 내용이라고 볼 수 있는 교재에 나오는 음운 체계, 음운 규칙, 발음 기술 및 표기, 그리고 발음 연습 등의 발음 항목들을 비교 분석하는 데에 그 목적이 있다. 또한 분석 결과를 통해 드러난 문제점을 지적하고 이를 위한 개선 방향을 제언하고자 한다. 분석 결과로 나온 발음 내용의 문제점과 개선 방향을 나타내보면, 음운 체계에서는 자음과 모음의 제시 순서가 교재마다 다르게 나타났다. 이를 위해서는 자모의 제시 순서에 대한 표준안이 마련되어야 하는데 교수 가능성 및 학습 용이성은 물론이고 교재 및 학습 목적을 고려해서 표준안을 구성해야 한다. 그리고 음운 체계의 제시방법에서 의사소통 관점과 한국어 억양의 기능을 고려했을 때 억양의 의미와 기능에 대한 기술을 제시할 필요가 있다. 두 번째, 음운 규칙에서도 음운 체계와 마찬가지로 제시 순서가 교재마다 다르게 나왔는데 제시 순서를 정해야 하며 어떤 음운 규칙을 교재에 제시할 것인지가 선행되어야 한다. 음운 규칙을 설명할 때 용어 사용은 가능한 한 하지 않고 필수적이고 공통적인 내용을 기술하도록 해야 한다. 마지막으로, 발음내용의 기타 사항에서는 발음을 위한 예를 단어로 제시하는 점과 다양한 연습문제가 없는 점 등을 문제점으로 지적하였다. 발음 교육을 위해서는 문장이나 대화문으로 제시하고 발음 연습을 위해 다양한 연습과 다른 언어 기능과 연계할 것을 제안하였다.

한국어 음성 합성을 위한 음가 변환 테이블 생성 (Formation of A Phonetic-Value Look-up Table for Korean Voice Synthesis)

  • 이계영;임재걸
    • 전자공학회논문지CI
    • /
    • 제38권5호
    • /
    • pp.44-57
    • /
    • 2001
  • 문법적으로 정확한 한국어 음성을 합성하려면 표준어 규정의 '표준 발음법'을 준용해야 한다. 따라서 한국어 음가 합성 시스템에 사용되는 한글을 음성으로 변환하여 주는 규칙은 '표준 발음법'을 완전하게 반영하며 또한 무결해야 한다. 기존의 연구에서는 표준 발음법을 검증없이 적용하여 왔고, 표준 발음법 자체에 모순이 있는가의 여부에 대해서도 체계적인 분석을 위한 시도가 진부하였다. 본 논문에서는 한국어 음가 생성의 기본 규칙으로 준용할 표준 발음법을 페트리 넷으로 모델링하여 표준 발음법의 일관성을 검증하였다. 그리고, 음운 변동 현상을 여러 단계로 나누어 차례로 적용한다든지, 변동된 단어에 대하여 처음부터 다시 변환 작업을 재수행하는 기존의 음가 생성 방법의 문제점을 해결하기 위하여 한번의 테이블 탐색으로 모든 음운 변동이 완료되는 한국어 음성 합성을 위한 음가 변환 테이블을 구현하였다.

  • PDF