• 제목/요약/키워드: HMM

검색결과 962건 처리시간 0.027초

비선형 집단화와 완화기법을 이용한 VQ/HMM에 관한 연구 (A Study on VQ/HMM using Nonlinear Clustering and Smoothing Method)

  • 정희석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.95-98
    • /
    • 1998
  • 본 논문에서는 이산적인 HMM(Hidden Markov Model)을 이용한 고립단어 인식 시스템에서 입력특징 벡터의 변별력을 향상시키기 위해 수정된 집단화 알고리듬을 제안하므로써 K-means나 LBG 알고리듬을 이용한 기존의 HMM에 비해 2.16%의 인식율을 향상시켰다. 또한 HMM학습과정에서 불충분한 학습데이타로 인해 발생되는 인식율저하의 문제를 해소하기 위해 개선된 smoothing 기법을 제안하므로써 화자독립 실험에서 3.07%의 인식율을 향상시켰다. 본 논문에서 제안한 두가지 알고리듬을 모두 적용하여 최종적으로 실험한 VQ/HMM에서는 기존의 방식에 비해 화자독립 인식실험 결과 평균 인식율이 4.66% 개선되었다.

  • PDF

Hidden Markov Model 과 Genetic Algorithm을 이용한 온라인 문자인식에 관한 연구 (On-Line Character Recognition using Hidden Markov Model and Genetic Algorithm)

  • 홍영표;장춘서
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(3)
    • /
    • pp.29-32
    • /
    • 2000
  • HMM(Hidden Markov Model)은 시간적인 정보를 토대로 하는 수학적인 방법으로서 문자인식에 많이 사용되어지고 있다. 그런데 HMM이 적용되고자 하는 문제에서 사용되어지는 상태 수와 HMM에서 사용되어지는 parameter들은 처음에 결정되는 값들에 의해서 상당히 많은 영향을 받게 된다. 따라서 한글의 특성을 이용한 HMM의 상태 수를 결정한 후 결정되어진 각각의 HMM parameter들을 Genetic Algorithm을 이용하였다. Genetic Algorithm은 매개변수 최적화 문제에 대하여 자연의 진화 원리를 마땅한 알고리즘으로 선택, 교배, 돌연변이 연산을 이용하여 최적의 개체를 구하게 된다. 여기서는 HMM에서의 Viterbi Algorithm을 적합도 검사에 사용하였다.

  • PDF

HMM 기반의 오프라인 필기 모델 (Off-line Character Modeling using HMM)

  • 신봉기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.337-340
    • /
    • 2000
  • 음성 인식 및 온라인 필기 인식기 모델로 널리 알려진 은닉 마르코프 모델(HMM)을 오프라인에 적용하려는 시도는 있었지만 아직까지 만족할 만한 성과는 찾아보기 어렵고 인식률도 신경망 등 다른 방법에 의한 시스템에 미치지 못하는 실정이다. 본 연구에서는 온라인 필기 모델 HMM을 오프라인 필기인식에 활용하는 방법 한 가지와 순수하게 오프라인 필기 모델로서 제안된 2D HMM을 기술한다. 두 방법 모두 기존의 HMM 모델링 틀에 기초를 두고 개발하였으며 다양한 국소 변형을 해석하기 위해 동적 계획법에 기반한 알고리즘을 응용하였다. 본 논문에서는 두 가지 독립적인 아이디어 제안에 의의를 두었으며 주요 아이디어만을 간략하게 기술하였다.

  • PDF

HMM 모델링을 위한 HMM의 State수와 Mixture수 분석 (Analysis of the Number of States and Mixtures for HMM Modeling)

  • 박미나;하진영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.658-660
    • /
    • 2002
  • 본 논문에서는 음성인식과 온라인 필기인식에서 우수한 성능을 보이는 은닉 마르코프(HMM)의 모델링의 문제점을 다룬다. HMM은 파라미터의 수가 클수록 자기 데이터에 대해 잘 모델링하는 특징으로 음성인식과 온라인 필기인식등에서 많이 쓰이고 있다. 그러나 그러한 특징으로 인해 해당 클래스 데이터가 아닌 다른 클래스 데이터에 대해서도 파라미터의 수가 클수록 잘 모델링하는 단점이 나타났다. 이에 본 연구에서는 대상 데이터를 분석하여 state의 수와 mixture의 수를 조정하여 가장 적절한 HMM의 구조의 파라미터를 구하는 가능성을 본다.

  • PDF

L-R HMM 갖는 문장 종속 음성 향상 방법 (Text Dependent Speech Enhancement based L-R HMM)

  • 이종주;이기용
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.61-64
    • /
    • 2002
  • 본 논문에서는 Left-Right HMM 모델에 기초를 둔 음질 향상 방법을 제안하였다. 기존 HMM에 기초를 둔 음질 향상 방법은 ergodic HMM에 기초를 두고 음질을 향상시켰다. 본 논문에서는 Left-Right HMM이 현재 상태에서 다음상태로만 변하는 성질을 이용하여 현재의 상태를 결정하여 다음 프레임에서 현재와 다음 상태에서만 계산을 하는 방법을 사용하였다. 그 결과 기존의 방법에 비해 많은 시간을 줄일 수 있었다.

  • PDF

한국어 숫자음 인식을 위한 TDNN과 HMM의 결합방법에 관한 연구 (The Study on the Integration method using TDNN and HMM for Korean Digit Speech Recognition)

  • 서원택;조범준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.85-90
    • /
    • 2001
  • 본 논문에서는 한국어 숫자음 인식을 위한 시간 지연 신경망(Time delay neural network-TDNN)과 은닉 마르코프 모델(Midden Markov Model-HMM)의 결합 방법에 대해서 연구하였고 그 성능을 측정하였으며, 기존의 시스템과 비교 평가하였다. 이 알고리즘은 TDNN과 HMM의 구조적인 결합에 기반하고 있는데 TDNN의 두번째 은닉층의 출력이 HMM의 입력으로 들어가도록 구성되었다. 그러면 HMM은 TDNN의 출력으로 각 단어에 대해서 훈련과정을 거치게 된다. 이렇게 구성된 인식알고리즘은 TDNN의 뛰어난 단기간(Short-time)분류 기능과 HMM의 시간 정렬(time-warping) 능력을 동시에 갖게 된다. 위의 과정을 컴퓨터 시뮬레이션을 이용하여 구현하였으며, 한사람의 음성을 녹음하여 실험한 결과 기존의 TDNN만으로 만들어진 인식기보다는 3%, HMM만으로 구성된 인식기 보다는 5.7% 나은 성능을 얻을 수 있었다.

  • PDF

분절 특징 HMM의 매개 변수 수의 감소에 관한 연구 (Reduction of Number of Free Parameters in Segmental-feature HMM)

  • 윤영선;오영환
    • 한국음향학회지
    • /
    • 제19권7호
    • /
    • pp.48-52
    • /
    • 2000
  • 음성 인식에 많이 사용되는 HMM (hidden Markov model)을 개선하기 위하여 분절 특징을 사용한 분절 특징 HMM은 성능이 우수하다고 발표되었다. 그러나, 분절 길이가 증가하고 회귀 차수가 놓아질수록 분절 특징 HMM을 표현하는 매개 변수의 수도 같이 증가된다. 따라서, 본 연구에서는 상태에서 관측 가능한 분절의 분산을 분절 내의 모든 프레임에 대하여 공통적으로 표현하는 고정 분산 방법을 통하여 성능의 저하 없이 매개 변수의 수를 줄이도록 시도하였다. 실험 결과, 두 혼합 밀도인 경우 고정 분산을 이용한 분절 특징 HMM의 성능과 시변 분산을 이용한 성능의 차이가 거의 없어, 제안된 방법의 유효성을 입증하였다.

  • PDF

HMM을 이용한 연속 음성 인식의 화자적응화에 관한 연구 (A Study on the Speaker Adaptation of a Continuous Speech Recognition using HMM)

  • 김상범;이영재;고시영;허강인
    • 한국음향학회지
    • /
    • 제15권4호
    • /
    • pp.5-11
    • /
    • 1996
  • 본 연구에서는 음절 단위의 HMM을 이용하여 발성한 문장에 대해 화자 적응화 할 수 있는 방법을 제안하였다. 문장에 대한 음절 단위의 추출은 음절HMM의 연결과 viterbi세그멘테이션으로 자동화하였고, 화자 적응화는 소량의 문장과 문장의 추가에서도 시켄셜적으로 적응화할 수 있는 MAPE(최대 사후 확률 추정)를 이용한 학습으로 수행하였다. 신문 사설에서 취한 문장에 대하여 화자 적응화한 경우의 인식을 71.8%로 적응화 전의 결과보다 37% 향상되었다.

  • PDF

분절 특징 HMM을 이용한 영어 음소 인식 (English Phoneme Recognition using Segmental-Feature HMM)

  • 윤영선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권3호
    • /
    • pp.167-179
    • /
    • 2002
  • 본 논문에서는 여러 프레임 특징으로 표현되는 분절 특징(segmental feature) 표현 방법을 제안하고, HMM 개념 위에서 음향학적 모델과 그 알고리즘을 개발하여 HMM의 약점으로 지적되는 독립관측 가정을 완화시키고자 한다. 제안된 특징 표현은 단일 프레임 특징이 음성 신호의 시간적 동적 특성 (temporal dynamics)을 제대로 표현하지 못하기 때문에, 여러 프레임을 이용하여 음성 특징을 표현하도록 한다. 분절 특징은 다항식의 회귀 함수(polynomial regression function)에 의하여 관측 벡터의 궤적으로 표현되고, 이 특징을 패턴 분류에 사용하기 위하여 음성 신호의 궤적을 효과적으로 표현하는 분절 HMM(segmental HMM)을 이용한다. SHMM은 상태에서의 관측 확률을 외적 분절 변이와 내적 분절 변이로 세분하며, 외적 분절 변이는 장기적인 변화를, 내적 분절 변이는 단기적인 변화를 나타낸다. 음향학적 모델에서 분절 특성을 고려하기 위하여 외적 분절 변이는 분절의 확률 분포로 표현하고, 내적 분절 변이는 궤적의 추정 오차로 표현하도록 SHMM을 수정한 분절 특징 HMM(SFHMM; segmental-feature HMM)을 제안한다. SFHMM에서는 분절의 관측 확률을 분절 우도와 궤적의 추정 오차의 관계로써 표현하며, 추정오차는 특정 상태에서의 분절의 우도에 대한 가중치로 고려될 수 있다. 제안된 방법의 유효성과 분절 특징의 특성을 살펴보기 위하여 TIMIT 자료를 이용하여 몇 가지 실험을 하였다. 이들 실험 결과에서, 제안된 방법이 기존의 HMM보다 매개 변수가 많더라도, 성능의 향상과 제안된 특징이 유연하고 정보를 많이 가진다는 점에서 의미가 있다고 하겠다.

얼굴인증 방법들의 조명변화에 대한 견인성 비교 연구 (Study On The Robustness Of Face Authentication Methods Under illumination Changes)

  • 고대영;김진영;나승유
    • 정보처리학회논문지B
    • /
    • 제12B권1호
    • /
    • pp.9-16
    • /
    • 2005
  • 본 논문은 얼굴인증 시스템 구현과 조명변화에 견인한 얼굴인증 방법들에 관한 연구에 초점을 둔다. 얼굴인증 시스템 구현을 위한 방법으로 PCA(Principal Component Analysis), GMM(Gaussian Mixture Models), 1차원 HMM(1 Dimensional Hidden Markov Models), 준 2차원 HMM(Pseudo 2 Dimensional Hidden Markov Models) 방법을 이용한다. 네 가지 다른 얼굴인증 방법들의 조명변화에 대한 성능비교 실험을 수행한다. 조명변화실험을 위해 얼굴이미지의 왼쪽에서 오른쪽으로 인공적인 조명효과(${\delta}=0,40,60,80$)를 준다. 얼굴특징벡터는 얼굴이미지에서 분할한 각 블록에 대한 2D DCT(2 Dimensional Discrete Cosine Transform) 계수를 이용하고 실험은 ORL(Olivetti Research Laboratory) 얼굴데이터베이스를 사용한다. 실험결과 모든 경우 조명변화 값이 커질수록 성능저하가 발생한다. 또한 조명변화가 없는 경우(${\delta}=0$) 준 2차원 HMM이 $2.54{\%}$, 1차원 HMM이 $3.18{\%}$, PCA가 $11.7{\%}$, GMM이 $13.38{\%}$의 EER(Equal Error Rate) 성능을 나타낸다. 조명변화가 없는 경우(${\delta}=0$) 1차원 HMM 방법이 PCA 방법보다 좋은 성능을 나타내지만 조명변화 ${\delta}{\geq}40$인 때에는 반대로 PCA 방법이 더 좋은 성능을 나타낸다. 마지막으로 준 2차원 HMM의 경우 조명변화에 관계없이 가장 좋은 EER성능을 나타낸다.