• Title/Summary/Keyword: HMM

검색결과 961건 처리시간 0.03초

전체 경로 제한 조건을 갖는 HMM을 이용한 단독음 인식 (HMM with Global Path constraint in Viterbi Decoding for Insolated Word Recognition)

  • 김원구;안동순;윤대희
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권1E호
    • /
    • pp.11-19
    • /
    • 1994
  • 상태 지속 밀도를 사용하는 hidden Markov Models(HMM/SD)은 음성 신호의 시간적인 변화를 보다 명확하게 나타낼 수 있다 그러나 상태 지속 밀도가 완만하거나 제한된 상태가 길면 이러한 장점은 감소된다. 이러한 문제점을 해결하기 위하여, 본 논문에서는 상태간의 천이가 특정한 시간 구간에서만 발생하도록 하는 전에 경로 제한 조건을 갖는 HMM/GPC를 제한한다. HMM/GPC는 상태 지속을 제한하고 음성 신호의 시간적 변화를 단순하고 효과적으로 표현할 수 있다. 또한 HMM/SD와 HMM/GPC를 결합한 새로운 형태의 HMM/SD+GPC를 제안하고 성능을 비교하였다. HMM/GPC는 기존 Viterbi 알고리즘을 약간 수정하여 구현될 수 있다. HMM/GPC와 HMM/SD+GPC는 기존 HMM과 HMM/SD에 비하여 우수한 성능을 보일 뿐만아니라 계산량도 매우 작다. 화자도립 단독음 인식 실험에서, HMM/GPC(1.6%)의 최소 오차는 기존 HMM보다 1.1% 낮았고 계산량도 57% 감소하였다.

  • PDF

은닉 마코프 모델 확률 보정을 이용한 음성 인식 성능 향상 (Performance Improvement in Speech Recognition by Weighting HMM Likelihood)

  • 권태희;고한석
    • 한국음향학회지
    • /
    • 제22권2호
    • /
    • pp.145-152
    • /
    • 2003
  • 본 논문에서는 인식 단위로서의 개개의 은닉 마코프 모델 (HMM: Hidden Markvo Model)에 대응하는 가중치를 도입하여 HMM출력 스코어는 HMM출력 확률과 HMM 가중치의 곱으로 표현된다고 가정하고 기존의 최소 분류 오류 훈련 방법과 유사하게 HMM 가중치를 반복적으로 훈련하는 방법을 제안하였다. 제안된 방법은 오인식 척도에 대해 차분 (delta) 계수를 정의하고 이를 이용하여 HMM 가중치를 반복하여 훈련하는 방법이다. 이러한 방법은 HMM 가중치의 합을 HMM 개수의 총합으로 제한함으로써 기존의 파라미터 추정 방법과 비터비 (Viterbi) 알고리즘에 큰 변화 없이 음성 인식에 효과적으로 적용될 수 있다. 제안된 방법은 기존의 분할 (segmental) 최소 분류 오류훈련 방법과 비교하여 추정하는 파라미터의 개수가 감소되었으며 훈련 모델의 최적 상태열을 이용한 경도 계산 과정이 포함되지 않음으로써 계산량을 효과적으로 단축할 수 있다. HMM가중치를 이용한 HMM기반의 음성 인식기의 성능 평가를 위해서 단독 숫자음 인식 실험을 실시하였다. 실험적 결과들은 HMM 확률 보정을 이용한 음성 인식 시스템이 베이스라인 시스템보다 음성 인식 성능이 더 우수함을 보여준다. 제안된 방법은 기존의 최소 분류 오류 훈련 방법에 비하여 구현하기 간편한 반면에 더욱 우수한 음성 인식 성능 향상을 보여준다.

음성인식을 위한 HMM의 파라메터 확장에 관한 연구 (A Study on the Rtension of HMM Parameters for Speech Recognition)

  • 박창호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.152-156
    • /
    • 1994
  • 본 논문에서는 연속출력 확률분포 HMM 모델의 단점을 보완하기 위해 1) 지속시간 확률분포를 갖는 HMM, 2) 동적특징 파라메터를 부여한 HMM, 3) 혼합연속출력 확률분포 HMM을 구성하여 한국어 단음절에 대한 인식실험을 하였다. 실험결과 화자 종속에서는 연속출력 확률분포 HMM 보다 지속시간 확률분포를 갖는 HMM의 경우 0.70%, 동적특징 파라메터를 부여한 HMM의 경우 1.06%, 혼합연속출력 확률분포 HMM의 경우 1.64%의 인식류리 향상되었다. 화자 독립에서는 연속출력 확률분포 HMM보다 동적특징 파라메터를 부여한 HMM의 경우 1.4%, 혼합연속 출력 확률분포 HMM의 경우 2.36%, 지속시간 확률분포를 갖는 HMM의 경우 2.78%의 인식률이 향상되었다.

  • PDF

온라인 한글 인식을 위한 HMM 상태 수의 최적화 (Optimization of Number of States in HMM for On-line Hangul Recognition)

  • 하진영;신봉기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.372-374
    • /
    • 1998
  • 온라인 문자 인식을 위해 시도된 여러 방법 중 은닉 마르코프 모델(HMM)이 우수한 성능을 보이고 있다. 영숫자 인식은 물론 한글 인식에 있어서도 HMM은 최근 널리 사용되고 있는데, HMM을 이용해서 모델링 할 때 해결해야 할 문제 중의 하나는 HMM의 구조를 어떻게 최적화 하느냐이다. 본 논문에서는 HMM을 이용한 온라인 한글 인식 시스템에서 HMM의 최적화를 통해 인식률을 향상시키고자 한다. 특히 HMM의 상태(state)수를 어떻게 정할 것인가에 초점을 맞춰, 실험을 통해 최적의 HMM 상태 수를 찾고자 한다.

  • PDF

회귀신경망 예측 HMM을 이용한 숫자음 인식에 관한 연구 (A Study on the Recognition of Korean Numerals Using Recurrent Neural Predictive HMM)

  • 김수훈;고시영;허강인
    • 한국음향학회지
    • /
    • 제20권8호
    • /
    • pp.12-18
    • /
    • 2001
  • 본문에서는 예측형 회귀신경망과 HMM (Hidden Markov Model)의 하이브리드 네트워크인 회귀신경망 예측 HMM을 구성하였다. 회귀신경망 예측 HMM은 예측형 회귀신경망을 HMM의 각 상태마다 예측기로 정의하여 일정치인 평균벡터 대신에 과거의 특징벡터의 영향을 받아 동적으로 변화하는 신경 망에 의한 예측치를 이용하므로 학습패턴 설정자체가 시변성을 반영하는 동적 네트워크의 특성을 가진다. 따라서 음성과 같은 시계열 패턴의 인식에 유리하다. 회귀신경망 예측 HMM은 예측형 회귀신경망의 구조에 따라 Elman망 예측 HMM과 Jordan망 예측 HMM으로 구분하였다. 실험에서는 회귀신경망 예측 HMM의 상태수를 4, 5, 6으로 증가시켜 각 상태 수별로 예측차수 및 중간층 유니트 수의 변화에 따른 인식성능을 조사하였다. 실험결과 평가용 데이터에 대하여 Elman망 예측 HMM은 상태수가 6이고, 예측차수가 3차, 중간층 유니트의 수가 15차원일 때, Jordan망 예측 HMM의 경우 상태수가 5이고, 예측차수가 3차, 중간층 유니트의 수가 10차원일 때 각각 98.5%로 우수한 결과를 얻었다.

  • PDF

필기 데이터 인식을 위한 이산 HMM과 연속 확률밀도 HMM에서의 HMM구조 최적화 기준 분석 (Analysis of HMM Topology Criteria on Discrete HMM and Continuous-Density HMM for Handwriting Recognition)

  • 박미나;하진영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.853-855
    • /
    • 2005
  • 은닉 마르코프(HMM)의 HMM의 구조 최적을 위한 모델 선택 방법에 많은 방법들이 연구되어지고 있다. HMM의 구조를 어떻게 최적으로 정해야 하는 가에 대해 HMM의 구조를 체계적인 방법으로 정함과 동시에 변별력의 단점을 개선 할 수 있는 방법으로 Anti-likelihood(ALC1)를 제안하였고 이를 모델 선택 기준인 BIC와의 결합(ALC2)하여 필기 데이터에 대해 실험한 결과 기존의 방법보다 파라미터의 수는 감소되고 인식률이 향상됨을 알 수 있었다. 이를 Discrete HMM에도 적용하여 제안된 ALC2가 HMM 구조를 최적화하는 모델 선택 기준임을 Continuous-Density HMM과 비교하여 실험 검증 한다.

  • PDF

한국어 숫자음 인식을 위한 이산분포 HMM과 연속분포 HMM의 성능 비교 연구 (A Comparison of Discrete and Continuous Hidden Markov Models for Korean Digit Recognition)

  • 홍형진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.157-160
    • /
    • 1994
  • 본 논문에서는 한국어 숫자음 인식에 대한 이산분포 HMM과 연속분포 HMM의 인식 성능을 비교하였다. 일반적으로 연속분포 HMM은 많은 계산량이 필요하고, 학습시 초기값이 매우 민감하다는 단점이 있지만, 이산분포 HMM의 VQ로 인한 왜곡을 제거함으로써 인식률을 향상시킬 수 있다. 여기서는 성능비교를 위해서 mel-cepstrum의 분석차수, 이산분포 HMM의 codebook 크기, 연속분포 HMM의 miture 개수등에 따른 인식성능을 비교하였다. 실험 결과 이산분포 HMM에서는 mel-cepstrum 벡터가 14차이고, codebook 크기가 64일 때 가장 좋은 성능을 나타냈으며, 연속부포 HMM에서는 mel-cepstrum 벡터가 16차이고 miture가 3개일 때 가장 좋은 결과를 얻을 수 있었다. 특히 학습 데이터의 양이 적은 경우에는 연속분포 HMM이 이산분포 HMM보다 더 좋은 인식률을 나타내었다.

  • PDF

회귀신경망 예측 HMM을 이용한 음성 인식에 관한 연구 (A study on Speech Recognition Using Recurrent Neural Predictive HMM)

  • 박경훈;한학용;김수훈;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.153-156
    • /
    • 2000
  • 본문에서는 예측형 회귀신경망과 HMM의 하이브리드 네트워크인 회귀신경망 예측 HMM을 구성하였다. 회귀신경망 예측 HMM은 예측형 회귀신경망을 HMM의 각 상태마다 예측기로 정의하여 일정치인 평균벡터 대신에 과거의 특징벡터의 영향을 받아 동적으로 변화하는 신경망에 의한 예측치를 이용하므로 학습패턴 설정자체가 시변성을 반영하는 동적 네트워크의 특성을 가진다. 따라서 음성과 같은 시계열 패턴의 인식에 유리하다. 회귀신경망 예측 HMM은 예측형 회귀신경망의 구조에 따라 Elman망 예측 HMM과 Jordan망 예측 HMM으로 구분하였다. 실험에서는 회귀신경망 예측 HMM의 상태수를 4, 5, 6으로 증가시켜 각 상태 수별로 예측차수 및 중간층 유니트 수의 변화에 따른 인식성능을 조사하였다. 실험결과 평가용. 데이터에 대하여 Elman망예측 HMM은 상태수가 6이고, 예측차수가 3차, 중간층 유니트의 수가 15차원일 때, Jordan망 예측 HMM의 경우 상태수가 5이고, 예측차수가 3차, 중간층 유니트의 수가 10차원일 때 각각 99.5%로 우수한 결과를 얻었다.

  • PDF

Substroke HMM 기반 온라인 필기체 문자인식 (On-line Handwriting Recognition Based on Substroke HMM)

  • 김춘영;석수영;정호열;정현열
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2003년도 하계학술대회 논문집
    • /
    • pp.74-77
    • /
    • 2003
  • 본 논문에서는 자연스러운 온라인 필기체 문자 인식을 위하여 획 기반 HMM(Substroke HMM)을 기반으로 한 인식 방법을 채택하고, 획 분류의 정확도 향상을 위한 전처리 과정에 대해 재샘플링 간격 조정을 통한 획 분류실험을 통해 인식률 제고에 관한 실험을 수행하였다 필기체 문자인식을 위한 방법으로 한 문자 전체를 HMM으로 구성하는 Whole-character HMM과 자소단위를 HMM으로 구성하는 character HMM을 주로 이용하였으나, 이러한 방법은 문자의 수에 비례하여 비교적 큰 메모리 용량과 계산량이 요구되는 단점이 있다. 이러한 단점을 개선하기 위한 획 기반 HMM은 문자를 획 단위로 분류한 후 이를 HMM 모델로 구성하므로 소수의 획 기반 HMM 모델만으로 문자를 모두 표현할 수 있는 장점을 가지고 있어, 인식률의 큰 저하 없이 계산량 및 메모리 용량을 크게 줄일 수 있다. PDA상에서 수집한 완성형 한글 데이터베이스를 사용하여 획 분류 실험을 수행한 결과 평활화와 7/100 길이의 재샘플링을 수행한 경우 평활화 과정을 추가하지 않은 기존의 재샘플링 5/100 길이의 경우에 비해 정확도가 평균 3.7% 향상을 나타내었으며, 특히 첨가 에러율이 감소함을 확인할 수 있다.

  • PDF

천이 제한 HMM을 이용한 잡음 환경에서의 음성 인식 (Speech Recognition in Noisy environment using Transition Constrained HMM)

  • 김원구;신원호;윤대희
    • 한국음향학회지
    • /
    • 제15권2호
    • /
    • pp.85-89
    • /
    • 1996
  • 본 논문에서는 상태간의 천이가 특정한 시간 구간에서만 발생하도록 하는 천이 제한(transition constrained) HMM를 제안하고 잡음 환경에서의 성능을 평가하였다. 천이 제한 HMM는 상태 지속을 제한하고 음성 신호의 시간적 변화를 단순하고 효과적으로 표현할 수 있다. 제안된 천이 제한 HMM은 기존 HMM 보다 성능이 우수할 뿐만아니라 계산량도 매우 감소한다. 제안된 방법의 성능을 평가하기 위하여 반연속(semi-continuous) HMM을 이용하여 잡음이 SNR 20, 10, 0 dB로 첨가된 음성에 화자독립 단독음 인식실험을 수행하였다. 실험 결과에서 제안된 방법은 잡음에 강인한 특성을 나타내었다. 두 가지 종류의 잡음을 SNR 10dB로 첨가하여 사용한 경우, 천이제한 HMM의 인식률은 기존 HMM의 단어 인식률 81.08%와 75.36%에 비하여 각각 7.31%와 10.35% 향상되었다.

  • PDF