• 제목/요약/키워드: continuous hidden markov model

검색결과 97건 처리시간 0.02초

화자인식에서 연속밀도 은닉마코프모델의 혼합밀도 결정방법 (Gaussian Density Selection Method of CDHMM in Speaker Recognition)

  • 서창우;이주헌;임재열;이기용
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.711-716
    • /
    • 2003
  • 본 논문은 연속밀도 은닉마코프모델에서 각 상태별 혼합성분 개수를 결정하는 방법을 제안한다. 지금까지의 대부분의 연구가 연속밀도 은닉마코프모델에서 화자의 스펙트럼 특성에 상관없이 각 상태별 동일한 혼합성분 개수를 적용하였다. 이런 접근방법은 많은 계산량을 요구할 뿐만 아니라, 각 상태의 특성을 무시하고 있기 때문에 각 상태별 음성신호의 정확한 모델링을 할 수 없다. 따라서 본 논문에서 제안한 연속밀도 은닉마코프모델의 파라미터 추정은 각 상태별 혼합성분에 대한 발생 확률값에 따라서 결정하였다. 또한 혼합성분의 개수를 줄이는 과정에서 신호의 상관성을 줄이고 시스템의 전체적인 안정성을 얻기 위해서 주성분 분석을 이용하였다. 제안한 방법은 기존의 은닉마코프모델에 비해서 평균 10% 작은 혼합성분 개수를 이용했을 때를 기준으로 실험하였다. 실험결과에서 혼합성분 결정만을 적용했을 때 거의 비슷한 성능을 얻을 수 있었다. 그리고 주성분 분석을 이용했을 때, 특정벡터가 16 차일 때 평균 0.35%의 성능감소가 일어났지만, 25 차에서는 평균 0.65%의 성능개선을 얻을 수 있었다.

천이 제한 HMM을 이용한 잡음 환경에서의 음성 인식 (Speech Recognition in Noisy environment using Transition Constrained HMM)

  • 김원구;신원호;윤대희
    • 한국음향학회지
    • /
    • 제15권2호
    • /
    • pp.85-89
    • /
    • 1996
  • 본 논문에서는 상태간의 천이가 특정한 시간 구간에서만 발생하도록 하는 천이 제한(transition constrained) HMM를 제안하고 잡음 환경에서의 성능을 평가하였다. 천이 제한 HMM는 상태 지속을 제한하고 음성 신호의 시간적 변화를 단순하고 효과적으로 표현할 수 있다. 제안된 천이 제한 HMM은 기존 HMM 보다 성능이 우수할 뿐만아니라 계산량도 매우 감소한다. 제안된 방법의 성능을 평가하기 위하여 반연속(semi-continuous) HMM을 이용하여 잡음이 SNR 20, 10, 0 dB로 첨가된 음성에 화자독립 단독음 인식실험을 수행하였다. 실험 결과에서 제안된 방법은 잡음에 강인한 특성을 나타내었다. 두 가지 종류의 잡음을 SNR 10dB로 첨가하여 사용한 경우, 천이제한 HMM의 인식률은 기존 HMM의 단어 인식률 81.08%와 75.36%에 비하여 각각 7.31%와 10.35% 향상되었다.

  • PDF

한국어 음성/문자 공용인식기의 성능향상을 위한 가변 상태수 CHMM모델의 구성 (Difference State Number of CHMM Model to Improve the Performance of SCCRS)

  • 석수영;김민정;김광수;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.95-98
    • /
    • 2002
  • 문자인식 또는 음성인식을 위해 사용되어지는 CHMM(Continuous Hidden Markov Model)모델은 일반적으로 모델의 상태수를 일정한 수로 고정하는 고정 상태수 모델 구조를 가지고 있으나, 이는 개별적인 인식 단위의 특성을 고려하지 않은 경우로써 이를 고려한 가변 상태수 모델을 사용할 경우 인식률 향상을 기대할 수 있다. 개별적인 인식 단위에 적합한 모델 상태수를 결정하는 방법으로 파라미터 히스토그램 방법과, BIC(Bayesian Information Criterion)방법을 사용하는 것이 대표적이다. 이들 방법들은 개별적인 인식단위의 우도값만을 향상시키기 위한 방법으로 전체인식률과 직접적으로 비례하지는 않는다. 따라서, 본 논문에서는 고정 상태수를 갖는 모델 적용 방법과 인식단위별 상태수 변화에 따른 인식률을 비교하였으며, 이를 바탕으로 각 모델별 상태수를 달리하는 가변 상태수 CHMM모델 구성 방법을 제안한다. 제안된 가변상태수 모델의 유효성을 확인하기 위해 음성/문자 공용인식기 중 필기체 문자 인식에 적용한 결과 제안한 LM(Local Maximum)으로 구성된 가변 상태수 모델이 MLE와 BIC로 구성된 모델과 인식률 면에서는 거의 동일한 성능을 유지하면서 전체 상태수는 MLE 모델에 비해 $31\%$, BIC로 구성된 모델에 비해 $22\%$ 감소를 나타내어 제안한 모델의 유효성을 확인할 수 있었다.

  • PDF

HMM을 이용한 제스처 인식 기반 한자 학습 콘텐츠 (The Chinese Characters Learning Contents Based on Gesture Recognition Using HMM Algorithm)

  • 송대현;김동민;이칠우
    • 한국멀티미디어학회논문지
    • /
    • 제15권8호
    • /
    • pp.1067-1074
    • /
    • 2012
  • 본 논문에서는 HMM을 이용한 제스처 인식을 입력 인터페이스로 사용한 한자 학습 콘텐츠에 대해 제안한다. 제안한 시스템의 입력정보는 TOF 카메라 영상으로부터 3차원 정보를 받으며, 제스처 인식 방법은 사용자의 포즈를 예측하는 부분과 연속된 포즈들로부터 제스처를 인식하는 부분으로 구성되어 있다. 사용자와 컴퓨터사이의 의사소통에서, 별도의 추가 장비를 사용하지 않고 사용자의 행동에 의한 조작을 통해 사용자가 쉽게 조작할 수 있도록 편리함을 제공하였다. 또한 대형 디스플레이와 다양한 멀티미디어 요소를 이용하여 몰입과 흥미를 유발시킬 수 있기 때문에 정보 전달을 극대화할 수 있다. 본 논문에서 제안한 에듀테인먼트 한자 학습 콘텐츠는 교육적 내용를 제공하고 사용자가 흥미를 느끼도록 하여 자연스레 한자를 습득할 수 있고, 제스처 인식을 기반으로 하므로 사용자에게 콘텐츠 체험을 통한 시너지 효과를 기대할 수 있다.

차량 항법용 음성인식 시스템의 구현 (Implementation of a Speech Recognition System for a Car Navigation System)

  • 이태한;양태영;박상택;이충용;윤대희;차일환
    • 전자공학회논문지S
    • /
    • 제36S권9호
    • /
    • pp.103-112
    • /
    • 1999
  • 본 논문에서는 차량 항법영 음성 인식을 위한 화자 독립 단독음 인식 시스템을 범용 DSP를 사용하여 구현하였으며, 잡음 처리 기술로 SNR 정규화와 RAS를 결합한 방법을 제안하여 인식 시스템의 성능을 개선시켰다. 인식 알고리즘으로서 반연속 HMM을 사용하였으며, TMS320C31을 이용하여 구현하였다. 실험에서 사용된 인식 단어는 차량 항법 시스템을 위한 명령어 69단어이며, 구현된 인식 시스템은 자동차 환경에서 녹음된 음성 데이터에 의한 인식 결과와 하드웨어 구현에 따르는 제약 조건을 동시에 고려하여 구현되었다. 주행 중에 녹음된 데이터에 대한 컴퓨터 시뮬레이션 상에서 특징 벡터 중 MFCC-CMS를 이용하고, 잡음 처리 방법으로 SNR 정규화와 스펙트럼 차감법을 결합하여 실험한 경우 최고 93.62%의 인식 성능을 보였으며, 89.93%의 인식률을 갖는 기존 방법보다 3.69%의 인식 성능 향상을 가져왔다. 제안된 잡음 처리 방법은 자동차 안에서의 SNR이 5dB이하에서 좋은 인식 성능을 보이는 것으로 나타났다.

  • PDF

로봇 제어를 위한 의미 있는 손동작 추출 방법 (An Extraction Method of Meaningful Hand Gesture for a Robot Control)

  • 김아람;이상용
    • 한국지능시스템학회논문지
    • /
    • 제27권2호
    • /
    • pp.126-131
    • /
    • 2017
  • 본 논문에서는 손짓을 이용하여 로봇에게 명령을 내릴 때, 사용자의 여러 가지 손짓 중 의미 있는 동작을 추출하기 위한 방법을 제시한다. 로봇에게 명령을 내릴 때, 사람들의 손짓은 준비동작, 본 동작, 마무리 동작으로 구분할 수 있다. 여기에서 본 동작이 로봇에게 명령을 전달하는 의미 있는 동작이고 다른 동작은 그 동작을 위한 의미 없는 보조 동작이다. 따라서 연속적인 손짓에서 본 동작만을 추출해야 한다. 또한 사람들은 무위식적으로 손을 움직일 수 있는데 이러한 동작들 역시 의미가 없는 동작으로 로봇이 판단하여야 한다. 본 연구에서는 키넥트 센서를 이용하여 획득한 거리영상에서 사람의 골격자료를 획득하여 손을 추출하고, 칼만필터를 이용하여 손의 위치를 추적하면서 의미 있는 손동작과 의미 없는 손동작을 구분하고 은닉 마코프 모델을 이용하여 손짓을 인식한다.

조건부 Copula 함수 기반의 월단위 GloSea5 앙상블 예측정보 편의보정 기법과 연계한 일단위 시공간적 상세화 모델 개발 (Development of daily spatio-temporal downscaling model with conditional Copula based bias-correction of GloSea5 monthly ensemble forecasts)

  • 김용탁;김민지;권현한
    • 한국수자원학회논문집
    • /
    • 제54권12호
    • /
    • pp.1317-1328
    • /
    • 2021
  • 본 연구에서는 예측 모델의 정확성이 비교적 높은 월단위의 GloSea5 자료를 기반으로 예측강수량을 편의보정 및 시공간적으로 상세화하여 연속된 일단위 강우량을 모의하고자 하였다. 이를 위하여 GloSea5를 입력자료로 조건부 Copula와 MNHMM 모형을 적용하여 일단위 시계열 강우량 예측정보를 생산할 수 있는 모델링 체계를 제시하였다. 모의결과 동기간의 자료라도 매주 생산되는 결과가 큰 차이를 나타내는 예측강수량의 변동성이 유의하게 개선되었다. 모형 검증에서 모의된 일강수량, 연속강우확률, 연속무강우확률 및 강우일수가 관측자료와 유사한 값으로 모의되는 등 수문모형의 입력자료로써 활용성이 클 것으로 판단된다. 유역 단위에서의 모의된 강수량 계열간의 상관성 차이가 최소 -0.02에서 최대 0.10로 유역의 강우관측소간 상호종속성을 효과적으로 복원되는 등 수문모형의 입력자료로 활용 시 유역의 수문기상학적 반응을 보다 현실적으로 모의가 가능할 것으로 기대된다.