• 제목/요약/키워드: continuous hidden markov model

검색결과 97건 처리시간 0.024초

3차원 가속도 데이터를 이용한 HMM 기반의 동작인식 (HMM-based Motion Recognition with 3-D Acceleration Signal)

  • 김상기;박건혁;전석희;임성훈;한갑종;최승문;최승진
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권3호
    • /
    • pp.216-220
    • /
    • 2009
  • 본 연구에서는 손에 들고 있는 컨트롤러를 이용하여 사용자의 동작을 인식하는 방법을 제안한다. 컨트롤러에는 3축 가속도 센서가 부착되어 있어 사용자의 움직임에 따라 가속도 신호를 생성 이를 블루투스 통신을 이용하여 컴퓨터로 전달한 후 분석하여 사용자의 동작을 인식한다. 입력된 가속도 신호로부터 중력 가속도를 제거한 후 동작구간을 추출하여 이를 동작 모델에 적용 가장 높은 우도(likelihood)를 갖는 동작으로 인식한다. 각 동작 모델은 HMM을 이용하여 학습되며 성능 향상을 위한 가중치 보정과정과 인식 속도향상을 위한 방법을 포함한다. 제안된 방법을 3가지의 동작 집합에 적용하여 실용화가 가능한 정도의 높은 인식 결과를 얻었다.

음성 문자 공용인식기를 위한 SSMS 기반 가변 파라미터 모델 (A Variable Parameter Model based on SSMS for an On-line Speech and Character Combined Recognition System)

  • 석수영;정호열;정현열
    • 한국음향학회지
    • /
    • 제22권7호
    • /
    • pp.528-538
    • /
    • 2003
  • 음성 문자 공용 인식 시스템은 PDA (Personal Digital Assistants)와 같은 휴대용 모빌 환경에서 음성인식과 문자인식을 적용하기에 적합하도록 개발되었다. 공용 인식 시스템은 특징 파라미터 추출에 있어서는 음성과 문자부분이 독립적으로 수행되나, 인식 과정은 단일 엔진으로 수행된다. CHMM (Continuous Hidden Markov Model)을 이용하는 인식엔진은 고정 파라미터 모델 구조 대신에 동일한 인식률을 유지하면서 모델의 파라미터의 수를 효과적으로 줄일 수 있는 가변 파라미터 모델 구조를 사용하는 것이 유리하다. 본 논문에서는 문맥 독립 가변 파라미터 모델을 생성하기 위해 SSMS (Successive State and Mixture Splitting) 방법을 제안한다. SSMS 알고리즘은 시간 방향 분할과 혼합수 방향분할을 통해 적절한 상태수와 각 상태당 적절한 혼합수를 가지는 모델을 생성한다. 음성 인식 실험 결과 동일한 인식성능을 나타내는 경우 SSMS 기반 가변 파라미터 모델이 고정 파라미터 모델에 비해 GOPDD (Gaussian Output Probability Density Distribution)의 수가 40% 감소함을 확인할 수 있었다.

모션 히스토리 영상 및 기울기 방향성 히스토그램과 적출 모델을 사용한 깊이 정보 기반의 연속적인 사람 행동 인식 시스템 (Depth-Based Recognition System for Continuous Human Action Using Motion History Image and Histogram of Oriented Gradient with Spotter Model)

  • 음혁민;이희진;윤창용
    • 한국지능시스템학회논문지
    • /
    • 제26권6호
    • /
    • pp.471-476
    • /
    • 2016
  • 본 논문은 깊이 정보를 기반으로 모션 히스토리 영상 및 기울기 방향성 히스토그램과 적출 모델을 사용하여 연속적인 사람 행동들을 인식하는 시스템을 설명하고 연속적인 행동 인식 시스템에서 인식 성능을 개선하기 위해 행동 적출을 수행하는 적출 모델을 제안한다. 본 시스템의 구성은 전처리 과정, 사람 행동 및 적출 모델링 그리고 연속적인 사람 행동 인식으로 이루어져 있다. 전처리 과정에서는 영상 분할과 시공간 템플릿 기반의 특징을 추출하기 위하여 Depth-MHI-HOG 방법을 사용하였으며, 추출된 특징들은 사람 행동 및 적출 모델링 과정을 통해 시퀀스들로 생성된다. 이 생성된 시퀀스들과 은닉 마르코프 모델을 사용하여 정의된 각각의 행동에 적합한 사람 행동 모델과 제안된 적출 모델을 생성한다. 연속적인 사람 행동 인식은 연속적인 행동 시퀀스에서 적출 모델에 의해 의미 있는 행동과 의미 없는 행동을 분할하는 행동 적출과 의미 있는 행동 시퀀스에 대한 모델의 확률 값들을 비교하여 연속적으로 사람 행동들을 인식한다. 실험 결과를 통해 제안된 모델이 연속적인 행동 인식 시스템에서 인식 성능을 효과적으로 개선하는 것을 검증한다.

유전 알고리즘이 결합된 MLP와 HMM 합성 분류기를 이용한 근전도 신호 인식 기법 (An EMG Signals Classification using Hybrid HMM and MLP Classifier with Genetic Algorithms)

  • 정정수;권장우;류길수
    • 한국멀티미디어학회논문지
    • /
    • 제6권1호
    • /
    • pp.48-57
    • /
    • 2003
  • 본 연구는 hidden Markov model(HMM)과 유전알고리 즘을 갖는 MLP(multilayer perceptron) 합성 분류기를 이용한 근전 신호의 인식에 관한 연구이다. 제안된 기법에서 유전알고리즘은 전역적인 탐색으로 신경회로망의 최적의 초기 연결강도를 선택하는데, 이로 인하여 학습속도 및 인식률이 향상되게 된다. 근전 신호의 동적 특성은 연속 운동 인식처럼 신호의 길이 및 시작점과 끝점이 일정치 않고 시변성이 큰 경우에 반드시 고려되어야 하나, 일반 신경회로망에서는 이의 적용이 용이하지 않다. 따라서, 본 연구에서는 신호의 동적 특성에 대한 적응성을 갖는 HMM과 MLP 신경회로망을 결합시킨 구조를 갖는 인식기를 제안한다. 이러한 구조는 인식기의 입장에서 볼 때 HMM의 신호의 동적 특성에 대한 적응성과, MLP의 정적인 신호에 대한 우수한 분류력이 결합되어 동적인 신호에도 높은 인식율을 갖는 특성을 갖는다.

  • PDF

연속 음성 인식 향상을 위해 LMS 알고리즘을 이용한 CHMM 모델링 (CHMM Modeling using LMS Algorithm for Continuous Speech Recognition Improvement)

  • 안찬식;오상엽
    • 디지털융복합연구
    • /
    • 제10권11호
    • /
    • pp.377-382
    • /
    • 2012
  • 본 논문은 반향 제거 평균 예측 LMS 알고리즘을 이용하여 반향 잡음에 강인한 연속 음성 인식 모델인 CHMM 모델을 구성하는 방법을 제안하였다. 변화하는 반향 잡음에 적응하고 연속 음성 인식 성능 향상을 위한 반향 잡음 제거 평균 예측 LMS 알고리즘을 이용하여 CHMM 모델을 구성하였다. 제안한 알고리즘에 의해 구성된 CHMM 모델에 대하여 연속 인식 성능을 평가하였다. 실험 결과 변화하는 환경 잡음을 제거하여 얻은 음성의 SNR은 평균 1.93dB이 향상되었고 연속 음성의 인식률은 2.1% 향상되었다.

잡음에 강한 음성 인식에서 SNR 기준 함수를 사용한 가우시안 함수 변형 및 결정에 관한 연구 (A Study on Variation and Determination of Gaussian function Using SNR Criteria Function for Robust Speech Recognition)

  • 전선도;강철호
    • 한국음향학회지
    • /
    • 제18권7호
    • /
    • pp.112-117
    • /
    • 1999
  • 잡음에 강한 음성인식시스템을 위하여 주파수 차감법을 사용할 경우 음성 신호마저 차감하여 신호를 더욱 부식시키는 경우가 존재한다. 본 연구에서는 이러한 경우를 위해서 프레임 마다 추정 잡음과 차감 신호의 SNR(Signal to Noise Ratio) 함수로부터 반연속 HMM(Hidden Markov Model)의 가우시안 함수를 변형 및 결정하는 방법을 제안한다. 이 방법의 타당성을 위해 프레임마다 추정 잡음의 오류 정도가 추정 잡음의 크기와 관계함을 신호 파형 형태로써 보였으며, 이러한 이유에서 SNR을 기준으로 가우시안 함수를 변형 및 결정하게 된다. 실험에서 80㎞/h 이상의 속도로 달리는 차량 내에서 배경 잡음과 음성이 혼합되었을 때의 음성 인식율을 평가하였다. 그 결과 주파수 차감한 경우와 차감하지 않은 경우에 비해 본 논문에서 제안한 SNR에 의한 가우시안 결정 방법이 더욱 향상된 인식율을 보였다.

  • PDF

은닉 마르코프 모델을 이용하여 계절의 변동을 동반한 인공 바람자료 생성 및 검증 (Generation and Verification of Synthetic Wind Data With Seasonal Fluctuation Using Hidden Markov Model)

  • 박석영;유기완
    • 한국항공우주학회지
    • /
    • 제49권12호
    • /
    • pp.963-969
    • /
    • 2021
  • 풍력발전단지 위치 선정에 있어 풍속 분포 및 발전량을 평가하기 위해 해당 지역의 기상 타워에서 계측된 바람 자료를 이용한다. 그러나 기상 타워에서 계측된 바람 자료는 종종 정보가 누락되거나 원하는 높이에 맞지 않거나, 혹은 데이터 길이가 충분하지 않아 풍력터빈 제어 및 성능 시뮬레이션 수행에 어려움을 겪게 된다. 따라서 풍력터빈 혹은 발전단지에 대한 연간 발전량 및 이용률을 평가하는데 원하는 높이에서 장기간의 연속적인 바람 자료는 매우 중요하다. 또한, 한반도와 같이 계절에 따른 풍향과 풍속 변동이 뚜렷한 경우에는 계절별 특징이 고려된 풍속과 풍향을 동반한 바람 자료를 고려해야 한다. 본 연구에서는 통계적 방법인 은닉 마르코프 모델을 이용하여 풍속과 풍향의 변동을 고려한 인공 바람을 생성하기 위한 방법을 제시한다. 통계처리를 위한 바람 자료는 전라북도 고군산군도에 있는 말도의 기상청 방재기상관측(AWS) 장비에서 계측된 자료를 사용한다. 은닉 마르코프 모델에 의해 생성된 인공 바람은 통계 변수, 풍력에너지밀도, 계절별 평균 풍속, 주 풍향 등을 계측 자료와 비교를 통해 검증하기로 한다.

은닉 마르코프 모델을 이용한 MPEG 압축 비디오에서의 점진적 변환의 검출 (Detection of Gradual Transitions in MPEG Compressed Video using Hidden Markov Model)

  • Choi, Sung-Min;Kim, Dai-Jin;Bang, Sung-Yang
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권3호
    • /
    • pp.379-386
    • /
    • 2004
  • 비디오 요약의 첫 걸음은 샷(shot) 변환의 검출이다. 이러한 샷 변환은 점진적인 변환과 급진적인 변환이 있다. 지금까지 급진적인 샷 변환은 이미 주어진 한계치나 연속된 두 프레임의 이미지에 기반을 둔 거리를 이용하여 검출하였고 점진적 변환 또한 일반적으로 한계치를 이용하여 검출하였다. 그러나 한계치에 따라 그 결과가 확연히 달라지고 또한 그 한계치를 정하는 것도 어려운 문제이다. 이 논문에서는 이런 문제의 해결과 MPEG 압축 비디오 상에서 점진적 변화의 검출뿐만 아니라 분류를 해결하는 방법을 제시하였다. 논문에서는 한계치를 사용하지 않은 은닉 마르코프 모델과 MPEG의 근사 DC 값을 이용하여 보다 빠르고 정확한 결과를 얻도록 하였다. 그리고 히스토그램의 차이뿐만 아니라 매크로 블록 (macro block)의 차이라 불리는 새로운 척도를 도입하여 보다 정확한 값을 얻도록 하였다. 은닉 마르코프 모델은 샷, 페이드(fade), 디졸브(dissolve), 컷(cut) 등의 4개의 상태를 갖게 하고 학습은 Baum-Welch 알고리즘으로 필요한 변수들을 추정하였다. 그리고 특정 벡터에 Viterbi 알고리즘을 적용하여 원하는 상태를 얻을 수 있다. 대부분의 실험 결과를 보면 새로 제안한 척도를 사용한 방법이 히스토그램의 차만을 이용한 방법보다 더 좋은 결과를 나타내었으며 이산적 마르코프 모델보다 연속적 마르코프 모델이 좋은 결과를 보여준다.

Discriminative Training of Stochastic Segment Model Based on HMM Segmentation for Continuous Speech Recognition

  • Chung, Yong-Joo;Un, Chong-Kwan
    • The Journal of the Acoustical Society of Korea
    • /
    • 제15권4E호
    • /
    • pp.21-27
    • /
    • 1996
  • In this paper, we propose a discriminative training algorithm for the stochastic segment model (SSM) in continuous speech recognition. As the SSM is usually trained by maximum likelihood estimation (MLE), a discriminative training algorithm is required to improve the recognition performance. Since the SSM does not assume the conditional independence of observation sequence as is done in hidden Markov models (HMMs), the search space for decoding an unknown input utterance is increased considerably. To reduce the computational complexity and starch space amount in an iterative training algorithm for discriminative SSMs, a hybrid architecture of SSMs and HMMs is programming using HMMs. Given the segment boundaries, the parameters of the SSM are discriminatively trained by the minimum error classification criterion based on a generalized probabilistic descent (GPD) method. With the discriminative training of the SSM, the word error rate is reduced by 17% compared with the MLE-trained SSM in speaker-independent continuous speech recognition.

  • PDF

GMM을 이용한 프레임 단위 분류에 의한 우리말 음성의 분할과 인식 (Korean Speech Segmentation and Recognition by Frame Classification via GMM)

  • 권호민;한학용;고시영;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2003년도 하계학술대회 논문집
    • /
    • pp.18-21
    • /
    • 2003
  • In general it has been considered to be the difficult problem that we divide continuous speech into short interval with having identical phoneme quality. In this paper we used Gaussian Mixture Model (GMM) related to probability density to divide speech into phonemes, an initial, medial, and final sound. From them we peformed continuous speech recognition. Decision boundary of phonemes is determined by algorithm with maximum frequency in a short interval. Recognition process is performed by Continuous Hidden Markov Model(CHMM), and we compared it with another phoneme divided by eye-measurement. For the experiments result we confirmed that the method we presented is relatively superior in auto-segmentation in korean speech.

  • PDF