• 제목/요약/키워드: continuous hidden markov model

검색결과 97건 처리시간 0.025초

발산거리 기반의 신경망에 의한 가우시안 확률 밀도 함수의 군집화 (Guassian pdfs Clustering Using a Divergence Measure-based Neural Network)

  • 박동철;권오현
    • 한국통신학회논문지
    • /
    • 제29권5C호
    • /
    • pp.627-631
    • /
    • 2004
  • 음성인식 모델상의 GPDFs(Gaussian Probability Density Functions)을 효율적으로 군집화 할 수 있는 알고리즘이 제안되었다. 제안된 알고리즘은 데이터 사이의 거리 척도로 발산 거리를 사용하는 새로운 형태의 CNN(Centroid Neural Network)으로, 제한된 자원을 가지는 H/W환경의 음성인식에서 메모리 사용량을 축소하는 응용에 대한 실험 결과, 음성인식 모델인 CDHMM(Continuous Density Hidden Markov Model)에서 기존의 Dk-means(Divergence-based k-means)알고리즘을 이용한 방법과 비교하여 인식 성능의 유지와 함께 약 31.3%의 GPDFs를 더 축소할 수 있었고, 군집화 알고리즘을 적용하지 자은 전체 GPDFs를 사용한 경우와 비교해서 인식 성능의 유지와 함께 약 61.8%의 GPDFs를 압축할 수 있었으며, SNR 10㏈ 잡음 데이터에 대한 성능평가에서도 인식 성능이 유지될 수 있었다.

음성 인식을 이용한 증권 정보 검색 시스템의 개발 (Development of a Stock Information Retrieval System using Speech Recognition)

  • 박성준;구명완;전주식
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권4호
    • /
    • pp.403-410
    • /
    • 2000
  • 본 논문에서는 음성 인식을 이용한 증권 정보 검색 시스템의 개발에 대하여 기술하고 시스템의 주요 특징을 설명한다. 이 시스템은 DHMM (discrete hidden Markov model)에 기반을 두고, 유사 음소를 기본 인식 단위로 사용하였다. 끝점 검출과 반향 제거 기능을 포함시켜 사용자의 음성 입력이 편리하도록 만들었으며, 한 번의 음성 입력이 하나만의 단어가 아닌 여러 개의 단어가 될 수 있도록 연속 음성 인식기를 구현하였다. 상용화 이후의 몇 개월에 걸친 데이터를 이용하여 운용 결과를 분석하였다.

  • PDF

CHMM을 이용한 발매기 명령어의 음성인식에 관한 연구 (A Study on the Speech Recognition for Commands of Ticketing Machine using CHMM)

  • 김범승;김순협
    • 한국철도학회논문집
    • /
    • 제12권2호
    • /
    • pp.285-290
    • /
    • 2009
  • 논문에서는 연속HMM(Continuos Hidden Markov Model)을 이용하여 실시간으로 발매기 명령어(314개 역명)를 인식 할 수 있도록 음성인식 시스템을 구현하였다. 특징 벡터로 39 MFCC를 사용하였으며, 인식률 향상을 위하여 895개의 tied-state 트라이폰 음소 모델을 구성하였다. 시스템 성능 평가 결과 다중 화자 종속 인식률은 99.24%, 다중화자 독립 인식률은 98.02%의 인식률을 나타내었으며, 실제 노이즈가 있는 환경에서 다중 화자 독립 실험의 경우 93.91%의 인식률을 나타내었다.

SVM을 이용한 자동 음소분할에 관한 연구 (Research about auto-segmentation via SVM)

  • 권호민;한학용;김창근;허강인
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2220-2223
    • /
    • 2003
  • In this paper we used Support Vector Machines(SVMs) recently proposed as the loaming method, one of Artificial Neural Network, to divide continuous speech into phonemes, an initial, medial, and final sound, and then, performed continuous speech recognition from it. Decision boundary of phoneme is determined by algorithm with maximum frequency in a short interval. Recognition process is performed by Continuous Hidden Markov Model(CHMM), and we compared it with another phoneme divided by eye-measurement. From experiment we confirmed that the method, SVMs, we proposed is more effective in an initial sound than Gaussian Mixture Models(GMMs).

  • PDF

한국어 음성인식 플랫폼(ECHOS)의 개선 및 평가 (Improvement and Evaluation of the Korean Large Vocabulary Continuous Speech Recognition Platform (ECHOS))

  • 권석봉;윤성락;장규철;김용래;김봉완;김회린;유창동;이용주;권오욱
    • 대한음성학회지:말소리
    • /
    • 제59호
    • /
    • pp.53-68
    • /
    • 2006
  • We report the evaluation results of the Korean speech recognition platform called ECHOS. The platform has an object-oriented and reusable architecture so that researchers can easily evaluate their own algorithms. The platform has all intrinsic modules to build a large vocabulary speech recognizer: Noise reduction, end-point detection, feature extraction, hidden Markov model (HMM)-based acoustic modeling, cross-word modeling, n-gram language modeling, n-best search, word graph generation, and Korean-specific language processing. The platform supports both lexical search trees and finite-state networks. It performs word-dependent n-best search with bigram in the forward search stage, and rescores the lattice with trigram in the backward stage. In an 8000-word continuous speech recognition task, the platform with a lexical tree increases 40% of word errors but decreases 50% of recognition time compared to the HTK platform with flat lexicon. ECHOS reduces 40% of recognition errors through incorporation of cross-word modeling. With the number of Gaussian mixtures increasing to 16, it yields word accuracy comparable to the previous lexical tree-based platform, Julius.

  • PDF

자동 분할과 ELM을 이용한 심장질환 분류 성능 개선 (Performance Improvement of Cardiac Disorder Classification Based on Automatic Segmentation and Extreme Learning Machine)

  • 곽철;권오욱
    • 한국음향학회지
    • /
    • 제28권1호
    • /
    • pp.32-43
    • /
    • 2009
  • 본 논문은 자동 분할과 extreme learning machine (ELM)을 이용하여 연속 심음신호에 의한 심장질환 분류의 성능을 개선한다. 자동 분할을 위한 전처리 단계에서 비정상적인 심음신호는 심잡음 (murmur)과 클릭음 (click)을 포함하고 있기 때문에 제1음 (S1)과 제2음 (S2) 시작점 검출 결과가 부정확하거나 누락되어 기존의 심장질환 분류 시스템의 정확도를 저하시키게된다. 이러한 분할 오류에 의한 성능 저하를 감소하기 위해 S1 및 S2의 위치를 찾고, S1 및 S2의 시간 차이를 이용하여 부정확한 시작점을 교정한 다음 한 주기 심음 신호를 추출한다. 특징벡터로는 단일 주기의 심음 신호로부터 추출된 멜척도 필터뱅크 로그 에너지 계수와 포락선을 사용한다. 심장질환을 분류하기 위하여 한 개의 은닉층을 가진 ELM 알고리듬을 사용한다. 9가지 심장질환 분류 실험을 수행한 결과, 제안 방법은 81.6%의 분류 정확도를 나타내며, multi-layer perceptron(MLP), support vector machine (SVM), hidden Markov model (HMM) 중에서 가장 높은 분류 정확도를 보여준다.

연속 잡음 음성 인식을 위한 다 모델 기반 인식기의 성능 향상에 대한 연구 (Performance Improvement in the Multi-Model Based Speech Recognizer for Continuous Noisy Speech Recognition)

  • 정용주
    • 음성과학
    • /
    • 제15권2호
    • /
    • pp.55-65
    • /
    • 2008
  • Recently, the multi-model based speech recognizer has been used quite successfully for noisy speech recognition. For the selection of the reference HMM (hidden Markov model) which best matches the noise type and SNR (signal to noise ratio) of the input testing speech, the estimation of the SNR value using the VAD (voice activity detection) algorithm and the classification of the noise type based on the GMM (Gaussian mixture model) have been done separately in the multi-model framework. As the SNR estimation process is vulnerable to errors, we propose an efficient method which can classify simultaneously the SNR values and noise types. The KL (Kullback-Leibler) distance between the single Gaussian distributions for the noise signal during the training and testing is utilized for the classification. The recognition experiments have been done on the Aurora 2 database showing the usefulness of the model compensation method in the multi-model based speech recognizer. We could also see that further performance improvement was achievable by combining the probability density function of the MCT (multi-condition training) with that of the reference HMM compensated by the D-JA (data-driven Jacobian adaptation) in the multi-model based speech recognizer.

  • PDF

의수 제어를 위한 HMM-MLP 근전도 신호 인식 기법 (An EMG Signals Discrimination Using Hybrid HMM and MLP Classifier for Prosthetic Arm Control Purpose)

  • 권장우;홍승홍
    • 대한의용생체공학회:의공학회지
    • /
    • 제17권3호
    • /
    • pp.379-386
    • /
    • 1996
  • This paper describes an approach for classifying myoelectric patterns using a multilayer perceptrons (MLP's) and hidden Markov models (HMM's) hybrid classifier. The dynamic aspects of EMG are important for tasks such as continuous prosthetic control or vari- ous time length EMG signal recognition, which have not been successfully mastered by the most neural approaches. It is known that the hidden Markov model (HMM) is suitable for modeling temporal patterns. In contrasts the multilayer feedforward networks are suitable for static patterns. Ank a lot of investigators have shown that the HMM's to be an excellent tool for handling the dynamical problems. Considering these facts, we suggest the combination of MLP and HMM algorithms that might lead to further improved EMG recognition systems.

  • PDF

분산 메모리 다중프로세서 환경에서의 병렬 음성인식 모델 (A Parallel Speech Recognition Model on Distributed Memory Multiprocessors)

  • 정상화;김형순;박민욱;황병한
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.44-51
    • /
    • 1999
  • 본 논문에서는 음성과 자연언어의 통합처리를 위한 효과적인 병렬계산모델을 제안한다. 음소모델은 연속 Hidden Markov Model(HMM)에 기반을 둔 문맥종속형 음소를 사용하며, 언어모델은 지식베이스를 기반으로 한다. 또한 지식베이스를 구성하기 위해 계층구조의 semantic network과 병렬 marker-passing을 추론 메카니즘으로 쓰는 memory-based parsing 기술을 사용한다. 본 연구의 병렬 음성인식 알고리즘은 분산메모리 MIMD(Multiple Instruction Multiple Data) 구조의 다중 Transputer 시스템을 이용하여 구현되었다. 실험결과, 본 연구의 지식베이스 기반 음성인식 시스템의 인식률이 word network 기반 음성인식 시스템보다 높게 나타났으며 code-phoneme 통계정보를 활용하여 인식성능의 향상도 얻을 수 있었다. 또한, 성능향상도(speedup) 관련 실험들을 통하여 병렬 음성인식 시스템의 실시간 구현 가능성을 확인하였다.

  • PDF

dPCA-HMM을 이용한 전투기 조종사 모델링 연구 (A Study on Modeling of Fighter Pilots Using a dPCA-HMM)

  • 최예림;전승욱;박종헌;신동민
    • 한국항공우주학회지
    • /
    • 제43권1호
    • /
    • pp.23-32
    • /
    • 2015
  • 전투기 조종사 모델링은 국방 M&S(Modeling & Simulation)를 활용한 전쟁 모의 및 전투 실험의 기초 기술로 국방 M&S의 중요성이 대두됨에 따라 연구의 필요성이 높아지고 있다. 특히, 최근 전투 로그의 축적으로 통계적 학습 기법을 활용한 모델링의 적용이 가능해졌으며 전투 로그의 시계열적 특성을 반영할 수 있는 HMM(Hidden Markov Model)이 적합하다. 하지만 HMM은 이산형 혹은 연속형 중 한 형태의 변수만을 통해 학습되므로 이형 변수로 구성된 전투 로그에 적용을 위해서는 형변환 과정이 필요하다. 따라서 본 논문에서는 형변환을 위한 dPCA(Discrete Principal Component Analysis)와 HMM을 접목한 dPCA-HMM 기반 조종사 모델링 방법을 제안한다. 국방과학연구소 관급 시뮬레이터로부터 생성된 전투 로그를 이용한 비교 실험을 통해 제안하는 방법론의 성능을 평가하였으며, 만족스러운 성능을 나타내었다.