• 제목/요약/키워드: HMM

검색결과 962건 처리시간 0.041초

HMM 기반의 한국어 음성합성에서 지속시간 모델 파라미터 제어 (Control of Duration Model Parameters in HMM-based Korean Speech Synthesis)

  • 김일환;배건성
    • 음성과학
    • /
    • 제15권4호
    • /
    • pp.97-105
    • /
    • 2008
  • Nowadays an HMM-based text-to-speech system (HTS) has been very widely studied because it needs less memory and low computation complexity and is suitable for embedded systems in comparison with a corpus-based unit concatenation text-to-speech one. It also has the advantage that voice characteristics and the speaking rate of the synthetic speech can be converted easily by modifying HMM parameters appropriately. We implemented an HMM-based Korean text-to-speech system using a small size Korean speech DB and proposes a method to increase the naturalness of the synthetic speech by controlling duration model parameters in the HMM-based Korean text-to speech system. We performed a paired comparison test to verify that theses techniques are effective. The test result with the preference scores of 73.8% has shown the improvement of the naturalness of the synthetic speech through controlling the duration model parameters.

  • PDF

의수 제어를 위한 HMM-MLP 근전도 신호 인식 기법 (An EMG Signals Discrimination Using Hybrid HMM and MLP Classifier for Prosthetic Arm Control Purpose)

  • 권장우;홍승홍
    • 대한의용생체공학회:의공학회지
    • /
    • 제17권3호
    • /
    • pp.379-386
    • /
    • 1996
  • This paper describes an approach for classifying myoelectric patterns using a multilayer perceptrons (MLP's) and hidden Markov models (HMM's) hybrid classifier. The dynamic aspects of EMG are important for tasks such as continuous prosthetic control or vari- ous time length EMG signal recognition, which have not been successfully mastered by the most neural approaches. It is known that the hidden Markov model (HMM) is suitable for modeling temporal patterns. In contrasts the multilayer feedforward networks are suitable for static patterns. Ank a lot of investigators have shown that the HMM's to be an excellent tool for handling the dynamical problems. Considering these facts, we suggest the combination of MLP and HMM algorithms that might lead to further improved EMG recognition systems.

  • PDF

피지에 기초를 둔 HMM을 이용한 음성 인식 (Speech Recognition Using HMM Based on Fuzzy)

  • 안태옥;김순협
    • 전자공학회논문지B
    • /
    • 제28B권12호
    • /
    • pp.68-74
    • /
    • 1991
  • This paper proposes a HMM model based on fuzzy, as a method on the speech recognition of speaker-independent. In this recognition method, multi-observation sequences which give proper probabilities by fuzzy rule according to order of short distance from VQ codebook are obtained. Thereafter, the HMM model using this multi-observation sequences is generated, and in case of recognition, a word that has the most highest probability is selected as a recognized word. The vocabularies for recognition experiment are 146 DDD are names, and the feature parameter is 10S0thT LPC cepstrum coefficients. Besides the speech recognition experiments of proposed model, for comparison with it, we perform the experiments by DP, MSVQ and general HMM under same condition and data. Through the experiment results, it is proved that HMM model using fuzzy proposed in this paper is superior to DP method, MSVQ and general HMM model in recognition rate and computational time.

  • PDF

인공신경망을 이용한 HMM 기반 온라인 한글인식 시스템의 자모 검증 (Verification of Graphemes Using Neural Networks in HMM Based On-line Koran Handwriting Recognition)

  • 조성정;김자환;김진형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.890-895
    • /
    • 2000
  • 본 논문에서는 인공신경망을 이용한 자모 검증을 HMM 기반 온라인 한글인식 시스템에 적용하는 방법론을 제시한다. 본 시스템에서 각각의 자모는 한 개의 HMM 모델과 한 개의 인공신경망 검증기를 갖는다. 자모 검증기는 HMM 네트웍이 생성한 자모 후보 가정을 입력으로 받은 후, 이 가정의 타당성에 대한 사후 확률을 출력한다. 이 사후 확률은 Viterbi 탐색시 탐색 경로에 반영된다. 기존 HMM 시스템의 국소적 특징의 한계를 보완하기 위하여, 한글 자모의 기본획 분석에서 얻어진 구조적, 전역적 특징이 자모 검증기에 사용되었다. 한글 낱자인식에 대한 실험 결과 HMM 기반 인식기에 자모 검증기를 도입함으로서 38.5%의 인식 오류를 줄일 수 있었다.

  • PDF

음성인식 시스템의 HMM 파라메터 추정을 위한 분절단위 교정 학습 (Segmental Corrective Training for HMM Parameter Estimation in Speech Recognition)

  • 김회린;이황수
    • The Journal of the Acoustical Society of Korea
    • /
    • 제12권2E호
    • /
    • pp.5-11
    • /
    • 1993
  • 본 논문에서 HMM 파라메터 추정을 위해 분절단위 정보를 이용하는 수정된 교정학습방법을 제안한다. 수정된 교정학습방법은 기존의 교정학습 방법에서 사용하는 전향·후향 알고리즘 대신에 분절단위 K-means 알고리즘을 사용하여 HMM 파라메터를 교정한다. 이 방식은 분절단위 K-means 알고리즘이 음성신호내의 공통의 통계적 특성을 가지는 상태단위 정보를 강조한다는 사실을 이용하였다. 화자종속 음소 및 단어인식 실험에서 제안된 알고리즘이 기존의 교정학습 방법보다 적은 계산량으로도 향상된 인식률을 보여주었다. 이것은 HMM 교정학습에서 상태다누이 정보가 중요함을 보여준다.

  • PDF

자동 음소 분할 성능 개선을 위한 음소 모델링에 관한 연구 (A Study of Phoneme Modeling for Improvement of Automatic Segmentation Performance)

  • 박혜영;김형순
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.175-178
    • /
    • 2002
  • 본 논문에서는 Hidden Markov Model(HMM)을 이용하여 corpus 기반 TTS에 사용할 DB를 자동 음소 분할 해주는 시스템을 구현하였다. HMM을 이용해서 음소 분할 할 경우 HMM을 모델링 하는 방법에 따라 많은 성능의 차이가 난다. 따라서 본 논문에서는 HMM 모델링 방법에 따른 몇 가지 실험 및 성능 평가를 하였다. 실험 결과 음성 인식과는 달리 HMM모델링 시 triphone 모델보다 monophone 모델의 성능이 더 우수하였으며, 에너지 기반의 후처리를 통해 성능 향상을 얻을 수 있었다.

  • PDF

대분류기법을 이용한 음성인식 시스템의 속도향상 (The Performance Improvement of Speech recognition system using Hierarchical Classification Method)

  • 전화성;김길연;윤영선;오영환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.476-478
    • /
    • 2000
  • 본 논문에서는 HMM 학습모델을 이용하여 1445단어 음성인식기를 구현하고, 대분류기법을 이용하여 그 성능을 향상시키는 방법에 대하여 연구를 수행하였으며, 속도개선에 중점을 두었다. 속도개선을 위해서 HMM모델에 계층적 대분류 기법을 적용시켰다. HMM의 상태수가 많을수록 속도가 저하된다는 점을 고려하여, 적은 상태수의 HMM모델로 후보를 정하고, 가변적으로 해당하는 상태수의 HMM모델로 목적단어를 인식하는 방법을 제안하였다. 후보를 정하는 방법을 후보수와 특징파라미터의 종류와 수를 고려하여 다양하게 설정, 실험하여 가장 이상적인 경우를 찾아내었다.

  • PDF

심층신경망 구조에 따른 구개인두부전증 환자 음성 인식 향상 연구 (A study on recognition improvement of velopharyngeal insufficiency patient's speech using various types of deep neural network)

  • 김민석;정재희;정보경;윤기무;배아라;김우일
    • 한국음향학회지
    • /
    • 제38권6호
    • /
    • pp.703-709
    • /
    • 2019
  • 본 논문에서는 구개인두부전증(VeloPharyngeal Insufficiency, VPI) 환자의 음성을 효과적으로 인식하기 위해 컨볼루션 신경망 (Convolutional Neural Network, CNN), 장단기 모델(Long Short Term Memory, LSTM) 구조 신경망을 은닉 마르코프 모델(Hidden Markov Model, HMM)과 결합한 하이브리드 구조의 음성 인식 시스템을 구축하고 모델 적응 기법을 적용하여, 기존 Gaussian Mixture Model(GMM-HMM), 완전 연결형 Deep Neural Network(DNN-HMM) 기반의 음성 인식 시스템과 성능을 비교한다. 정상인 화자가 PBW452단어를 발화한 데이터를 이용하여 초기 모델을 학습하고 정상인 화자의 VPI 모의 음성을 이용하여 화자 적응의 사전 모델을 생성한 후에 VPI 환자들의 음성으로 추가 적응 학습을 진행한다. VPI환자의 화자 적응 시에 CNN-HMM 기반 모델에서는 일부층만 적응 학습하고, LSTM-HMM 기반 모델의 경우에는 드롭 아웃 규제기법을 적용하여 성능을 관찰한 결과 기존 완전 연결형 DNN-HMM 인식기보다 3.68 % 향상된 음성 인식 성능을 나타낸다. 이러한 결과는 본 논문에서 제안하는 LSTM-HMM 기반의 하이브리드 음성 인식 기법이 많은 데이터를 확보하기 어려운 VPI 환자 음성에 대해 보다 향상된 인식률의 음성 인식 시스템을 구축하는데 효과적임을 입증한다.

결정적 잡음 모델을 이용한 효율적인 잡음음성 인식 접근 방법 (An Efficient Approach for Noise Robust Speech Recognition by Using the Deterministic Noise Model)

  • 정용주
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.559-565
    • /
    • 2002
  • 본 논문에서는 잡음음성 HMM (Hidden Markov Model)의 파라미터 값을 효율적으로 추정하는 새로운 방법에 대해서 제안하였다. 기존의 방법들에서 잡음음성의 HMM 파라미터 값을 추정하기 위해서는 먼저 잡음음성의 생성 모델을 가정한 후, 잡음과 원래 음성의 통계 모델을 이용하여 잡음음성 HMM 파라미터 값을 해석적으로 얻게 된다. 하지만 이러한 해석적 방법은 항상 단순화의 가정을 취하게 되므로 실제의 잡음음성 HMM 분포에 정확히 근접하는데 어려움을 겪게 된다. 본 연구에서는 이러한 가정을 하지 않고, 원래의 깨끗한 음성에서 얻을 수 있는 HMM의 파라미터 값을 사용하고 결정적 잡음 모델을 이용함으로서 기존의 방법보다 인식시에 계산량을 줄일 수 있었을 뿐만 아니라 인식 성능의 향상도 이룰 수 있었다.

순서기반 비정상행위 탐지 센서의 임계치 결정 방법 (The Decision Method of A Threshold in Sequence-based Anomaly Detection Sensor)

  • 김용민;김민수;김홍근;노봉남
    • 정보처리학회논문지C
    • /
    • 제8C권5호
    • /
    • pp.507-516
    • /
    • 2001
  • 본 논문은 SOM과 HMM을 이용하여 시스템 호출 수준에서 순서기반의 비정상행위 탐지 센서를 구현하였다. 그리고, 시스템 호출에서 중요한 정보가 무엇이고 임계값은 어떻게 설정해야하는 지를 분석하였다. 본 논문에서 사용한 SOM의 새로운 필터링 규칙과 축약 규칙은 HMM의 입력 크기를 줄일 수 있었다. 이러한 축약은 HMM기반 비정상행위 탐지의 실시간 처리능력을 보장해 준다. 또한, 비정상행위 수라는 개념을 도입하여 HMM의 탐지결과에 대한 민감성을 둔화시켜서, 사용자가 탐지결과를 쉽게 이해하고 false-positive를 줄이는 효과가 있었다. 그리고, 능동적으로 threshold 값을 조정하여 시스템 상황에 따라 탐지센서가 적응할 수 있도록 하였다.

  • PDF