• 제목/요약/키워드: Hidden markov model

검색결과 639건 처리시간 0.024초

한국어 음성 인식 시스템을 위한 MEL-LPC 분석 방법과 LPC-MEL 분석 방법의 비교 (Comparison of MEL-LPC and LPC-MEL Analysis Method for the Korean Speech Recognition Systems.)

  • 김주곤;김범국;정호열;정현열
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.833-836
    • /
    • 2001
  • 본 논문에서는 한국어 음성인식 시스템의 성능 향상을 위해 청각 주파수 분해능을 가진 MEL-LPC Cepstrum을 음소단위의 HMM(Hidden Markov Model)을 기반으로 하는 인식 시스템에 적용하여 그 결과를 비교 검토하였다. 선형예측(LP) 분석 후에 후처리로서 주파수를 왜곡시킨 LPC-MEL 분석이 계산량이 적고 효과적이라 일반적으로 많이 사용되고 있으나 주파수 분해능은 많이 개선되지 않는다. 따라서 본 논문에서는 주파수 분해능을 개선하기 위해, 원 음성신호로부터 직접적으로 멜주파수로 왜곡시킨 후 선형 예측 분석을 수행하는 MEL-LPC 분석방법을 이용한 음소기반의 화자 독립 음성인식 시스템을 구성하여 기존의 LPC-MEL 분석방법과 비교실험을 통하여 MEL-LPC 분석방법의 유효성을 검토하였다. 실험에 사용한 음성 데이터베이스는 음소 및 단어 인식실험에서는 ETRI 445단어 DB, 연속 숫자음인식 실험에서는 KLE 4연속 숫자음 DB를 사용하였다. 화자 독립 음소인식 실험의 경우, 묵음을 제외한 47개의 유사 음소에 대하여 4상태 3출력의 Left-to-Right 모델을이용하였다. 단어 및 연속 숫자음 인식 실험의 경우, 유한상태 네트워크에 의한 OPDP법을 이용하였다. 화자 독립 음소, 단어 및 4연속 숫자음 인식 실험결과, 기존의 LPC-MEL Cepstrum을 사용한 경우보다 MEL-LPC Cepstum을 사용한 경우가 더 높은 인식률을 나타내어 한국어 음성인식 시스템에서 MEL-LPC 분석방법의 유효성을 확인할 수 있었다.

  • PDF

TAKTAG: 통계와 규칙에 기반한 2단계 학습을 통한 품사 중의성 해결 (TAKTAG: Two phase learning method for hybrid statistical/rule-based part-of-speech disambiguation)

  • 신상현;이근배;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.169-174
    • /
    • 1995
  • 품사 태깅은 형태소 분석 이후 발생한 모호성을 제거하는 것으로, 통계적 방법과 규칙에 기 반한 방법이 널리 사용되고 있다. 하지만, 이들 방법론에는 각기 한계점을 지니고 있다. 통계적인 방법인 은닉 마코프 모델(Hidden Markov Model)은 유연성(flexibility)을 지니지만, 교착어(agglutinative language)인 한국어에 있어서 제한된 윈도우로 인하여, 중의성 해결의 실마리가 되는 어휘나 품사별 제대로 참조하지 못하는 경우가 있다. 반면, 규칙에 기반한 방법은 차체가 품사에 영향을 받으므로 인하여, 새로운 태그집합(tagset)이나 언어에 대하여 유연성이나 정확성을 제공해 주지 못한다. 이러한 각기 서로 다른 방법론의 한계를 극복하기 위하여, 본 논문에서는 통계와 규칙을 통합한 한국어 태깅 모델을 제안한다. 즉 통계적 학습을 통한 통계 모델이후에 2차적으로 규칙을 자동학습 하게 하여, 통계모델이 다루지 못하는 범위의 규칙을 생성하게 된다. 이처럼 2단계의 통계와 규칙의 자동 학습단계를 거치게 됨으로써, 두개 모델의 단점을 보강한 높은 정확도를 가지는 한국어 태거를 개발할 수 있게 하였다.

  • PDF

동작인식 및 촉감제공 게임 컨트롤러 (Motion-Recognizing Game Controller with Tactile Feedback)

  • 전석희;김상기;박건혁;한갑종;이성길;최승문;최승진;어홍준
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.1-6
    • /
    • 2008
  • 본 연구에서는 게임에서의 몰입도 증가를 위해 기존 버튼 방식의 입력에 사용자의 자연스러운 동작을 이용한 입력과 진동 촉감을 출력하는 게임 컨트롤러를 제안한다. 동작을 이용한 입력장치는 가속도 추적기와 적외선 비디오 카메라를 동시에 사용한다. 두 정보의 장단점을 보완/융합해서 컨트롤러의 움직임을 추적하고, 사용자의 동작을 인식한다. 다양한 종류의 진동촉감은 보이스코일 진동자를 이용하여 제공된다. 또한, 제안하는 게임 컨트롤러를 게임의 상호작용에 적용하는 방법을 제공하고, 응용 프로그램에의 적용가능성을 살펴본다.

  • PDF

CCD 카메라 얼굴 영상에서의 SVD 및 HMM 기법에 의한 눈 패턴 검출 (Eye Pattern Detection Using SVD and HMM Technique from CCD Camera Face Image)

  • 진경찬;P.미셰;박일용;손병기;조진호
    • 센서학회지
    • /
    • 제8권1호
    • /
    • pp.63-68
    • /
    • 1999
  • CCD 카메라에 얻어진 비디오 신호로부터 디지털화된 얼굴영상을 얻은 다음 신속하게 눈 패턴을 검출할 수 있는 알고리즘을 제안하였다. 얼굴영역 및 눈 패턴 검출을 위해 주축성분분석(Principle Component Analysis : PCA)과 통계적인 성질이 유사한 일괄처리 SVD(Singular Value Decomposition)알고리즘 및 패턴서치회로망을 이용하였고, 정확도를 향상하기 위해 HMM(Hidden Markov Model)을 이용하였다. 제안한 알고리즘으로 기존의 주축성분분석을 이용한 패턴 검출보다 계산량이 적고 정확도도 우수하며 초당 2 프레임 정도의 실시간 처리가 가능함을 알 수 있었다.

  • PDF

Comprehensive Investigations on QUEST: a Novel QoS-Enhanced Stochastic Packet Scheduler for Intelligent LTE Routers

  • Paul, Suman;Pandit, Malay Kumar
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권2호
    • /
    • pp.579-603
    • /
    • 2018
  • In this paper we propose a QoS-enhanced intelligent stochastic optimal fair real-time packet scheduler, QUEST, for 4G LTE traffic in routers. The objective of this research is to maximize the system QoS subject to the constraint that the processor utilization is kept nearly at 100 percent. The QUEST has following unique advantages. First, it solves the challenging problem of starvation for low priority process - buffered streaming video and TCP based; second, it solves the major bottleneck of the scheduler Earliest Deadline First's failure at heavy loads. Finally, QUEST offers the benefit of arbitrarily pre-programming the process utilization ratio.Three classes of multimedia 4G LTE QCI traffic, conversational voice, live streaming video, buffered streaming video and TCP based applications have been considered. We analyse two most important QoS metrics, packet loss rate (PLR) and mean waiting time. All claims are supported by discrete event and Monte Carlo simulations. The simulation results show that the QUEST scheduler outperforms current state-of-the-art benchmark schedulers. The proposed scheduler offers 37 percent improvement in PLR and 23 percent improvement in mean waiting time over the best competing current scheduler Accuracy-aware EDF.

실감형 컨텐츠를 위한 향상된 동작 인식 리모트 컨트롤러 (Improved Motion-Recognizing Remote Controller for Realistic Contents)

  • 박건혁;김상기;임성훈;한갑종;최승문;최승진;어홍준;조선영
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.396-401
    • /
    • 2009
  • 본 연구에서는 실감형 컨텐츠를 위한 리모트 컨트롤러의 하드웨어 및 소프트웨어적 개선점을 살펴본다. 보이스코일 모터와 진동 모터를 모두 사용한 진동 촉감 제공 방법을 제시하며, 마커의 크기 및 카메라 파라미터 최적화를 통한 위치 추적 시스템의 성능 향상을 살펴보고 효율적인 세그멘테이션 및 비전 데이터 추가를 통한 동작 인식의 개선점을 살펴본다. 또한, 제시된 컨트롤러의 실감형 컨텐츠에 대한 적용 가능성을 살펴본다.

  • PDF

반복학습 음소모델을 이용한 핵심어 검출 시스템의 성능 향상 (Performance Enhancement of Keyword Spotting System Using Repeated Training of Phone-models)

  • 김주곤;임수호;이여송;김범국;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.65-68
    • /
    • 2004
  • 본 논문에서는 반복학습으로 음소모델을 강건하게 하여 음소기반 핵심어 검출 시스템의 성능을 개선하고자 하였다. 가변어휘 핵심어 검출 시스템은 인식 대상 핵심어의 추가와 변경이 용이하도록 모노폰 단위로 핵심어 모델과 필러 모델을 구성하였다. 핵심어 모델과 필러 모델은 동일한 음소모델을 이용하므로 각각의 음소 모델의 분별력 향상은 핵심어 검출 성능과 밀접한 관계에 있다. 따라서 본 논문에서는 음소 HMM(Hidden Markov Model)의 학습시에 반복 학습을 통하여 음소 모델을 강건하게 만든 후 핵심어 검출 실험을 수행하였다. 그 결과, 10회의 반복학습을 통하여 얻어진 음소 HMM을 이용한 핵심어 검출의 성능은 반복학습을 하지 않은 경우보다 핵심어 검출의 CA-CR 평균 성능이 $4\%$ 향상됨을 확인할 수 있었다.

  • PDF

FIR 필터링과 스펙트럼 기울이기가 MFCC를 사용하는 음성인식에 미치는 효과 (The Effect of FIR Filtering and Spectral Tilt on Speech Recognition with MFCC)

  • 이창영
    • 한국전자통신학회논문지
    • /
    • 제5권4호
    • /
    • pp.363-371
    • /
    • 2010
  • 특징벡터의 분류를 개선시켜 화자독립 음성인식의 오류율을 줄이려는 노력의 일환으로서, 우리는 MFCC의 추출에 있어서 푸리에 스펙트럼을 기울이는 방법이 미치는 효과를 연구한다. 음성신호에 FIR 필터링을 적용하는 효과의 조사도 병행된다. 제안된 방법은 두 가지 독립적인 방법에 의해 평가된다. 즉, 피셔의 차별함수에 의한 방법과 은닉 마코브 모델 및 퍼지 벡터양자화를 사용한 음성인식 오류율 조사 방법이다. 실험 결과, 적절한 파라미터의 선택에 의해 기존의 방법에 비해 10% 정도 낮은 인식 오류율이 얻어짐을 확인하였다.

대용량 온라인 한자 인식을 위한 클러스터링 거리계산 척도 (Distance Measures in HMM Clustering for Large-scale On-line Chinese Character Recognition)

  • 김광섭;하진영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권9호
    • /
    • pp.683-690
    • /
    • 2009
  • 은닉 마코프 모델(Hidden Markov Model: HMM)에 기반을 둔 온라인 한자 인식에서 클래스의 수가 대용량일 경우에는 인식에 걸리는 시간 증가가 좋은 인식 시스템을 구현하는데 있어서의 걸림돌이 된다. 본 논문에서는 이러한 인식 속도 문제를 해결하고자 HMM을 클러스터링하여 인식 속도를 개선하는 방법과 이에 적합한 효율적인 HMM 간의 거리계산법을 제안한다. 유니코드 한 중 일 통합한자로 정의된 총 20,902개의 한자에 대한 온라인 한자 인식 시스템을 구축하는 실험에서 약 2배 정도로 인식속도가 향상됨을 확인할 수 있었고 클러스터링을 하지 않았을 때보다 0.9%의 인식률만 하락한 95.37%의 10순위 인식률을 달성했다.

PCA를 이용한 온라인 문자인식 기법 (Online Character Recognition Technique Using PCA)

  • 유재만;김우생;한정훈
    • 한국멀티미디어학회논문지
    • /
    • 제9권4호
    • /
    • pp.414-420
    • /
    • 2006
  • 온라인 문자 인식 기술은 PDA, 타블릿 PC 등 많은 새로운 응용에서 사용되고 있으나, 인식 기술은 아직 이러한 첨단 도구들을 자연스럽게 이용하기에는 못 미치는 실정이다. 또한 최근 많이 사용되는 은닉 마르코프 모델(HMM)은 입력패턴을 전체 표준패턴과 비교함으로써 많은 기억장소와 계산량을 필요로 하는 단점을 지니고 있다. 따라서 본 논문에서는 더욱 효율적으로 온라인 문자 인식을 가능하게 하는 방법을 제안한다. 본 연구에서는 전처리 단계를 거쳐 학습 데이터와 인식 데이터의 체인코드를 생성하고, 인식 단계에서 입력 데이터에 주성분 분석(PCA) 기법을 적용하여 데이터의 차원을 줄여 문자를 인식한다. 제안하는 방법의 타당성은 실험을 통해서 검증한다.

  • PDF