• 제목/요약/키워드: 벡터양자화

검색결과 318건 처리시간 0.022초

Recursive Least-Square 알고리즘을 이용한 한국어 음소분류에 관한 연구 (A Study on Korean Phoneme Classification using Recursive Least-Square Algorithm)

  • 김회린;이황수;은종관
    • 한국음향학회지
    • /
    • 제6권3호
    • /
    • pp.60-67
    • /
    • 1987
  • 본 논문에서는 recursive least-square(RLS) 알고리즘을 이용한 한국어 음소분류방법에 관하여 연구하였다. 각 음소의 특징벡터는 prewindowed RLS lattice 알고리즘을 사용하여 추출하는 방법을 제안하였고, 각 음소의 기준패턴은 추출된 특징벡터들을 벡터양자화하여 구성하였다. 제안된 음소인식방식의 성능시험을 위하여 한국어 음소중 자음11개와 모음 8개가 포함된 7개의 한국어 도시명을 발음하여 사용하였으며 초기의 각 음소의 기준패턴으로는 음성신호의 파형을 관찰하여 추출한 표준패턴(prototype)을 사용하였다. 컴퓨터 simulation의 결과로는 화자종속 음소인식의 경우 약간의 음소규칙을 고려할 때 약$85\%$의 음소인식율을 얻었으나, 화자독립 음소인식의 경우는 이보다 훨씬 낮은 인식율을 보였다.

  • PDF

다 해상도 프레임 구조에 기반한 고속 움직임 추정 기법 (A Fast Motion Estimation Algorithm Based on Multi-Resolution Frame Structure)

  • 송병철;나종범
    • 대한전자공학회논문지SP
    • /
    • 제37권5호
    • /
    • pp.54-63
    • /
    • 2000
  • 고속 움직임 추정을 위한 다 해상도 블록 정합 기법을 제안한다 최저 해상도 계층에서 전역 탐색을 통해 최소 정함 오치를 갖는 움직임 벡터를 선택하고, 공간적으로 인접한 블록들의 움직임 벡터들 중에서 최소 정합 오차를 갖는 움직임 벡터를 찾는다 이 때, 주변 움직임 벡터들의 보다 정확한 탐색을 위해 저 해상도 계층에서도 움직임 벡터의 양자화 없이 탐색을 할 수 있는 효과적인 방법을 제안한다. 이렇게 얻어진 2개의 움직임 벡터들은 중간 해상도 계층에서의 탐색을 위한 초기 탐색 중심점들로 사용된다 중간 계층에서, 각 초기점을 중심으로 훨씬 좁아진 영역에서의 지역 탐색을 수행한다. 최저 해상도 계층에서 주변 움직임 벡터 탐색을 위해 사용했던 방법을 이용하면, 각 지역 탐색을 정수 화소 단위로 수행할 수 있다 지역 탐색 영역 내에서 최소 정함 오차를 갖는 움직임 벡터를 찾고, 이 벡터를 중심으로 마지막 계층에서의 마지막 탐색을 수행한다 그러나, 중간 해상도 계층에서 이미 정수 화소 단위의 정확한 움직임 벡터 추정을 수행했기 때문에, 마지막 최고 해상도 계층에서의 지역 탐색은 전체 성능에 미미한 영향을 주게 된다. 따라서 최고 해상도 계층에서의 탐색을 생략하더라도 성능 저하 없이 탐색 속도를 향상시킬 수 있다 모의 실험을 통해 최고 계층에서의 지역 탐색을 생략하더라도 제안한 블록 정합 기법이 전역 탐색 기법에 비해 보편적인 MPEG2 부호화 환경 하에서 최대 02dB의 PSNR 저하만을 보이며, 200배 이상의 계산 속도를 가점을 보인다 또한, 제안한 기법은 규칙적인 데이터 흐름을 가지am로 하드웨어 구현에도 적합하다.

  • PDF

웨이블렛 필터뱅크를 이용한 자동차 소음에 강인한 고립단어 음성인식 (Robust Speech Recognition with Car Noise based on the Wavelet Filter Banks)

  • 이대종;곽근창;유정웅;전명근
    • 한국지능시스템학회논문지
    • /
    • 제12권2호
    • /
    • pp.115-122
    • /
    • 2002
  • 본 논문에서는 웨이블렛 서브밴드 필터링기법을 이용하여 다중의사 결정기법에 기반을 둔 외부 잡음에 강인한 고립단어 음성인식 알고리즘을 제안하고자 한다. 음성인식에 있어서 외부잡음은 음성인식 알고리듬의 인식률을 저하시키는 주요 원인으로 지적되므로 음성인식기의 성능을 향상시키기 위해서 무엇보다도 잡음에 강인한 음성인식 알고리즘의 개발이 절실히 요구되고 있다. 제안된 알고리즘의 타당성을 검증하기 위하여 다양한 자동차 소음하에서 한국어 단독 숫자음 10단어의 인식률 변동을 알아 보았다. 그 결과 현재 음성인식 기법으로 널리 쓰이고 있는 벡터양자화 알고리즘만을 적용한 경우에 비해 9~25%의 향상된 인식률을 보였다.

음성 인식에서 위상 정보의 활용 (Utilization of Phase Information for Speech Recognition)

  • 이창영
    • 한국전자통신학회논문지
    • /
    • 제10권9호
    • /
    • pp.993-1000
    • /
    • 2015
  • MFCC는 음성 신호 처리에서 귀중한 특징 벡터들 중 하나이다. MFCC에서 명백한 결점은 푸리에 변환의 크기를 취함에 의해 위상 정보가 손실된다는 것이다. 이 논문에서 우리는 푸리에 변환의 실수부와 허수부 크기를 따로 취급함으로써 위상 정보를 활용하는 방법을 생각한다. 퍼지 벡터 양자화와 은닉 마코브 모델을 이용한 음성인식에 이 방법을 적용함으로써, 종전 방법에 비해 음성 인식 오류율을 줄일 수 있음을 보인다. 우리는 또한 수치해석을 통하여, FFT의 실수부와 허수부 각각에서 6개의 성분을 취하여 모두 12개의 MFCC 성분을 사용하는 것이 음성인식에 최적임을 보인다.

터보회전기기의 진동모니터링 및 진단을 위한 이산 은닉 마르코프 모델에 관한 연구 (A Study on Discrete Hidden Markov Model for Vibration Monitoring and Diagnosis of Turbo Machinery)

  • 이종민;황요하;송창섭
    • 한국유체기계학회 논문집
    • /
    • 제7권2호
    • /
    • pp.41-49
    • /
    • 2004
  • Condition monitoring is very important in turbo machinery because single failure could cause critical damages to its plant. So, automatic fault recognition has been one of the main research topics in condition monitoring area. We have used a relatively new fault recognition method, Hidden Markov Model(HMM), for mechanical system. It has been widely used in speech recognition, however, its application to fault recognition of mechanical signal has been very limited despite its good potential. In this paper, discrete HMM(DHMM) was used to recognize the faults of rotor system to study its fault recognition ability. We set up a rotor kit under unbalance and oil whirl conditions and sampled vibration signals of two failure conditions. DHMMS of each failure condition were trained using sampled signals. Next, we changed the setup and the rotating speed of the rotor kit. We sampled vibration signals and each DHMM was applied to these sampled data. It was found that DHMMs trained by data of one rotating speed have shown good fault recognition ability in spite of lack of training data, but DHMMs trained by data of four different rotating speeds have shown better robustness.

HMM을 이용한 회전체 시스템의 질량편심 결함진단 (Fault Diagnosis of Rotating System Mass Unbalance Using Hidden Markov Model)

  • 고정민;최찬규;강토;한순우;박진호;유홍희
    • 한국소음진동공학회논문집
    • /
    • 제25권9호
    • /
    • pp.637-643
    • /
    • 2015
  • In recent years, pattern recognition methods have been widely used by many researchers for fault diagnoses of mechanical systems. The soundness of a mechanical system can be checked by analyzing the variation of the system vibration characteristic along with a pattern recognition method. Recently, the hidden Markov model has been widely used as a pattern recognition method in various fields. In this paper, the hidden Markov model is employed for the fault diagnosis of the mass unbalance of a rotating system. Mass unbalance is one of the critical faults in the rotating system. A procedure to identity the location and size of the mass unbalance is proposed and the accuracy of the procedure is validated through experiment.

이산 HM을 이용한 실시간 음성인식 다이얼링 시스템 개발 (Development of a Read-time Voice Dialing System Using Discrete Hidden Markov Models)

  • 이세웅;최승호;이미숙;김홍국;오광철;김기철;이황수
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권1E호
    • /
    • pp.89-95
    • /
    • 1994
  • 본 논문에서는 화자독립으로 100단어를 인식할 수 있는 실시간 음성인식 다이얼링 시스템의 개발에 대하여 기술하였다. 이 시스템에서 음성인식 알고리즘은 전화선 인터페이스를 갖춘 DSP 보드상에 구현되었으며, IBM PC AT/486 상에서 작동된다. DSP 보드에서는 단어의 시작점이 검출된 후에 특징추출, 벡터양자화 그리고 끝점검출 과정이 실시간으로 10 msec의 프레임 구간마다 수행된다. 또한, 본 시스템에서는 인식시간과 기억용량을 줄이기 위해 VQ 코드북의 크기와 끝점검출 과정을 최적화하였다. 본 실시간 음성인식 다이얼링 시스템은 데모 시스템으로 구현되어 대전엑스포‘93에서 한국이동통신의 MOBILAB 내에 전시되었다.

  • PDF

웨이블렛 필터뱅크에 기반을 둔 강인한 화자식별 기법 (A Robust Speaker Identification Method Based on the Wavelet Filter Banks)

  • 이대종;곽근창;유정웅;전명근
    • 정보처리학회논문지C
    • /
    • 제9C권4호
    • /
    • pp.459-466
    • /
    • 2002
  • 본 논문에서는 웨이블렛 서브밴드 필터링기법을 이용하여 다중의사 결정기법에 기반을 둔 잡음에 강인한 화자식별 알고리즘을 제안한다. 제안된 방법은 잡음이 첨가된 음성신호를 웨이블렛 서브밴드 필터뱅크를 이용하여 각 주파수 대역별로 신호를 분리한 후 개별적인 대역별로 인식 알고리즘을 수행하기 때문에 어떤 서브밴드에서의 노이즈 영향이 상대적으로 적으므로 대역제약된 형태로 주어지는 일반적인 주변잡음이 있는 환경하에서 우수한 성능을 보일 수 있도록 시스템을 구성하였다. 제안된 알고리즘은 화자인식 기법으로 널리 쓰이고 있는 벡터양자화 알고리즘만을 적용한 경우에 비해 15∼60%의 향상된 인식률을 보였다.

웨이블렛 계수와 Hidden Markov Model을 이용한 얼굴인식 기법 (Face Recognition Using Wavelet Coefficients and Hidden Markov Model)

  • 이경아;이대종;박장환;전명근
    • 한국지능시스템학회논문지
    • /
    • 제13권6호
    • /
    • pp.673-678
    • /
    • 2003
  • 본 논문에서는 웨이블렛 계수와 Hidden Markov Model(HMM) 이용한 얼굴인식 알고리즘을 제안 한다. 입력 영상은 이산웨이블렛을 기반으로 한 다행상도 분석기법을 사용하여 데이터 수를 압축한 후, 각각의 해상도에서 얻어진 웨이블렛 계수를 특징벡터로 사용하여 HMM의 모델을 생성한다. 인식단계 에서는 웨이블렛 변환에 의해 생성된 개별대역의 인식값을 더하여 상호 보완함으로써 인식률을 높일 수 있었다. 제안된 알고리즘의 타당성을 검증하기 위하여 기본적 알고리즘인 벡터 양자화(VQ) 기법을 적용한 경우와 기존 얼굴인식에 제안된 DCT-HMM을 이용한 기법과의 인식률 비교를 한 결과, 제안된 방법이 우수한 성능을 보임을 알 수 있었다.

다중레벨 벡터양자화 기반의 유사도를 이용한 자동 음악요약 (Automatic Music Summarization Using Similarity Measure Based on Multi-Level Vector Quantization)

  • 김성탁;김상호;김회린
    • The Journal of the Acoustical Society of Korea
    • /
    • 제26권2E호
    • /
    • pp.39-43
    • /
    • 2007
  • Music summarization refers to a technique which automatically extracts the most important and representative segments in music content. In this paper, we propose and evaluate a technique which provides the repeated part in music content as music summary. For extracting a repeated segment in music content, the proposed algorithm uses the weighted sum of similarity measures based on multi-level vector quantization for fixed-length summary or optimal-length summary. For similarity measures, count-based similarity measure and distance-based similarity measure are proposed. The number of the same codeword and the Mahalanobis distance of features which have same codeword at the same position in segments are used for count-based and distance-based similarity measure, respectively. Fixed-length music summary is evaluated by measuring the overlapping ratio between hand-made repeated parts and automatically generated ones. Optimal-length music summary is evaluated by calculating how much automatically generated music summary includes repeated parts of the music content. From experiments we observed that optimal-length summary could capture the repeated parts in music content more effectively in terms of summary length than fixed-length summary.