• 제목/요약/키워드: Vector quantization (VQ)

검색결과 129건 처리시간 0.023초

백터양자화기의 신속코더백터 찾기 (Fast Codevector Search on Vector Quantization)

  • 우홍체
    • 한국산업정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.16-21
    • /
    • 2000
  • 백터 양자화기는 음성 부호화, 오디오 부호화, 그리고 비디오 부호화와 같은 많은 고품질 고전송률 데이터 압축응용에서 널리 사용되고 있다. 백터 양자화기의 코더북의 크기가 매우 클 때, 코더북 전체를 찾는 방식은 많은 응용의 경우에서 계산량 때문에 상당한 문제점이 된다. 계산량을 낮추기 위하여 삼각형의 변 길이에 대한 부등식과 같은 코더북의 특성을 활용하는 많은 알고리즘들이 제안되고 연구되어 왔다. 본 논문에서는 최적의 코더백터를 찾기 위하여 다단구조에 기반한 신속 코더백터 찾기 알고리즘을 제안하고자 한다. 간단한 2 단계 구조의 이 알고리즘을 사용하여도 상당한 계산 복잡성을 압축대상의 품질을 손상시키지 않고 줄일 수 있다.

  • PDF

SOM과 LVQ에 의한 자음의 분류 (Classification of Consonants by SOM and LVQ)

  • 이채봉;이창영
    • 한국전자통신학회논문지
    • /
    • 제6권1호
    • /
    • pp.34-42
    • /
    • 2011
  • 음성타자기의 구현에 접근하려는 노력의 일환으로서, 우리는 본 논문에서 자음의 분류에 대해 연구한다. 많은 자음들은 시간에 따른 주기적 거동을 보이지 않고 따라서 그들에 대한 푸리에 해석의 타당성에 확신을 갖기 어렵다. 그러므로, 우선 음성 신호로부터 추출되는 MFCC와 LPCC 특징벡터들이 자음에 대해 어느 정도의 의미가 있는지를 파악하기 위하여 LBG 클러스터링을 통한 벡터양자화를 수행한다. VQ의 실험적 결과는 자음에 대한 푸리에 해석의 타당성에 관해 분명한 결론을 내리는 것이 쉽지 않음을 보여주었다. 자음의 분류를 위해 SOM과 LVQ의 두 가지 신경망이 사용되었다. SOM의 결과는 몇 쌍의 자음들이 나뉘어 분류되지 않음을 보여주었다. LVQ에서는 본질적으로 이 문제가 사라지지만 자음의 분류 정확도는 낮은 수준이었다. 이로부터, LVQ에 의한 자음 분류에 있어서는 MFCC 및 다른 특징 벡터들이 함께 사용되어야 함이 사료된다. 하지만 본 연구에서 도입한 MFCC/LVQ의 결합은 기존의 언어모델을 기반으로 하는 음소 분류에 비해 그 결과가 나쁘지 않은 것으로 나타났다. 모든 경우에 LPCC 특징벡터는 MFCC에 비해 그 결과가 좋지 않았다.

에너지와 VQ를 이용한 음성 인식 (Speech Recognition Using the Energy and VQ)

  • 황영수
    • 한국ITS학회 논문지
    • /
    • 제6권3호
    • /
    • pp.87-94
    • /
    • 2007
  • 본 논문은 음성인식과 화자 적응 방법들의 성능을 검토한 것이다. 본 논문에서 검토한 인식 방법은 에너지의 변화 상태와 VQ를 이용하여, 음성 인식을 수행하였으며, 화자에 따른 인식률 문제를 해결하기 위하여 화자 적응 방법(최대사후 확률추정법, 선형스펙트럼 추정법)을 검토하였다. 수행 결과 일반 VQ 방법보다 에너지 변화 상태를 이용한 인식 결과가 더 우수한 결과를 보였으며, 최대사후 확률 추정법을 적용할 경우, 2-3 %의 인식률 향상을 얻을 수 있었다.

  • PDF

강인한 VQ-PCA에 기반한 효율적인 화자 식별 (Efficient Speaker Identification based on Robust VQ-PCA)

  • 이기용
    • 인터넷정보학회논문지
    • /
    • 제5권3호
    • /
    • pp.57-62
    • /
    • 2004
  • 본 논문에서는, 효율적인 화자 식별을 위하여 강인한 벡터 양자화 주성분 분석을 제안하였다. 제안된 방법은 화자 식별에서 특징벡터의 학습을 위한 고차원(high dimension) 문제와 이상치(Outlier)에 대한 문제를 해결 하기위하여 제안 되었다. 먼저, 제안된 방법은 M-추정을 이용하여 강인한 벡터 양자화(Vector Quantization : VQ) 에 의한 몇 개의 분리된 영역으로 데이터 공간을 나눈다. 분리된 자 영역에서 공분산 행렬로부터 강인한 주성분 분석(Principal Component Analysis)이 얻어지게 된다. 마지막으로 각 영역에서 강인한 PCA에 의하여 줄어든 차원을 갖는 변환된 특징 벡터로부터 화자의 가우시안 혼합 모델(Gaussian Mixture Model : GMM)을 구한다. 제안된 방법은 같은 성능하에서 대각 공분산 행렬을 갖는 전형적인 GMM방법과 비교할 때 더빠른 결과를 얻었으며, 데이터의 저장공간을 줄일 수 있었을 뿐 아니라, 이상치가 존재할 경우에 더욱 강인하였다.

  • PDF

표본 적응 프러덕트 양자기에 기초한 DPCM을 이용한 고 전송률 영상 압축 (High Bit Rate Image Coder Using DPCM based on Sample-Adaptive Product Quantizer)

  • 김동식;이상욱
    • 한국통신학회논문지
    • /
    • 제24권12B호
    • /
    • pp.2382-2390
    • /
    • 1999
  • 본 논문에서는 표본 적응 프러덕트 양자기(sample-adaptive product quantizer: SAPQ)라 불리는 새로운 기법의 양자기를 불변 길이 출력을 가지며 높은 전송률을 가지는 DPCM(differential pulse coded modulation)에 기초한 영상 데이터 감축에 적용하였다. DPCM의 성능을 개선하기 위해서는 기존의 스칼라 양자기 대신에 벡터 양자기(vector quantizer: VQ)를 사용해야 하는데, 전송률이 증가함에 따라 일반적인 VQ나 심지어 나무 구조를 가지는 변형된 VQ도 부호화 복잡도나 요구되는 기억 장치의 양으로 인하여 그 구현이 거의 불가능하다. SAPQ는 매우 짧은 적응 주기를 가지는 feed-forward 적응 스칼라 양자기로 일종의 제한적 구조를 가지는 VQ의 일종이다. 따라서, 비록 전송률이 높다고 해도, SAPQ를 사용하면 일반 VQ에서의 부호화 복잡도와 요구되는 기억 장치의 양을 줄이면서 VQ의 성능을 얻을 수 있다. 나아가서 SAPQ가 스칼라 양자기 구조를 가지고 있으므로 DPCM 부호기에서 기존의 스칼라 값을 예측하는 예측기를 그대로 사용하면서 SAPQ는 양자화 역할을 수행할 수 있다. 합성 신호와 실제 영상 데이터에 대하여 실험한 결과 DPCM의 양자화 부분?을 바꾸어서 전송률이 4 b/point 이상에서 2-3 dB 정도의 성능 향상을 얻을 수 있었다.

  • PDF

LPCA에 기반한 GMM을 이용한 화자 식별 (Speaker Identification Using GMM Based on LPCA)

  • 서창우;이윤정;이기용
    • 음성과학
    • /
    • 제12권2호
    • /
    • pp.171-182
    • /
    • 2005
  • An efficient GMM (Gaussian mixture modeling) method based on LPCA (local principal component analysis) with VQ (vector quantization) for speaker identification is proposed. To reduce the dimension and correlation of the feature vector, this paper proposes a speaker identification method based on principal component analysis. The proposed method firstly partitions the data space into several disjoint regions by VQ, and then performs PCA in each region. Finally, the GMM for the speaker is obtained from the transformed feature vectors in each region. Compared to the conventional GMM method with diagonal covariance matrix, the proposed method requires less storage and complexity while maintaining the same performance requires less storage and shows faster results.

  • PDF

X-ray 의료영상 압축을 위한 ADCT-VQ와 JPEG의 성능 비교 (Performance Comparision of the ADCT-VQ and JPEG for X-ray Image Compression)

  • 김근섭;임호근;권용무;이재천;김형곤
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1992년도 추계학술대회
    • /
    • pp.29-33
    • /
    • 1992
  • We examine the compression performance of two irreversible (lossy) compression techniques, ADCT-VQ (Adaptive Discrete Cosine Trandform - Vector Quantization) and JPEG (Joint Photographic Experts group) which are basis of medical image information systems. Under the same compression ratio, MSE(Mean Square Error) is 0.578 lower in JPEG than in ADCT-VQ while SNR(Signal to Noise Ratio) is 1.236 dB higher in JPEG than in ADCT-VQ.

  • PDF

VQ 인덱스의 엔트로피 부호화를 위한 코드북 재정렬 기법 (Codebook Reordering Technique for Entropy Coding of VQ Indexes)

  • 황재호;홍충선;이대영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.903-906
    • /
    • 2000
  • 웨이브렛 영역에서 벡터 양자화(vector quantization)를 수행하여 생성된 VQ 인덱스들을 엔트로피 부호화(entropy coding)하면 영상의 코딩 효율을 높일 수 있다. 본 논문에서는 벡터 양자화 이전에 VQ 인덱스들의 중복성을 높이기 위해 다중해상도 코드북의 코드 워드들을 에너지 크기 순으로 재정렬하는 기법을 제안한다. 코드 워드들의 평균과 편차를 이용한 재정렬 방법과 제안된 기법을 벡터 양자화 후 생성되는 VQ 인덱스에 DPCM/Huffman 기법을 적용하여 각각에 대한 코딩 효율을 비교한다.

  • PDF

멀티 VQ 코드북을 이용한 화자확인 시스템의 성능개선 (The Improvement Performance of Speaker Verification System Through the Multi-Vector Quantization Codebook Structure)

  • 이재희;이상철;정연해
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 학술대회 논문집 전문대학교육위원
    • /
    • pp.176-179
    • /
    • 2005
  • In this paper, we propose the new method that separate the existing common VQ code book into two parts, one is the common VQ code book which is the half of existing common VQ code book, another is the personal speaker VQ code book which accommodate the personal speaker characteristic, variation to improve the performance of the text-dependent speaker verification system using discrete HMM. We apply the propose method m this paper to the text-dependent speaker verification system using discrete HMM and have the improvement performance of about 0.24% compared to existing method

  • PDF

유전자 알고리즘을 이용한 벡터 양자화 (Vector Quantization using Genetic Algorithm)

  • 임현택
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.197-200
    • /
    • 1998
  • 본 논문에서는 유전자 알고리즘(genetic Algorithm)을 사용하여 벡터 양자화(vector quantization : VQ)를 수행하는 방법을 제안하고자 한다. 벡터 양자화를 수행하여 코드북(codebook)을 생성할 때 생성된 코드북과 학습벡터(training vector)사이에는 반드시 양자화 오차(quantization error)가 발생하는데 기존의 K-means 알고리듬을 사용하여 코드북을 생성했을 경우 양자화 오차를 줄이는데 한계가 있었다. 본 논문에서 제안하는 유전자 알고리즘을 이용한 벡터 양자화는 이 양자화 오차를 감소시키기 위해서 연구되었다. 제안한 방법의 성능을 평가하기 위해 음성데이터를 기존의 K-means 알고리즘에서 클러스터의 중심을 선택하는 방법중의 하나인 Minimax방법으로 코드북을 생성하여 제안한 방법과 양자화 오차를 비교한 결과 양자화 오차가 감소됨을 알 수 있었다.

  • PDF