• 제목/요약/키워드: Data Codebook

검색결과 80건 처리시간 0.025초

문장종속 화자확인 시스템을 위한 개선된 군집화 알고리즘에 관한 연구 (A Study on Modified Clustering Algorithm for Text-Dependent Speaker Verification System)

  • 강철호;정희석
    • 한국음향학회지
    • /
    • 제23권7호
    • /
    • pp.548-553
    • /
    • 2004
  • 본 연구에서는 집단화 오차를 최소로 하기위해 개선된 LBG 알고리즘을 제안한다. 기존의 LBG 알고리즘은 화자확인 시스템에 적용시 소량의 학습 데이터의 분포가 가지는 특수성으로부터 기인하는 문제점들이 발생한다. 즉, 개인별 특성을 무시하고 항상 일정한 크기의 코드북을 생성해야 하는데서 기인하는 군집화 오류와 분할할 (Splitting) 방향을 잘못 선택하면서 발생하는 집단화의 오류가 전체 화자 인식율 저하의 원인이 된다. 따라서, 본 연구에서는 개인별로 최적의 크기를 가지는 가변길이 코드북 생성 기법과 중심값으로부터 최외곽의 멤버 벡터 인덱스를 찾고 다시 최외곽 멤버 벡터에서 가장 먼 멤버 벡터 인덱스를 찾음으로써 분할할 방향을 인위적으로 지정해 주는 개선된 군집화 알고리즘을 제안한다. 실험 결과, 제안된 방식을 적용한 화자확인 시스템이 기존의 LBG알고리즘을 사용한 시스템보다 오거부율(FR)은 3.165%, 오수락율 (FA)는 0.06%씩 각각 향상 되었다.

백터양자화기의 신속코더백터 찾기 (Fast Codevector Search on Vector Quantization)

  • 우홍체
    • 한국산업정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.16-21
    • /
    • 2000
  • 백터 양자화기는 음성 부호화, 오디오 부호화, 그리고 비디오 부호화와 같은 많은 고품질 고전송률 데이터 압축응용에서 널리 사용되고 있다. 백터 양자화기의 코더북의 크기가 매우 클 때, 코더북 전체를 찾는 방식은 많은 응용의 경우에서 계산량 때문에 상당한 문제점이 된다. 계산량을 낮추기 위하여 삼각형의 변 길이에 대한 부등식과 같은 코더북의 특성을 활용하는 많은 알고리즘들이 제안되고 연구되어 왔다. 본 논문에서는 최적의 코더백터를 찾기 위하여 다단구조에 기반한 신속 코더백터 찾기 알고리즘을 제안하고자 한다. 간단한 2 단계 구조의 이 알고리즘을 사용하여도 상당한 계산 복잡성을 압축대상의 품질을 손상시키지 않고 줄일 수 있다.

  • PDF

윤관보존을 위한 개선된 벡터 양자화 알고리즘에 관한 연구 (A Study on the Advanced Vector Quantization Algorithm for Edge Preserving)

  • 김백기;이대영
    • 전자공학회논문지B
    • /
    • 제31B권12호
    • /
    • pp.72-80
    • /
    • 1994
  • In this paper, we present a digital image data compression method using vector quantization preserving edges. A new vector quantization algorithm is proposed using a new sampling method and edge region extraction. The codebook generation time is faster than existing algorithms and the quality of decompressed images is much improved. Extrimental results suggest that the resultant compression ratio and PSNR are better than those of BPVQ and HMVQ methods.

  • PDF

A Lossless Data Hiding Scheme for VQ Indexes Based on Joint Neighboring Coding

  • Rudder, Andrew;Kieu, The Duc
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권8호
    • /
    • pp.2984-3004
    • /
    • 2015
  • Designing a new reversible data hiding technique with a high embedding rate and a low compression rate for vector quantization (VQ) compressed images is encouraged. This paper proposes a novel lossless data hiding scheme for VQ-compressed images based on the joint neighboring coding technique. The proposed method uses the difference values between a current VQ index and its left and upper neighboring VQ indexes to embed n secret bits into one VQ index, where n = 1, 2, 3, or 4. The experimental results show that the proposed scheme achieves the embedding rates of 1, 2, 3, and 4 bits per index (bpi) with the corresponding average compression rates of 0.420, 0.483, 0.545, and 0.608 bit per pixel (bpp) for a 256 sized codebook. These results confirm that our scheme performs better than other selected reversible data hiding schemes.

정상 가우시안 소오스와 음성 신호용 변환 격자 코드에 대한 훈련 알고리즘 개발 (A Training Algorithm for the Transform Trellis Code with Applications to Stationary Gaussian Sources and Speech)

  • 김동윤;박용서;황금찬
    • 한국음향학회지
    • /
    • 제11권1호
    • /
    • pp.22-34
    • /
    • 1992
  • 변환 격차 코드는 모든 레이트에서 정상 가우시안 소오스와 자승 오차 왜곡에 대해 최적코드이다. 본 논문은 실제 데이타의 통계적 특성에 잘 맞는 코드를 얻기 위해 점근적으로 최적인 변환 격자 코드를 훈련시켰다. 훈련 알고리즘은 격자 코드북을 탐색하기위한 M알고리즘과 코드북을 새롭게하기 위한 LBG 알고리즘을 사용했다. 훈련된 변환 격자 코드의 성능을 조사하기 위해서 상관 계수가 0.9인 1차 AR 가우시안 소오스와 실제 음성 데이타를 사용하였다. 1차 AR 소오스에서, 훈련에 사용되지 않은 데이타에 대한 SNR은 레이트에 따라 샤논의 정보량 왜곡 함수에 의한 SNR보다 0.6에서 1.4dB 낮았으나, 이것은 같은 계산량을 사용한 다른 코딩 결과들보다 우수 했다. 실제 음성 데이타는 레이트 1.0 bits/sample에서 코딩을 했으며, 보다 좋은 성능을 얻기 위해 윈도우 함수와 이득 적용을 사용했다.

  • PDF

Random Beamforming 시스템에서의 CQI 양자화 기법 (CQI Quantization Scheme in Random Beamforming System)

  • 고경준;이정우
    • 한국통신학회논문지
    • /
    • 제34권2A호
    • /
    • pp.170-176
    • /
    • 2009
  • 다중사용자 다중안테나 시스템은 단일사용자 다중안테나 시스템보다 더 좋은 성능을 가진다는 것이 알려져 있다. 그러나 다중사용자 다중안테나 시스템은 선택된 사용자들 간의 신호 간섭이 발생하기 때문에 그것을 제거해야 된다. 간섭 신호를 제거하는 기법 중에 가장 널리 쓰이는 방법으로서 zero-forcing beamforming (ZFBF) 방법이 있다. 하지만 이 방법은 상당히 정확한 채널 정보를 송신단이 알아야 되기 때문에 실제 시스템에서 사용되기 위해서는 많은 양의 피드백 비트수가 필요하게 된다. ZFBF의 단점을 보완하기 위해 Random Beamforming (RBF) 시스템이 제안되었다[1]. RBF는 미리 정해진 코드북에 가장 최적의 성능을 보이는 사용자들에게 데이터를 보내는 방법으로서, 각 수신단은 코드북 내의 최적의 성능을 가지는 코드워드의 인텍스와 CQI 정보를 피드백 한다. 그러나 [l]에서는 송신단이 각 수신단의 CQI 정보를 완벽히 안다고 가정을 하였는데 실제 시스템에서는 CQI 정보도 양자화 되어야 한다. 따라서 이번 논문에서는 CQI 정보를 효율적으로 양자화하는 방법을 제안한다.

부호책 제한을 가지는 표본 적응 프로덕트 양자기를 이용한 1차 마르코프 과정의 고 전송률 양자화 (High Bit-Rates Quantization of the First-Order Markov Process Based on a Codebook-Constrained Sample-Adaptive Product Quantizers)

  • 김동식
    • 대한전자공학회논문지SP
    • /
    • 제49권1호
    • /
    • pp.19-30
    • /
    • 2012
  • 디지털 신호의 양을 줄이기 위한 손실 소스 부호화에서 양자화는 필수적이다. 이때 보다 효율적인 양자화를 위해서는 벡터양자기(vector quantizer: VQ)를 사용하는데, 벡터의 차수 또는 전송률이 올라감에 따라 VQ의 부호화 복잡도는 기하급수적으로 증가한다. 이를 보완하기 위하여 여러 변형된 VQ가 제안되어 있다. 이러한 변형된 VQ의 일종으로 표본 적응 프로덕트 양자기(sample-adaptive product quantizer: SAPQ)가 있는데, 벡터의 차수를 줄여서 부호화 복잡도를 줄일 수 있는 프로덕트 VQ(product VQ: PQ)와 유사한 구조를 가지지만, 일반 PQ보다 더 좋은 성능을 가지면서 일반 VQ보다는 부호화 복잡도가 낮고 부호책을 위한 메모리의 크기도 작은 일종의 구조적 제한을 가지는 VQ이다. 이러한 SAPQ 중에서 부호책의 구조가 양자화 공간의 대각선에 대칭 형태를 가지는 단순한 형태의 1-SAPQ가 있는데, 이러한 1-SAPQ의 성능은 동일한 분포를 가지며 서로 독립인 입력에 좋은 성능을 보인다. 본 논문에서는 1-SAPQ를 1차 마르코프 과정에 대하여 설계하고 그 성능을 평가하였다. 효율적인 1-SAPQ의 설계를 위하여 초기 부호책 설계 알고리듬을 제안하였으며, 수치해석을 통하여 1-SAPQ는 비슷한 부호화 복잡도를 가지는 VQ보다 좋은 성능을 보임을 보였다. 또한 DPCM(differential pulse coded modulation) 기법에 Lloyd-Max 양자화를 사용한 경우의 성능에 근접함을 보였다.

문맥종속 화자인식을 위한 준비반복 벡터 양자기 설계 알고리즘 (A Semi-Noniterative VQ Design Algorithm for Text Dependent Speaker Recognition)

  • 임동철;이행세
    • 정보처리학회논문지B
    • /
    • 제10B권1호
    • /
    • pp.67-72
    • /
    • 2003
  • 이 논문은 문맥 종속 화자인식에 사용될 벡터 앙자기의 설계법 개선에 관한 연구이다. 구체적으로 벡터 양자기 코드북 생성 과정에서 기준 화자를 제외한 모든 비기준 화자에 대해 비반복적 학습 방법을 사용하여, 학습에 필요한 계산 복잡도를 획기적으로 줄이는 방법을 제안한다. 이 제안된 준비반복 벡터 양자기 설계법은, 종래의 설계법이 모든 화자의 코드북 생성에 반복적 학습 설계를 사용한다는 것과 대조를 이룬다. 준비반복 벡터 양자기 설계법의 특징은 다음과 같다. 첫째, 이 설계법은 단지 기준 화자에 대하여만 반복 학습을 수행하고 비기준 화자에 대하여는 반복 학습을 하지 않는다. 둘째, 설계된 비기준 화자의 양자 영역은 기준화자의 양자 영역을 원용하며, 양자점은 자신의 통계 분포에 대해 최적점으로 설정된다. 수치 실험은 화자 20명에 대하여 멜켑스트럼 12차 특징벡터를 사용하였고 코드북 크기를 2부터 32까지 변화시키면서 기존의 벡터 양자기 인식법과 비교하였다. 제안된 방법은 코드북 크기가 적절하고 학습 데이터 길이가 충분한 경우 인식률 100%로 기존의 방법과 같은 결과를 보였다. 따라서 제안된 준비반복 벡터 양자기 설계법은, 설계에 필요한 학습 횟수가 획기적으로 줄면서 인식률은 보존되어, 새로운 대안이 될 것으로 사료된다.

Speech Recognition using MSHMM based on Fuzzy Concept

  • Ann, Tae-Ock
    • The Journal of the Acoustical Society of Korea
    • /
    • 제16권2E호
    • /
    • pp.55-61
    • /
    • 1997
  • This paper proposes a MSHMM(Multi-Section Hidden Markov Model) recognition method based on Fuzzy Concept, as a method on the speech recognition of speaker-independent. In this recognition method, training data are divided into several section and multi-observation sequences given proper probabilities by fuzzy rule according to order of short distance from MSVQ codebook per each section are obtained. Thereafter, the HMM per each section using this multi-observation sequences is generated, and in case of recognition, a word that has the most highest probability is selected as a recognized word. In this paper, other experiments to compare with the results of these experiments are implemented by the various conventional recognition methods(DP, MSVQ, DMS, general HMM) under the same data. Through results of all-round experiment, it is proved that the proposed MSHMM based on fuzzy concept is superior to DP method, MSVQ method, DMS model and general HMM model in recognition rate and computational time, and does not decreases recognition rate as 92.91% in spite of increment of speaker number.

  • PDF

Color Image Vector Quantization Using Enhanced SOM Algorithm

  • Kim, Kwang-Baek
    • 한국멀티미디어학회논문지
    • /
    • 제7권12호
    • /
    • pp.1737-1744
    • /
    • 2004
  • In the compression methods widely used today, the image compression by VQ is the most popular and shows a good data compression ratio. Almost all the methods by VQ use the LBG algorithm that reads the entire image several times and moves code vectors into optimal position in each step. This complexity of algorithm requires considerable amount of time to execute. To overcome this time consuming constraint, we propose an enhanced self-organizing neural network for color images. VQ is an image coding technique that shows high data compression ratio. In this study, we improved the competitive learning method by employing three methods for the generation of codebook. The results demonstrated that compression ratio by the proposed method was improved to a greater degree compared to the SOM in neural networks.

  • PDF