• 제목/요약/키워드: VQ

검색결과 252건 처리시간 0.025초

A Rotation Invariant Image Retrieval with Local Features

  • You, Hee-Jun;Shin, Dae-Kyu;Kim, Dong-Hoon;Kim, Hyun-Sool;Park, Sang-Hui
    • International Journal of Control, Automation, and Systems
    • /
    • 제1권3호
    • /
    • pp.332-338
    • /
    • 2003
  • Content-based image retrieval is the research of images from database, that are visually similar to given image examples. Gabor functions and Gabor filters are regarded as excellent methods for feature extraction and texture segmentation. However, they have a disadvantage not to perform well in case of a rotated image because of its direction-oriented filter. This paper proposes a method of extracting local texture features from blocks with central interest points detected in an image and a rotation invariant Gabor wavelet filter. We also propose a method of comparing pattern histograms of features classified by VQ (Vector Quantization) among images.

한국어 연속음성중 키워드 인식을 위한 반연속 은닉 마코브 모델과 One-Pass 알고리즘의 개선방안 (Improvement of Semicontinuous Hiden Markov Models and One-Pass Algorithm for Recognition of Keywords in Korean Continuous Speech)

  • 최관선
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.358-363
    • /
    • 1994
  • This paper presents the improvement of the SCHMM using discrete VQ and One-Pass algorithm for keywords recognition in Korean continuous speech. The SCHMM using discrete VQ is a simple model that is composed of a variable mixture gaussian probability density function with dynamic mixture number. One-Pass algorithm is improved such that recognition rates are enhanced by fathoming any undesirable semisyllable with the low likelihood and the high duration penalty, and computation time is reduced by testing only the frame which is dissimilar to the previously testd frame. In recognition experiments for speaker-dependent case, the improved One-Pass algorithm has shown recognition rates as high as 99.7% and has reduced compution time by about 30% compared with the currently abailable one-pass algorithm.

  • PDF

분할 매트릭스 부호화를 이용한 문장 독립형 화자인식 시스템 (Text Independent Speaker Identification Using Separate Matrix Quantization)

  • 경연정;이황수
    • 한국음향학회지
    • /
    • 제17권5호
    • /
    • pp.69-72
    • /
    • 1998
  • 본 논문에서는 문장독립형 화자인식 시스템에 MQ(Matrix Quantization) 방법 사용 을 제안한다. 또한 인식율을 높이기 위해 MQ를 수정한 방법인 SMQ(Separated Matrix Quantization)을 제안한다. 기존의 VQ-distortion 방법은 대체로 좋은 성능을 가지나 화자의 동적 특성을 이용하지 못한다는 단점이 있다. MQ와 SMQ는 화자의 동적 특성을 이용할 수 있으므로 시간 변화에 대한 화자의 특징 변화까지 모델링 할 수 있는 장점이 있다. MQ는 여러 프레임을 묶어 Matrix Codebook을 가지며 SMQ는 MQ의 기본 codebook을 다시 켑스 트럼의 차수에 따라 나누어 codebook을 만든다. 즉, 켑스트럼 차수를 저, 중, 고차로 나누어 각 부분별로 Matrix codebook을 만들도록 한다. 인식실험은 문장독립 음성 데이터에 대해 실행했으며 MQ모델의 경우 Matrix의 크기를 짧은 음소크기부터 음절단위까지 변화시켜 실 험하였다. 아울러 SMQ 모델에서의 실험은 차수별 유용도를 보기 위하여 부분 차수를 이용 하여 실험하였다. 실험결과 MQ와 SMQ방법이 VQ에 비해 좋은 성능을 가짐을 확인하였다.

  • PDF

AMR부호화기와 MLT-VQ방법을 이용한 다전송률 광대역 음성부호화기 (Multi Rate Wideband Speech Coder with the AMR Speech Coder and MLT-VQ)

  • 김은주;이인성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.809-812
    • /
    • 2001
  • 본 논문에서는 AMR(Adaptive Multi-Rate)과 MLT (Modulated Lapped Transform) 벡터 양자화 방법을 이용하여 광대역 음성부호화기를 설계하였다. 제안한 음성부호화 알고리즘은 split-band 구조를 가지고 있으며 16kHz로 샘플링 된 신호를 입력받아 QMF 필터에 의해 두 개의 대역으로 나누어, 각각 8kHz 샘플링 신호로 변환시킨 후 저대역(0Hz-3400Hz)의 신호와 고대역(3400Hz -7000Hz)의 신호로 나누어 각각 부호화한다. 나누어진 두 개의 협대역 음성신호는 AMR(Adaptive Multi-Rate)부호화기와 MLT (Modulated Lapped Transform)벡터 양자화 방법을 사용하여 각각 부호화되어 전송된다. 수신단에서는 각 대역을 AMR과 IMLT(Inverse MLT) 벡터 양자화 방법으로 역부호화하여 음성신호를 합성한다. 제안한 음성부호화기는 20.2kbps에서 12.15kbps까지의 다전송률로 동작된다. 설계된 광대역 음성부호화기는 MOS시험 결과로부터 G.722의 56 kbps 음성이 설계된 코더의 20.2 kbps와 비슷한 음질을 갖음을 확인할 수 있었다.

  • PDF

고음질을 갖는 음색변경에 관한 연구 (A Study on the Voice Conversion Algorithm with High Quality)

  • 박형빈;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.157-160
    • /
    • 2000
  • In the generally a voice conversion has used VQ(Vector Quantization) for partitioning the spectral feature and has performed by adding an appropriate offset vector to the source speaker's spectral vector. But there is not represented the target speaker's various characteristics because of discrete characteristics of transformed parameter. In this paper, these problems are solved by using the LMR(Linear Multivariate Regression) instead of the mapping codebook which is determined to the relationship of source and target speaker vocal tract characteristics. Also we propose the method for solved the discontinuity which is caused by applying to time aligned parameters using Dynamic Time Warping the time or pitch-scale modified speech. In our proposed algorithm for overcoming the transitional discontinuities, first of all, we don't change time or pitch scale and by using the LMR change a speaker's vocal tract characteristics in speech with non-modified time or pitch. Compared to existed methods based on VQ and LMR, we have much better voice quality in the result of the proposed algorithm.

  • PDF

프레임 차분 체적양자화기에 의한 복원영상의 압축 효과 (The Compression Effects of Reconstruction Images with Frame Difference Volume Quantizer)

  • 최재윤;김태효
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.269-273
    • /
    • 2000
  • 본 논문에서는 연속되는 동영상 시퀸스의 9개의 프레임에서 이웃하는 프레임간의 차분 프레임으로 이루어진 8개의 차분 데이터를 3D-DCT 처리 후 특성에 맞는 프레임 차분 체적 양자화기(FDVQ)를 설계하고, 이것으로 처리된 영상데이터를 부호화하여 복원영상 데이터의 압축 효과를 분석하였다. 여러가지 동영상 시퀀스를 시험 대상으로 사용한 결과, 제안한 FDVQ를 적용한 3D-DCT 방법은 유사한 해상도에서 차분 영상 데이터에 대한 압축률은 2D-DCT 방법에 비하여 평균 20.3% 향상된 압축 효율을 얻었다. 체적 양자화(VQ:Volume Quantizer)를 이용한 3D-DCT 방법과 비교했을 때는 유사한 압축률을 보였다. 특히, 움직임 성분이 많은 영상에 대해서는 제안한 FDVQ를 이용한 방법이 압축률을 높일수록 2D-DCT방법과 VQ를 이용한 방법보다 압축률 0.05bpp이하에서 약 1.0dB 개선된 결과를 나타내었다.

  • PDF

청각 모델에 기초한 음성 특징 추출에 관한 연구 (A study on the speech feature extraction based on the hearing model)

  • 김바울;윤석현;홍광석;박병철
    • 전자공학회논문지B
    • /
    • 제33B권4호
    • /
    • pp.131-140
    • /
    • 1996
  • In this paper, we propose the method that extracts the speech feature using the hearing model through signal precessing techniques. The proposed method includes following procedure ; normalization of the short-time speech block by its maximum value, multi-resolution analysis using the discrete wavelet transformation and re-synthesize using thediscrete inverse wavelet transformation, differentiation after analysis and synthesis, full wave rectification and integration. In order to verify the performance of the proposed speech feature in the speech recognition task, korean digita recognition experiments were carried out using both the dTW and the VQ-HMM. The results showed that, in case of using dTW, the recognition rates were 99.79% and 90.33% for speaker-dependent and speaker-independent task respectively and, in case of using VQ-HMM, the rate were 96.5% and 81.5% respectively. And it indicates that the proposed speech feature has the potentials to use as a simple and efficient feature for recognition task.

  • PDF

경계의 방향성에 근거를 둔 가변블록형상 적응 예측영상부호화 (Adaptive Predictive Image Coding of Variable Block Shapes Based on Edge Contents of Blocks)

  • 도재수;김주영;장익현
    • 한국정보처리학회논문지
    • /
    • 제7권7호
    • /
    • pp.2254-2263
    • /
    • 2000
  • This paper proposes an efficient predictive image-compression technique based on vector quantization of blocks of pels. In the proposed method edge contents of blocks control the selection of predictors and block shapes as well. The maximum number of bits assigned to quantizers has been in creased to 3bits/pel from 1/5bits/pel, the setting employed by forerunners in predictive vector quantization of images. This increase prevents the saturation in SNR observed in their results in high bit rates. The variable block shape is instrumental in eh reconstruction of edges. The adaptive procedure is controlled by means of he standard deviation ofp rediction errors generated by a default predictor; the standard deviation address a decision table which can be set up beforehand. eh proposed method is characterized by overall improvements in image quality over A-VQ-PE and A-DCT VQ, both of which are known for their efficient use of vector quantizers.

  • PDF

유한 상태 벡터 양자화기를 이용한 프레임간 부호화 (On interframe coding with Finite State Vector Quantization)

  • 김시중;최종수
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1454-1456
    • /
    • 1987
  • Space domain image coding with VQ [9, 10, 11] has been very effective at low rates. To achieve quality at lower rates, it is necessary to exploit spaial redundancy over a larger region of pixels than is possible with general VQ. This paper presents a interframe coding algorithm which is capable of obtaining better performance and lower bi t rate than those of the general interframe coding. The performance is evaluated on the basis of SNR (Signal to Noise Ratio), memory requirements and bit rate.

  • PDF