• 제목/요약/키워드: Vector Quantization(VQ)

검색결과 129건 처리시간 0.025초

신경회로망과 벡터양자화에 의한 사후확률과 확률 밀도함수 추정 및 검증 (Verification and estimation of a posterior probability and probability density function using vector quantization and neural network)

  • 고희석;김현덕;이광석
    • 대한전기학회논문지
    • /
    • 제45권2호
    • /
    • pp.325-328
    • /
    • 1996
  • In this paper, we proposed an estimation method of a posterior probability and PDF(Probability density function) using a feed forward neural network and code books of VQ(vector quantization). In this study, We estimates a posterior probability and probability density function, which compose a new parameter with well-known Mel cepstrum and verificate the performance for the five vowels taking from syllables by NN(neural network) and PNN(probabilistic neural network). In case of new parameter, showed the best result by probabilistic neural network and recognition rates are average 83.02%.

  • PDF

DCT와 블록 계층 분할 유한상태 벡터 양자화를 이용한 영상 부호화 (Image Coding Using DCT and Block Hierarchical Segmentation Finite-State Vector Quantization)

  • 조성환;김응성
    • 한국정보처리학회논문지
    • /
    • 제7권3호
    • /
    • pp.1013-1020
    • /
    • 2000
  • In this paper, we propose an algorithm which segments hierarchically blocks of image using discrete cosine transform(DCT) and execute finite-state vector quantization (FSVQ) for each block. Using DCT coefficient feature, image is segmented hierarchically to large smooth block and small edge block, then the block hierarchy informations are transmitted. The codebooks are respectively constructed for each hierarchical blocks, the encoder transmits codeword index using FSVQ for reducing encoded bit with hierarchical segmentation. Compared with side match VQ(SMVQ) and hierarchical FSVQ(HFSVQ) algorithm, about Zelda and Boat image, the new algorithm shows better picture quality with 1.97dB and 2.85 dB difference as to SMVQ, 1.78dB and 1.85dB diffences as to HFSVQ respectively.

  • PDF

VQ와 DTW를 이용한 문장 의존형 화자인식 시스템 (Text-dependent Speaker Recognition System Using DTW & VQ)

  • 정종순;오세영;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.97-103
    • /
    • 2001
  • 초기 DTW(Dynamic Time Warping)를 이용한 화자인식 방법은 인식률이 시간이 지남에 따라 저하된다는 단점이 있었다[1][3][4]. 따라서 이를 보완하기 위한 새로운 알고리즘이 많이 제안되었다. 본 논문에서는 DTW방법을 이용한 화자 인식 시스템의 사용자 등록시기에 화자에 대한 불충분한 음성특징을 보충하고 시간이 지남에 따라 발생하는 오인식률의 증가를 줄이기 위해 사용자 등록시 기준패턴의 정규화를 수행하고 시스템 사용시 기준패턴을 변경하는 방법이다. 본 논문에서 사용된 핵심적인 알고리즘은 VQ(Vector Quantization)와 DTW 방법이다. 본 논문의 알고리즘을 이용한 모의 실험 결과 기존의 방법에 비해 $3.3\%$ 인식률 향상되어 $97.5\%$의 인식률을 얻을 수 있었다.

  • PDF

SOFM 벡터 양자화기와 프랙탈 혼합 시스템의 영상 왜곡특성 향상에 관한 연구 (A Study on the Enhancement of Image Distortion for the Hybrid Fractal System with SOFM Vector Quantizer)

  • 김영정;김상희;박원우
    • 융합신호처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.41-47
    • /
    • 2002
  • 프랙탈 영상압축은 원 영상블록과 가장 유사한 영역을 원영상 내에서 찾는 자기유사성에 기반한 축소변환을 이용하여 영상데이터를 압축시키는 방법이다. 프랙탈은 영상데이터를 압축하는 효율적인 방법으로 인정을 받고 있으나 상대적으로 높은 영상 왜곡률과 부호화 시간이 오래 걸리는 단점을 가지고 있다. 본 논문은 프랙탈의 영상 왜곡률 특성을 개선하기 위하여 프랙탈과 벡터양자화기를 혼합하였으며, 벡터양자화기의 클러스터링 알고리듬으로는 개선한 Self Organizing Feature Map(SOFM)을 사용하였다. 제안된 시스템의 성능평가를 위하여 일반적인 SOFM을 사용한 시스템 그리고 프랙탈을 단독으로 사용한 시스템과 비교하여 전체적인 성능 향상 정도를 확인하였다. 그 결과 개선한 경쟁학습 SOFM을 사용한 벡터양자화기와 프랙탈 혼합시스템이 일반적인 SOFM을 사용한 벡터양자화기와 프랙탈 혼합시스템보다 영상 왜곡특성이 향상된 것을 확인하였다.

  • PDF

가변 블럭 벡터 양자화를 이용한 효율적인 다분광 화상 데이터 압축 (Efficient Multispectral Image Compression Using Variable Block Size Vector Quantization)

  • 반성원;김병주;석정엽;권성근;권기구;김영춘;이건일
    • 대한전자공학회논문지SP
    • /
    • 제38권6호
    • /
    • pp.703-711
    • /
    • 2001
  • 본 논문에서는 가변 블럭 벡터 양자화를 이용한 효율적인 다중 분광 화상 데이타 압축 기법을 제안하였다. 이 방법에서는 먼저 공간적으로 가장 낮은 분산을 가지고 다른 대역과 상관성이 가장 큰 기준 대역을 웨이브릿 영역에서 가변 블럭 벡터 양자화를 행하였다. 그리고 나머지 각 대역은 웨이브릿 영역에서 기준 대역으로부터 영역별 예측을 통하여 대역간 중복성을 제거하였다. 그리고 원 화상의 웨이브릿 계수와 예측 영상의 웨이브릿 계수의 차이를 줄이기 위해 오차 가변 블럭 벡터 양자화를 행한다. 실제 원격 센싱된 인공위성화상데이타에 대한 실험을 통하여 제안한 기법의 부호화 효율이 기존의 기법에 비하여 우수함을 확인하였다.

  • PDF

분산 음성 인식 시스템을 위한 특징 계수 양자화 방식 설계 (Design of a Quantization Algorithm of the Speech Feature Parameters for the Distributed Speech Recognition)

  • 이준석;윤병식;강상원
    • 한국음향학회지
    • /
    • 제24권4호
    • /
    • pp.217-223
    • /
    • 2005
  • 본 논문에서는 분산 음성 인식 시스템에서 사용되는 멜켑스트럼 계수를 양자화 하기 위하여 예측 구조를 갖는 BC-TCQ 양자화기를 제안하였다. 분산 음성 인식 시스템을 위한 효율적인 멜켑스트럼 계수 양자화기를 설계하기 위하여, 인접 프레임간의 높은 상관도를 이용한 1차 AR 예측 필터를 적용하였다. 그리고 예측 필터에 의해서 구해지는 예측 에러 벡터는 BC-TCQ를 사용하여 양자화를 수행하였다. 본 연구에서 제안된 예측 BC-TCQ멜켑스트럼 계수 양자화기는 분산 음성 인식 시스템을 위해 ETSI 규격에서 사용되는 split VQ 멜켑스트럼 계수 양자화 방식보다 cepstral distortion (CD) 측면에서 훨씬 좋은 성능을 보이며, 인코딩 연산 복잡도 및 메모리 요구량에서도 더 유리하다.

퍼지 벡터 양자화기 사상화와 신경망에 의한 화자적응 음성합성 (Speaker-Adaptive Speech Synthesis based on Fuzzy Vector Quantizer Mapping and Neural Networks)

  • 이진이;이광형
    • 한국정보처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.149-160
    • /
    • 1997
  • 본 연구에서는 퍼지사상화(fuzzy mapping)와 FLVQ(fuzzy learning vector quantization)에 의한 사상된(mapped)코드북을 사용하는 화자적용 음성합성 알고리즘 을 제안하고, 기존의 음성합성결과와 비교한다. 입력화자와 기준화자의 코드북은 FLVQ 방법으로 작성한다. 사상된 코드북은 퍼지 히스토그램을 작성하여 이들을 선형 결합함으로써 얻어지는 퍼지 사상화에 의하여 작성된다. 대응 코드벡터의 퍼지 히스 토그램은 동일 입력벡터에 대해 선택된 입력화자의 코드벡터와 기준화자의 코드벡터 사이의 DTW(dynamic time warping)을 행하여 대응하는 코드벡터들의 소속값 (membership value)을 누적하여 얻는다. 음성합성시에는 사상된 코드북을 사용하여 입력화자의 음성을 퍼지벡터 양자화한 다음, FCM(fuzzy c means) 합성규칙을 사용하 여 사상된 코드북내의 코드벡터가 아닌 새로운 하나의 합성벡터를 얻게 되어 좀 더 입력화자에 적응된 합성음을 얻게 된다. 이 기술의 성능평가는 성별이 서로 다른 화 자를 입력화자 및 기준화자로 선정하여 입력화자의 음성에 가까운 정도로 평가하였으 며 그 결과 기존의 음성합성보다 입력화자에 더 적용된 합성음을 얻었다.

  • PDF

멀티미디어 정보검색에 적합한 영상정보의 벡터 양자화 코드북 설계 및 특징추출 (VQ Codebook Design and Feature Extraction of Image Information for Multimedia Information Searching)

  • 서석배;김대진;강대성
    • 전자공학회논문지S
    • /
    • 제36S권8호
    • /
    • pp.101-112
    • /
    • 1999
  • 본 논문에서는 멀티미디어 정보검색을 위하여 영상정보의 특징추출에 적합한 벡터 양자화 코드북 설계 방법을 제안한다. 기존의 벡터 양자화의 경우 영상에 대한 특징을 추출할 경우 보통 영상을 복원한 다음 수행하므로 많은 시간과 메모리가 소요되며, DCT(discrete cosine transform)를 이용한 방법처럼 블록화 현상을 동반한다. 이를 개선하기 위하여 본 논문에서는 웨이브렛 변환과 주성분 해석을 이용한 벡터 양자화 코드북 설계 방법을 제안한다. 웨이브렛 변환은 높은 압축률에서도 블록화 없는 영상을 복원하기 위해서 도입되었으며, 주성분해석은 데이터를 여러 그룹으로 분할하기 위해 도입되었다. 신경회로만인 SOM(self-organizing map)을 이용한 벡터 양자화와 비교실험에서 비슷한 성능을 보이면서도 처리 시간을 대폭 단축시킬 수 있음을 볼 수 있었다.

  • PDF

A Rotation Invariant Image Retrieval with Local Features

  • You, Hee-Jun;Shin, Dae-Kyu;Kim, Dong-Hoon;Kim, Hyun-Sool;Park, Sang-Hui
    • International Journal of Control, Automation, and Systems
    • /
    • 제1권3호
    • /
    • pp.332-338
    • /
    • 2003
  • Content-based image retrieval is the research of images from database, that are visually similar to given image examples. Gabor functions and Gabor filters are regarded as excellent methods for feature extraction and texture segmentation. However, they have a disadvantage not to perform well in case of a rotated image because of its direction-oriented filter. This paper proposes a method of extracting local texture features from blocks with central interest points detected in an image and a rotation invariant Gabor wavelet filter. We also propose a method of comparing pattern histograms of features classified by VQ (Vector Quantization) among images.

유한 상태 벡터 양자화기를 이용한 프레임간 부호화 (On interframe coding with Finite State Vector Quantization)

  • 김시중;최종수
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1454-1456
    • /
    • 1987
  • Space domain image coding with VQ [9, 10, 11] has been very effective at low rates. To achieve quality at lower rates, it is necessary to exploit spaial redundancy over a larger region of pixels than is possible with general VQ. This paper presents a interframe coding algorithm which is capable of obtaining better performance and lower bi t rate than those of the general interframe coding. The performance is evaluated on the basis of SNR (Signal to Noise Ratio), memory requirements and bit rate.

  • PDF