• 제목/요약/키워드: Vector quantization (VQ)

검색결과 129건 처리시간 0.022초

다중스펙트럼 위성영상 압축을 위한 복합부호화 기법 (Hybrid Coding for Multi-spectral Satellite Image Compression)

  • 정경훈
    • 한국지리정보학회지
    • /
    • 제3권1호
    • /
    • pp.1-11
    • /
    • 2000
  • 본 논문에서는 인공위성으로부터 얻어진 다중스펙트럼영상의 부호화 방법을 다룬다. 위성영상의 공간 및 스펙트럼 해상도가 급속도로 향상되면서 처리해야 할 다중스펙트럼 영상의 데이터량은 엄청나게 증가하였다. 이에 따라 위성영상을 활용하기 위해서는 효율적으로 부호화하는 기술이 필요하다. 본 논문에서는 벡터양자화에 근거한 예측부호화, 영상의 quadtree 분할, 그리고 예측오차의 압축을 위한 DCT를 복합적으로 적용한 부호화 기법을 제시한다. 벡터양자화를 통해 대역영상간의 공간적인 특징이 동일하다는 점을 이용한 예측을 하고, 영상분할을 통해 영상의 공간적인 정보량에 따라 적응적으로 비트를 할당하며, DCT를 통해 예측오차의 공간적응적인 부호화를 수행한다. Landsat TM 영상을 대상으로 수행한 실험을 통해 제안 알고리듬의 위성영상 압축기법으로서의 타당성을 보였다.

  • PDF

고음질의 음성합성을 위한 퍼지벡터양자화의 퍼지니스 파라메타선정에 관한 연구 (A Study on Fuzziness Parameter Selection in Fuzzy Vector Quantization for High Quality Speech Synthesis)

  • 이진이
    • 한국지능시스템학회논문지
    • /
    • 제8권2호
    • /
    • pp.60-69
    • /
    • 1998
  • 본 눈문에서는 퍼지 벡터양자호를 이용하여 음성을 합성하는 방법을 제시하고,원음에 가까운 합성음을 얻기 위하여 퍼지벡터양자화의 성능을 최적화 하는 Fuzziness갑의 선정방법을 연구한다. 퍼지벡터 양자화를 이용하여 음성을 합성할때, 분석단에서는 입력 음성패턴과 코드북의 음성패턴의 유사도를 나타내는 퍼지 소속함수값을 출력하고, 합성단에서는 분석단에서 얻은 퍼지소속 함수값, fuzziness값, 그리고 FCM(Fuzzy-C-Means) 연산식을 이용하여 음성을 합성한다. 시뮬레이션을 통하여 벡터양자화에 의해 합성된 음성과 퍼지 벡터양자화에 의해 합성된 음성을 코드북의 크기에 따라 비교한 결과, 퍼지벡터양자화를 이용한 음성합성의 성능이 코드북 크기가 절반으로 줄어도 벡터양자화에 의한 성능과 거의 같음을 알수 있다. 이것은 VQ(Vecotr Quantiz-ation)에 의한 음성합성 결과와 같은 성능을 얻기 위해서 퍼지 VQ를 사용하면, 코드북 저장을 위한 메모리의 크기를 절반으로 줄일 수 있음을 의미한다. 그리고 SQNR을 최대로 하는 퍼지 벡터양자화를 얻기 위한 최적 Fuzziness값은 음성분석 프레임의 분산값이 크면 작게 선정해야 하고, 작으면 크게 선정 해야함을 밝혔다. 또한 합성음들을 주파수 영역의 스펙트로그램에서 비교한 결과 포만트 주파수와 피치주파수에서 퍼지 VQ에 의한 합성음이 VQ에 의한 것보다 원 음성에 더 가까움을 알 수 있었다.

  • PDF

변환영역에서의 지능형 분류벡터양자화를 이용한 영상압축 (Image Compression using an Intelligne Classified Vector Quantization Method in Transform Domain)

  • 이현수;공성곤
    • 한국지능시스템학회논문지
    • /
    • 제7권4호
    • /
    • pp.18-28
    • /
    • 1997
  • 이 논문에서는 영상데이터를 여러개의 영상블록들로 나누고 이산 코사인변환 영역에서 물체의 에지에 해당하는 영상블록을 에지방향을 고려하여 적절히 분류함으로써 영상데이터를 효과적을 압축하였다. 벡터양자화에 의한 영상데이터의 압축은 높은 압축률을 실현할 수 있지만 영상내 물체의 에지부근이 손상되어 시각적인 화질이 저하되는 단점이 있다. 높은 압축률을 유지하면서도 시각적인 화질의 열화를 피하기 위하여 영상블록의 이산 코사인변환계수의 에너지 분포에 따라 에지블록을 8개의 부류로 분류하였다. 또한 이 분류과정을 통하여 얻어진 데이터를 가지고 신경회로망을 학습하여 구현한 에지블록의 분류과정과 성능을 비교하였다. 에너지분포에 의한 에지분류방법과 신경망으로 학습한 분류과정은 에지특성벡터에 의한 분류벡터양자화에 비해 더 높은 PSNR과 시각적으로 좋은 화질을 보여주었다.

  • PDF

은닉표적의 분할을 위한 실시간 Graphic User Interface 구현에 관한 연구 (A study on Real-time Graphic User Interface for Hidden Target Segmentation)

  • 염석원
    • 융합신호처리학회논문지
    • /
    • 제17권2호
    • /
    • pp.67-70
    • /
    • 2016
  • 본 논문에서 8mm 파장영역에서 획득한 수동형 밀리미터파 영상을 이용하여 위험물체를 은닉한 대상으로부터 금속표적(권총)을 자동으로 분할하고 식별하는 실시간 그래픽 사용자 인터페이스(Graphic User Interface)를 구현한다. 은닉된 표적의 분할 방법은 다단계 영상 분할 방법을 이용한다. 다단계 영상 분할의 각 단계는 밀리미터파 영상의 히스토그램을 가우시안 혼합 모델(Gaussian Mixture Model)로 가정하고 LBG 양자화(Vector-Quantization)과 추정(Expectation)-최대화(Maximization) 알고리즘으로 구성된다. 첫 번째 단계에서 배경으로부터 몸체 영역을 분할하고 두 번째 단계에서 몸체로부터 은닉된 물체 영역을 순차적으로 분할한다. 실험 및 시뮬레이션에서는 그래픽 사용자 인터페이스 프로그램을 이용하여 분석된 결과를 보여준다.

주축의 연속적 분할을 통한 고속 벡터 양자화 코드북 설계 (Fast VQ Codebook Design by Sucessively Bisectioning of Principle Axis)

  • 강대성;서석배;김대진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권4호
    • /
    • pp.422-431
    • /
    • 2000
  • 본 논문에서는 주성분 해석 기법에 기반한 새로운 벡터 양자화 코드북 설계 방법을 제안한다. 주성분 해석 알고리즘은 입력 영상벡터를 더 작은 차원의 특징 벡터로 변환시키는데 사용되며, 변환된 영역에서 특징 벡터의 군집을 최적으로 결정된 분할 초평면을 이용하여 두 군집으로 분할하는 과정을 반복 함으로써 코드북을 생성한다. 본 논문에서는 연산 시간이 오래 걸리는 최적 분할 초평면 탐색을 (1) 분할 초평면은 특징 벡터의 주축에 수직이며, (2) 좌우측 부군집의 오차의 균형점과 일치하며, (3) 좌우측 부군집의 오차를 점진적으로 조정함으로서 연산 수행 시간을 크게 단축시켰다. 제안한 주축 연속 분할은 분할전후의 오차의 감축이 가장 큰 군집에 대해, 전체 군집의 오차가 설정한 수준보다 작을 때까지 연속적으로 수행된다. 실험 결과 제안한 주성분 해석 기반 벡터 양자화 방법은 SOFM을 이용한 방법보다 수행시간이 빠르며 K-mean 알고리즘을 이용한 방법보다 복원 성능이 뛰어남을 볼 수 있다.

  • PDF

공간 채널 모델의 통계적 특성을 활용하는 MIMO 시스템의 코드북 결정 및 성능 평가 (Determination and Performance Evaluation of a Codebook for MIMO Systems Utilizing Statistical Properties of The Spatial Channel Model)

  • 서준엽;강호식;성원진
    • 전자공학회논문지
    • /
    • 제52권7호
    • /
    • pp.22-30
    • /
    • 2015
  • LTE (long-term evolution) MIMO 시스템에서는 제한된 피드백 환경 하에서 추정된 채널 정보를 활용하기 위한 코드북이 사용되고 있으며, 이와 관련된 연구도 활발히 진행되었다. 기존에 활용된 방식으로는 VQ (vector quantization) 기반 및 DFT(discrete fourier transform) 기반으로 생성된 코드벡터를 활용하는 코드북이 있으며, LTE 표준에서도 이를 변형한 방식을 최대 8개의 송신 안테나에 대해 적용할 수 있게 규정하고 있다. 그러나 안테나 개수가 추가적으로 증가하고, 공간 채널 모델이 LTE 시스템 전송 성능 평가에 기본적인 모델로 활용됨에 따라, 이에 따른 새로운 빔포밍 방안 및 코드북 설계가 필요하다. 본 논문에서는 LTE 전송 성능 평가에 활용되는 3차원 공간 채널 모델 (3D Spatial Channel Model; 3D-SCM)의 구현을 통해 생성된 채널의 핵심적인 통계적 특성을 분석하고, 이에 따른 코드북 설계의 방향성을 제시하고자 한다. 특히 DFT 기반 코드 북 활용 시, 기존의 균일위상 DFT 코드북을 개선한 비균일위상 DFT 코드북을 제안하고, 주어진 SCM 환경에서 성능을 평가한다. 코드벡터 설계에 필요한 인접한 안테나 원소 간의 위상차의 통계적 특성의 경우 SCM에서 뚜렷한 경향성이 존재하며, 이를 적절히 활용함으로써 기존 방식 대비 이득을 발생시킬 수 있다.

LPC Cepstral 벡터 양자화에 의한 저 전송율 CELP 음성부호기의 스펙트럼 표기 (Spectrum Representation Based on LPC Cepstral VQ for Low Bit Rate CELP Coder)

  • 정재호
    • 한국통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.761-771
    • /
    • 1994
  • 본 논문에서는, 매우 낮은 전송율이 요구되는 음성통신의 환경하에서 CELP 음성 부호기를 사용할 경우, 스펙트럼에 대한 정보를 어떻게 효과적으로 나타낼 것인가에 대하여 고찰하였다. 구체적으로, 스펙트럼에 대한 정보를 나타내는 LPC 파라메타를 cepstrum으로 변형시키고, 변형된 LPC cepstrum계수들을 효과적으로 벡터 양자화하는 방법을 제시하였다. 벡터 양자화에 사용되는 코드-북의 설계를 위하여, 주파수 대역에서 서로 다른 의미를 갖는 세계의 cepstral distance measure들을 시도하였으며, 각각에 대한 성능이 분석되어졌다. 시뮬레이션을 통하여, 본 논문에서 제시한 LPC cepstral 벡터 양자화 방식이 스펙트럼에 대한 정보를 매우 효과적으로 나타낼 수 있음을 보였다.

  • PDF

Aspect feature extraction of an object using NMF

  • JOGUCHI, Hirofumi;TANAKA, Masaru
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.1236-1239
    • /
    • 2002
  • When we see an object, we usually can say what it is easily even for the case where the object isn't shown in the frontal view. However, it is difficult to believe that all views of every object we have ever seen are fully memorized in our brain. Possibly, when an object is shown, we have some typical views of the object in our brain through our past experience and reconstruct the view to recognize what the presented object is. Non-negative Matrix Factorization (NMF) is one of the methods to extract the basis images from sample data set. The prominent feature of this method is that the reconstructed image is obtained by only additions of the basis images with suitable positive weights. So NMF can be seen more biologically plausible method than any other feature extraction methods such as Vector Quantization (VQ) and principal Component Analysis (PCA). In this paper, we adopt NMF to extract the aspect features from the set of images, which consists of various views of a given object. Some experiments are shown how much well NMF can extract the aspect features than any other methods such as VQ and PCA.

  • PDF

One Channel Five-Way Classification Algorithm For Automatically Classifying Speech

  • Lee, Kyo-Sik
    • The Journal of the Acoustical Society of Korea
    • /
    • 제17권3E호
    • /
    • pp.12-21
    • /
    • 1998
  • In this paper, we describe the one channel five-way, V/U/M/N/S (Voice/Unvoice/Nasal/Silent), classification algorithm for automatically classifying speech. The decision making process is viewed as a pattern viewed as a pattern recognition problem. Two aspects of the algorithm are developed: feature selection and classifier type. The feature selection procedure is studied for identifying a set of features to make V/U/M/N/S classification. The classifiers used are a vector quantization (VQ), a neural network(NN), and a decision tree method. Actual five sentences spoken by six speakers, three male and three female, are tested with proposed classifiers. From a set of measurement tests, the proposed classifiers show fairly good accuracy for V/U/M/N/S decision.

  • PDF

LDA와 tri-tone 모델을 이용한 운율경계강도 예측 (Prosodic Break Index Estimation using LDA and Tri-tone Model)

  • 강평수;엄기완;김진영
    • 한국음향학회지
    • /
    • 제18권7호
    • /
    • pp.17-22
    • /
    • 1999
  • 본 논문에서는 발화된 문장으로부터 운율 경계 강도를 효과적으로 예측하기 위해 LDA와 tri-tone 모델을 혼합한 방법을 제안하였다. 이 방법은 기존의 LDA 방법을 사용하여 음절과 휴지기의 길이 정보를 운율경계강도 예측에 적용하고 피치정보를 벡터양자화에 적용하여 tri-tone이란 개념을 도입한 혼합형 모형이다. 제안된 방법은 주어진 200문장의 운율경계 강도를 예측하는 실험에서 72%의 정확성을 나타내었다.

  • PDF