• 제목/요약/키워드: 벡터양자화

검색결과 318건 처리시간 0.025초

웨이브릿 영역에서 다분광 화상 데이터의 효율적인 압축 알고리듬 (Efficiency Algorithm of Multispectral Image Compression in Wavelet Domain)

  • 박경남;김영춘;장종국;이건일
    • 대한전자공학회논문지SP
    • /
    • 제38권4호
    • /
    • pp.38-38
    • /
    • 2001
  • 본 논문에서는 웨이브릿 영역에서의 영역 분류와 대역간 예측 및 선택적 벡터 양자화를 이용한 다분광 화상테이타 압축 기법을 제안하였다. 이 방법에서는 각 대역을 웨이브릿 변환 후, 각 대역의 기저밴드의 대역별 특성을 이용하여 영역 분류를 행하였다. 그리고, 다른 대역과 해상도가 동일하고 공간적 분산이 작으며 분광적 상관성이 큰 기준대역 (reference channel)을 결정한 뒤, 이를 영역별 스칼라 및 분류별 가변 벡터 양자화를 행하여 부호화 하였다. 또한 기준대역과의 대역간 상관성이 큰 대역들에 대해서는 영역별 대역간 예측을 행한 후, 활동도가 높은 블록에 대해서만 선택적 벡터 양자화로 부호화를 행하였다. 이때, 활동도가 높은 블록들의 위치정보는 기준대역으로부터 얻어지는 임계치 지도 (threshold map; THMAP)를 이용하였다. 즉, 제안한 방법에서는 각 대역에 대해 웨이브릿 영역에서의 영역 분류 후 영역별 대역간 예측을 행함으로써 다분광 화상데이타에 존재하는 대역간 중복성을 제거하고 선택적 벡터 양자화를 행함으로써 대역내 중복성을 효과적으로 제거하여 압축효율을 향상시킨다. 실제 원격 센싱된 인공위성 화상데이타에 대한 실험을 통하여 제안한 기법의 부호화 효율이 기존의 기법에 비하여 우수함을 확인하였다.

웨이브릿 영역에서의 영역별 대역간 예측과 벡터 양자화를 이용한 다분광 화상 데이타의 압축 (Multispectral Image Compression Using Classified Interband Prediction and Vector Quantization in Wavelet domain)

  • 반성원;권성근;이종원;박경남;김영춘;장종국;이건일
    • 한국통신학회논문지
    • /
    • 제25권1B호
    • /
    • pp.120-127
    • /
    • 2000
  • 본 논문에서는 웨이브릿 영역에서 영역별 대역간 예측과 벡터 양자화를 이용한 다중 분광 화상데이타 압축 기법을 제안하였다. 이 방법에서는 먼저 화상데이타에서 각 대역의 반사 특성을 이용하여 영역 분류를 행한 후, 공간적으로 가장 낮은 분산을 가지고 다른 밴드와 상관성이 가장 큰 기준 대역을 웨이브릿 영역에서 영역 분류 벡터 양자화를 행한다. 또한 나머지 각 밴드는 웨이브릿 영역에서 기준 대역으로부터 영역별 예측을 통하여 대역간 중복성을 제거하였다. 그리고 원 화상의 웨이브릿 계수와 예측 영상의 웨이브릿 계수의 차이를 줄이기 위해 오차 벡터 양자화를 행한다. 실제 원격 센싱된 인공위성 화상데이터에 대한 실험을 통하여 제안한 기법의 부호화 효율이 기존의 기법에 비하여 우수함을 확인하였다.

  • PDF

웨이브렛 변환 영상 부호화용 고성능 범용 벡터양자화기의 설계 (Design of High Performance Robust Vector Quantizer for Wavelet Transformed Image Coding)

  • 정태연;도재수
    • 한국정보처리학회논문지
    • /
    • 제7권2호
    • /
    • pp.529-535
    • /
    • 2000
  • 본 논문에서는 웨이브렛 변환을 이용한 영상 부호화에서 입력 영상의 통계적 성질에 영향을 받지 않고 부호화 결과에 범용성을 갖는 새로운 벡터 양자화기 설계법을 제안한다. 기존의 벡터 양자화기의 가장 큰 문제점은 양자화대상 영상과 대표 벡터를 생성하기 위한 학습계열간의 통계적 성질의 불일치에 의한 부호화 성능의 열화이다. 그리하여, 본 논문에서는 벡터 양자화기의 대표벡터를 생성하기 위한 학습계열로 독립 난수에 영상의 상관과 에지 성분을 첨가한 모사 영상을 사용하여 종래 방식의 문제점을 해결하는 방법에 대하여 검토하였다. 제안방식에 의해 설계된 벡터양자화기와 대표 벡터 생성에 이용하는 학습계열에 부호화 대상이 되는 영상과 같은 실제의 영상을 사용한 종래 방식에 의해 설계된 벡터 양자화기와 부호화 성능을 컴퓨터 시뮬레이션을 통하여 비교하여 종래 방식의 문제점을 명확하게 밝힘과 동시에 제안 방식으로 설계된 벡터 양자화기가 부호화 성능이 뛰어남을 보인다.

  • PDF

분산 음성 인식 시스템을 위한 특징 계수 양자화 방식 설계 (Design of a Quantization Algorithm of the Speech Feature Parameters for the Distributed Speech Recognition)

  • 이준석;윤병식;강상원
    • 한국음향학회지
    • /
    • 제24권4호
    • /
    • pp.217-223
    • /
    • 2005
  • 본 논문에서는 분산 음성 인식 시스템에서 사용되는 멜켑스트럼 계수를 양자화 하기 위하여 예측 구조를 갖는 BC-TCQ 양자화기를 제안하였다. 분산 음성 인식 시스템을 위한 효율적인 멜켑스트럼 계수 양자화기를 설계하기 위하여, 인접 프레임간의 높은 상관도를 이용한 1차 AR 예측 필터를 적용하였다. 그리고 예측 필터에 의해서 구해지는 예측 에러 벡터는 BC-TCQ를 사용하여 양자화를 수행하였다. 본 연구에서 제안된 예측 BC-TCQ멜켑스트럼 계수 양자화기는 분산 음성 인식 시스템을 위해 ETSI 규격에서 사용되는 split VQ 멜켑스트럼 계수 양자화 방식보다 cepstral distortion (CD) 측면에서 훨씬 좋은 성능을 보이며, 인코딩 연산 복잡도 및 메모리 요구량에서도 더 유리하다.

연속음성 인식기를 위한 벡터양자화기 기반의 화자정규화 (Vector Quantizer Based Speaker Normalization for Continuos Speech Recognition)

  • 신옥근
    • 한국음향학회지
    • /
    • 제23권8호
    • /
    • pp.583-589
    • /
    • 2004
  • 포만트 등의 음향학적인 정보를 이용하지 않는 연속음성인식 (CSR)을 위한 벡터 양자화기 기반의 화자 정규화 방법을 제안한다. 이 방법은 앞서 제안한 간단한 숫자음 인식기를 위한 화자정규화 방법을 개선한 것으로, 코드북의 크기를 증가시켜 가면서 벡터양자화기를 반복적으로 학습시킴으로써 정규화된 코드북을 구한 다음, 치를 이용하여 시험용화자의 워핑계수를 추정한다. 코드북 생성과 워핑계수 추정을 위해 모음 음소의 집합과 자음과 모음을 포함한 모든 음소의 집합 등 두 가지 음소집합을 이용i,겨 실험하였으며, 추정한 워핑계수에 상응하는 구간선형 워핑함수를 이용하여 인식기의 학습과 시험에 사용될 특징벡터를 워핑하였다. TIMIT 코퍼스와 HTK toolkit을 이용한 음소인식 실험을 수행하여 제안하는 방법의 성능을 조사한 결과, 포만트를 이용한 워핑 방법과 비슷한 성능을 가짐을 확인하였다.

개선된 SOM을 이용한 칼라 이미지 벡터 양자화 (Color Image Vector Quantization using Enhanced SOM)

  • 남미영;이종희;김광백
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.255-258
    • /
    • 2000
  • 정보 산업의 발달에 의해 여러 가지 형태의 정보 전달이 가능하게 되었으며 최근에 칼라 화상의 정보 전달에 있어서 빠른 전송과 압축기법이 필요하게 되었다. 본 논문에서는 칼라 화상을 압축하는데 있어 개선된 SOM 알고리즘을 이용하여 칼라 이미지에 대한 벡터 양자화 기법을 제안한다. 제안된 방법은 기존의 LBG 알고리즘을 이용한 벡터 양자화 기법에 비해 블록화 현상을 줄일 수 있었으며 이미지 전체에 대해 블록의 수만큼 계속해서 반복하지 않고 동적으로 코드북을 생성시킴으로써 실행 시간도 줄일 수 있었다. 또한 웨이블릿을 칼라 화상에 적용시켜 화상의 특징을 더욱더 두드러지게 함으로써 개선된 SOM을 적용시 재생의 효과를 높일 수 있었다.

  • PDF

웨이브릿 패킷 영역에서의 방향성 벡터양자화 (Directional Vector Quantization on the Wavelet Packet Domain)

  • 강동욱
    • 전자공학회논문지S
    • /
    • 제35S권6호
    • /
    • pp.72-80
    • /
    • 1998
  • 웨이브릿 패킷을 이용한 방향성 벡터양자화 기법을 제안하였다. 영상에 대한 웨이브릿 패킷 계수들을 대응되는 방향에 따라 9개의 에지로 분할한 후, 국지적으로 지배적인 에지들을 부호화하여 전송한다. 에지의 방향은 조건부 부호책 교환이 있는 가변길이부호화를 통하여 부호화하며, 에지의 내용은 벡터양자화와 그 인덱스의 가변길이부호화를 이용하여 부호화하였다. 제안된 부호화기법은 기존의 여러 영상압축기법에 비하여 PSNR 성능이 우수하며, 특히 0.1~0.3 bpp의 낮은 부호율의 경우 상대적으로 더욱 우수하다. 제안된 알고리듬은 인간시각특성상 가장 중요한 에지 정보들을 보전함으로써, 낮은 부호율에서도 우수한 주관적 화질을 나타낸다.

  • PDF

광대역 음성부호화기를 위한 백터-스칼라 LSP 파라미터 양자화기 설계 (Design of the Vector-Scalar Quantizer of LSP Parameters for Wideband Speech Coder)

  • 신재현;이인성;지덕구;윤병식;최송인
    • 대한전자공학회논문지SP
    • /
    • 제40권4호
    • /
    • pp.286-291
    • /
    • 2003
  • 본 논문에서는 광대역 음성 부호화기를 위한 VQ-SQ 구조의 LSP(Line Spectral Pairs) 파라미터 양자화기를 설계하였다. 16차 LPC(Linear Prediction Coefficients) 계수를 사용하며, 양자화 특성이 좋고 합성필터의 안정성의 조건을 검사하기 쉬운 LSP 파라미터로 변환/sup [2]/하여 양자화 한다. 설계된 VQ-SQ 양자화기는 첫 번째 단에서 2단 SVQ(Split VQ)로 각각 8차씩 양자화한 뒤, 두 번째 단에서 순서화 특성(OP Ordering Property)을 적용한 SQ를 사용하여 잔여신호(Residual Signal)를 양자화하는 구조로 되어있다. VQ-SQ결합 양자화기의 전체적인 성능개선을 위해 백터 양자화기에서 하나의 최적 벡터를 찾지 않고 5개의 후보백터를 가지고 스칼라 양자화를 수행한 후, 전체적으로 본래의 LSP 파라미터에 가장 가까운 벡터 양자화기 인덱스와 스칼라 양자화기의 인덱스를 결정한다. 순서화 특성을 고려하여 설계된 적응 VQ-SQ 양자화기는 LSP 파라미터에 총 35비트를 할당하여 광대역 명료도(Wideband Transparency)인 평균 1.6㏈ 이하의 스펙트럼 왜곡(SD : Spectral Distortion)과 4%미만의 3㏈가 넘는 프레임의 비율/sup [1]/을 만족하였으며, 기존의 VQ-SQ 양자화기보다 2-3비트를 절약할 수 있었다.

벡터 양자화를 이용한 한국어 억양 곡선 생성 (Generation of Korean Intonation using Vector Quantization)

  • 안혜선;김형순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.209-212
    • /
    • 2001
  • 본 논문에서는 text-to-speech 시스템에서 사용할 억양 모델을 위해 벡터 양자화(vector quantization) 방식을 이용한다. 어절 경계강도(break index)는 세단계로 분류하였고, CART(Classification And Regression Tree)를 사용하여 어절 경계강도의 예측 규칙을 생성하였다. 예측된 어절 경계강도를 바탕으로 운율구를 예측하였으며 운율구는 다섯 개의 억양 패턴으로 분류하였다. 하나의 운율구는 정점(peak)의 시간축, 주파수축 값과 이를 기준으로 한 앞, 뒤 기울기를 추출하여 네 개의 파라미터로 단순화하였다. 운율구에 대해서 먼저 운율구가 문장의 끝일 경우와 아닐 경우로 분류하고, 억양 패턴 다섯 개로 분류하여. 모두 10개의 운율구 set으로 나누었다. 그리고 네 개의 파라미터를 가지고 있는 운율구의 억양 패턴을 벡터 양자화 방식을 이용하여 분류(clusteing)하였다 운율의 변화가 두드러지는 조사와 어미는 12 point의 기본주파수 값을 추출하고 벡터 양자화하였다. 운율구와 조사 어미의 codebook index는 문장에 대한 특징 변수 값을 추출하고 CART를 사용하여 예측하였다. 합성할 때에는 입력 tort에 대해서 운율구의 억양 파라미터를 추정한 다음, 조사와 어미의 12 point 기본주파수 값을 추정하여 전체 억양 곡선을 생성하였고 본 연구실에서 제작한 음성합성기를 통해 합성하였다.

  • PDF