• 제목/요약/키워드: Perceptual Quantization

검색결과 39건 처리시간 0.03초

계층적 움직임 추정 및 적응 양자화 기법을 사용한 GA HDTV 동영상 부호화기 개발에 관한 연구 (Hardware Implementation of GA HDTV Video Encoder Using Hierarchical Motion Estimation and Adaptive Quantization)

  • 임경원;최병선;조현덕;최정필;유한주;송병철;김성득;박현상;나종범
    • 방송공학회논문지
    • /
    • 제1권2호
    • /
    • pp.152-164
    • /
    • 1996
  • 본 논문은 GA(Grand Alliance) HDTV 동영상 부호화기의 하드웨어 구조 및 그의 구현을 위한 기술을 기술한다. 구현된 동영상 부호화기는 1125본(30Hz)의 비월주사 방식 영상을 입력으로 받고, MPEG-2에 따르는 비트열을 출력한다. 부호화기의 처리과정은 넓은 영역 움직임 추정 및 진보된 비트율 제어 기법을 포함한다. 시스템의 복잡도를 현실화하기 위해 계층적 움직임 추정기법이 사용되었고, 그것의 하드웨어 구조를 개발하였다. 또한, 시각적 화질을 향상시키기 위해 시각 특성을 이용한 적응 양자화 기법이 사용되었다. 개발된 시스템은 실시간 처리를 위해 병렬처리구조를 취하고, 프로그램 가능 소자, 기억 소자, 그리고 DCT와 움직임 추정 소자와 같은 특수 처리 소자를 이용하여 구현된다.

  • PDF

영상 부호화를 위한 DCT 계수의 시각적 분석 및 순차적 규에지 벡터 양자화 (Perceptual Decomposition and Sequential Principal Edge Vector Quantization of DCT Coefficients for Image Coding)

  • 강동욱;송준석;이충웅
    • 전자공학회논문지B
    • /
    • 제32B권1호
    • /
    • pp.64-72
    • /
    • 1995
  • We propose a new image coding method which takes into account both statistical redundancy and perceptual irrelevancy of the DCT coefficients so as to provide a high quality of the reconstructed images with a reduced transmission bit rate First, a block of DCT coefficients are decomposed into 16 subvectors so as for a subvector to convey key information about one of the low-pass or the dirctional filtered images. Then, the most significant subvector is selected as the principal edge of the block and then vector quantized. After that, the residuals of the block are computed and then sequentially quantized through aforementioned procedure until the quantization distortion is smaller than the target distortion. The proposed scheme is good at encoding images with a variety of transmission bit rates, especially at very low bit rate coding. In addition, it is another benifit of the proposed scheme that an image can be quantized with a wide range of the transmission bit rates by simply adapting the stopping criterion of the sequential vector quantizer according to the target distortion of the reconstructed image.

  • PDF

선 스펙트럼 주파수의 청각 적응 부호화 (Perceptual and Adaptive Quantization of Line Spectral Frequency Parameters)

  • 한우진;김은경;오영환
    • 한국음향학회지
    • /
    • 제19권8호
    • /
    • pp.68-77
    • /
    • 2000
  • 선 스펙트럼 주파수를 양자화하기 위한 대부분의 방법들이 가중 유클리드 거리에 기반하고 있는 반면, 본 논문에서는 청각 마스킹 효과에 기반한 에러 척도를 사용하여 선 스펙트럼 주파수를 효과적으로 양자화하는 방법을 제안하였다. 제안한 방법에서는 noise-to-mask ratio (NMR)를 선 스펙트럼 주파수의 양자화에 적합하도록 변형한 새로운 에러 척도를 유도하고, 이를 사용하여 선 스펙트럼 주파수를 양자화한다. 한편, 본 논문에서는 양자화하고자 하는 음성 프레임이 갖는 청각적인 특성을 고려하여 동적으로 비트를 할당하는 적응 양자화 알고리즘을 제안하였다. 성능 평가를 위해서 11948 프레임의 테스트 자료를 기존의 방법과 제안한 방법으로 각자 양자화하고 perceptually transparent frame의 비운 및 이때의 평균 비트율을 비교한 결과, 기존의 방법이 1800 bps의 비트율에서 89.9%의 perceptually transparent frame을 얻은 데 비해, 제안한 방법은 770 bps의 평균 비트율에서 95.5%의 perceptually transparent frame을 얻음으로써 제안한 방법이 효과적임을 보였다.

  • PDF

멀티웨이브릿 변환 영역 기반의 연속 부대역 양자화 및 지각 모델을 이용한 적응 워터마킹 (Adaptive Watermarking Using Successive Subband Quantization and Perceptual Model Based on Multiwavelet Transform Domain)

  • 권기룡;이준재
    • 한국멀티미디어학회논문지
    • /
    • 제6권7호
    • /
    • pp.1149-1158
    • /
    • 2003
  • 본 논문에서는 멀티웨이브릿 변환영역에서 연속부대역 양자화 및 지각 모델을 이용한 내용기반 적응적 워터마킹 기법을 제안한다. 제안한 방법의 워터마크는 멀티웨이브릿을 통해 분해된 계수들 중 지각적 중요계수(perceptually significant coefficients, PSCs)에 삽입된다. 고주파 부대역에서의 PSC는 연속부대역양자화(successive subband quantization, SSQ)에 의해 결정된다. 문턱값은 각 부대역내의 최대계수의 절반에서 결정된다. 지각모델은 워터마크 삽입을 위한 국부적 영상 특성을 가지는 NVF (noise visibility function)에 기반한 통계적 방법을 적용한다. 이 모델은 워터마크가 노이즈특성을 가지므로 정상상태 일반화 가우스모델을 사용한다. 또한 워터마크는 각 부대역 영역의 분산과 형상계수 (shape parameter)에 의해 추정함으로써 평탄영역과 에지나 텍스쳐 영역에 따라 내용 기반 적응적 척도를 얻는다. 제안한 멀티웨이브릿 변환 기반에서의 워터마크 삽입 방법에 대한 실험 결과 우수한 강인성과 비가시성을 확인하였다.

  • PDF

Adaptive Image Watermarking Using a Stochastic Multiresolution Modeling

  • Kim, Hyun-Chun;Kwon, Ki-Ryong;Kim, Jong-Jin
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.172-175
    • /
    • 2002
  • This paper presents perceptual model with a stochastic rnultiresolution characteristic that can be applied with watermark embedding in the biorthogonal wavelet domain. The perceptual model with adaptive watermarking algorithm embed at the texture and edge region for more strongly embedded watermark by the SSQ(successive subband quantization). The watermark embedding is based on the computation of a NVF(noise visibility function) that have local image properties. This method uses non-stationary Gaussian model stationary Generalized Gaussian model because watermark has noise properties. In order to determine the optimal NVF, we consider the watermark as noise. The particularities of embedding in the stationary GG model use shape parameter and variance of each subband regions in multiresolution. To estimate the shape parameter, we use a moment matching method. Non-stationary Gaussian model use the local mean and variance of each subband. The experiment results of simulation were found to be excellent invisibility and robustness. Experiments of such distortion are executed by Stirmark benchmark test.

  • PDF

Lightweight Quality Metric Based on No-Reference Bitstream for H.264/AVC Video

  • Kim, Yo-Han;Shin, Ji-Tae;Kim, Ho-Kyom
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권5호
    • /
    • pp.1388-1399
    • /
    • 2012
  • This paper proposes a quality metric based on a No-Reference Bitstream (NR-B) having least computational complexity for the assessment of the human-perceptual quality of H.264 encoded video. The proposed NR-B method performs a modeling of encoding distortion with three bit-stream information (i.e. frame-rate, motion-vector, and quantization-parameter) that can be directly extractable from the encoded bitstream and does not require additional complex processing of final pictures. From performance evaluation using 165 compressed video sequences, the experiment results show that the proposed metric has a higher correlation with subjective quality than is achieved with other comparable methods.

SAW 필터를 이용한 KLT 기반 Entropy-Constrained Quantizer 성능 향상 (Perceptual Quality Improvement of KLT based Entropy-Constrained Quantizer using a SAW Filter)

  • 임동석;김무영
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.1-2
    • /
    • 2013
  • KLT-AECQ 는 지각적인 성능 향상을 위하여 formant weighting 필터를 사용한다.Code Excited Linear Prediction(CELP) 코더는 사람의 음성신호를 압축하는 대표적인 방식이다. CELP 의 Rate-Distortion 성능을 향상 시키기 위해서 Karhunen-Loeve-Transform (KLT) 기반의 Classified Vector Quantization (KLT-CVQ) 방식이 제안되었으며, 이는 KLT 기반의 Adaptive Entropy-Constrained Quantization (KLT-AECQ) 방식으로 확장되었다. 기존의 KLT-AECQ 에서는 지각적인 성능 향상을 위하여 formant weighting 필터를 사용한다. 본 논문에서는 이 필터 대신에 Spectral Amplitude Warping (SAW) 필터를 적용함으로써, KLT-AECQ 코더의 지각적인 성능을 향상하였다.

  • PDF

시각적 인지 중복성 제거를 위해 양자화 크기값에 적응적인 최소 인지 왜곡 기반 전처리 방법 (JND based Video Pre-processing Adaptive to Quantization Step sizes for Perceptual Redundancy Reduction)

  • 기세환;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.100-102
    • /
    • 2016
  • 본 논문에서는 기존의 인지 영상 부호화에 사용되던 Just Noticeable Distortion(JND) 보다 더 압축에 적합한 모델인 Just Noticeable Quantization Distortion(JNQD) 모델을 제시하고, 이를 사용한 인지적 영상 압축 방법을 제안한다. 제안하는 인지적 영상 압축 방식은 영상 코덱 내부의 Rate-Distortion Optimization(RDO)을 수정하지 않고 입력되는 영상의 불필요한 정보들을 미리 제거하는 전처리 과정으로서, JNQD 모델을 사용하여 보다 간단하면서 압축 효율을 크게 증가 시킬 수 있다. 기존 영상 압축의 전처리 방법들은 부호화기의 양자화 값을 전처리 과정에서 고려하지 못하여 부정확한 인지 중복성 제거 결과를 초래하였으나, 제안하는 방법은 영상의 특성뿐만 아니라 양자화 크기 값을 고려하여 적응적으로 인지 왜곡이 발생하지 않는 주관적 인지 중복성 제거를 전처리 과정에서 수행할 수 있다. 거의 유사한 주관적 품질 수준을 유지하면서 HEVC 참조 소프트웨어 대비 약 15%의 압축효율 향상을 보인다.

  • PDF

패킷 손실시 H.264 SVC의 무기준법 영상 화질 평가 방법 (No-Referenced Video-Quality Assessment for H.264 SVC with Packet Loss)

  • 김현태;김요한;신지태;원석호
    • 한국통신학회논문지
    • /
    • 제36권11C호
    • /
    • pp.655-661
    • /
    • 2011
  • 다양한 네트워크 환경에서 적응적인 서비스 품질을 제공할 수 있는 H.264 SVC 전송에 대한 연구가 활발하다. 본 논문은 H.264 SVC의 무기준법 객관적 화질 평가 방법으로서, H.264 SVC의 계층성을 이용한 품질 평가 지표를 제안한다. 제안하는 지표는 패킷 손실의 위치에 따라 움직임 벡터, 계층적 예측 구조에 의한 에러 전파 패턴, 양자화 파라미터, 영향을 받은 영상프레임 수 등 에러를 반영한 인지적 화질 평가를 예측한다. 제안하는 품질평가 지표는 사람의 인지적인 영상 품질을 반영한 객관적 지표이며 이 지표를 주관적 화질평가 결과인 DMOS와의 상관관계를 통해 성능을 검증하였다.

저전송률 오디오 부호화에서 음성 신호의 성능 개선을 위한 마스킹 임계값 적응기법 향상 (Enhanced Adjustment Strategy of Masking Threshold for Speech Signals in Low Bit-Rate Audio Coding)

  • 이창헌;강홍구
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.62-68
    • /
    • 2010
  • 본 논문에서는 기존 마스킹 임계값 적응 방식을 개선하여 저전송률 오디오 부호화에서 음성 신호에 대한 성능을 향상시킨다. 포먼트 영역 검색 이후, 각 포먼트 영역의 평균 에너지와 해당 서브밴드의 에너지 비율을 이용하여 마스킹 임계값을 변화시킨다. 상대적으로 에너지가 큰 밴드에 대해서는 더 많은 양자화 노이즈가 허용되는 반면, 청각적으로 민감한 스펙트럴 밸리에서는 비트 할당을 높여 양자화 에러를 좀 더 줄인다. 이는 음성 부호화에서 널리 사용되는 지각 가중(perceptual weighting) 개념을 반영한 것이다. 객관적 음질 평가 결과, 제안한 알고리즘이 기존 방식에 비해 음성 신호에 대한 성능을 향상시킨다는 것을 확인하였다.