• Title, Summary, Keyword: 양자화 모델

Search Result 163, Processing Time 0.046 seconds

Sequential Speaker Classification Using Quantized Generic Speaker Models (양자화 된 범용 화자모델을 이용한 연속적 화자분류)

  • Kwon, Soon-Il
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.44 no.1
    • /
    • pp.26-32
    • /
    • 2007
  • In sequential speaker classification, the lack of prior information about the speakers poses a challenge for model initialization. To address the challenge, a predetermined generic model set, called Sample Speaker Models, was previously proposed. This approach can be useful for accurate speaker modeling without requiring initial speaker data. However, an optimal method for sampling the models from a generic model pool is still required. To solve this problem, the Speaker Quantization method, motivated by vector quantization, is proposed. Experimental results showed that the new approach outperformed the random sampling approach with 25% relative improvement in error rate on switchboard telephone conversations.

Improved R-Q model for rate control in hierarchical coding structure of H.264/AVC (계층적 부호화 구조의 H.264/AVC에서 효율적인 비트율 제어를 위한 향상된 비트율-양자화 모델링)

  • Seo, Chan-Won;Han, Jong-Ki
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • /
    • pp.91-92
    • /
    • 2010
  • 계층적 부호화 구조는 H.264/AVC의 부호화 효율을 최대화하고 시간적 스케일러빌리티를 지원하는 등 다양한 장점을 제공한다. 이러한 구조에서 비트 할당 및 비트율 제어 기술은 비디오 코덱의 성능을 향상시킬 수 있는 중요한 요소들이다. 기존의 비트율 제어 기술에서는 계층적 구조의 특성을 고려하지 못한 비트율-양자화 모델을 사용하여 비디오 코덱의 성능을 최적화하기에 어려움이 있었다. 따라서, 본 논문에서는 계층적 구조에서도 효율적으로 비트 할당 및 비트율 제어를 할 수 있도록, 기존보다 향상된 비트율-양자화 모델을 제안한다. 그리고 실험을 통하여 제안하는 비트율-양자화 모델이 기존 기술에 비해 정확함을 보인다.

  • PDF

R-Q model for efficient rate control in HEVC (HEVC에서 효율적인 비트율 제어를 위한 비트율-양자화 모델링)

  • Lee, Min-Ho;Han, Jong-Ki
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • /
    • pp.228-230
    • /
    • 2012
  • ITU와 ISO/IEC가 공동으로 UHD(Ultra High Definition)급 영상 부호화를 위해 표준화를 진행하고 있는 HEVC(High Efficient Video Codec)는 H.264/AVC 대비 2배 이상의 압축 효율을 갖는 것을 목표로 정하고 있다. HEVC는 다수의 개선된 기술을 사용하고 있기 때문에 부호화효율을 크게 향상시켰는데 여기에 비트 할당 및 비트율 제어 기술사용을 비디오 코덱의 성능을 향상 시킬 수 있는 중요한 요소들이다. 기존 H.264/AVC의 비트율 제어 기술에는 HEVC의 특성을 고려하지 못한 비트율-양자화 모델을 사용하여 HEVC의 성능을 최적화하기에 어려움이 있었다. 따라서 본 논문에서는 HEVC에서 효율적으로 비트 할당 및 비트율 제어를 할 수 있도록, 기존보다 향상된 비트율-양자화 모델을 제안한다. 그리고 실험을 통하여 제안하는 비트율-양자화 모델이 기존 기술에 비해 정확함을 보인다.

  • PDF

Postprocessing in Block-Based Video Coding Based on a Quantization Noise Model (양자화 잡음 모델에 근거한 블록기반 동영상 부호화에서의 후처리)

  • 문기웅;장익훈;김남철
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.8B
    • /
    • pp.1129-1140
    • /
    • 2001
  • 본 논문에서는 블록기반 동영상 부호화에서 나타나는 양자화 잡음을 그 특성에 맞게 모델링을 하고, 이를 기반으로 웨이블렛 변환(wavelet transform)을 이용하여 양자화 잡음을 제거하는 후처리 방법을 제안한다. 제안된 방법에서는 양자화 잡음을 특정 프로화일(profile)로 표현되는 블록화 잡음과 비에지 화소(non-edge pixel)에서 백색 가우시안 특성을 가지는 나머지 잡음의 합으로 모델링 한다. 이러한 양자화 잡음의 모델을 기반으로 정칙화 미분(regularized differentiation)을 표현하는 Mallat의 1차원 웨이브렛 변환을 이용하여 영상복원 관점에서 각각의 잡음을 제거한다. 먼저, 웨이브렛 영역의 블록경계에서 임펄스로 나타나는 블록화 잡음 성분들의 크기를 추정하여 줄임으로 해서 블록화 잡음을 제거한다. 이때 임펄스 크기의 추정은 메디안 필터와 양자화 파라미터(quantization parameter), 그리고 국부 활동도(local activity)를 이용하여 이루어진다. 그리고 나머지 잡음은 비에지 화소에서 연역치화(soft-thresholding)을 수행함으로써 제거한다. 이러한 후처리 방법의 구현은 실시간 응용을 위해 웨이브렛 필터를 이용하여 근사적으로 공간 영역에서 이루어진다. 실험 결과, 제안된 방법이 다양한 영상과 압축률에 대해 MPEG-4 VM(verification model) 후처리 필터(post-filter)보다 PSNR 성능뿐만 아니라 주관적 화질면에서도 우수함을 확인하였다.

  • PDF

A Comparative Study on Parameter for Korean Phoneme-based HMM Model Decision (한국어 음소 HMM 모델 결정을 위한 파라미터 비교 연구)

  • 권혁제
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • /
    • pp.302-305
    • /
    • 1998
  • 음소의 확률적 분포를 이용하는 음소 HMM 모델을 결정하기 위한 여러 가지 거리 측정방법에 대한 연구이다. 음소 HMM 모델 결정을 위해서 LPC 계수를 이용하고, 거리 측정자를 LPC 계수, LPC 스첵트럼, LPC 켑스트럼 등의 파라미터를 이용하고, 또한 양자화 과정은 k-means 와 LBG 알고리즘을 혼합한 하이브리드 알고리듬을 사용하였다. LPC 코드북을 구성하기 위해 세 가지 파라미터를 유클리디안 거리로 거리측정에 이용하였다. 이렇게 양자화한 파라미터의 평균과 분산을 구하고, 양자화한 파라미터 코드북의 확률갑승ㄹ 비교해 한국어 음소 HMM 모델 결정을 위한 거리 측정 파라미터를 비교하였으며, 그 결과 LPC 계수를 주파수 영역으로 변환하여 유클리디안 거리를 이용한 코드북의 분산이 작으므로 상대적으로 높은 확률을 가짐을 보았다.

  • PDF

MPEG Audio Layer-III Encoder Using Approximated Psy-choacoustic Model (간략화된 심리음향모델을 이용한 MPEG Audio Layer-III 부호화기)

  • 송창준;오현오;박영철;윤대희
    • Proceedings of the IEEK Conference
    • /
    • /
    • pp.469-472
    • /
    • 2001
  • MPEC Audio Layer-III(MP3)알고리듬은 복호화기에 비해 부호화기가 월등히 많은 연산량을 가지고 있는 비대칭 구조를 가지고 있다. MP3 부호화기의 대부분의 연산량은 복잡한 초월함수 연산이 포함되는 심리음향모델과 반복 루프 과정을 수행하는 비선형 양자화와 비트 할당과정 이 차지한다. 본 논문에서는 MP3 부호화기의 실시간 구현을 위한 알고리듬 레벨의 최적화를 수행하였다. MP3 부호화기의 연산량을 줄이기 위해 심리음향모델을 간략화하고 반복 루프의 회수를 최소화할 수 있는 방법을 제안하였다. 프레임당 한 그래뉼의 심리음향모델 정보를 계산하여 한 프레임 내에서의 심리음향모델 정보를 추정함으로써 연산량을 45% 이상 감소시켰다. 또한 외부 반복 루프의 반복 회수를 줄이기 위하여 외부 반복 루프의 반복에 따른 스케일 팩터(Scale Factor) 및 양자화 스탭의 증가 패턴을 관찰하고 최적화된 스캐일 팩터 증가 방법을 제안하였다. 제안된 고속화 방법은 주관적 음질 평가를 통해 성능을 검증하였다.

  • PDF

Rate Control for Using Temporal Correlation Between Frames (화면간 상관성을 고려한 비트율 제어 방법)

  • Kim, Se-Ho;Lee, Jeong-Woo;Suh, Jea-Won
    • Proceedings of the KIEE Conference
    • /
    • /
    • pp.423-424
    • /
    • 2007
  • 비트율 제어는 제한된 대역폭 내에서 더 좋은 화질을 제공하기 위해 필요로하는 비디오 부호화의 구성요소이다. 본 논문에서는 저 전송률 환경에서의 모델기반 율제어 기법의 개선 방안에 대하여 연구하였다. H.263 TMN8과 MPEG-4 VMl6은 비트율-왜곡 분석관점에서 접근한 모델기반 비트율 제어 알고리즘으로 양자화가 수행될 데이터의 특성 분포를 단일 모델로 정의하여 해석한다. 이는 실제적인 데이터 분포 특성을 지나치게 간략화하기 때문에 부호화 효율을 떨어뜨리는 원인이 될 수 있다. 이러한 문제를 해결하기 위해 본 논문에서는 SAD값을 이용해 의미 있는 영역을 구하고, 이전 프레임의 양자화 변수들을 반영하여 양자화 변수를 결정하는 방법을 제안한다.

  • PDF

Histogram Equalization Based Color Space Quantization for the Enhancement of Mean-Shift Tracking Algorithm (실시간 평균 이동 추적 알고리즘의 성능 개선을 위한 히스토그램 평활화 기반 색-공간 양자화 기법)

  • Choi, Jangwon;Choe, Yoonsik;Kim, Yong-Goo
    • Journal of Broadcast Engineering
    • /
    • v.19 no.3
    • /
    • pp.329-341
    • /
    • 2014
  • Kernel-based mean-shift object tracking has gained more interests nowadays, with the aid of its feasibility of reliable real-time implementation of object tracking. This algorithm calculates the best mean-shift vector based on the color histogram similarity between target model and target candidate models, where the color histograms are usually produced after uniform color-space quantization for the implementation of real-time tracker. However, when the image of target model has a reduced contrast, such uniform quantization produces the histogram model having large values only for a few histogram bins, resulting in a reduced accuracy of similarity comparison. To solve this problem, a non-uniform quantization algorithm has been proposed, but it is hard to apply to real-time tracking applications due to its high complexity. Therefore, this paper proposes a fast non-uniform color-space quantization method using the histogram equalization, providing an adjusted histogram distribution such that the bins of target model histogram have as many meaningful values as possible. Using the proposed method, the number of bins involved in similarity comparison has been increased, resulting in an enhanced accuracy of the proposed mean-shift tracker. Simulations with various test videos demonstrate the proposed algorithm provides similar or better tracking results to the previous non-uniform quantization scheme with significantly reduced computation complexity.

Modeling Quantization Error using Laplacian Probability Density function (Laplacian 분포 함수를 이용한 양자화 잡음 모델링)

  • 최지은;이병욱
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.11A
    • /
    • pp.1957-1962
    • /
    • 2001
  • Image and video compression requires quantization error model of DCT coefficients for post processing, restoration or transcoding. Once DCT coefficients are quantized, it is impossible to recover the original distribution. We assume that the original probability density function (pdf) is the Laplacian function. We calculate the variance of the quantized variable, and estimate the variance of the DCT coefficients. We can confirm that the proposed method enhances the accuracy of the quantization error estimation.

  • PDF

Quantization Modeling of Intra Frame for Rate Control (비트율 제어를 위한 인트라 프레임 양자화 모델링)

  • Park, Sang-Hyun
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.9 no.10
    • /
    • pp.1207-1214
    • /
    • 2014
  • The first frame of a GOP is encoded in intra mode which generates a larger number of bits. In addition, the first frame is used for the inter mode encoding of the following frames. Thus the encoding results of the intra frame affects the first frame as well as the following frames. Traditionally, the quantization parameter for an intra frame is determined only depending on the bpp not considering the characteristics of the intra frame. For accurate intra frame encoding, we should consider not only bpp but also the complexity of the video sequence and the output bandwidth. In this paper, we propose a real-time quantization model which is used to calculate the quantization parameter for an intra frame encoding based on the investigation on the characteristics of a GOP. It is shown by experimental results that the proposed quantization model captures the characteristics of an intra frame effectively and the proposed method for model parameters accurately estimates the real values.