• 제목/요약/키워드: Quantization parameter

검색결과 145건 처리시간 0.024초

실시간 비디오 전송을 위한 채널레이트 조절 (A Control of Channel Rate for Real-time VBR Video Transmission)

  • 고석주;이채영
    • 한국경영과학회지
    • /
    • 제24권3호
    • /
    • pp.63-72
    • /
    • 1999
  • Recent studies on the Constant Bit Rate and Variable Bit Rate transmissions have mainly focused on the frame by frame encoder rate control based on the quantization parameter. With the existing approaches it is difficult to guarantee a consistent video quality. Also, the rate control overhead is too high for the real-time video sources. In this paper, a channel rate allocation scheme based on the control period is proposed to transmit a real-time video, in which the control period is defined by a pre-specified number of frames or group of pictures. At each control period, video traffic information is collected to determine the channel rate at the next control period. The channel rate is allocated to satisfy various channel rate constraints such that the buffer occupancy at the decoder is maintained at a target level. If the allocated channel rate approaches the level at which the negotiated traffic descriptions may be violated, the encoder rate is decreased through adjusting quantization parameters in the MPEG encoder. In the experimental results, the video quality and the overflow and underflow probabilities at the buffer are compared at different control periods. Experiments show that the video quality and the utilization of network bandwidth resources can be optimized through the suitable selection of the control period.

  • PDF

DMS 모델과 이중 스펙트럼 특징을 이용한 HMM에 의한 음성 인식 (HMM-based Speech Recognition using DMS Model and Double Spectral Feature)

  • 안태옥
    • 한국산학기술학회논문지
    • /
    • 제7권4호
    • /
    • pp.649-655
    • /
    • 2006
  • 본 논문은 화자 독립의 음성인식을 위한 연구로써, DMS 모델에 의한 DMSVQ(Dynamic Multi-Section Vector Quantization) 코드북과 이중 스펙트럼 특징을 이용한 HMM(Hidden Markov Model) 음성인식 방법을 제안한다. 정적 스펙트럼 특징으로서는 LPC ?S스트럼 계수를 이용하였고, 동적 스펙트럼 특징으로는 LPC ?S스트럼의 회귀계수를 사용하였다. 이들 두개의 스펙트럼 특징들을 각각 VQ 코드북으로 양자화되고, DMS 모델을 이용한 HMM은 입력으로써 정적 스펙트럼 특징과 동적 스펙트럼 특징을 받아드림으로써 모델링된다. 제안된 방법에 의한 인식 실험은 기존의 다양한 인식 방법에 의한 인식 실험들과 비교를 위해 동일한 데이터와 조건 하에서 수행하였다. 실험 결과, 본 연구에서 제안한 방법이 기존의 방법들보다 우수한 방법임을 입증하였다.

  • PDF

학습벡터양자화 뉴럴네트워크를 이용한 공압 인공 근육 로봇의 지능 스위칭 제어 (Intelligent Switching Control of a Pneumatic Artificial Muscle Robot using Learning Vector Quantization Neural Network)

  • 윤홍수;안경관
    • 한국정밀공학회지
    • /
    • 제26권4호
    • /
    • pp.82-90
    • /
    • 2009
  • Pneumatic cylinder is one of the low cost actuation sources which have been applied in industrial and prosthetic application since it has a high power/weight ratio, a high-tension force and a long durability However, the control problems of pneumatic systems, oscillatory motion and compliance, have prevented their widespread use in advanced robotics. To overcome these shortcomings, a number of newer pneumatic actuators have been developed such as McKibben Muscle, Rubber Actuator and Pneumatic Artificial Muscle (PAM) Manipulators. In this paper, one solution for position control of a robot arm, which is driven by two pneumatic artificial muscles, is presented. However, some limitations still exist, such as a deterioration of the performance of transient response due to the changes in the external load of the robot arm. To overcome this problem, a switching algorithm of the control parameter using a learning vector quantization neural network (LVQNN) is proposed in this paper. This estimates the external load of the pneumatic artificial muscle manipulator. The effectiveness of the proposed control algorithm is demonstrated through experiments with different external working loads.

양자화 잡음 모델에 근거한 블록기반 동영상 부호화에서의 후처리 (Postprocessing in Block-Based Video Coding Based on a Quantization Noise Model)

  • 문기웅;장익훈;김남철
    • 한국통신학회논문지
    • /
    • 제26권8B호
    • /
    • pp.1129-1140
    • /
    • 2001
  • 본 논문에서는 블록기반 동영상 부호화에서 나타나는 양자화 잡음을 그 특성에 맞게 모델링을 하고, 이를 기반으로 웨이블렛 변환(wavelet transform)을 이용하여 양자화 잡음을 제거하는 후처리 방법을 제안한다. 제안된 방법에서는 양자화 잡음을 특정 프로화일(profile)로 표현되는 블록화 잡음과 비에지 화소(non-edge pixel)에서 백색 가우시안 특성을 가지는 나머지 잡음의 합으로 모델링 한다. 이러한 양자화 잡음의 모델을 기반으로 정칙화 미분(regularized differentiation)을 표현하는 Mallat의 1차원 웨이브렛 변환을 이용하여 영상복원 관점에서 각각의 잡음을 제거한다. 먼저, 웨이브렛 영역의 블록경계에서 임펄스로 나타나는 블록화 잡음 성분들의 크기를 추정하여 줄임으로 해서 블록화 잡음을 제거한다. 이때 임펄스 크기의 추정은 메디안 필터와 양자화 파라미터(quantization parameter), 그리고 국부 활동도(local activity)를 이용하여 이루어진다. 그리고 나머지 잡음은 비에지 화소에서 연역치화(soft-thresholding)을 수행함으로써 제거한다. 이러한 후처리 방법의 구현은 실시간 응용을 위해 웨이브렛 필터를 이용하여 근사적으로 공간 영역에서 이루어진다. 실험 결과, 제안된 방법이 다양한 영상과 압축률에 대해 MPEG-4 VM(verification model) 후처리 필터(post-filter)보다 PSNR 성능뿐만 아니라 주관적 화질면에서도 우수함을 확인하였다.

  • PDF

분산 동영상 부호화 시스템을 위한 효과적인 상관 잡음 모델링 및 성능평가 (Efficient Correlation Noise Modeling and Performance Analysis for Distributed Video Coding System)

  • 문학수;이창우;이성원
    • 한국통신학회논문지
    • /
    • 제36권6C호
    • /
    • pp.368-375
    • /
    • 2011
  • 분산 동영상 부호화 시스템에서는 복호기에서 Wyner-Ziv 프레임을 복원하기 위해서 부호기에서 생성된 패리티비트를 사용하게 된다. 이때 오류 정정 부호로 터보 부호나 LDPC 부호가 사용되는데 복호기에서는 원 Wyner-Ziv 프레임을 모르기 때문에 오류 정정을 위한 효과적인 상관 잡음 모델링이 필요하다. 본 논문에서는 복호기에서 Wyner-Ziv 프레임과 부가정보 간의 상관 잡음을 효과적으로 모델링하기 위한 방법을 제안하고 추정한 상관 잡음 모델이 분산 동영상 부호화 시스템에 미치는 영향을 분석한다. 또한 모의실험을 위해 H.264 intraframe 부호화 방법으로 부호화된 키 프레임을 사용하였는데 부호기에서 동적으로 키 프레임 양자화 파라미터 값을 추정하기 위한 방법을 제안하고 성능을 해석한다.

분절 특징 은닉 마코프 모델에서의 경향 공유에 관한 연구 (A Study on Trend Sharing in Segmental-feature HMM)

  • 윤영선
    • 한국음향학회지
    • /
    • 제21권7호
    • /
    • pp.641-647
    • /
    • 2002
  • 본 논문에서는 경향 양자화 기법을 적용하여 분절 특징 은닉 마코프 모델 (HMM: hidden Markov model)의 매개 변수 수를 줄이는 방법을 제안한다. 제안된 방법은 분절 특징 HMM에서 사용하는 분절 특징, 즉 모수적 궤적을 위치 정보와 경향 정보로 분리한 후, 분리된 경향 정보를 경향 코드북을 이용하여 공유한다. 분절 특징에서 위치 정보는 특징의 기준 점을 나타내고, 경향 정보는 분절 특징의 변이를 의미하며 특징의 많은 부분을 차지하고 있다. 따라서 경향 정보가 공유될 수 있다면 분절 특징 HMM의 매개 변수 수를 줄일 수 있을 것이다. 실험 결과 제안된 방식이 기존의 시스템과 비슷한 성능을 보였으며 매개 변수 수를 줄이는 방안으로 고려될 수 있음을 보였다.

네트워크 환경에서 서버용 음성 인식을 위한 MFCC 기반 음성 부호화기 설계 (A MFCC-based CELP Speech Coder for Server-based Speech Recognition in Network Environments)

  • 이길호;윤재삼;오유리;김홍국
    • 대한음성학회지:말소리
    • /
    • 제54호
    • /
    • pp.27-43
    • /
    • 2005
  • Existing standard speech coders can provide speech communication of high quality while they degrade the performance of speech recognition systems that use the reconstructed speech by the coders. The main cause of the degradation is that the spectral envelope parameters in speech coding are optimized to speech quality rather than to the performance of speech recognition. For example, mel-frequency cepstral coefficient (MFCC) is generally known to provide better speech recognition performance than linear prediction coefficient (LPC) that is a typical parameter set in speech coding. In this paper, we propose a speech coder using MFCC instead of LPC to improve the performance of a server-based speech recognition system in network environments. However, the main drawback of using MFCC is to develop the efficient MFCC quantization with a low-bit rate. First, we explore the interframe correlation of MFCCs, which results in the predictive quantization of MFCC. Second, a safety-net scheme is proposed to make the MFCC-based speech coder robust to channel error. As a result, we propose a 8.7 kbps MFCC-based CELP coder. It is shown from a PESQ test that the proposed speech coder has a comparable speech quality to 8 kbps G.729 while it is shown that the performance of speech recognition using the proposed speech coder is better than that using G.729.

  • PDF

Proposal of Parameter Range that Offered Optimal Performance in the Coastal Morphodynamic Model (XBeach) Through GLUE

  • Bae, Hyunwoo;Do, Kideok;Kim, Inho;Chang, Sungyeol
    • 한국해양공학회지
    • /
    • 제36권4호
    • /
    • pp.251-269
    • /
    • 2022
  • The process-based XBeach model has numerous empirical parameters because of insufficient understanding of hydrodynamics and sediment transport on the nearshore; hence, it is necessary to calibrate parameters to apply to various study areas and wave conditions. Therefore, the calibration process of parameters is essential for the improvement of model performance. Generally, the trial-and-error method is widely used; however, this method is passive and limited to various and comprehensive parameter ranges. In this study, the Generalized Likelihood Uncertainty Estimation (GLUE) method was used to estimate the optimal range of three parameters (gamma, facua, and gamma2) using morphological field data collected in Maengbang beach during the four typhoons that struck from September to October 2019. The model performance and optimal range of empirical parameters were evaluated using Brier Skill Score (BSS) along with the baseline profiles, sensitivity, and likelihood density analysis of BSS in the GLUE tools. Accordingly, the optimal parameter combinations were derived when facua was less than 0.15 and simulated well the shifting shape, from crescentic sand bar to alongshore uniform sand bars in the surf zone of Maengbang beach after storm impact. However, the erosion and accretion patterns nearby in the surf zone and shoreline remain challenges in the XBeach model.

왜곡-비트율 추정에 근거한 MPEG-2 비디오의 순방향 비트율 제어 (Forward rate control of MPEG-2 video based on distortion-rate estimation)

  • 홍성훈;김성대;최재각;홍성용
    • 한국통신학회논문지
    • /
    • 제23권8호
    • /
    • pp.2010-2024
    • /
    • 1998
  • 비디오 부호화에 있어서 평균화질의 향상뿐만 아니라 이웃한 영상들간에 일관된 화질을 유지하는 것은 매우 중요하다. 본 논문에서는 MPEG-2 비디오에 대한 왜곡-비트율 추정방식과 이 추정결과를 이용히여 일정 비트율(CBR)로 부호화되는 MPEG-2 비디오가 일관된 화질을 유지하면서도 향상된 평균화질을 얻도록 하는 순방향 비트율 제어방식을 제안한다. 본 논문에서 제안하는 왜곡-비트율 추정은 부호화에 사용되는 양자화 스텝 크기에 따라한 영상에서 발생하는 비트량과 왜곡을 예측하거나, 역으로 발생하는 비트량이나 왜곡에 대한 양자화 스텝 크기를 예측할 수 있다. 제안된 추정 방식의 장점은 실제의 비디오 부호화 응용에 적용할 수 있을 만큼 계산량이 적고 정확하다는 것이다. 한편 제안된 비트율 제어는 프레임 단위로 왜곡-비트율 추정, 목표 비트 할당, 왜곡 제한 그리고 VBV(Video B Buffer Verification) 제한 절차에 의해서 부호화에 적용할 양자화 파라메터를 결정하고, 이 양자화 파라메터를 적용하여 영상을 부호화 함으로써 일관되고도 향상된 화질을 유지한다. 또한 화면전환이나 기준영상의 화질열화 등에 의하여 화질저하가 오래 지속되는 문제를 B-picture 제거와 기준영상에 대하여 최소 비트량 할당을 보장함으로써 해결한다. 그리고 제안된 순방향 비트율 제어방식과 MPEG-2의 TM5(Test Model 5)에서 제안한 비트율 제어를 비교한 실험 결과들을 통하여 제안된 방식이 영상들 간에 일관된 화질을 유지할 뿐만 아니라 평균화질도 향상 됨을 확인한다.

  • PDF

JPEG2000에서 저 전송 부호화를 위한 비주얼 양자화기 설계 (Design of Visual Quantizer for very low Bit-rate Coding on JPEG2000)

  • 김동혁;전준현
    • 대한전자공학회논문지SP
    • /
    • 제47권4호
    • /
    • pp.69-78
    • /
    • 2010
  • 대역분할 부호화방식의 표준인 비가역 9/7 JPEG2000의 경우 0.15bpp 이하에서 양자화 손실로 배경과 에지 부분에서 급격한 화질 왜곡이 발생하는 문제점을 갖고 있다. 본 논문에서는 이러한 문제를 해결하기 위해 고주파대역들의 L-pdf(Laplace probability density function) 통계특성을 이용한 VQ(Visual Quantizer)를 제안하였다. 제안된 VQ는 재생영상의 화질왜곡을 최소화하기 위한 비주얼파라메타와 효율적인 비트율 감축을 위한 가중치 파라메타를 각각 사용하여 설계되었다. 실험결과 제안된 VQ는 0.15bpp이하에서도 재생영상의 시각적 손실을 최소화하면서 재생영상의 화질왜곡 기준척도인 MSE(Mean-Squared Error)도 최소화 할 수 있었다.