• 제목/요약/키워드: rate distortion optimization

검색결과 134건 처리시간 0.026초

PID 제어기를 이용한 영상 품질 변화 최소화 방법 (Video Quality Variation Minimizing Method using PID Controller)

  • 박상현;강의성
    • 한국정보통신학회논문지
    • /
    • 제11권11호
    • /
    • pp.2009-2014
    • /
    • 2007
  • 본 논문에서는 버퍼를 이용한 가변적인 트래픽을 제어에서 영상의 품질 변화를 최소화 하는 방법을 제안한다. 제안하는 알고리즘은 반복적인 최적화 방법을 사용하지 않고 프레임 레이어에서 전송률을 제어하는 방법으로 영상 프레임간의 왜곡의 변화를 최소화한다. 그리고 버퍼의 정보를 비트율에 효과적으로 반영 하기 위하여 제어 시스템에서 많이 사용되는 PID 제어를 하였다. PID 제어는 많은 계산량을 필요로 하지 않기 때문에 제안하는 알고리즘은 낮은 계산량을 필요로 하는 실시간 영상 코덱에 적당한 알고리즘이다. 제안하는 알고리즘과 기존의 알고리즘간의 비교 실험은 제안하는 알고리즘이 PSNR 성능에서 기존의 알고리즘 보다 우수함을 보여준다.

H.264 표준에서 양자화 계수를 고려한 고속 인터모드 결정 방법 (A Fast Inter Mode Decision Algorithm Considering Quantization Parameter in H.264)

  • 김근용;호요성
    • 대한전자공학회논문지SP
    • /
    • 제43권6호
    • /
    • pp.11-19
    • /
    • 2006
  • 최근에 만들어진 비디오 압축 표준인 H.264는 매크로블록당 최적의 부호화 모드를 결정하기 위해 비트율-왜곡 (rate-distortion) 기법을 사용하지만, 그 복잡성으로 인해 부호화하는 데 많은 시간이 걸린다. 따라서, H.264의 부호화 시간을 단축하기 위해 고속 모드결정 방법이 필요하다. 본 논문에서는 양자화 계수에 따라 발생 모드가 변하는 특성에 기반하여 불필요한 움직임 예측 및 모드결정 과정을 생략하는 새로운 고속 모드결정 방법을 제안한다. 양자화 계수에 따라 최적모드의 발생 빈도가 변하게 되는데, 제안한 방법에서는 매크로블록의 양자화된 이산 여현변환 계수들이 모두 0일 때, 0의 값을 가지는 CBP(coded block pattern)를 고려하여 이러한 특성을 반영하며, 조기 SKIP 모드 결정방법과 조기 $16{\times}16$ 모드 결정방법을 이용한다. 컴퓨터 모의실험을 통해, 본 논문에서 제안한 고속 인터모드 결정방법이 H.264의 참조 소프트웨어에 구현된 고속 인터모드 결정방법에 비해, Baseline 프로파일의 경우 19.6%, Main 프로파일의 경우 18.8%의 부호화 시간을 감소시키는 것을 확인했다.

움직임 분석 기반의 시각인지 모델을 이용한 비디오 코딩 방법 (Video Coding Method Using Visual Perception Model based on Motion Analysis)

  • 오형석;김원하
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.223-236
    • /
    • 2012
  • 본 논문에서는 인간 인지 기반 비디오 코딩을 위한 비디오 처리 방법을 개발한다. 제안하는 방법은 율-왜곡(rate-distortion) 최적화의 영향뿐만 아니라 제한적인 시, 공간 해상도, 지역적인 움직임 이력(history), visual saliency에 의한 인간 시각 인지를 고려한다. 이러한 인간의 인지적인 효과들을 고려하기 위하여 본 논문에서는 움직임 패턴을 모델링하고 Hedge 알고리듬을 사용하여 움직임 패턴을 결정하는 기법을 개발한다. 그 다음, 제안한 움직임 패턴과 기존의 visual saliency와의 결합을 통하여 인간 시각 인지 모델을 수립한다. 제안된 인간 시각 인지 모델을 구현하기 위하여 기존의 foveation filtering 방법을 확장한다. 시각적 자극이 덜한 지역만을 부드럽게(smoothing)하는 기존의 foveation filtering 기법과 비교하여 제안하는 foveation filtering 기법은 인간 시각 인지 모델에 따라 지역적으로 부드럽게 또는 지역적 특성을 향상시킴으로써, 시각적 자극이 덜한 지역에서 줄여진 대역폭을 효과적으로 시각적 자극이 큰 지역에서 사용하도록 이동 시킬 수 있는 장점이 있다. 제안된 방법의 성능은 전반적인 비디오 화질을 만족할 뿐만 아니라 인간이 인지하는 화질의 품질을 12%~44% 향상시킨다.

비디오 부호화 루프 내에서 의사 윤곽 오차의 선택적 제거 알고리즘 (In-Loop Selective Decontouring Algorithm in Video Coding)

  • 유기원;손광훈
    • 방송공학회논문지
    • /
    • 제15권5호
    • /
    • pp.697-702
    • /
    • 2010
  • 디지털 영상 내의 평탄한 영역에 대한 양자화 과정은 종종 의도하지 않은 의사 윤곽 오차 (false contour artifact)를 발생한다. 본 레터논문에서는 통상적인 블록 기반 비디오 부호화 방식의 양자화 과정에서 발생되는 이러한 오차의 효율적 제거 알고리즘을 보인다. 먼저, 입력 블록에 대해 의사 윤곽의 발생 특성에 기반하여 추출된 특징값들을 이용하여 후보 블록을 선정 한다. 그리고, 해당 블록에 대해 미리 준비된 pseudo-random noise mask를 적용함으로써 의사 윤곽을 제거한다. 이러한 후보 블록 선정을 통한 선택적인 필터링 과정은 불필요한 처리를 최소화함으로써, 화질 열화 억제와 연산 복잡도 감소를 동시에 달성한다. 또한 블록 기반의 처리는 비디오 부호화 루프와의 통합을 용이하게 함으로써, 종래의 코덱 루프 밖에서의 후처리 필터링 방식과 비교하여 구현에 필요한 자원 절감과 프레임 지연 방지라는 측면에서 큰 이점을 갖는다. 제안 알고리즘은 H.264/AVC표준 소프트웨어에 구현되어 율-왜곡 최적화(rate-distortion optimization) 관점에서 압축 성능의 저하없이 낮은 복잡도에서 의사 윤곽을 효율적으로 제거함을 확인하였다.

HEVC 인트라 부호화를 위한 특징점 기반의 고속 CU Depth 결정 (Keypoint-based Fast CU Depth Decision for HEVC Intra Coding)

  • 김남욱;임성창;고현석;전병우
    • 전자공학회논문지
    • /
    • 제53권2호
    • /
    • pp.89-96
    • /
    • 2016
  • MPEG-H HEVC/ITU-T H.265는 quadtree 구조의 CU (Coding Unit)를 갖는 최신의 비디오 부호화 표준 기술이다. HEVC 부호화기는 모든 가능한 CU 구조에 대해서 Rate-distortion 최적화 과정을 통하여 최적 부호화 성능의 CU depth를 구할 수 있지만, 그 과정에 매우 많은 계산량을 필요로 한다. 본 연구에서는 컴퓨터 비젼 분야에서 잘 알려진 blob detection을 통하여 특징점을 찾는 과정이 저역 필터를 거치는 것과 같은 효과를 가진다는 것과 CU depth의 결정에는 영상의 고주파수 에너지 분포를 고려하는 것이 중요하다는 사실에 착안하여, blob detection 방법을 사용하여 추출된 특징점을 사용하여 HEVC 부호화기의 인트라 예측의 계산 복잡도를 낮추고자 한다. 실험을 통하여 all intra의 경우 0.45%의 BDBR 저하만으로 20% 정도의 부호화 시간을 절감할 수 있음을 보인다.

필터뱅크 기반 프로스트 알고리즘을 이용한 빔포밍 최적화 (Beamforming Optimization Using Filterbank-based Frost Algorithm)

  • 박지훈;이성주;홍정표;정상배;한민수
    • 대한음성학회지:말소리
    • /
    • 제66호
    • /
    • pp.73-86
    • /
    • 2008
  • Beamforming is one of the spatial filtering techniques which extract only desired signals from noisy environments using microphone arrays. Fixed beamforming is a simple concept and easy to implement. However, it does not show good performance in real noisy conditions. As an adaptive beamforming, Frost algorithm can be a good candidate. It uses the concept of the linearly constrained minimum variance (LCMV) algorithm. The difference between the Frost and the LCMV algorithm is the error correction scheme which is very effective feature in the aspect of performance. In this paper, as quadrature mirror filtering (QMF)-based filterbank is utilized as the pre-processing of the Frost beamformning, the filter length and the learning rate of each band is optimized to improve the performance. The performance is measured by the signal-to-noise ratio (SNR) and the Bark's scale spectral distortion (BSD).

  • PDF

IVC의 비참조 P 프레임을 위한 Lagrange 계수 선택 기법 (Lagrange Multiplier Selection for Non-Reference P Frames in Internet Video Coding)

  • 오수창;양안나;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.197-199
    • /
    • 2014
  • 현재 MPEG에서 표준화 중인 IVC(Internet Video Coding)에서는 기존의 비디오 부호화 표준과 같이 Lagrange 계수 기반의 율-왜곡 최적화(RDO: Rate-Distortion Optimization)를 사용하여 최적의 부호화 모드를 결정하고 있다. RDO를 위하여 픽쳐 타입과 부호화 구조에 따라 미리 결정된 Lagrange 계수가 선택적으로 사용되고 있다. 한편 IVC에서는 저지연 모드 부호화 구조에서 비참조 P 프레임 부호화 기법을 선택적으로 사용하여 상당한 부호화 성능을 얻고 있다. 하지만 Lagrange 계수 선택에서 기존의 P 프레임과는 다른 비참조 P 프레임의 RD 특성이 반영되고 있지 않다. 본 논문에서는 비참조 P 프레임의 RD 특성을 고려하여 기존의 기법을 확장한 새로운 Lagrange 계수 선택 기법을 제안한다. 실험결과 제안기법은 IVC 시험모델 ITM 10.0에서 기존 기법 대비 0.4%의 비트율 감소를 얻을 수 있음을 확인하였다.

  • PDF

Enhanced Inter Mode Decision Based on Contextual Prediction for P-Slices in H.264/AVC Video Coding

  • Kim, Byung-Gyu;Song, Suk-Kyu
    • ETRI Journal
    • /
    • 제28권4호
    • /
    • pp.425-434
    • /
    • 2006
  • We propose a fast macroblock mode prediction and decision algorithm based on contextual information for Pslices in the H.264/AVC video standard, in which the mode prediction part is composed of intra and inter modes. There are nine $4{\times}4$ and four $16{\times}16$ modes in the intra mode prediction, and seven block types exist for the best coding gain based on rate-distortion optimization. This scheme gives rise to exhaustive computations (search) in the coding procedure. To overcome this problem, a fast inter mode prediction scheme is applied that uses contextual mode information for P-slices. We verify the performance of the proposed scheme through a comparative analysis of experimental results. The suggested mode search procedure increased more than 57% in speed compared to a full mode search and more than 20% compared to the other methods.

  • PDF

Adaptive Prediction Block Filter for Video Coding

  • Yoon, Yeo-Jin;Jung, Seung-Won;Lee, Ha-Hyun;Kim, Hui-Yong;Choi, Jin-Soo;Ko, Sung-Jea
    • ETRI Journal
    • /
    • 제34권1호
    • /
    • pp.106-109
    • /
    • 2012
  • In this letter, we propose a new prediction block filter that can reduce errors between the original and prediction blocks. The proposed filter adaptively adjusts filter coefficients by using the previously reconstructed adjacent blocks and their prediction blocks. Then, the filter is selectively applied to the current prediction block according to the rate-distortion optimization. Moreover, since the same filter coefficients can be derived in the decoder, they are not encoded into the bit-stream. The proposed method achieves a 4.65% bitrate saving on average compared with H.264/AVC.

AI 기반 이동통신 물리계층 기술 동향과 전망 (Physical-Layer Technology Trend and Prospect for AI-based Mobile Communication)

  • 장갑석;고영조;김일규
    • 전자통신동향분석
    • /
    • 제35권5호
    • /
    • pp.14-29
    • /
    • 2020
  • The 6G mobile communication system will become a backbone infrastructure around 2030 for the future digital world by providing distinctive services such as five-sense holograms, ultra-high reliability/low-latency, ultra-high-precision positioning, ultra-massive connectivity, and gigabit-per-second data rate for aerial and maritime terminals. The recent remarkable advances in machine learning (ML) technology have recognized its efficiency in wireless networking fields such as resource management and cell-configuration optimization. Further innovation in ML is expected to play an important role in solving new problems arising from 6G network management and service delivery. In contrast, an approach to apply ML to a physical-layer (PHY) target tackles the basic problems in radio links, such as overcoming signal distortion and interference. This paper reviews the methodologies of ML-based PHY, relevant industrial trends, and candiate technologies, including future research directions and standardization impacts.