• Title/Summary/Keyword: Intra Prediction Coding

Search Result 201, Processing Time 0.027 seconds

4×4 Block Inter Prediction for Internet Video Coding (IVC 의 4×4 블록 화면간 예측부호화)

  • Yang, Anna;Lee, Jae-Yung;Kim, Jae-Gon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.555-556
    • /
    • 2015
  • MPEG 의 Royalty-Free 비디오 코덱의 하나로 표준화 중인 IVC(Internet Video Coding)에서는 화면내(intra) 예측부호화에서 부호화 이득을 위하여 $4{\times}4$ 블록 예측 및 $4{\times}4$ 블록 변환을 포함하고 있다. 반면, 화면간(inter) 예측부호화에서는 $16{\times}16$ 블록에서 최소 $8{\times}8$ 블록까지의 가변크기 블록에 대한 예측만 가능하다. 보다 복잡한 영상의 경우 보다 작은 블록에 대한 화면간 예측을 통하여 부호화의 성능 개선을 개선할 수 있다. 본 논문에서는 기존의 화면간 예측의 블록 크기를 $4{\times}4$ 블록까지 확장하여 화면간 예측부호화 성능을 개선한다. 실험결과 제안기법은 기존의 ITM 12.0 대비 다양한 테스트 시퀀스의 휘도성분에서 평균적으로 비트율 절감의 이득은 없으나 대부분의 클래스에서 성능개선을 보였고 추가적인 최적화가 필요함을 확인하였다.

  • PDF

Fast PU Decision Method Using Sub-CBF in HEVC (Sub-CBF를 이용한 HEVC의 고속 PU 결정 기법)

  • Jang, Jae-Kyu;Choi, Ho-Youl;Kim, Jae-Gon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.11a
    • /
    • pp.194-196
    • /
    • 2014
  • HEVC(High Efficiency Video Coding)는 재귀적 쿼드트리 분할 구조의 부호화단위(CU: Coding Unit)와 각 CU에서 다양한 예측단위(PU: Prediction Unit)를 제공하고, 율-왜곡 기반으로 최적의 CU와 PU를 결정함으로써 높은 부호화 효율을 얻을 수 있는 반면 부호화 복잡도 또한 크게 증가하는 문제가 있다. 본 논문에서는 부호화기의 복잡도를 감소시키기 위해 상위깊이의 부호화 정보를 이용한 고속 부호화 기법을 제안한다. 제안기법은 상위깊이 CU의 Sub-CBF(coded block flag)를 이용하여 현재깊이 CU에서의 PU를 조기 결정하여 PU 탐색을 고속화 한다. 또한 화면내(Intra) 예측 고속화를 위하여 현재 CU의 sub-CBF를 함께 사용하여 하위깊이에서의 화면내 예측을 생략한다. 실험결과 제안기법은 HM 14.0 대비 1.2%의 BD-rate 증가에 31.4%의 부호화 시간 감소 효과를 얻을 수 있었다.

  • PDF

Fast intra-prediction method in HEVC using transform coefficient (변환 계수를 이용한 HEVC 고속 인트라 예측 방법)

  • Kim, Ga-Ram;Lee, Yung-Lyul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.546-548
    • /
    • 2015
  • HEVC(High Efficiency Video Coding)는 JCT-VC(Joint Collaborative Team on Video Coding)라는 ITU-T(VCEG)와 ISO-IEC(MPEG)가 공동으로 진행한 팀이 만들어낸 표준화이다. 이 표준화된 코덱에서 율-왜곡 최적화(RDO)는 실행함에 있어 높은 성능 향상을 보이지만 상대적으로 많은 부호화 시간이 요구된다. RDO 의 부호화 시간을 줄이기 위해서 이 논문에서는 변환 계수를 이용한 고속 인트라 예측 방법을 제안한다. 기존 HEVC 에서는 RMD(Rough Mode Decision)를 통해 상위 N 개의 후보를 구하고 MPM(Most Probable Mode)을 거쳐 나온 후보들의 수의 합을 가지고 RDO 를 구하게 된다. 여기서 제안하는 고속 인트라 예측 방법은 RDO 를 구하기 전에 나왔던 N 개의 후보에서 이산 여현 변환(DCT) 계수를 이용하여 예측 모드의 수를 한 번 더 줄임으로써 RDO 수행시간을 줄이는 방법이다. 이 방법은 기존 HEVC 부호화 방법보다 적은 손실에도 불구하고 높은 속도 향상을 보인다.

  • PDF

Intra 16$\times$16 Mode Decision Using Subset of Transform Coefficients in H.264/AVC (H.264/AVC에서 변환계수의 부분집합을 사용한 인트라 16$\times$16 예측 모드 선택 방법)

  • Lim, Sang-Hee;Lee, Seong-Won;Paik, Joon-Ki
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.44 no.6
    • /
    • pp.54-62
    • /
    • 2007
  • In this paper, we significantly reduces the amount of computation for intra 16$\times$16 mode decision in H.264 by applying the fast algorithm, which obtains the transformed prediction residual with fewer computations. By extending the existing intra 4$\times$4 mode decision, we propose the new algorithm for fast intra 16$\times$16 mode decision. The proposed algorithm uses partial transform coefficients which consist of one DC and three adjacent AC coefficients after 4$\times$4 transform in the intra 16$\times$16 mode decision. Theoretical analysis and experimental results show that the proposed algorithm can reduce computations up to 50% in the intra 16$\times$16 mode decision process with unnoticeable degradation.

Spatio-Temporal Error Concealment of I-frame using GOP structure of MPEG-2 (MPEG-2의 GOP 구조를 이용한 I 프레임의 시공간적 오류 은닉)

  • Kang, Min-Jung;Ryu, Chul
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.29 no.1C
    • /
    • pp.72-82
    • /
    • 2004
  • This paper proposes more robust error concealment techniques (ECTs) for MPEG-2 intra coded frame. MPEG-2 source coding algorithm is very sensitive to transmission errors due to the use of variable-length coding. The transmission errors are corrected by error correction scheme, however, they cannot be revised properly. Error concealment (EC) is used to conceal the errors which are not corrected by error correction and to provide minimum visual distortion at the decoder. If errors are generated in intra coded frame, that is the starting frame of GOP, they are propagated to other inter coded frames due to the nature of motion compensated prediction coding. Such propagation of error may cause severe visual distortion. The proposed algorithm in this paper utilizes the spatio-temporal information of neighboring inter coded frames to conceal the successive slices errors occurred in I-frame. The proposed method also overcomes the problems that previous ECTs reside. The proposed algorithm generates consistent performance even in network where the violent transmission errors frequently occur. Algorithm is performed in MPEG-2 video codec and we can confirm that the proposed algorithm provides less visible distortion and higher PSNR than other approaches through simulations.

A Technical Analysis on Deep Learning based Image and Video Compression (딥 러닝 기반의 이미지와 비디오 압축 기술 분석)

  • Cho, Seunghyun;Kim, Younhee;Lim, Woong;Kim, Hui Yong;Choi, Jin Soo
    • Journal of Broadcast Engineering
    • /
    • v.23 no.3
    • /
    • pp.383-394
    • /
    • 2018
  • In this paper, we investigate image and video compression techniques based on deep learning which are actively studied recently. The deep learning based image compression technique inputs an image to be compressed in the deep neural network and extracts the latent vector recurrently or all at once and encodes it. In order to increase the image compression efficiency, the neural network is learned so that the encoded latent vector can be expressed with fewer bits while the quality of the reconstructed image is enhanced. These techniques can produce images of superior quality, especially at low bit rates compared to conventional image compression techniques. On the other hand, deep learning based video compression technology takes an approach to improve performance of the coding tools employed for existing video codecs rather than directly input and process the video to be compressed. The deep neural network technologies introduced in this paper replace the in-loop filter of the latest video codec or are used as an additional post-processing filter to improve the compression efficiency by improving the quality of the reconstructed image. Likewise, deep neural network techniques applied to intra prediction and encoding are used together with the existing intra prediction tool to improve the compression efficiency by increasing the prediction accuracy or adding a new intra coding process.

HEVC 화면내 예측 및 부호화

  • Choe, Hae-Cheol
    • The Magazine of the IEIE
    • /
    • v.38 no.8
    • /
    • pp.33-39
    • /
    • 2011
  • HEVC(High Efficiency Video Coding)는 현재 국제 비디오 부호화 표준화 단체인 JCT-VC에서 표준화가 진행되고 있는 새로운 국제비디오 부호화 표준이다. 이 표준화에서는 H.264/AVC를 넘어선 높은 부호화 성능을 갖기 위해서 다양한 부호화 방법들이 논의되고 있다. 본고에서는 HEVC의 새로운 부호화 모드 중 화면 내 예측(intra prediction) 부호화 방법에 대해 소개한다. 화면 내 예측 부호화는 시간적으로 다른 영상을 참조하지 않고 오직 현재 부호화하려는 영상에서 공간적 주변 정보를 이용하여 현재 블록을 예측하는 방법이다. 이 화면 내 부호화 방법은 화면 간 예측(inter prediction) 부호화 방법과 함께 부호화 효율 향상에 기여할 뿐만 아니라, 임의 접근(random access)을 가능하게 하고 부호화 된 비트스트림의 에러 내성을 높인다. HEVC 화면 내 부호화 방법은 예측 모드의 종류를 최대 35개까지 확장함으로써 기존 비디오 부호화 표준에 비해 높은 부호화 효율을 갖는다.

  • PDF

Single Interpolation for Multi-sample Prediction in Intra Coding of HEVC (단일 보간을 이용한 화면내 복수 샘플 예측)

  • Lee, Jinho;Kim, Hui Yong;Lim, Sung-Chang;Lee, Hahyun;Choi, Jin Soo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.184-187
    • /
    • 2011
  • 본 논문에서는 화면내 예측의 계산 복잡도를 감소시키기 위한 방법을 제안한다. HM2.0 의 화면내 예측방법인 각도에 의한 예측(Angular prediction)은 예측 대상블록 내부의 각 샘플이 예측하기 위해 사용하는 참조샘플로부터 정수단위의 위치에 있지 않을 경우 참조 샘플들을 보간 하여 예측을 수행한다. 이러한 방법은 예측 대상 블록의 크기가 커질수록 보간 하는 횟수가 증가하고 계산 복잡도가 증가하는 단점이 있다. 제안하는 방법은 한번의 보간으로 복수의 샘플들을 예측함으로써 보간 횟수를 줄이고 결과적으로 계산의 복잡도를 줄인다. PU_32x32 에 대해 제안하는 방법을 적용하였을 경우, 보간하는 횟수는 HM2.0 대비 1/2 배 또는 1/4 배 가까이 감소하고 성능 저하는 High-Efficiency(HE)에서 0.1% 또는 0.2% 정도로 미미하게 나타났다.

  • PDF

Deep-learning based Object Detection in Thermal Video Using Compressed-Domain Information (열영상에서 압축 도메인 정보를 이용한 딥러닝 기반 객체 탐지 방법)

  • Byeon, JooHyung;Nam, Gunook;Park, Jangsoo;Lee, Jongseok;Sim, Donggyu
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.11a
    • /
    • pp.160-162
    • /
    • 2018
  • 본 논문에서는 압축 영역에서 열 영상을 이용한 딥러닝 기반의 객체 검출 방법을 제안한다. 비디오 압축 표준인 High Efficiency Video Coding(HEVC)를 이용하여 부보화된 비트스트림으로부터 Intra Prediction Mode(IPM), Prediction Unit Size(PUS), Transform Unit Size(TUS)를 추출하고 3 채널 영상으로 변환하고 객체 검출 네트워크인 YOLO 에 입력으로 넣어주어 최종적으로 객체의 위치 및 객체의 종류를 예측한다. 실험결과로써 복원된 열 영상과 검출된 결과를 주관적으로 보여줌으로써 압축영역에서 열영상을 이용한 객체 검출이 가능함을 보인다.

  • PDF

Fast Mode Decision using Block Size Activity for H.264/AVC (블록 크기 활동도를 이용한 H.264/AVC 부호화 고속 모드 결정)

  • Jung, Bong-Soo;Jeon, Byeung-Woo;Choi, Kwang-Pyo;Oh, Yun-Je
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.44 no.2 s.314
    • /
    • pp.1-11
    • /
    • 2007
  • H.264/AVC uses variable block sizes to achieve significant coding gain. It has 7 different coding modes having different motion compensation block sizes in Inter slice, and 2 different intra prediction modes in Intra slice. This fine-tuned new coding feature has achieved far more significant coding gain compared with previous video coding standards. However, extremely high computational complexity is required when rate-distortion optimization (RDO) algorithm is used. This computational complexity is a major problem in implementing real-time H.264/AVC encoder on computationally constrained devices. Therefore, there is a clear need for complexity reduction algorithm of H.264/AVC such as fast mode decision. In this paper, we propose a fast mode decision with early $P8\times8$ mode rejection based on block size activity using large block history map (LBHM). Simulation results show that without any meaningful degradation, the proposed method reduces whole encoding time on average by 53%. Also the hybrid usage of the proposed method and the early SKIP mode decision in H.264/AVC reference model reduces whole encoding time by 63% on average.