• 제목/요약/키워드: versatile video coding

검색결과 80건 처리시간 0.023초

Compressed Representation of Neural Networks for Use Cases of Video/Image Compression in MPEG-NNR

  • Moon, Hyeoncheol;Kim, Jae-Gon
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.133-134
    • /
    • 2018
  • MPEG-NNR (Compressed Representation of Neural Networks) aims to define a compressed and interoperable representation of trained neural networks. In this paper, a compressed representation of NN and its evaluation performance along with use cases of image/video compression in MPEG-NNR are presented. In the compression of NN, a CNN to replace the in-loop filter in VVC (Versatile Video Coding) intra coding is compressed by applying uniform quantization to reduce the trained weights, and the compressed CNN is evaluated in terms of compression ratio and coding efficiency compared to the original CNN. Evaluation results show that CNN could be compressed to about quarter with negligible coding loss by applying simple quantization to the trained weights.

  • PDF

화면 간 예측에서 인코딩 정보를 고려한 딥러닝 기반 인루프 필터 (Considering Encoding Information for CNN based In-loop Filter in Inter Video Coding)

  • 김양우;이영렬
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.143-144
    • /
    • 2020
  • VVC (Versatile Video Coding)는 HEVC이후 차세대 표준 비디오 코딩으로 JVET(Joint Video Exploration)에 의해 2018년 표준화를 시작하였다. VVC에는 복원픽쳐의 변환-양자화에러에 의해 발생한 블로어, 블로킹, 링잉 아티팩트를 감소시키기 위하여 deblocking filter (DF), sample adaptive offset (SAO), adaptive loop filter(ALF)와 같은 모듈을 사용한다. 한편 CNN (Convolutional Neural Network)은 최근 이미지와 비디오 복원에 높은 성능을 보이고 있다. VVC에서 픽쳐는 CTU (Coding Tree Unit)으로 분할되고 각 CTU는 다시 CU (Coding Unit)으로 분할된다. 그리고 인코딩을 위한 중요한 정보들이 Picture, CTU, CU단위로 디코더에 전송된다. 이 논문에서는 화면 간 예측으로 인코딩 된 픽처에서 블록과 픽처정보를 이용한 딥러닝 기반의 인루프 필터 모델을 제안한다. 제안하는 모델은 화면 간 예측에서 QP, 4×4 블록단위의 모션벡터, 참조블록과의 시간적거리, CU의 깊이를 모델에 추가적인 정보로 이용한다.

  • PDF

VVC 행렬가중 화면내 예측(MIP) 학습기법 분석 (Analysis of Training Method for Matrix Weighted Intra Prediction (MIP) in VVC)

  • 박도현;권형진;정세윤;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.148-150
    • /
    • 2020
  • 최근 VVC(Versatile Video Coding) 표준 완료 이후 JVET(Joint Video Experts Team)은 인공신경망 기반의 비디오 부호화를 위한 AhG(Ad-hoc Group) 구성하고 인공지능을 이용한 비디오 압축 기술들을 검증하고 있으며, MPEG(Moving Picture Experts Group)에서는 DNNVC(Deep Neural Network based Video Coding) 활동을 통해 딥러닝 기반의 차세대 비디오 부호화 표준 기술을 탐색하고 있다. 본 논문은 VVC 에 채택된 신경망 기반의 기술인 MIP(Matrix Weighted Intra Prediction)를 참조하여, MIP 모델의 학습에서 손실함수가 예측 성능에 미치는 영향을 분석한다. 즉, 예측의 왜곡(MSE)만을 고려한 경우와 예측오차의 부호화 비용도 함께 반영한 손실함수를 비교한다. 실험을 위해 HEVC(High Efficiency Video Coding) 화면내 예측 대비 평균적인 PSNR 향상 정도를 나타내는 성능 지표(��PSNR)를 정의한다. 실험결과 예측오차의 부호화 특성을 반영하는 손실함수를 이용한 학습이 MSE 만 고려한 학습 대비 ��PSNR 기준 평균 0.4dB 향상됨을 보였다.

  • PDF

스크린 콘텐츠를 위한 VVC 화면내 삼각형 분할 예측 방법 (VVC Intra Triangular Partitioning Prediction for Screen Contents)

  • 최재륜;권대혁;한희지;이하현;강정원;최해철
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.325-337
    • /
    • 2020
  • VVC(Versatile Video Coding)는 ISO/IEC/ITU-T의 JVET(Joint Video Experts Team)에서 표준화 중인 새로운 비디오 부호화 표준으로 스크린 콘텐츠 부호화 툴을 포함한 다양한 기술을 채택하고 있다. 스크린 콘텐츠는 문자 영역과 같이 사선 방향 에지가 자주 발생하는 특징을 가지며, 이런 특징을 갖는 영상에 삼각형 형태의 분할 부호화를 적용하면 압축 효율이 증가할 수 있다. 본 논문에서는 스크린 콘텐츠를 위한 VVC 기반 화면내 삼각형 분할 예측 방법을 제안한다. 기존 VVC의 화면간 예측 부호화에서 삼각형 분할 예측을 지원하는 Triangular Prediction Mode 방법과 유사하게, 제안 방법은 화면내 예측 부호화에서 수직과 수평 방향 예측 모드와 주변 복원 참조 라인을 이용하여 두 개의 사각형 예측 블록을 생성하고 삼각형 모양의 마스크로 두 예측 블록을 가중합하여 최종 예측 신호를 만든다. 제안 방법의 실험 결과는 All Intra 스크린 콘텐츠 영상 실험에서 YUV 각각 평균 1.86%, 1.49%, 1.55% 부호화 성능향상을 보이고, 자연 영상 실험 조건에서는 부호화 효율에 미미한 손실을 보였다. 결론적으로, 화면내 예측 부호화 모드에 제안 방법을 적용하여 압축 성능을 향상할 수 있었다.

고속 VVC 부호화를 위한 신경망 기반 움직임 벡터 해상도 결정 알고리즘 (Motion Vector Resolution Decision Algorithm based on Neural Network for Fast VVC Encoding)

  • 백한결;박상효
    • 방송공학회논문지
    • /
    • 제26권5호
    • /
    • pp.652-655
    • /
    • 2021
  • Versatile Video Coding(VVC)의 압축 효율을 끌어올리기 위하여 다양한 화면 간 예측(inter prediction)기법 중 적응적 움직임 벡터 해상도(Adaptive motion vector resolution, 이하 AMVR)기술이 채택되어 왔다. 다만, AMVR을 적용하여 최적의 해상도를 결정하기 위해서는 매 부호화 유닛마다 다양한 테스트를 진행해야 하며, 이는 율-왜곡 비용의 계산 복잡도 증가를 야기한다. 따라서 VVC의 부호화 복잡도의 감소를 위해 효과적으로 최적의 AMVR 모드를 찾아야 한다. 본 논문에서는 보다 다양한 데이터셋 기반 하에 경량화된 신경망 기반의 AMVR 결정 알고리즘을 제안한다.

VVC 표준의 MPM 유도 단순화 방법 (Simplified MPM derivation for Versatile Video Coding)

  • 최재륜;권대혁;한희지;이하현;강정원;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.17-19
    • /
    • 2019
  • ISO/IEC JTC1 WG11 Moving Picture Expers Group 과 ITU-T SC16 은 Joint Video Experts Team 을 구성하여 차세대 비디오 부호화 표준으로서 Versatile Video Coding(VVC)를 표준화 중이다. VVC 는 현재 블록의 화면내 예측 모드일 가능성이 높은 모드의 집합인 Most Probable Mode(MPM) 리스트를 유도하고, MPM 을 이용하여 효율적으로 화면내 예측 모드를 부호화한다. VVC 는 주변 블록의 화면내 예측 모드에 따라 7가지 종류의 MPM 리스트 유도 방식을 가지고 있으나 이 중 두 가지는 동일한 MPM 들로 유도되는 중복성이 있다. 따라서 본 논문은 이 중복성 문제를 해결하기 위한 MPM 유도 방법을 제안한다. 제안 방법은 MPM 유도조건을 수정하여 중복적인 유도 방식이 제거된 6 가지 MPM 리스트 유도 방식을 갖는다. 실험을 통해 제안방법이 부호화 효율에 전혀 영향을 주기 않고 MPM 유도 과정을 단순화시켰음을 보인다.

  • PDF

MAE 기반 예측 정확도 함수를 이용한 VVC의 고속 화면간 CU 분할 알고리즘 (Fast Inter CU Partitioning Algorithm using MAE-based Prediction Accuracy Functions for VVC)

  • 원동재;문주희
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.361-368
    • /
    • 2022
  • VVC(Versatile Video Coding) 표준에서는 블록 분할 기술로써 QT+MTT(Quaternary Tree plus Multi-Type Tree) 분할 구조가 채택되었다. QT+MTT 분할 구조는 우수한 부호화 효율을 제공하지만, BT(Binary Tree)와 TT(Ternary Tree) 분할 타입으로 인한 블록 분할의 확장성 때문에, 전반적인 부호화 복잡도가 크게 증가하였다. 본 논문에서는 MAE(Mean of the Absolute Error)에 기한반 예측 정확도 함수를 이용하여, BT와 TT 분할 타입을 위한 화면간 CU(Coding Unit) 분할 알고리즘의 고속화 기법을 제안한다. 제안하는 고속화 기법은 부호화 복잡도 감소율의 일관성과 안정적이고 낮은 부호화 손실을 통해, 저복잡도 VVC 부호화기 설계 시에 실용적인 방법으로 활용될 수 있다. RA(Random Access) 실험 환경에서 휘도 성분의 BD(Bjontegaard Delta) 비트율은 1.0%~2.1% 증가한 반면에 부호화 시간 복잡도는 24.0%~31.7% 감소시킬 수 있었다.

VVC 화면 내 부호화 복잡도 감소를 위한 부호화 기술 선택 방법 (VVC Intra Coding Tool Selection for Low Complexity Video Coding)

  • 김범윤;박지윤;전병우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.199-200
    • /
    • 2022
  • 최신 비디오 압축 표준인 VVC(Versatile Video Coding)의 화면 내 부호화 기술이 사용하는 MIP (Matrix-based Intra Prediction), MRLP (Multiple Reference Line Prediction), ISP (Intra Sub-Partition) 기술의 성능평가를 위하여 VTM (VVC Test Model) 10.0 을 이용한 각 기술들의 비활성화 성능은 보고된 바 있지만, 최근 버전인 VTM 16.0 을 기준으로 하나 또는 복수개의 기술을 비활성화 하였을 때의 성능은 아직 보고된 바 없다. 본 논문에서는 VVC 의 화면 내 부호화 기술들을 활성화 및 비활성화 성능실험을 통하여 부호화 성능 또는 부호화 복잡도를 우선시하는 응용에 따라 VVC 부호화기를 경량화 시킬 수 있는 부호화 기술 선택 방법을 제안한다.

  • PDF

VVC의 화면간 가중 양예측(BCW)을 위한 효율적인 가중치 시그널링 기법 (An Efficient Weight Signaling Method for BCW in VVC)

  • 박도현;윤용욱;이진호;강정원;김재곤
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.346-352
    • /
    • 2020
  • 표준화 마무리 단계인 차세대 비디오 부호화 표준 VVC(Versatile Video Coding)는 HEVC(High Efficiency Video Coding) 보다 두배 이상의 압축 성능을 달성하기 위해 다양한 기술들을 채택하고 있다. VVC는 GPB(Generalized P and B) 슬라이스에서의 양예측(bi-prediction) 기법의 성능 향상을 위하여 두 예측신호에 다양한 가중치를 적용하여 최종 예측신호를 생성하는 BCW(Bi-prediction with CU-level Weight)를 채택하였다. BCW 가중치는 가용한 참조픽처 중 재생 순서상 미래 픽처의 존재 유무를 지시하는 신택스(syntax) 요소인 NoBackwardPredFlag에 따라 적응적으로 시그널링 된다. 이러한 신택스 구조는 비디오 코덱의 유연성을 저해하고 비트스트림 파싱(parsing) 단계에서의 의존성 문제를 야기한다. 본 논문에서는 이러한 문제를 해결하기 위하여 가중치 전송에서 기존의 조건 판단 없이 가능한 모든 가중치를 허용하는 기법을 제안하였으며, 부호화기에서의 다양한 가중치 탐색을 통해 제안방법의 성능을 확인하였다. 제안된 기법은 제기된 문제를 해결하면서도 실험결과 3개의 가중치 탐색을 수행하였을 때 무시할 정도의 BD-rate 손실과 5개의 가중치 탐색을 수행하였을 때 다소의 부호화 성능 향상을 확인하였다.

Separate Scale for Position Dependent Intra Prediction Combination of VVC

  • Yoon, Yong-Uk;Park, Dohyeon;Kim, Jae-Gon
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.20-21
    • /
    • 2019
  • The Joint Video Experts Team (JVET) has been working on the development of next generation of video coding standard called Versatile Video Coding (VVC). Position Dependent Intra Prediction Combination (PDPC) which is one of the major tools for intra prediction refines the prediction through a linear combination between the reconstructed samples and the predicted samples according to the sample position. In VVC WD6, nScale which is shift value that adjusts the weight is determined by the width and height of the current block. It may cause that PDPC is applied to regions that do not fit the characteristics of the current intra prediction mode. In this paper, we define nScale for each width and height so that the weight can be applied independently to the left and top reference samples, respectively. Experimental results show that, compared to VTM 6.0, the proposed method gives -0.01%, -0.04% and 0.01% Bjotegaard-Delta (BD)-rate performance, for Y, Cb, and Cr components, respectively, in All-Intra (AI) configuration.

  • PDF