DOI QR코드

DOI QR Code

An Atlas Generation Method with Tiny Blocks Removal for Efficient 3DoF+ Video Coding

효율적인 3DoF+ 비디오 부호화를 위한 작은 블록 제거를 통한 아틀라스 생성 기법

  • Lim, Sung-Gyun (Korea Aerospace University, School of Electronics and Information Engineering) ;
  • Kim, Hyun-Ho (Korea Aerospace University, School of Electronics and Information Engineering) ;
  • Kim, Jae-Gon (Korea Aerospace University, School of Electronics and Information Engineering)
  • 임성균 (한국항공대학교 항공전자정보공학부) ;
  • 김현호 (한국항공대학교 항공전자정보공학부) ;
  • 김재곤 (한국항공대학교 항공전자정보공학부)
  • Received : 2020.07.10
  • Accepted : 2020.08.05
  • Published : 2020.09.30

Abstract

MPEG-I is actively working on standardization on the coding of immersive video which provides up to 6 degree of freedom (6DoF) in terms of viewpoint. 3DoF+ video, which provides motion parallax to omnidirectional view of 360 video, renders a view at any desired viewpoint using multiple view videos acquisitioned in a limited 3D space covered with upper body motion at a fixed position. The MPEG-I visual group is developing a test model called TMIV (Test Model for Immersive Video) in the process of development of the standard for 3DoF+ video coding. In the TMIV, the redundancy between a set of input view videos is removed, and several atlases are generated by packing patches including the remaining texture and depth regions into frames as compact as possible, and coded. This paper presents an atlas generation method that removes small-sized blocks in the atlas for more efficient 3DoF+ video coding. The proposed method shows a performance improvement of BD-rate bit savings of 0.7% and 1.4%, respectively, in natural and graphic sequences compared to TMIV.

MPEG-I에서는 최대 6자유도(6DoF)를 가지는 몰입형(immersive) 비디오의 압축 표준화를 진행하고 있다. 360 비디오의 전방위 뷰(view)와 함께 움직임 시차(parallax)를 제공하는 3DoF+ 비디오는 고정된 위치에서 상체 움직임 정도의 제한된 공간에서 획득된 여러 뷰 비디오를 사용하여 임의의 원하는 시점의 뷰를 렌더링한다. MPEG-I 비쥬얼 그룹에서는 이러한 3DoF+ 비디오의 압축 표준화를 진행하고 있으며, 그 과정에서 TMIV(Test Model for Immersive Video)라는 시험모델을 개발하고 있다. TMIV에서는 다수의 입력 뷰 비디오들의 중복성을 제거하고 남은 텍스쳐 및 깊이 영상 패치(patch)들을 촘촘히 프레임으로 패킹한 아틀라스(Atlas)를 생성하고 이를 부호화한다. 본 논문은 보다 효율적인 3DoF+ 비디오 부호화를 위해서 작은 크기의 블록들을 제거하는 아틀라스 생성 기법을 제시한다. 제안기법은 TMIV 대비 자연영상과 그래픽 영상에서 각각 0.7%와 1.4%의 BD-rate 비트율 감소의 성능 개선을 보였다.

Keywords

References

  1. "MPEG-I Use Cases for omnidirectional 6DoF, windowed 6DoF, and 6DoF," ISO/IEC JTC1/SC29/WG11, N16768, Apr. 2017.
  2. M. Wien, J. M. Boyce, T. Stockhammer, and W.-H. Peng, "Standardization Status of Immersive Video Coding," IEEE Jour. Emerg. Select. Topics Circuits Syst., vol. 9, no. 1, Mar. 2019.
  3. J. Boyce, R. Dore, V. Vadakital, "Working Draft 4 of Immersive Video," ISO/IEC JTC1/SC29/WG11, N19001, Jan. 2020.
  4. B. Salahieh, B. Kroon, J. Jung, M. Domański (Eds.), "Test model 4 for Immersive Video," ISO/IEC JTC1/SC29/WG11, N19002, Jan. 2020.
  5. J. Jung, B. Kroon, J. Boyce, "Common Test Conditions for Immersive Video," ISO/IEC JTC1/SC29/WG11, N18997, Jan. 2020.
  6. HM reference software, [Online]. Available at http://hevc.hhi.fraunhofer.de/svn/svn_HEVCSoftware
  7. ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, "On BD-rate Calculation," JCTVC-F270, Jul. 2011.
  8. S. Lim, H. Kim, J. Kim, G. Lee, J. Jeong, J. Seo, "CE3-Related: Patch Trimming Using Hole Filling and Tiny Region Removal in Atlas," ISO/IEC JTC1/SC29/WG11, m53834, Apr. 2020.