Adaptive Spatio-Temporal Prediction for Multi-view Coding in 3D-Video (3차원 비디오 압축에서의 다시점 부호화를 위한 적응적 시공간적 예측 부호화)

  • 성우철;이영렬
    • Journal of Broadcast Engineering
    • v.9 no.3
    • pp.214-224
    • 2004
  • In this paper, an adaptive spatio-temporal predictive coding based on the H.264 is proposed for 3D immersive media encoding, such as 3D image processing, 3DTV, and 3D videoconferencing. First, we propose a spatio-temporal predictive coding using the same view and inter-view images for the two TPPP, IBBP GOP (group of picture) structures 4hat are different from the conventional simulcast method. Second, an 2D inter-view direct mode for the efficient prediction is proposed when the proposed spatio-temporal prediction uses the IBBP structure. The 2D inter-view direct mode is applied when the temporal direct mode in B(hi-Predictive) picture of the H.264 refers to an inter-view image, since the current temporal direct mode in the H.264 standard could no: be applied to the inter-view image. The proposed method is compared to the conventional simulcast method in terms of PSNR (peak signal to noise ratio) for the various 3D test video sequences. The proposed method shows better PSNR results than the conventional simulcast mode.

Fast Intra Mode Selection Algorithm for H.264/AVC Using Constraints of Frequency Characteristics (주파수 특성의 제약 조건들을 이용한 H.264/AVC를 위한 고속 화면 내 모드 선택 방법)

  • Jin, Soon-Jong;Park, Sang-Jun;Jeong, Je-Chang
    • The Journal of Korean Institute of Communications and Information Sciences
    • v.33 no.4C
    • pp.321-329
    • 2008
  • H.264/AVC video coding standard enables a considerably higher improvement in coding efficiency compared with previous standards such as MPEG-2, H.263 and MPEG-4. To achieve this, for each macro-block in H.264/AVC, Rate-Distortion Optimization (RDO) technique is employed to select the best motion vector, reference frame, and macro-block mode. As a result, computational complexity is increased significantly whereas RDO achieve higher improvement. This paper presents fast intra mode selection algorithm based on constraints of frequency characteristics which are derived from intra coding modes of H.264/AVC. First of all, we observe the features of each intra mode through the frequency analysis of image. And then proposed Frequency Error Costs (FECs) are calculated to select the best mode which has minimum cost. Computational complexity is considerably reduced because rate-distortion costs only calculate the candidate modes which are set of best mode and its neighbouring two modes. Experimental results show that proposed algorithm reduces the complexity dramatically maintaining the rate-distortion performance compared with H.264/AVC reference software.

View Synthesis Error Removal for Comfortable 3D Video Systems (편안한 3차원 비디오 시스템을 위한 영상 합성 오류 제거)

  • Lee, Cheon;Ho, Yo-Sung
    • Smart Media Journal
    • v.1 no.3
    • pp.36-42
    • 2012
  • Recently, the smart applications, such as smart phone and smart TV, become a hot issue in IT consumer markets. In particular, the smart TV provides 3D video services, hence efficient coding methods for 3D video data are required. Three-dimensional (3D) video involves stereoscopic or multi-view images to provide depth experience through 3D display systems. Binocular cues are perceived by rendering proper viewpoint images obtained at slightly different view angles. Since the number of viewpoints of the multi-view video is limited, 3D display devices should generate arbitrary viewpoint images using available adjacent view images. In this paper, after we explain a view synthesis method briefly, we propose a new algorithm to compensate view synthesis errors around object boundaries. We describe a 3D warping technique exploiting the depth map for viewpoint shifting and a hole filling method using multi-view images. Then, we propose an algorithm to remove boundary noises that are generated due to mismatches of object edges in the color and depth images. The proposed method reduces annoying boundary noises near object edges by replacing erroneous textures with alternative textures from the other reference image. Using the proposed method, we can generate perceptually inproved images for 3D video systems.

multi-scale feature compression for VCM (VCM 을 위한 다중 스케일 특징 압축 방법)

  • Han, Heeji;Choi, Minseok;Jung, Soon-heung;Kwak, Sangwoon;Choo, Hyon-Gon;Cheong, Won-Sik;Seo, Jeongil;Choi, Haechul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • 2022.06a
    • pp.140-142
    • 2022
  • 최근 신경망 기반 기술들의 발달에 따라, 신경망 기술들은 충분히 높은 임무 수행 성능을 달성하고 있으며 사물인터넷, 스마트시티, 자율주행 등 다양한 환경을 고려한 응용 역시 활발히 연구되고 있다. 하지만 이러한 신경망의 임무 다양성과 복잡성은 더욱 많은 비디오 데이터가 요구되며 대역폭이 제한된 환경을 고려한 응용에서 이러한 비디오 데이터를 효과적으로 전송할 방법이 필요하다. 이에 따라 국제 표준화 단체인 MPEG 에서는 신경망 기계 소비에 적합한 비디오 부호화 표준 개발을 위해 Video Coding for Machines (VCM) 표준화를 진행하고 있다. 본 논문에서는 신경망의 특징 부호화 효율을 개선하기 위하여 VCM 을 위한 다중 스케일 특징 압축 방법을 제안한다. COCO2017 데이터셋의 검증 영상을 기반으로 제안방법을 평가한 결과, 압축된 특징의 크기는 원본 이미지의 0.03 배이며 6.8% 미만의 임무 정확도 손실을 보였다.

Virtual reference image-based video coding using FRUC algorithm (FRUC 알고리즘을 사용한 가상 참조 이미지 기반 부호화 기술 연구)

  • Yang, Fan;Han, Heeji;Choi, Haechul
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • 2022.05a
    • pp.650-652
    • 2022
  • Frame rate up-conversion (FRUC) algorithm is an image interpolation technology that improves the frame rate of moving pictures. This solves problems such as screen shake or blurry motion caused by low frame rate video in high-definition digital video systems, and provides viewers with a more free and smooth visual experience. In this paper, we propose a video compression technique using deep learning-based FRUC algorithm. The proposed method compresses and transmits after excluding some images from the original video, and uses a deep learning-based interpolation method in the decoding process to restore the excluded images, thereby compressing them with high efficiency. In the experiment, the compression performance was evaluated using the decoded image and the image restored by the FRUC algorithm after encoding the video by skipping 1 or 3 pages. When 1 and 3 sheets were excluded, the average BD-rate decreased by 81.22% and 27.80%. The reason that excluding three images has lower encoding efficiency than excluding one is because the PSNR of the image reconstructed by the FRUC method is low.

A Design of H.263+ Codec using VHDL (VHDL을 이용한 H.263+ Codec의 설계)

  • 김은성;김상철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • /
    • 1999
  • H.263+[1]는 1996년에 비디오압축 표준안으로 확정된 H.263의 확장으로 현재 널리 퍼져 있는 저 전송률의 가정용 전화선을 위한 비디오 압축에 관한 표준안으로 1988년에 확정되었다. H.263+의 기본 알고리즘은 H.263과 같으나 사용상의 편의를 위한 여러 선택모드와 이종의 네트워크환경에서 발생하는 대역폭의 변화나 에러를 위한 scalability(계층부호화)와 같은 새로운 기능이 추가되었다. 새로운 표준안에 따른 실시간 비디오 전송을 처리하기 위해서 필연적으로 하드웨어 코덱의 개발 필요성이 대두되고 있으며 실시간 비디오 코덱은 영상회의 전화기나 멀티미디어 전송시스템의 핵심기술로써 적용될 수 있다. 본 논문에서는 ITU-T H.263+의 기본모드와 새로이 추가된 선택모드 일부를 지원하는 코덱을 하드웨어 기술 언어인 VHDL(VHSIC Hardware Description Language)을 사용하여 기술하고 각 모듈과 최상의 모듈을 시뮬레이션하여 동작을 검증했다.

Blocking noise reduction method based on Convolutional Neural Network (합성곱 신경망 기반의 블록화 노이즈 감소 기법)

  • Jung, JiYeon;Kim, Yang-Woo;Lee, Yung-Lyul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • 2019.06a
    • pp.270-271
    • 2019
  • 본 논문에서는 최신 비디오 압축 표준인 HEVC 를 기반으로, 영상의 부호화 과정에서 블록 사이에 형성되는 잡음을 감소시키기 위하여 합성곱 신경망을 학습시켜 영상의 품질과 예측 성능을 향상시키는 기법을 제안한다. 실험 결과 본 제안 기법은 기존의 HEVC 대비 평균 0.06dB 의 PSNR 개선을 보였고, 원본 값과 예측 값의 오차는 0.5%만큼 감소하였다.

A View Interpolation Method for Multi-view Video of Large Disparity (변위 범위가 큰 다시점 비디오에 적합한 영상보간법)

  • Lee, Cheon;Oh, Kwan-Jung;Ho, Yo-Sung
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • 2006.11a
    • pp.55-58
    • 2006
  • 차세대 방송서비스 개발의 일환으로 관심을 모으고 있는 다시점 비디오 부호화(multi-view video coding, MVC) 방식은 인접한 여러 대의 카메라로 동시에 획득한 영상을 효과적으로 압축하는데 그 목적이 있다. 이때, 중간시전 영상을 생성하여 부호화하는 과정의 참조영상으로 이용할 수 있으며, 이를 위해서는 다시점 비디오 특성에 맞는 영상보간 방법이 필요하다. 기존에 제안되었던 영상보간법은 변위의 검색범위를 초기에 설정하여 블록정합을 이용하여 화소 단위로 변위를 측정하기 때문에 카메라 사이의 거리가 크거나 객체의 움직임이 커서 변위의 변동이 심한 영상에서는 안정적인 화질의 영상을 얻기 어렵다. 또한, 고정된 크기의 블록을 이용하여 전체 변위를 측정하므로 객체의 변위차가 큰 영역에서 변위 오류가 많이 발생한다. 본 논문에서는 이와 같은 문제를 해결하여 보다 개선된 화질의 중간시점 영상을 얻기 위한 새로운 영상보간법을 제안한다. 영역분할을 이용한 초기의 변위측정 과정에서, 처음부터 최대 변위의 범위를 설정하는 대신에 블록 단위로 대략적인 변위륵 측정한 후에, 가변 블록을 이용하여 보다 세밀한 변위를 측정한다. 이 방법은 변위차가 큰 객체의 경계 부분에서 보다 정확하게 변위를 측정 할 수 있으므로, 화소 단위로 변위를 측정할 때 이전에 추한 변위 정보를 바탕으로 각 화소별로 검색 범위를 설정한다. 적응적으로 설정된 검색 범위를 이용하여 화소 단위의 변위를 측정하면 보다 개선된 변위를 얻을 수 있다. 추가적으로, 변위측정 과정에서 발생하는 변위의 오류를 최대한 줄이기 위해 각 단계별로 미디언 필터를 이용하여 변위 오류를 수정하였다. 본 논문에서 제안한 방법으로 실험한 결과 기존의 영상보간 방법보다 화질이 약 $1{\sim}4dB$ 정도 개선되었다.필, 투명도 등을 위성원격탐사 자료와 GIS를 이용하여 공간분석을 실시하고, 공간분포도를 작성함으로써 대상해역의 해양환경을 파악하였다. 본 연구결과, 분석된 위성자료가 현장조사에 의한 검증이 이루어지지 않을 경우, 영상자료분석을 통한 표층수온 추출은 대기 중의 수증기와 에어로졸에 의한 계산치의 오차가 반영되기 때문에 실측치 보다 낮게 평가 될 수 있으므로, 반드시 이에 대한 검증이 필요함을 알 수 있었다. 현지관측에 비해 막대한 비용과 시간을 절약할 수 있는 위성영상해석방법을 이용한 방법은 해양수질파악이 가능할 것으로 판단되며, GIS를 이용하여 다양하고 복잡한 자료를 데이터베이스화함으로써 가시화하고, 이를 기초로 공간분석을 실시함으로써 환경요소별 공간분포에 대한 파악을 통해 수치모형실험을 이용한 각종 환경영향의 평가 및 예측을 위한 기초자료로 이용이 가능할 것으로 사료된다.염총량관리 기본계획 시 구축된 모형 매개변수를 바탕으로 분석을 수행하였다. 일차오차분석을 이용하여 수리매개변수와 수질매개변수의 수질항목별 상대적 기여도를 파악해 본 결과, 수리매개변수는 DO, BOD, 유기질소, 유기인 모든 항목에 일정 정도의 상대적 기여도를 가지고 있는 것을 알 수 있었다. 이로부터 수질 모형의 적용 시 수리 매개변수 또한 수질 매개변수의 추정 시와 같이 보다 세심한 주의를 기울여 추정할 필요가 있을 것으로 판단된다.변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이루어질 수 있을 것으로 기대된다.는 초과수익률이 상승하지만, 이후로는 감소하므로, 반전거래전략을 활용하는 경우 주식투자기간은 24개월이하의 중단기가 적합함을 발견하였다. 이상의 행태적 측면과 투자성과측면의 실증결과를 통하여 한국주식시장에 있어서 시장수익률을 평균적으로 초과할 수 있는 거래전략은

Quantization Method in Spatial Domain for Screen Content Video Compression (스크린 콘텐츠 영상 압축을 위한 화소 영역 양자화 방법)

  • Nam, Jung-Hak;You, Jong-Hun;Sim, Dong-Gyu;Oh, Seoung-Jun
    • Journal of the Institute of Electronics Engineers of Korea SP
    • v.49 no.4
    • pp.67-76
    • 2012
  • Expanding services and productions for screen content videos recently, necessity of new compression techniques is emerging. The next-generation video coding standard is also considering specified coding tools for screen content videos, but it is still preliminary stage. In this paper, we investigate the characteristics of screen content videos for which we propose the quantization in spatial domain to improve coding efficiency. The proposed method directly employs quantization for residual signal without any transformations. The proposed method also applies adaptive coefficients prediction and in-loop filter for quantized residual signals in spatial domain based on the characteristics of screen content videos. As a results, the proposed method for the random access, the low-delay and the all-intra modes achieve bit-saving about 4.4%, 5.1%. and 4.9%, respectively.

Effective Compression Technique of Multi-view Image expressed by Layered Depth Image (계층적 깊이 영상으로 표현된 다시점 영상의 효과적인 압축 기술)

  • Jee, Inn-Ho
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • v.14 no.4
    • pp.29-37
    • 2014
  • Since multi-view video exists a number of camera color image and depth image, it has a huge of data. Thus, a new compression technique is indispensable for reducing this data. Recently, the effective compression encoding technique for multi-view video that used in layered depth image concepts is a remarkable. This method uses several view point of depth information and warping function, synthesizes multi-view color and depth image, becomes one data structure. In this paper we use actual distance for solving overlap in layered depth image that reduce required data for reconstructing in color-based transform. In experimental results, we confirmed high compression performance and good quality of reconstructed image.