• 제목/요약/키워드: Video Rate

검색결과 1,828건 처리시간 0.032초

다목적 비디오 부호화를 위한 고속 어파인 움직임 예측 방법 (Fast Affine Motion Estimation Method for Versatile Video Coding)

  • 정승원;전동산
    • 한국산업융합학회 논문집
    • /
    • 제25권4_2호
    • /
    • pp.707-714
    • /
    • 2022
  • Versatile Video Coding (VVC) is the most recent video coding standard, which had been developed by Joint Video Expert Team (JVET). It can improve significant coding performance compared to the previous standard, namely High Efficiency Video Coding (HEVC). Although VVC can achieve the powerful coding performance, it requires the tremendous computational complexity of VVC encoder. Especially, affine motion compensation (AMC) was adopted the block-based 4-parameter or 6-parameter affine prediction to overcome the limit of translational motion model while VVC require the cost of higher encoding complexity. In this paper, we proposed the early termination of AMC that determines whether the affine motion estimation for AMC is performed or not. Experimental results showed that the proposed method reduced the encoding complexity of affine motion estimation (AME) up to 16% compared to the VVC Test Model 17 (VTM17).

비디오 얼굴 식별 성능개선을 위한 다중 심층합성곱신경망 결합 구조 개발 (Development of Combined Architecture of Multiple Deep Convolutional Neural Networks for Improving Video Face Identification)

  • 김경태;최재영
    • 한국멀티미디어학회논문지
    • /
    • 제22권6호
    • /
    • pp.655-664
    • /
    • 2019
  • In this paper, we propose a novel way of combining multiple deep convolutional neural network (DCNN) architectures which work well for accurate video face identification by adopting a serial combination of 3D and 2D DCNNs. The proposed method first divides an input video sequence (to be recognized) into a number of sub-video sequences. The resulting sub-video sequences are used as input to the 3D DCNN so as to obtain the class-confidence scores for a given input video sequence by considering both temporal and spatial face feature characteristics of input video sequence. The class-confidence scores obtained from corresponding sub-video sequences is combined by forming our proposed class-confidence matrix. The resulting class-confidence matrix is then used as an input for learning 2D DCNN learning which is serially linked to 3D DCNN. Finally, fine-tuned, serially combined DCNN framework is applied for recognizing the identity present in a given test video sequence. To verify the effectiveness of our proposed method, extensive and comparative experiments have been conducted to evaluate our method on COX face databases with their standard face identification protocols. Experimental results showed that our method can achieve better or comparable identification rate compared to other state-of-the-art video FR methods.

Distributed Coding Scheme for Multi-view Video through Efficient Side Information Generation

  • Yoo, Jihwan;Ko, Min Soo;Kwon, Soon Chul;Seo, Young-Ho;Kim, Dong-Wook;Yoo, Jisang
    • Journal of Electrical Engineering and Technology
    • /
    • 제9권5호
    • /
    • pp.1762-1773
    • /
    • 2014
  • In this paper, a distributed image coding scheme for multi-view video through an efficient generation of side information is proposed. A distributed video coding technique corrects the errors in the side information, which is generated with the original image, by using the channel coding technique at the decoder. Therefore, the more correct the generated side information is, the better the performance of distributed video coding. The proposed technique is to apply the distributed video coding schemes to the image coding for multi-view video. It generates side information by selectively and efficiently using both 3-dimensional warping based on the depth map with spatially adjacent frames and motion-compensated temporal interpolation with temporally adjacent frames. In this scheme the difference between the adjacent frames, the sizes of the motion vectors for the adjacent blocks, and the edge information are used as the selection criteria. From the experiments, it was observed that the quality of the side information generated by the proposed technique was improved by the average peak signal-to-noise ratio of 0.97dB than the one by motion-compensated temporal interpolation or 3-dimensional warping. The result from analyzing the rate-distortion curves revealed that the proposed scheme could reduce the bit-rate by 8.01% on average at the same peak signal-to-noise ratio value, compared to previous work.

대화형 비디오 서비스를 위한 MPEG 비디오 기반의 동적 대역폭 관리 기법 (Dynamic Bandwidth Management scheme for Interactive Video Service Based on MPEG Video)

  • 이승윤;유황빈
    • 한국정보처리학회논문지
    • /
    • 제6권2호
    • /
    • pp.367-376
    • /
    • 1999
  • 가변 압축 미디어 특성을 갖는 비디오 서비스는 발생되는 프레임 단위의 트래픽의 유동성 때문에 대역폭 관리에 있어 많은 제약을 수반한다. 특히, MPEG 비디오와 같이 VBR(Variable Bit Rate) 트래픽 특성을 갖는 비디오에 대한 대역폭 관리는 프레임간의 심한 트래픽 변이 때문에 대역폭 활용 이득이 낮아진다. 또한, VOD(Video-On-Demand)와 같은 대화형 비디오 서비스에서 VCR 기능과 같은 대화형 서비스를 제공할 때의 트래픽 변화는 예측하기 힘들기 때문에 효과적인 대역폭 관리가 힘들다. 본 논문에서는 MPEG 비디오와 같이 VBR 트래픽 특성을 지닌 저장 미디어를 기반으로 하는 대화형 비디오 서비스를 위한 동적 대역폭 할당 방법을 제안한다. 이 방법은 선인출 기반의 가변구간 대역폭 할당 기법과 다수 스트림에 대한 동적 대역폭 관리를 통해 주어진 전체 대역폭의 활용율을 극대화시킨다. 또한, 제안하는 기법은 MPEG 스트림의 트래픽 특성을 반영한 대역폭 할당 방법을 적용하며, 다중 스트림에 대해 동적 대역폭 관리를 사용한 네트워크 자원 활용을 극대화시킬 수 있는 방법을 제공한다.

  • PDF

H.264/AVC에서 다시점 비디오 부호화를 위한 향상된 GoGOP 구조 (An Improved GoGOP Structure for Multi-view Video Coding in H.264/AVC)

  • 신광무;이서영;김성민;정기동
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권3호
    • /
    • pp.271-275
    • /
    • 2008
  • 근래의 지속적인 멀티미디어 기술의 발전과 컨덴츠를 이용하는 사용자의 향상된 욕구가 부합하여 새로운 실감 미디어 기술이 창출되고 있다. 그 중에서 다시점 비디오는 3차원 TV, 자유 시점 비디오 등의 기반 기술로써 활발하게 연구되고 있다. 하지만 시점 수의 증가에 따른 부호화 시간 증가, 비트율 증가 등이 문제점으로 작용한다. 본 논문에서는 다시점 비디오의 부호화 효율을 높이기 위해 향상된 GoGOP 구조를 제안한다. 즉, Key 프레임 위치 조절, 동적인 I 프레임 수 그리고 동적인 B 프레임 수를 이용하는 방법을 적용하여 향상된 GoGOP 구조를 제안하였다. 실험 결과, 본 논문에서 제안한 기법이 Anchor 구조와 비교하여 유사한 PSNR 값을 가지면서, 비트율이 상당히 감소하였다.

DTV시스템에서의 정적 화질 테스트를 위한 고화질 스트림의 생성 (Generation of high quality stream for static picture quality test in DTV system)

  • 이광순;한찬호;장수욱;김은수;송규익
    • 한국통신학회논문지
    • /
    • 제29권2C호
    • /
    • pp.315-323
    • /
    • 2004
  • 본 논문은 디지털 TV 시스템의 화질 테스트를 위해 사용될 수 있는 정적 비디오 테스트 패턴에 대한 고화질 스트림을 생성할 수 있는 방법을 제안하고 있다. 이를 위해 정적 비디오 테스트 패턴의 부호화에 적합하고 양자화로 인한 화질의 손실을 최소화할 수 있는 사용자 양자화 테이블을 제안하고 있으며, 정적 테스트 패턴의 부호화 과정에서 발생할 수 있는 비디오 버퍼의 넘침 및 고갈 현상을 적응적인 제로 추가 방법을 이용하여 해결함으로써 최적의 화질을 구현하였다. 제안한 알고리즘을 실험해 본 결과 안정된 전송률을 나타낼 뿐만 아니라 화질 또한 멀티버스트 패턴에서 기존 방식 보다 약 3 dB 정도의 우수함을 보여 DTV 시스템의 테스트에 적합함을 알 수 있었다.

CNN-based Fast Split Mode Decision Algorithm for Versatile Video Coding (VVC) Inter Prediction

  • Yeo, Woon-Ha;Kim, Byung-Gyu
    • Journal of Multimedia Information System
    • /
    • 제8권3호
    • /
    • pp.147-158
    • /
    • 2021
  • Versatile Video Coding (VVC) is the latest video coding standard developed by Joint Video Exploration Team (JVET). In VVC, the quadtree plus multi-type tree (QT+MTT) structure of coding unit (CU) partition is adopted, and its computational complexity is considerably high due to the brute-force search for recursive rate-distortion (RD) optimization. In this paper, we aim to reduce the time complexity of inter-picture prediction mode since the inter prediction accounts for a large portion of the total encoding time. The problem can be defined as classifying the split mode of each CU. To classify the split mode effectively, a novel convolutional neural network (CNN) called multi-level tree (MLT-CNN) architecture is introduced. For boosting classification performance, we utilize additional information including inter-picture information while training the CNN. The overall algorithm including the MLT-CNN inference process is implemented on VVC Test Model (VTM) 11.0. The CUs of size 128×128 can be the inputs of the CNN. The sequences are encoded at the random access (RA) configuration with five QP values {22, 27, 32, 37, 42}. The experimental results show that the proposed algorithm can reduce the computational complexity by 11.53% on average, and 26.14% for the maximum with an average 1.01% of the increase in Bjøntegaard delta bit rate (BDBR). Especially, the proposed method shows higher performance on the sequences of the A and B classes, reducing 9.81%~26.14% of encoding time with 0.95%~3.28% of the BDBR increase.

색 공간 내 중복 정보 감소를 위한 HEVC 스크린 콘텐츠 부호화 기법 성능 분석 (Performance Analysis of Screen Contents Coding Tools to Reduce Inter-Color Component Correlation)

  • 강제원
    • 방송공학회논문지
    • /
    • 제20권5호
    • /
    • pp.687-696
    • /
    • 2015
  • 최근 동영상 압축에 관한 국제 표준화 기구인 JCT-VC (Joint Collaborative Team on Video Coding) 에서는 High Efficiency Video Coding (HEVC)의 확장 표준으로 HEVC/Range Extension (HEVC/RExt)의 개발을 완료하고 스크린 콘텐츠 동영상의 부호화기술을 위한 표준인 HEVC/Screen Content Coding (HEVC/SCC)을 제정 중이다. 기존 동영상 압축 과정에서는 이미지 센서로부터 취득한 RGB 영상을 변환하여 부호화를 수행하는 반면에 애니매이션, 그래픽스 등 컴퓨터로 합성한 영상을 일컫는 스크린 콘텐츠의 경우는 색 공간의 변환이 주관적 화질을 심각하게 열화 시킬 수 있으므로 기존 RGB 색 공간을 유지하며 효율적으로 색 공간 내 정보의 중복성을 줄이기 위한 부호화 기법이 필요하다. 본 논문에서는 HEVC/RExt.와 HEVC/SCC에서 개발한 스크린 콘텐츠 동영상 압축을 위한 색 요소 예측 기법과 루프 내 색 공간 변환 기술의 성능을 분석한다. 실험 결과에 의하면 색 요소 예측 기법은 평균 약 11.7% BD-rate 감소, 색 공간 예측 기법은 평균 약 16.4% BD-rate 감소를 보인다. 그러나 두 기법이 동시에 적용되는 경우 약 18.2%의 BD-rate 감소를 보여 두 기법의 부호화 효율이 약 9.9% 중첩된다. 본 결과를 응용하여 두 기법이 배타적으로 선택이 되게끔 부호기 고속화를 수행하는 경우 약 0.3%의 부호화 손실로 93%의 부호화 측정 시간을 제공한다.

비디오 프레임 타입을 이용한 비디오 셧 검출 (Video Shot Detection Based on Video Frame Types)

  • 김영빈;류광렬;로버트스크라바시
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.145-148
    • /
    • 2007
  • 논문은 비디오 픽쳐 타입을 이용한 비디오 셧 검출에 관한 연구이다. 제안한 방법은 압축된 비디오 프레임에 대하여 원 영상을 복원하지 않고, 압축 상태의 비디오 프레임을 이용한다. I픽쳐 프레임에서 DC영상을 복원하고, P픽쳐 프레임에서는 매크로블록의 개수를 이용하여 비디오 셧을 검출 한다. 테스트 비디오를 이용하여 실험 결과 $85\sim98%$의 장면전환 검출이 가능 하였고, 압축비트스트림을 복원하여 장면전환의 셧을 검출 하는 기법에 비해 4배 빠른 검색이 가능하다.

  • PDF

차세대 비디오 코덱(JEM)의 고속 QTBT 분할 깊이 결정 기법 (A Fast Decision Method of Quadtree plus Binary Tree (QTBT) Depth in JEM)

  • 윤용욱;박도현;김재곤
    • 방송공학회논문지
    • /
    • 제22권5호
    • /
    • pp.541-547
    • /
    • 2017
  • 차세대 비디오 부호화 표준 기술 탐색을 진행하고 있는 JVET(Joint Video Exploration Team)의 참조 SW 코덱인 JEM(Joint Exploration Model)은 재귀적 QTBT(Quadtree plus Binary Tree) 분할 구조의 부호화단위(CU)를 제공한다. QTBT를 통하여 새로운 블록 형태를 추가하여 부호화 효율 이득을 얻을 수 있는 반면, 부호화 복잡도 또한 크게 증가하는 문제가 있다. 본 논문에서는 JEM 부호화기의 복잡도 감소를 위해 상위 분할 깊이(depth)와 현재 분할 깊이의 율-왜곡(Rate-Distortion: RD) 비용을 사용하는 고속 블록 분할 깊이 결정 기법을 제안한다. 실험결과 JEM 5.0 대비 AI(All Intra) 부호화 구조에서 0.7%의 BD-rate 증가에 21.6%의 부호화 시간 감소를 보였고, RA(Random Access)에서는 1.2%의 BD-rate 증가에 11.0%의 시간 감소 효과를 얻을 수 있었다.