• 제목/요약/키워드: MPEG-4/AVC

검색결과 123건 처리시간 0.021초

HEVC의 재귀적 CU 구조에 대한 조건부 확률 기반 고속 탐색 알고리즘 (Conditional Probability Based Early Termination of Recursive Coding Unit Structures in HEVC)

  • 한우진
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.354-362
    • /
    • 2012
  • MPEG과 ITU-T에서 최근 표준화가 진행되고 있는 HEVC는 H.264/AVC에 비해, CU(coding unit), PU(prediction unit), TU(transform unit)의 다양한 형태 분할 단위를 갖는 것을 큰 특징으로 한다. 이 중, CU와 TU는 쿼드트리 형태의 재귀적 분할 구조를 가지도록 구성되는데, 압축 효율은 향상시키지만 높은 부호화 복잡도를 갖는 단점이 있다. 본 논문에서는 이러한 재귀적 분할 구조에서의 rate-distortion cost를 조건부 확률을 이용한 통계적 분석 방법을 사용하여, 분할이 일어나는 경우와 그렇지 않은 경우로 분류하는 방법을 제안한다. 제안한 방법을 HEVC의 재귀적 CU 부호화에 적용한 결과, 부호화 복잡도를 32% 가량 감소시키면서 압축 효율하락은 0.4-0.5%로 억제할 수 있었다. 또한, HM4.0에 구현되어 있는 고속 탐색 알고리즘과 함께 사용하는 경우, 압축 효율 하락을 0.9%로 억제하면서 부호화 복잡도를 1/2로 감소시킬 수 있었다.

스케일러블 비디오 코딩에서의 실시간 스케일러빌리티 변환 (Dynamic Full-Scalability-Conversion in SVC)

  • 이동수;배태면;노용만
    • 전자공학회논문지CI
    • /
    • 제43권6호
    • /
    • pp.60-70
    • /
    • 2006
  • 유비쿼터스 환경에서의 비디오 적응 변환을 위하여 현재 MPEG-4 AVC/SE SVC에서는 공간적, 시간적, 품질적 스케일러빌리티를 지원하고 있다. 이러한 스케일러빌리티의 변환은 가변적인 대역폭을 가지는 네트워크 특성에 따라 실시간으로 이루어져야 한다. 그러나 현재의 SVC에서는 품질적 스케일러빌리티에 대해서는 실시간으로 스케일러빌리티를 변환할 수 잇지만 공간적, 시간적 스케일러빌리티에 대해서는 이를 제대로 지원할 수 없다. 이에 본 논문에서는 이와 관련된 문제점들을 자세히 알아보고 이를 해결하기 위한 방법을 제안한다. 부호시에는 주기적으로 IDR NAL을 삽입하였다. 추출시에는 실시간 추출에 필요한 정보들을 미리 분석한 후 실제 추출시에 활용하여 실시간 추출을 가능하도록 하였다. 마지막으로 복호시에는 실시간 스케일러빌리티를 지원할 수 있는 프로세스를 정의하였다. 이를 JSVM4.0에 구현하였고 주어진 네트워크 대역폭에 스케일러빌리티를 통하여 적응된 비트스트림의 비트레이트, PSNR, 스케일러빌리티를 측정하여 제안된 방법의 유효성을 검증하였다.

HEVC 쿼드트리 부호화를 위한 율-왜곡 모델 (Rate-Distortion Model for HEVC Quadtree Coding)

  • 이범식;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.169-172
    • /
    • 2011
  • 최근 ISO/IEC의 MPEG과 ITU-T의 VCEG이 JCT-VC (Joint Collaborative Team for Video Coding)를 구성하여 HEVC (High Efficiency Video Coding) 차세대 비디오 압축 표준 제정을 위한 작업을 진행 중이다. 과거 압축률이 가장 좋은 것으로 알려진 H.264/AVC 보다 최대 50%까지 부호화 효율 향상을 목표로 하고 있다. HEVC는 H.264/AVC와는 상이한 부호화 구조를 채택하고 있고 작은 크기의 영상뿐만 아니라 크기가 큰 영상까지도 효율적으로 부호화할 수 있도록 설계되고 있다. 예측 및 변환 부호화 과정이 계층적 쿼드트리 구조를 가지며, 특히 변환 부호화는 작은 크기의 변환 블록으로부터 $32{\times}32$ 크기의 변환 블록까지 크게 확장되어 계층적 변환 구조를 이루며 부호화하도록 되어 있다. 본 논문에서는 기존 코덱과는 상이한 부호화 구조를 갖는 쿼드트리 부호화 기반 HEVC 코덱 표준을 위한 율-왜곡 (Rate-Distortion) 모델을 제안한다. 기존의 코덱에서는 부호화되는 기본 단위가 $16{\times}16$로 일정하고, 변환 및 양자화되는 블록의 크기 역시 $4{\times}4$또는 $8{\times}8$ 크기 단위로 그 블록의 크기가 작을 뿐만 아니라 고정된 크기를 사용한다. 따라서 단일 확률 모형을 사용하여 율-왜곡 모델을 만들었으며, 그 정확도 역시 비교적 정확한 결과를 얻었다. 그러나 HEVC에서는 계층적 가변 블록 크기를 갖는 기본 부호화, 예측 및 변환/양자화 기법을 사용하기 때문에 기존의 단일 모델로는 정확한 율-왜곡 모델을 만들어 내기 어렵다. 제안하는 방법은 HEVC의 기본 단위인 CU (Coding Unit)별로 독립적인 확률 모형을 사용하여 율-왜곡모델을 사용하는 것으로 CU의 크기가 가변적이고 CU 내의 텍스처 역시 크기에 따라 매우 다른 특성을 가지고 있기 때문에 단일 모델을 사용하는 것보다 매우 효율적인 것을 실험을 통하여 확인하였다.

  • PDF

ASIP을 위한 움직임 추정 전용 연산기 구조 및 명령어 설계 (Motion Estimation Specific Instructions and Their Hardware Architecture for ASIP)

  • 황성조;선우명훈
    • 대한전자공학회논문지SP
    • /
    • 제48권3호
    • /
    • pp.106-111
    • /
    • 2011
  • 본 논문은 H.264나 MPEG4등, 다양한 영상압축 코덱을 지원할 수 있는 ME ASIP의 전용 IME 명령어와 재구성 가능한 하드웨어 구조를 제안한다. 제안하는 전용의 명령어와 하드웨어 가속기는 HD급의 고화질 영상을 지원할 수 있는 성능을 가지고 있다. 제안하는 IME명령어는 다수의 병렬 연산과 패턴 정보를 이용한 연산기 제어를 통하여 전역탐색을 비롯한 각종 고속 탐색 알고리즘을 지원한다. 제안한 하드웨어 구조는 256개의 Processor Elements로 구성되어 있는 Processor Element Group (PEG) 하나당 77,860 게이트를 가진다. 16개의 PEG로 구성된 ASIP은 160MHz의 동작 주파수를 가지고 있으며, HD급 1080p의 해상도를 가지는 영상을 실시간으로 동작 시킬 수 있다.

비디오 비트율 제어를 위한 적응적 모델 기반의 양자화 변수 결정 방법 (Adaptive Model-Based Quantization Parameter Decision for Video Rate Control)

  • 김선기;호요성
    • 한국통신학회논문지
    • /
    • 제32권4C호
    • /
    • pp.411-417
    • /
    • 2007
  • 비트율 제어는 채널 용량이나 프레임율과 같은 제한 조건에서 더 좋은 화질을 제공하기 위해 비디오 부호화에 있어서 필요한 구성 요소이다. 일반적으로 양자화 변수를 결정할 때 양자화가 수행될 데이터를 단일 분포로 가정하면, 실제 데이터의 분포를 지나치게 간략화하게 되는 문제가 발생할 수 있으며, 이는 이동통신 환경과 같이 전송 대역의 제약이 심한 상황에서 부호화 효율을 떨어뜨리는 원인이 된다. 본 논문에서는 이러한 문제를 해결하기 위해 다양한 소스 분포를 일반화된 가우시안 분포(Generalized Gaussian Distribution)를 이용하여 정의하고, 각각의 분포 특성을 나타내는 모양 변수를 결정하여 일반화된 가우시안 분포의 비트율-왜곡 함수에 기반을 둔 양자화 변수 결정 모델을 설계한다. 본 논문에서 제안한 알고리즘은 저 비트율 환경에서 우수한 성능을 제공하는 비디오 부호화 표준인 H.264 비디오 코덱에 구현하여 MPEG-2 TM5 및 H.263 TMN8과 그 성능을 비교한다.

하드웨어 기반의 H.264 정수 변환 및 양자화 구현 (Hardware Implementation of Integer Transform and Quantization for H.264)

  • 임영훈;정용진
    • 한국통신학회논문지
    • /
    • 제28권12C호
    • /
    • pp.1182-1191
    • /
    • 2003
  • 본 논문에서는 H.264의 정수 변환 모듈, 양자화 모듈, 역양자화 모듈, 정수 역변환 모듈에 대한 하드웨어 구조를 제안한다. 새로운 동영상 압축기술인 H.264의 전체 구성 중에서 핵심 부분인 동영상 데이터의 영역 변환 및 양자화 기능들을 하드웨어로 설계할 수 있도록 알고리즘을 기술하고, 저전력 설계를 위하여 하드웨어 사이즈를 최소화하도록 구조를 정하였다. 구현된 전체 모듈들은 PCI 인터페이스를 통한 Altera APEX-II FPGA 구성과 삼성 STD130 0.18um CMOS Cell Library를 이용하여 각각 합성하고 검증하였다. 이렇게 검증된 구조의 성능은 ASIC으로 구현하였을 경우 최대 동작 주파수가 100MHz이며, QCIF의 사이즈 기준으로 초당 최대 1295 프레임의 계산을 수행할 수 있으며, 이는 하드웨어 기반의 H.264 실시간 부호화기를 설계하기에 적합한 구조임을 보여준다.

관심영역 암호화 시 발생하는 H.264 영상의 비트레이트 오버헤드 최소화 방법 연구 (A Study on the Method of Minimizing the Bit-Rate Overhead of H.264 Video when Encrypting the Region of Interest)

  • 손동열;김지민;지청민;김강석;김기형;홍만표
    • 정보보호학회논문지
    • /
    • 제28권2호
    • /
    • pp.311-326
    • /
    • 2018
  • H.264/AVC-MPEG의 JM v10.2 코드 기반에서 QCIF ($176{\times}144$) 해상도를 가지는 News 샘플 영상을 사용하여 실험을 하였다. 암호화를 하게 될 관심영역(Region of Interest, ROI)이 H.264 표준의 움직임 예측 및 보상의 특성상 연속적으로 각 프레임마다 불필요하게 참조하여 드리프트를 발생시켰다. 드리프트를 완화하기 위해 암호화가 된 I픽처를 특정 주기로 재삽입하는 최신 관련연구의 방법은 추가 연산량 증가로 이어져 영상 전체의 비트레이트 오버헤드가 증가하는 요인이 된다. 따라서 움직임 예측 및 보상 단계에서 각 프레임마다 암호화가 될 관심영역에서의 Block과 Frame의 참조 탐색 범위를 제한하고, 암호화가 되지 않을 비관심영역에서의 참조 탐색 범위는 정상적인 인코딩 효율을 유지하기 위해 제한하지 않는다. 이와 같이 특정 참조 탐색 범위가 제한된 영상 인코딩을 한 후, 영상 속 개인정보 보호를 위해 얼굴과 같이 개인 식별이 가능한 관심영역에 대해 RC4 비트스트림 암호화 하는 방법을 제안한다. 그리고 동일한 환경의 조건에서 암호화되지 않은 원본 영상과 최신 관련연구 방법과 본 연구의 제안 방법을 각각 구현한 후, 실험 결과들을 비교 분석하였다. 최신 관련연구 방법과 다르게 제안방법을 통해 시간상 드리프트를 완화하면서, 제안방법이 적용된 영상 전체의 비트레이트 오버헤드가 원본 영상보다 2.35% 증가되고 최신 관련연구 방법보다 14.93% 감소되었다. 이와 같이 향상된 결과는 본 연구의 실험을 통해 입증하였다.

HDR/WCG 비디오와 3D 오디오를 지원하는 초고품질 방송서비스와 고정 UHD/이동 HD 방송 서비스를 제공하는 ATSC 3.0 기반 UHDTV 방송 시스템 개발 (Development of ATSC3.0 based UHDTV Broadcasting System providing Ultra-high-quality Service that supports HDR/WCG Video and 3D Audio, and a Fixed UHD/Mobile HD Service)

  • 기명석;석진욱;백승권;장대영;이태진;김휘용;오혜주;임보미;배병준;김흥묵;최진수
    • 방송공학회논문지
    • /
    • 제22권6호
    • /
    • pp.829-849
    • /
    • 2017
  • TV디스플레이 대형화, 방송과 통신의 융합화, 신호 압축 및 전송 기술의 고도화로 인해 지상파 디지털 방송은 초고품질 방송, 하이브리드 방송, 고정UHD/이동HD 동시방송을 제공할 수 있는 UHD 방송으로 진화하고 있다. 이러한 지상파 UHDTV 방송을 위한 국내 표준은 북미의 차세대 방송 표준인 ATSC3.0을 근간으로 하고 있다. ATSC3.0은 비디오 압축 표준으로 HEVC 비디오 부호화 표준을, 오디오 압축 표준으로는 MPEG-H 3D 오디오 부호화 표준을 채택하고 있다. 또한 방송망과 IP망에서의 운용을 위해 기존의 MPEG-2 TS 방식을 대신하여 IP기반의 ROUTE/DASH와 MMT를 전송 포맷으로 채택하고 있으며, 4K UHD 방송과 이동 HD 서비스를 동시에 제공하기 위한 다중화 기술을 도입하고 있다. 본 논문에서는 ATSC3.0을 기반으로 HDR/WCG 지원 고품질 비디오 서비스, 10.2채널/4객체 지원 입체음향 서비스, 고정 UHD와 이동 HD 동시방송 서비스를 제공하기 위해 필요한 오디오/비디오 부호화기, ROUTE/DASH 패키저, 다중화 시스템과 물리계층 송수신을 위한 ATSC 3.0 LDM 시스템을 구현하고, 이를 실시간 방송 송수신 환경에 적용하여 서비스 가능성을 검증하고자 하였다.

시·공간적 주변 블록들의 움직임을 이용하여 적응적으로 탐색 범위 조절을 하는 고속 움직임 추정 (Fast Motion Estimation with Adaptive Search Range Adjustment using Motion Activities of Temporal and Spatial Neighbor Blocks)

  • 이상학
    • 한국전자통신학회논문지
    • /
    • 제5권4호
    • /
    • pp.372-378
    • /
    • 2010
  • 시 공간적으로 인접한 주변 블록들의 움직임 정보들을 이용하여 적응적으로 탐색 범위를 조절하는 고속 움직임 추정 기법을 제안한다. 기존의 탐색 범위 조절을 통한 고속 움직임 추정 기법들은 참조 프레임에 있는 모든 블록들의 움직임 벡터들 중에서 최댓값을 이용하여 현재 블록의 탐색 범위 조절을 하기 때문에 움직임이 작은 블록들에 대해서는 최적의 탐색 범위 조절을 못할 수 있다. 본 논문에서는 참조 프레임과 현재 프레임에서 현재 블록과 인접한 주변 블록들의 움직임 정보를 동시에 고려하여 최적의 탐색 범위를 결정하여 움직임 추정을 고속으로 할 수 있는 움직임 추정 기법을 제안한다. 시간적으로 인접된 블록들 즉 참조 프레임에 있는 주변 블록들의 움직임 정보를 이용하면 움직임이 작은 블록의 탐색 범위의 크기를 적절하게 작게 할 수 있어 고속의 움직임 추정을 할 수 있다. 실험을 통하여 본 논문에서 제안한 시 공간적 주변 블록들의 움직임 정보를 이용하는 탐색 범위 조절을 통한 고속 움직임 추정 기법이 비트율과 움직임 추정 오차는 거의 비슷하게 유지하면서 기존의 방법인 Simple Dynamic Search Range(SDSR) 기법보다 탐색 점의 수를 약 15% 더 감소시킬 수 있음을 확인하였다.

스케일러블 동영상 부호화를 위한 적응적 GOP 구조에 관한 연구 (A Study on Adaptive GOP Structure for SVC)

  • 정세윤;박민우;박광훈;김규헌;홍진우
    • 방송공학회논문지
    • /
    • 제10권4호통권29호
    • /
    • pp.463-473
    • /
    • 2005
  • 본 논문에서는 JVT에서 표준화가 진행중인 스케일러블 동영상 부호화의 부호화 효율을 높이기 위해 영상 시퀀스의 시간적변환 특성을 고려하여 적응적으로 GOP의 크기를 선택하여 부호화를 하는 방법을 제안한다. 일반적으로 SVC에서는 한 영상 시퀀스에 대해서 GOP의 크기를 고정하여 부호화를 하는데, GOP의 크기와 영상 시퀀스의 시간적 특성에 따라 부호화 효율이 변하게 된다. 이에 비디오 시퀀스의 지역적인 시간적 특성에 따라 GOP의 크기를 적응적으로 가변 하여 부호화하는 방식을 제안한다. 실험 결과 제안된 적응적 GOP 구조 (Adaptive GOP Structure) 부호화 방법의 부호화 효율이 개선되었으며, Crew 시퀀스에서는 0.63dB 가 향상되었다.