• 제목/요약/키워드: hm 트리

검색결과 18건 처리시간 0.03초

부화소 움직임 추정의 선택적 수행을 통한 HEVC 부호화 고속화 (Adaptive Fractional Pel Motion Estimation for Fast HEVC Encoding)

  • 목정수;안용조;심동규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.268-270
    • /
    • 2014
  • 본 논문은 FME (Fractional Motion Estimation)의 선택적 수행을 통한 HEVC (High Efficiency Video Coding)의 부호화 고속화 방법을 제안한다. HEVC 는 H.264/AVC 에 비해 약 2 배의 압축 효율을 보이지만, 쿼드트리 구조의 재귀적 호출은 복잡도를 크게 증가시켰다. 이러한 이유로 인하여 HEVC 부호화기의 고속 모드 결정 및 고속화 연구가 활발히 진행되고 있다. 본 논문에서는 HEVC 부호화기 중 가장 높은 복잡도를 갖는 화면 간 예측 모드의 부화소 움직임 추정 (FME: Fractional Motion Estimation)의 선택적 수행을 통하여 부호화기를 고속화하는 방법을 제안한다. 제안하는 방법을 HEVC 레퍼런스 소프트웨어인 HM-12.0 에 적용하여 평균 2.0%의 BD-BR 가 증가하였으나, 평균 36.0%의 부호화 시간 감소 효과를 얻을 수 있었다.

  • PDF

Sub-CBF를 이용한 HEVC의 고속 PU 결정 기법 (Fast PU Decision Method Using Sub-CBF in HEVC)

  • 장재규;최호열;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.194-196
    • /
    • 2014
  • HEVC(High Efficiency Video Coding)는 재귀적 쿼드트리 분할 구조의 부호화단위(CU: Coding Unit)와 각 CU에서 다양한 예측단위(PU: Prediction Unit)를 제공하고, 율-왜곡 기반으로 최적의 CU와 PU를 결정함으로써 높은 부호화 효율을 얻을 수 있는 반면 부호화 복잡도 또한 크게 증가하는 문제가 있다. 본 논문에서는 부호화기의 복잡도를 감소시키기 위해 상위깊이의 부호화 정보를 이용한 고속 부호화 기법을 제안한다. 제안기법은 상위깊이 CU의 Sub-CBF(coded block flag)를 이용하여 현재깊이 CU에서의 PU를 조기 결정하여 PU 탐색을 고속화 한다. 또한 화면내(Intra) 예측 고속화를 위하여 현재 CU의 sub-CBF를 함께 사용하여 하위깊이에서의 화면내 예측을 생략한다. 실험결과 제안기법은 HM 14.0 대비 1.2%의 BD-rate 증가에 31.4%의 부호화 시간 감소 효과를 얻을 수 있었다.

  • PDF

HEVC 부호화기에서 CU 정보 병합 알고리즘을 이용한 빠른 CU 부호화 방법 (Fast encoding algorithm using CU merge scheme in HEVC)

  • 이재영;한종기
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.361-364
    • /
    • 2012
  • MPEG과 ITU-T에서 최근 표준화가 진행되고 있는 HEVC는 H.264/AVC에 비해, CU(coding unit), PU(prediction unit), TU(transform unit)의 다양한 형태 분할 단위를 갖는 것을 큰 특징으로 한다. 이 중, CU와 TU는 쿼드트리 형태의 재귀적 분할 구조를 가지도록 구성되는데, 압축 효율은 향상시키지만 높은 부호화 복잡도를 갖는 단점이 있다. 본 논문에서는 이러한 재귀적 분할 구조를 변환하여 가장 작은 CU의 정보를 병합하여 큰 CU의 정보를 빠르게 결정하는 방법을 제안한다. 제안한 방법을 HEVC의 CU 부호화에 적용한 결과, 부호화 복잡도를 32-45% 가량 감소시키면서 압축 효율 하락은 0.6-0.9%로 억제할 수 있었다. 또한, HM6.1에 구현되어 있는 고속 탐색 알고리즘과 비교 할 경우, 압축 효율 하락을 0.2-0.3%로 억제하면서 부호화 복잡도를 8-12% 감소시킬 수 있었다.

  • PDF

124-Mpixels/sec 하드웨어 HEVC 인코더의 화면간 예측 구현 (Implementation of Inter Prediction for 124-Mpixels/s Hardware HEVC Encoders)

  • 조승현;김현미;이석호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.1-3
    • /
    • 2014
  • 본 논문에서는 하드웨어 HEVC 인코더의 화면간 예측의 구조를 제안한다. 제안된 화면간 예측은 정수화소 움직임 예측을 통해 코딩 트리 유닛 내 코딩 유닛 분할과 각 코딩 유닛의 분할모드를 결정한다. 그리고, 부화소 움직임 예측, Merge모드 판단을 통해 예측 유닛의 움직임 벡터를 확정하고 움직임 보상을 수행한다. 이 과정에서 율-왜곡 비용계산 및 보간 필터 등의 하드웨어 자원이 효율적으로 공유된다. 또한, 전력소모를 줄이기 위하여 코딩 유닛의 skip 여부의 조기 판단을 통해 부화소 움직임 예측 및 화면내-화면간 최종 예측모드 결정과정의 전부 또는 일부를 생략하는 방법을 제공한다. 제안된 화면간 예측을 포함한 하드웨어 HEVC 인코더를 구현하여 실험한 결과, 250 MHz 의 동작 주파수에서 초당 124 Mpixel 의 처리성능을 보였으며, HM-14.0 대비 PSNR 0.5~0.8 dB 수준의 화질열화를 나타냈다.

  • PDF

HEVC의 재귀적 CU 구조에 대한 조건부 확률 기반 고속 탐색 알고리즘 (Conditional Probability Based Early Termination of Recursive Coding Unit Structures in HEVC)

  • 한우진
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.354-362
    • /
    • 2012
  • MPEG과 ITU-T에서 최근 표준화가 진행되고 있는 HEVC는 H.264/AVC에 비해, CU(coding unit), PU(prediction unit), TU(transform unit)의 다양한 형태 분할 단위를 갖는 것을 큰 특징으로 한다. 이 중, CU와 TU는 쿼드트리 형태의 재귀적 분할 구조를 가지도록 구성되는데, 압축 효율은 향상시키지만 높은 부호화 복잡도를 갖는 단점이 있다. 본 논문에서는 이러한 재귀적 분할 구조에서의 rate-distortion cost를 조건부 확률을 이용한 통계적 분석 방법을 사용하여, 분할이 일어나는 경우와 그렇지 않은 경우로 분류하는 방법을 제안한다. 제안한 방법을 HEVC의 재귀적 CU 부호화에 적용한 결과, 부호화 복잡도를 32% 가량 감소시키면서 압축 효율하락은 0.4-0.5%로 억제할 수 있었다. 또한, HM4.0에 구현되어 있는 고속 탐색 알고리즘과 함께 사용하는 경우, 압축 효율 하락을 0.9%로 억제하면서 부호화 복잡도를 1/2로 감소시킬 수 있었다.

음성의 시간변이와 상태분할을 고려한 강건한 문맥의존 음향모델에 관한 연구 (A study on the robust context-dependent acoustic models by considering the state splitting and the time variant of speech)

  • 오세진;김광동;노덕규;정현열
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.229-231
    • /
    • 2003
  • 일반적으로 음성은 시간함수로 표현되며 음성인식에서 표준모델을 모델링하는 것은 매우 중요한 문제이다. 음절 단어, 연속음성을 발성할 때 자음과 모음에 따라 발성시간에 차이가 있으며 이를 잘 모델링하는 것 또한 음성인식에서는 중요한 문제라고 할 수 있다. 따라서 본 연구에서는 강건한 음향모델을 학습하기 위해 시간의 변화와 상태분할과정에서의 모델의 변화를 고려하여 다양한 구조의 초기모델을 작성하였다. 각 초기모델에 의한 HM-Net 문맥의존 음향모델은 음소결정트리 기반 SSS 알고리즘(PDT-SSS)을 이용하였다. PDT-SSS 알고리즘은 미지의 문맥정보를 해결하기 위해 문맥방향과 시간방향으로 목표 상태수에 도달할 때까지 상태분할을 수행하여 모델을 작성하는 방법이다. 음성의 시간변이를 고려한 강건한 문맥의존 음향모델을 작성하기 위해 설정한 각 모델의 구조에 대한 유효성을 확인하기 위해 국어공학센터의 452 단어를 대상으로 음소와 단어인식 실험을 수행한 결과. 음소인식의 경우 상태수 2000개에서 2상태 구조의 모델에 비해 4상태 구조가 약 11.4% 향상된 인식성능과 39.2초의 인식시간을 단축할 수 있었다. 또한 단어인식의 경우 상태수 2000개에서 1상태 구조의 모델에 비해 4상태 구조가 약 5% 향상된 인식성능과 4상태 구조에서 한 단어를 인식하는데 평균 0.8초가 소요되었다. 따라서 강건한 문맥의존 음향모델을 작성하기 위해 수행한 초기모델의 구조에 관한 연구가 향후 음성인식 시스템을 구축하는데 유효함을 확인할 수 있었다.

  • PDF

상위깊이의 Sub-CU 부호화 정보를 이용한 HEVC의 고속 PU 결정 기법 (Fast PU Decision Method Using Coding Information of Co-Located Sub-CU in Upper Depth for HEVC)

  • 장재규;최호열;김재곤
    • 방송공학회논문지
    • /
    • 제20권2호
    • /
    • pp.340-347
    • /
    • 2015
  • HEVC(High Efficiency Video Coding)는 재귀적 쿼드트리 분할구조의 부호화단위(CU: Coding Unit)와 각 CU에서 다양한 예측단위(PU: Prediction Unit)를 제공하고, 율-왜곡 기반으로 최적의 CU 분할구조와 PU 모드를 결정함으로써 높은 부호화 효율을 얻을 수 있는 반면 복잡도 또한 크게 증가하는 문제가 있다. 본 논문에서는 부호화기의 복잡도를 감소시키기 위해 상위깊이의 부호화 정보를 이용한 다음 세 가지의 PU 모드 고속 결정 기법을 제안한다. 첫 번째 방법은 상위깊이 CU의 sub-CBF(Coded Block Flag)를 이용하여 현재깊이 CU에서의 PU 모드를 조기 결정하여 PU 탐색을 고속화 한다. 두 번째 방법은 화면내(Intra) 예측 고속화를 위하여 상위 CU의 sub-Intra 율-왜곡 비용을 이용하여 현재깊이에서의 화면내 예측을 생략한다. 마지막 방법으로는 화면내 예측 고속화를 위하여 현재 CU의 sub-CBF를 함께 사용하여 하위깊이에서의 화면내 예측을 생략한다. 실험결과 제안 방법은 HM 14.0 대비 각각 1.2%, 0.11%, 0.9%의 BD-rate 증가에 31.4%, 2.5%, 23.4%의 부호화 시간 감소 효과를 얻을 수 있었다. 제안된 3가지 방법은 화면간 및 화면내 예측에 적용되는 것으로 결합하여 적용될 수 있으며, 이 경우 1.9%의 BD-rate 증가에 34.2%의 부호화 시간 감소를 얻었다.

쿼드트리 구조와 SATD를 이용한 HEVC 인코더의 고속 인트라 예측 방식 (A Fast Intra Prediction Method Using Quadtree Structure and SATD in HEVC Encoder)

  • 김영조;김재석
    • 전자공학회논문지
    • /
    • 제51권3호
    • /
    • pp.129-138
    • /
    • 2014
  • 본 논문은 HEVC(high efficiency video coding) 인코더의 인코딩 시간을 줄이기 위한 고속 인트라 예측 방식을 제안한다. 제안하는 고속 인트라 예측 방식은 쿼드트리 구조와 SATD(Sum of Absolute Transformed Differences)를 사용한다. HEVC는 $8{\times}8$ 이상의 블록에서 SATD 값을 구하기 위해 $8{\times}8$ hadamard 변환을 이용한 $8{\times}8$ SATD 값을 사용한다. 제안하는 방식은 $16{\times}16$ 이상의 블록에서 각각의 $8{\times}8$ SATD 결과를 이용해서 최적 SATD 값을 산출한다. 그 후, RDO를 위한 후보 모드의 SATD와 산출된 최적 SATD의 비교를 기반으로 후보 모드를 제거한다. 후보 모드를 제거함으로써 제안하는 방식은 RDO의 연산을 줄이고 전체 인코딩 시간을 줄이게 된다. 제안하는 방식은 $8{\times}8$ 블록에서는 추가로 $4{\times}4$ SATD를 사용하여 최적 SATD를 구한다. 실험 결과 제안하는 방식은 거의 압축 성능 손실 없이 HM 12.1에 비해 5.33%의 인코딩 시간 감소 효과를 얻을 수 있었다.