• 제목/요약/키워드: video compression.

검색결과 778건 처리시간 0.03초

H.264에서 성능향상을 위한 Uni-directional 8X8 인트라 예측 (Uni-directional 8X8 Intra Prediction for H.264 Coding Efficiency)

  • 국승용;박광훈;이윤진;심동규;정광수;최해철;최진수;임성창
    • 방송공학회논문지
    • /
    • 제14권5호
    • /
    • pp.589-600
    • /
    • 2009
  • 본 논문은 초 고화질급(UHD) 영상으로 디지털화 되어 가는 시대에 대응하기 위하여, 현재 우리가 사용하고 있는 최신 코덱의 하나인 H.264 코덱 구조에서 인트라 예측 성능을 향상토록 한 Uni-directional $8{\times}8$ 인트라 예측 기반 코덱을 개발하여 앞으로의 동영상 압축 개발에 기여하고자 한다. Uni-directional $8{\times}8$ 인트라 예측은 $8{\times}8$ 픽셀 단위의 인트라 예측 시 $4{\times}4$ 픽셀 단위로 나누어 같은 인트라 예측방향을 사용하면서 $4{\times}4$ 픽셀 단위로 재구성된 영상을 통하여 예측을 세밀하게 할 수 있게 하는 아이디어를 기반으로 한다. 본 논문에서 제안한 Uni-directional $8{\times}8$ 인트라 예측은 H.264 코덱 구조에서 기존의 $8{\times}8$ 인트라 예측만을 수행한 코딩 결과와 비교할 경우 QCIF, CIF에서 약 7.3% BDBR 성능 향상을 가져오며, 현재의 H.264 코덱 구조에 더하여 적용하였을 경우, 약 1.3% BDBR 성능 향상을 가져왔다. 더 큰 영상 사이즈를 압축하기 위해서는 지금 영상 사이즈에 최적화 된 코덱을 그대로 쓰기보다는 지금보다 더 큰 블록 사이즈를(현재는 $4{\times}4$ 블록 단위가 최소 단위) 기준으로 할 수도 있기 때문에 새로운 코덱기술 개발에 있어 기초 연구가 될 수 있을 것이다.

H.264/AVC에서 향상된 인트라/인터 예측을 위한 모드 추정 방법 (Enhanced Mode Estimation Method for Intra/Inter Prediction in H.264/AVC)

  • 박경석;김민준;전재현;류상률;김승호
    • 한국산학기술학회논문지
    • /
    • 제13권4호
    • /
    • pp.1830-1838
    • /
    • 2012
  • H.264/AVC에서는 인트라 예측과 인터 예측의 움직임 추정은 전체 압축 시간의 70 ~ 80%를 차지하게 된다. 다양한 부호화 기술을 이용하여 압축 효율은 높아지지만 복잡도가 증가하여 부호화 시간이 증가하게 되었다. 따라서 본 논문에서는 H.264 부호화 과정 중 화질 손실을 최소한으로 줄이면서 소모되는 시간을 단축시키는 인트라 예측의 블록크기 결정방법과 모드 결정방법을 제안하고자 한다. 추가적으로 계산량을 줄이기 위해 인터 예측의 움직임 추정을 위해 적응적으로 탐색방법을 결정하는 알고리즘을 제시하고자 한다. 실험을 통해 화질의 열화와 계산량을 측정하기 위해서 PSNR과 인트라 예측 및 인터 예측 계산 시 소모되는 시간을 알아보았다. 그 결과, 3가지 방법을 모두 사용 했을 때, 기존의 H.264방법과 비교하여 화질은 거의 비슷하게 유지하면서 실험한 모든 영상의 경우 모든 프레임에서 평균 500 ~ 600ms정도의 부호화 시간이 단축됨을 보였다.

H.264/AVC의 효율적인 파이프라인 구조를 적용한 CABAC 하드웨어 설계 (Efficient Pipeline Architecture of CABAC in H.264/AVC)

  • 최진하;오명석;김재석
    • 대한전자공학회논문지SD
    • /
    • 제45권7호
    • /
    • pp.61-68
    • /
    • 2008
  • 본 논문에서는 최신 동영상 압축 기술인 H.264/AVC (Advanced Video Coding)에서 엔트로피 코딩 방법 중 하나로 사용되는 CABAC (Context Adaptive Binary Arithmetic Coding)의 하드웨어 구현과 부호화 처리율을 높이기 위한 알고리즘 및 구조를 제안한다. CABAC는 CAVLC에 비해 쳐대 15%까지 더 나은 압축효율을 낼 수 있는 장점을 가지고 있지만 연산의 복잡도는 훨씬 높아진다. 특히 부호화 과정 중 데이터 사이의 의존도가 높기 때문에 연산과정의 복잡도가 더욱 증가하게 된다. 따라서 연산양을 줄이기 위한 다양한 구조가 제안되었으나, 여전히 데이터의 의존도에 의한 부호화에 latency가 존재하게 된다. 본 논문에서는 이진 산술 부호화의 첫 단계인 확률 값을 계산하는데 필요한 range의 7, 8번째 비트를 빠르게 계산하는 구조와 부호화할 심벌이 MPS인 경우 부호화 단계를 한 단계 줄일 수 있는 구조를 제안하였다. 제안된 구조를 적용하여, 6가지 시퀀스에 대하여 실험한 결과 기존의 구조에 비해 약 27-29%의 수행시간을 줄일 수 있었다. 또한 제안된 구조를 하드웨어로 구현한 결과 0.18um standard library에서 19K gate를 사용하였다.

DCT-기반 영상/비디오 보안을 위한 암호화 기법 및 하드웨어 구현 (Ciphering Scheme and Hardware Implementation for MPEG-based Image/Video Security)

  • 박성호;최현준;서영호;김동욱
    • 대한전자공학회논문지SP
    • /
    • 제42권2호
    • /
    • pp.27-36
    • /
    • 2005
  • 년 논문에서는 MPEG과 JPEG, H.26X 계열 등의 DCT-기반 영상/비디오 컨텐츠에 효과적인 암호화 방법을 제안하였고, 이를 최적화된 하드웨어로 구현하여 고속동작이 가능하도록 하였다. 영상/비디오의 압축, 복원 및 암호화로 인한 많은 연산량을 고려하여 영상의 중요한 정보(DC 및 DPCM계수)만을 암호화 대상 데이터로 선정하여 부분 암호화를 수행하였다. 그 결과 암호화에 소요되는 비용은 원 영상 전체를 암호화하는 비용이 감소하였다. 여기서 Nf는 GOP내의 프레임수이고 PI는 B와 P 프레임에 존재하는 인트라 매크로블록의 수이다. 암호화 알고리즘으로는 다중모드 AES, DES, 그리고 SEED를 선택적으로 사용할 수 있도록 하였다. 제안한 암호화 방법은 C++로 구현한 소프트웨어와 TM-5를 사용하여 약 1,000개의 영상을 대상으로 실험하였다 그 결과 부분 암호화된 영상으로부터 원 영상을 추측할 수 없어 암호화 효과가 충분함을 확인하였으며, 이 때 암호화에 의한 압축률 감소율은 $1.6\%$에 불과하였다. Verilog-HDL로 구현한 하드웨어 암호화 시스템은 하이닉스 $0.25{\mu}m$ CMOS 팬텀-셀 라이브러리를 사용하여 SynopsysTM의 디자인 컴파일러로 합성함으로써 게이트-수준 회로를 구하였다. 타이밍 시뮬레이션은 CadenceTM의 Verilog-XL을 이용해서 수행한 결과 100MHz 이상의 동자 주파수에서 안정적으로 동작함을 확인하였다. 따라서 제안된 암호화 방법 및 구현된 하드웨어는 현재 중요한 문제로 대두되고 있는 종단간(end-to-end) 보안에 대한 좋은 해결책으로 유용하게 사용될 수 있으리라 기대된다.

분할영역의 3차원 스캐닝을 이용한 홀로그래픽 비디오 신호의 효율적인 부호화 기술 (An Efficient Coding Technique of Holographic Video Signal using 3D Segment Scanning)

  • 서영호;최현준;김동욱
    • 한국통신학회논문지
    • /
    • 제32권2C호
    • /
    • pp.132-140
    • /
    • 2007
  • 본 논문에서는 디지털화된 형태로 취득 및 저장된 홀로그램 신호를 부호화하는 새로운 기술을 제안한다. 디지털 홀로그램의 독특한 특성을 파악하여 적절한 형태의 데이터로 변환한 후에 현재 널리 사용되고 있는 표준 압축 기술들에 적용하고자 한다. 전처리과정 이후에 부호화를 위해 추출된 홀로그램은 위치적인 다시점 특성을 이용하여 분할된다. 분할된 홀로그램은 2차원의 여러 시점에서 객체를 촬영한 것과 유사한 특성을 보인다. 시각적으로 잡음과 유사한 형태로 관찰되는 홀로그램의 회절 패턴은 그 자체로써 압축에 이용하기 어렵다. 따라서 홀로그램 생성 원리와 유사하면서 고속 변환이 가능한 2차원 DCT (Discrete Cosine Transform)를 이용하여 분할된 홀로그램을 주파수 변환한다. 주파수 변환된 분할 영역들은 시간적 및 공간적 상관도에 따라서 3차원 스캔 과정을 거치면서 하나의 비디오 스트림으로 구성된다. 비디오 스트림의 한 프레임에 해당하는 분할된 영역들은 다양한 범위를 가지는 계수들로 구성되는데 이를 재구성한 후에 부호화 알고리즘을 이용하여 압축한다. 실험 결과를 살펴보면 제안한 알고리즘은 기존의 기술에 비해서 16배 이상의 높은 압축율에서 더 좋은 복원 성능을 보였다.

2차원 비트율-왜곡 모델을 이용한 매크로블록 단위 비트율 제어 (A Macroblock-Layer Rate Control for H.264/AVC Using Quadratic Rate-Distortion Model)

  • 손남례;이귀상;임창훈
    • 한국통신학회논문지
    • /
    • 제32권9C호
    • /
    • pp.849-860
    • /
    • 2007
  • H.264/AVC부호화 방식이 압축성능이 뛰어나더라도 가변길이부호화방식을 따르기 때문에 동영상을 부호화할 때 발생하는 데이터량은 시간의 흐름에 따라 큰 폭으로 변할 수 밖에 없다. 따라서 부호화된 비디오 비트스트림을 고정된 저대역폭의 네트워크를 통해 실시간으로 전송하고자 할 경우에는 부호기로부터 출력되는 비트율을 반드시 제어할 필요가 있다. 기존의 비트율 제어 알고리즘은 각 프레임당 목표 비트를 결정하는 2차원 비트율-왜곡 모델을 채택하고 있다. 본 논문에서는 전송율이 고정된 비디오 채널에서 H.264/AVC 부호화 기법으로 압축된 동영상을 전송할 때 움직임이 많은 영상의 비트율을 보다 효율적으로 제어하는 알고리즘을 제시한다. 제안된 비트율 제어 알고리즘은 2차원 비트율-왜곡 모델식을 이용하여 이전 프레임의 매크로블록과 현재 프레임의 매크로블록간에 움직임 변화량을 예측함으로써 매크로블록 단위로 비트율을 제어한다. 움직임이 많고 장면전환이 빈번한 동영상 샘플을 대상으로 비교 실험한 결과, 비트율 제어의 경우 기존의 알고리즘은 채널전송 환경에 부적합하게 비트율을 초과하지만, 새롭게 제안한 알고리즘은 채널전송에 적합하게 부호화됨을 확인할 수 있었다. 화질 또한 제안한 방법이 기존의 비트율 제어 방법보다 평균적으로 $0.4{\sim}0.9\;dB$로 높게 나타남을 확인하였다.

VVC의 화면간 가중 양예측(BCW)을 위한 효율적인 가중치 시그널링 기법 (An Efficient Weight Signaling Method for BCW in VVC)

  • 박도현;윤용욱;이진호;강정원;김재곤
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.346-352
    • /
    • 2020
  • 표준화 마무리 단계인 차세대 비디오 부호화 표준 VVC(Versatile Video Coding)는 HEVC(High Efficiency Video Coding) 보다 두배 이상의 압축 성능을 달성하기 위해 다양한 기술들을 채택하고 있다. VVC는 GPB(Generalized P and B) 슬라이스에서의 양예측(bi-prediction) 기법의 성능 향상을 위하여 두 예측신호에 다양한 가중치를 적용하여 최종 예측신호를 생성하는 BCW(Bi-prediction with CU-level Weight)를 채택하였다. BCW 가중치는 가용한 참조픽처 중 재생 순서상 미래 픽처의 존재 유무를 지시하는 신택스(syntax) 요소인 NoBackwardPredFlag에 따라 적응적으로 시그널링 된다. 이러한 신택스 구조는 비디오 코덱의 유연성을 저해하고 비트스트림 파싱(parsing) 단계에서의 의존성 문제를 야기한다. 본 논문에서는 이러한 문제를 해결하기 위하여 가중치 전송에서 기존의 조건 판단 없이 가능한 모든 가중치를 허용하는 기법을 제안하였으며, 부호화기에서의 다양한 가중치 탐색을 통해 제안방법의 성능을 확인하였다. 제안된 기법은 제기된 문제를 해결하면서도 실험결과 3개의 가중치 탐색을 수행하였을 때 무시할 정도의 BD-rate 손실과 5개의 가중치 탐색을 수행하였을 때 다소의 부호화 성능 향상을 확인하였다.

MPEG-2비트열에서의 인증 및 조작위치 검출을 위한 디지털 워터마킹 기법 (Digital watermarking algorithm for authentication and detection of manipulated positions in MPEG-2 bit-stream)

  • 박재연;임재혁;원치선
    • 대한전자공학회논문지SP
    • /
    • 제40권5호
    • /
    • pp.378-387
    • /
    • 2003
  • 디지털 워터마킹은 소유권자의 정보나 특정 코드, 혹은 패턴을 디지털화 되어 있는 정지영상, 동영상, 음성 데이터 등에 인간의 시각이나 청각으로는 감지 할 수 없도록 삽입하는 기술이다. 디지털 워터마킹은 크게 강인성 워터마킹과 연성 워터마킹으로 분류 될 수 있다. 강인성 워터마킹은 이미지나 영상에 대한 소유권자의 소유권을 보호하는 것이 주된 목적이며, 연성 워터마킹은 디지털 콘텐츠를 불법적인 변형으로부터 보호하는 것이 목적이다. 특히 준 연성(semi-fragile) 워터마킹은 잡음 첨가 혹은 압축과 같은 데이터의 전송 과정에서 자주 발생하는 비의도적 변형에 대해서는 삽입된 워터마크가 제거되지 않아야 하지만 의도적 변형에 대해서는 삽입된 워터마크가 훼손되어 검출되지 않아야 한다. 본 논문에서는 이러한 요구 사항들을 만족시키는 MPEG-2 비트열에서의 인증 및 조작위치 검출을 위한 준 연성 워터마킹 알고리즘을 제안한다. 제안된 알고리즘은 두 가지의 워터마크를 양자화 된 DCT 계수에 삽입한다. 따라서 압축된 비트스트림에 직접적으로 적용할 수 있다. 첫번째 워터마크는 해쉬 함수를 사용하여 비디오 데이터에 대한 인증을 한다. 두번째 삽입되는 워터마크는 양자화 된 DCT DC 계수를 이용하며 조작위치를 검출하는데 사용한다. 제안된 알고리즘은 비트스트림 영역에서의 트랜스 코딩에 의한 비디오 데이터의 변형과 의도적인 변형을 구별 할 수 있으며 만약 비디오 데이터에 의도적인 변형이 있었을 경우 인트라 프레임에 대해서는 변형된 위치를 블록 단위로 검출 가능하다. 또한 제안된 알고리즘은 가역적 특성을 갖고 있기 때문에 비디오 데이터에 변형이 없었을 경우에는 원래의 데이터를 복원 할 수 있다.

MMT 프로토콜 기반의 360도 VR 비디오 전송을 위한 개선된 QER 선택 알고리듬 (An Advanced QER Selection Algorithm Based on MMT Protocol for 360-Degree VR Video Streaming)

  • 김아영;안은빈;서광덕
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.948-955
    • /
    • 2019
  • 360도 VR(Virtual Reality) 비디오 서비스에 대한 관심이 증가함에 따라서 대용량의 VR 비디오 데이터를 압축하여 전송하기 위한 기술이 빠르게 발전하고 있다. QER(Quality Emphasized Region) 기반의 전송 기법은 360도 VR 영상을 영역별로 나누고 차별화된 화질의 영상으로 전송함으로써 몰입감을 유지하고 대역폭의 낭비를 줄이는 뷰포트 적응적 360도 비디오 스트리밍 시스템(Viewport-Adaptive 360-Degree Video Streaming System)의 일종으로 개발되었다. 사용자 시점에 해당하는 특정 QER을 선택하기 위해서는 QEC(Quality Emphasis Center) 거리 계산 과정과 QER 전환을 요청하는 시그널링 과정이 필요하다. QEC 거리계산은 QER의 개수만큼 계산을 반복하기 때문에 클라이언트에게 높은 계산 복잡도를 요구한다. 또한 QER 전환 요청을 위한 시그널링 메시지의 전송 주기는 효율적 대역폭 사용과 원활한 QER 전환 사이에서 서로 절충적인(trade off) 관계를 갖는다. 본 논문에서는 이러한 문제를 해결하기 위해 MMT 프로토콜 기반의 개선된 QER 선택 알고리듬을 제안한다. 개선된 QER 선택 알고리듬은 미리 준비된 QER_ID_MAP을 사용하여 시스템 계산 복잡도를 줄이는 동시에, 시그널링 주기를 적응적으로 수정하여 네트워크의 부담을 최소화하고 적시에 적절하게 QER 변환이 가능하도록 제안된 방법이다.

물체탐색과 전경영상을 이용한 인공지능 멀티태스크 성능 비교 (Comparison of Artificial Intelligence Multitask Performance using Object Detection and Foreground Image)

  • 정민혁;김상균;이진영;추현곤;이희경;정원식
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.308-317
    • /
    • 2022
  • 딥러닝 기반 머신 비전 기술을 이용한 영상분석 과정에서 전송되고 저장되는 방대한 양의 동영상 데이터의 용량을 효율적으로 줄이기 위한 연구들이 진행 중이다. MPEG(Moving Picture Expert Group)은 VCM(Video Coding for Machine)이라는 표준화 프로젝트를 신설해 인간을 위한 동영상 부호화가 아닌 기계를 위한 동영상 부호화에 대한 연구를 진행 중이다. 그 중 한 번의 영상 입력으로 여러가지 태스크를 수행하는 멀티태스크에 대한 연구를 진행하고 있다. 본 논문에서는 효율적인 멀티태스크를 위한 파이프라인을 제안한다. 제안하는 파이프라인은 물체탐지를 선행해야 하는 각 태스크들의 물체탐지를 모두 수행하지 않고 한번만 선행하여 그 결과를 각 태스크의 입력으로 사용한다. 제안하는 멀티태스크 파이프라인의 효율성을 알아보기 위해 입력영상의 압축효율, 수행시간, 그리고 결과 정확도에 대한 비교 실험을 수행한다. 실험 결과 입력 영상의 용량이 97.5% 이상 감소한데 반해 결과 정확도는 소폭 감소하여 멀티태스크에 대한 효율적인 수행 가능성을 확인할 수 있었다.