• 제목/요약/키워드: additional coding tools

검색결과 6건 처리시간 0.019초

H.264/AVC에서 3차원 변환에 기반을 둔 효율적인 동영상 압축 방법 (The Efficient Coding Tools based 3-Dimensional Transform in H.264/AVC)

  • 조재규;조혜정;이진호;정세윤;안창범;오승준
    • 방송공학회논문지
    • /
    • 제15권3호
    • /
    • pp.434-453
    • /
    • 2010
  • 본 논문에서는 H.264/AVC에서 사용하는 정수형 변환을 $4{\times}4$ 블록 단위로 적용하고 인접 네 개의 $4{\times}4$ 블록의 같은 주파수 위치의 계수값을 모아서 추가로 $4{\times}1$ 블록 단위로 1차원 변환하는 3차원 변환(3DT : Dimensional Transform)을 기반으로 부호화 방법을 통합한 환경인 3DTE(3DT Environment)를 제안한다. 제안하는 방법에서 사용하는 변환인 3DT는 H.264/AVC가 가지는 예측오차를 유지하면서 인접블록 간에 남아있을 공간적 중복도를 추가로 줄일 수 있고 이와 같은 특성에 적합한 방법을 적용하였다. 본 논문의 실험에서 제안하는 방법은 JM11.0과 비교 실험했을 때 대표적인 시험 시퀀스에 대하여 High profile 환경에서 평균적으로 약 3.58% 정도의 비트율 절감을 얻었다. 특히 HD급과 같이 해상도가 높은 영상에서 평균 약 5.40% 정도의 높은 비트율 절감을 보였다.

Low-Complexity MPEG-4 Shape Encoding towards Realtime Object-Based Applications

  • Jang, Euee-Seon
    • ETRI Journal
    • /
    • 제26권2호
    • /
    • pp.122-135
    • /
    • 2004
  • Although frame-based MPEG-4 video services have been successfully deployed since 2000, MPEG-4 video coding is now facing great competition in becoming a dominant player in the market. Object-based coding is one of the key functionalities of MPEG-4 video coding. Real-time object-based video encoding is also important for multimedia broadcasting for the near future. Object-based video services using MPEG-4 have not yet made a successful debut due to several reasons. One of the critical problems is the coding complexity of object-based video coding over frame-based video coding. Since a video object is described with an arbitrary shape, the bitstream contains not only motion and texture data but also shape data. This has introduced additional complexity to the decoder side as well as to the encoder side. In this paper, we have analyzed the current MPEG-4 video encoding tools and proposed efficient coding technologies that reduce the complexity of the encoder. Using the proposed coding schemes, we have obtained a 56 percent reduction in shape-coding complexity over the MPEG-4 video reference software (Microsoft version, 2000 edition).

  • PDF

MPEG-4 ALS - The Standard for Lossless Audio Coding

  • Liebchen, Tilman
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.618-629
    • /
    • 2009
  • The MPEG-4 Audio Lossless Coding (ALS) standard belongs to the family MPEG-4 audio coding standards. In contrast to lossy codecs such as AAC, which merely strive to preserve the subjective audio quality, lossless coding preserves every single bit of the original audio data. The ALS core codec is based on forward-adaptive linear prediction, which combines remarkable compression with low complexity. Additional features include long-term prediction, multichannel coding, and compression of floating-point audio material. This paper describes the basic elements of the ALS codec with a focus on prediction, entropy coding, and related tools and points out the most important applications of this standardized lossless audio format.

몰입형 비디오 압축을 위한 스크린 콘텐츠 코딩 성능 분석 (Screen Content Coding Analysis to Improve Coding Efficiency for Immersive Video)

  • 이순빈;정종범;김인애;이상순;류은석
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.911-921
    • /
    • 2020
  • 최근 MPEG-I (Immersive) 그룹에서는 몰입형 비디오(Immersive Video)에 대한 표준화 프로젝트를 통해 압축 성능 탐색을 진행하고 있다. MIV(MPEG Immersive Video) 표준 기술은 다수의 시점 영상과 깊이 맵을 통한 깊이 맵 기반 이미지 렌더링(DIBR)을 바탕으로 제한적인 6DoF을 제공하고자 하는 기술이다. 현재 MIV에서는 바탕 시점(Basic View)과 각 시점의 고유한 영상 정보를 패치 단위로 모아둔 추가 시점(Additional View)으로 처리하는 모델을 채택하고 있다. MIV에서 생성된 아틀라스는 포함되는 시점의 성격에 따라 다른 영상의 특성을 나타내어 비디오 코덱의 압축 효율에 대한 고찰이 필요하다. 따라서 본 논문에서는 다양한 시점과 패치들이 반복되는 패턴에 착안하여 화면 내 블록 카피(IBC: intra block copy) 등의 압축 기법이 포함된 스크린 콘텐츠 코딩 툴에 대한 성능 비교 분석을 진행하여 복원 영상에서 최대 -15.74% Peak Signal-to-Noise Ratio (PSNR) 관점에서의 부호화 성능 향상을 제공하였다.

알고리즘적 사고 중심 프로그래밍 활동을 위한 교육용 텐저블 코딩 도구 개발 (Development of an Educational Tangible Coding Tools for Algorithmic Thinking Focused on Programming Activities)

  • 심재권;권대용
    • 컴퓨터교육학회논문지
    • /
    • 제22권6호
    • /
    • pp.11-18
    • /
    • 2019
  • 4차 산업혁명에 대응하기 위한 인재양성을 목적으로 초등학교에서부터 소프트웨어 교육을 필수적으로 수행하고 있다. 소프트웨어 교육은 알고리즘적 사고의 향상을 위해 컴퓨팅을 기반으로 문제해결 절차를 설계하고, 코딩하여 결과를 확인하는 프로그래밍 활동을 제공하고 있다. 일반적으로 프로그래밍 활동에서는 언플러그드 활동을 통해 알고리즘을 설계하고, 이후 코딩하는 단계로 진행된다. 하지만 학생은 알고리즘 설계 활동과 코딩 활동이 중복되는 것처럼 느낄 수 있으며 코딩에 사용되는 도구의 사용법에 따라 설계한 내용과 표현이 다를 수 있어 인지적 부담이 발생할 수 있다. 본 연구에서는 언플러그드 활동에서 설계한 알고리즘을 직관적으로 소스 코드로 변환하여 실행시킬 수 있는 교육용 텐저블 코딩 도구를 제안하고자 한다. 제안하는 도구는 종이 블록을 조합하는 언플러그드 활동을 통해 알고리즘을 설계하고, 사진을 찍어 코드로 변환하여 실행된 결과를 확인할 수 있도록 개발하였고 초등학생을 대상으로 사용성을 검증하였다.

딥 러닝 기반의 이미지와 비디오 압축 기술 분석 (A Technical Analysis on Deep Learning based Image and Video Compression)

  • 조승현;김연희;임웅;김휘용;최진수
    • 방송공학회논문지
    • /
    • 제23권3호
    • /
    • pp.383-394
    • /
    • 2018
  • 본 논문에서는 최근 활발히 연구되고 있는 딥 러닝 기반의 이미지와 비디오 압축 기술에 대해 살펴본다. 딥 러닝 기반의 이미지 압축 기술은 심층 신경망에 압축 대상 이미지를 입력하고 반복적 또는 일괄적 방식으로 은닉 벡터를 추출하여 부호화한다. 이미지 압축 효율을 높이기 위해 심층 신경망은 복원 이미지의 화질은 높이면서 부호화된 은닉 벡터가 보다 적은 비트로 표현될 수 있도록 학습된다. 이러한 기술들은 특히 저 비트율에서 기존의 이미지 압축 기술에 비해 뛰어난 화질의 이미지를 생성할 수 있다. 한편, 딥 러닝 기반의 비디오 압축 기술은 압축 대상 비디오를 직접 입력하여 처리하기 보다는 기존 비디오 코덱의 압축 툴 성능을 개선하는 접근법을 취하고 있다. 본 논문에서 소개하는 심층 신경망 기술들은 최신 비디오 코덱의 인루프 필터를 대체하거나 추가적인 후처리 필터로 사용되어 복원 영상의 화질 개선을 통해 압축 효율을 향상시킨다. 마찬가지로, 화면 내 예측 및 부호화에 적용된 심층 신경망 기술들은 기존 화면 내 예측 툴과 함께 사용되어 예측 정확도를 높이거나 새로운 화면 내 부호화 과정을 추가함으로써 압축 효율을 향상 시킨다.