• 제목/요약/키워드: image/video coding

검색결과 355건 처리시간 0.03초

계층적 깊이 영상으로 표현된 다시점 비디오에 대한 H.264 부호화 기술 (H.264 Encoding Technique of Multi-view Video expressed by Layered Depth Image)

  • 신종홍;지인호
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.43-51
    • /
    • 2014
  • 깊이 영상을 고려한 다시점 비디오는 매우 많은 양의 데이터 때문에 저장과 전송을 위해서 새로운 부호화 압축 기술 개발이 요구된다. 계층적 깊이 영상은 다시점 비디오의 효과적인 표현방법이 된다. 이 방법은 다시점 칼라와 깊이 영상을 합성하는 데이터 구조를 만들어 준다. 이 새로운 콘텐츠를 효과적으로 압축하는 방법으로 3차원 워핑을 이용한 계층적 깊이 영상 표현과 비디오 압축 부호화를 적용하는 방법을 제안하였다. 이 논문은 계층적 영상 표현을 사용한 H.264/AVC 비디오 부호화 기술의 개선된 압축 방법을 제시하여 준다. 컴퓨터 모의시험으로 좋은 압축율과 좋은 성능의 회복 영상을 얻을 수 있음을 제시하였다.

스테레오 영상에서 움직임 벡터를 이용한 고속 변이 벡터 추정 (Fast Disparity Vector Estimation using Motion vector in Stereo Image Coding)

  • 도남금;김태용
    • 대한전자공학회논문지SP
    • /
    • 제46권5호
    • /
    • pp.56-65
    • /
    • 2009
  • 스테레오 영상은 단일 영상과는 달리 오른쪽과 왼쪽, 2개의 영상으로 구성되어 있기 때문에 단일 영상에 비하여 더욱 많은 데이터량을 가지게 된다. 따라서 이를 효율적으로 처리하기 위한 영상 압축 기술이 필요하게 되었고, 이를 위해 DPCM기반의 예측 부호화 압축 기술을 대부분의 비디오 압축 표준에서 사용한다. 예측 부호화 기술의 구현을 위해 움직임 추정 및 변이 추정이 필요한데 이를 수행하는 알고리즘으로 여러 가지 비디오 코딩 표준들에서 블록 정합 알고리즘을 사용한다. 블록 정합 알고리즘 중 완전탐색 알고리즘은 기준 블록을 탐색영역 안에 존재하는 모든 블록과 비교하여 최적의 블록을 찾아낸다. 이 알고리즘은 최적의 블록을 찾을 수 있어 효율은 좋으나 많은 연산량이 단점이 된다. 본 논문에서는 스테레오 영상에서 움직임 벡터 정보와 전 프레임의 변이벡터 정보를 이용하여 고속으로 현재 프레임의 변이 벡터를 추정할 수 있는 방안을 제시한다. 변이 벡터 추정시 전역 변이 벡터를 사용하여 탐색 영역을 줄이고, 전 프레임들 사이에서 구한 변이 벡터 정보를 재사용하면서 움직임 벡터 정보를 이용하여 탐색 위치를 제한함으로 연산량을 줄여 고속의 변이 벡터 추정을 가능하게 하였다. 실험결과 제안 알고리즘은 움직임이 많은 복잡 영상 보다는 움직임이 적은 단순 영상에서의 성능이 훨씬 뛰어났으며, 움직임이 적은 단순 영상에서의 변이 벡터 추정 시에 약간의 residual 증가는 있지만 빠른 처리 속도를 제공하여 고속의 변이 벡터 추정을 가능하게 함을 확인하였다.

적응 불규칙 양자화와 반복 복호를 이용한 비디오 코딩 방식에의 응용 (Adaptive Irregular Binning and Its Application to Video Coding Scheme Using Iterative Decoding)

  • 최강선
    • 한국통신학회논문지
    • /
    • 제31권4C호
    • /
    • pp.391-399
    • /
    • 2006
  • 센서 네트워크와 같이 한정된 리소스만을 사용할 수 있는 차세대 소형 무선 비디오 시스템을 위해 움직임 추정(motion estimation)이 필요 없는 저 복잡도의 비디오 인코딩 방식과 이를 효과적으로 디코딩하는 새로운 비디오 코딩 방식을 제안한다. 비디오 프레임을 주기적으로 인트라 코딩(Intra coding)하고 인트라 코딩된 프레임 사이에 있는 프레임에 대해선 제안하는 불규칙 양자화(irregular binning) 방식을 이용하여 효과적으로 코딩한다. 불규칙 양자화 방식은 코딩할 데이터의 Local statistics에 따라 각 구간의 길이를 조절함으로써 적은 수의 불규칙적인 구간으로도 효과적으로 데이터를 표현할 수 있다. 이와 함께, 연속된 프레임 간에 존재하는 높은 상관 관계(correlation)를 활용하기 위해 디코딩 시 불규칙 양자화 정보로 복원된 영상을 기초로 하여, 주변 프레임으로부터 움직임이 보상된 선명한 영상 부분(motion compensated image components)을 가져와 합성함으로써 복원된 프레임의 화질을 향상시키는 방법을 제안한다. 제안된 비디오 코딩 방식은 실험 결과에서 최신의 비디오 압축 방식인 H.264/AVC의 IB 코딩 모드와 유사한 성능을 보여주고 있다. 따라서 제안된 비디오 코딩 방식은 저 복잡도의 인코더가 필요한 응용 분야에 H.264/AVC를 대신하여 사용될 수 있다.

SVC 다중 ROI를 이용한 인터랙티브 비디오 시스템 구현 (Implementation of User Interactive Video System using Multiple ROI in SVC)

  • 최정화;배태면;노용만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.253-256
    • /
    • 2006
  • 본 논문은 사용자의 인터랙션(user interaction)을 고려하여, 사용자가 관심을 가지는 영역에 대해서 최적화된 비디오 콘텐츠를 제공받을 수 있는 비디오 서비스 시스템을 제안한다. 본 논문에서 제안하는 사용자 인터랙티브티를 고려한 서비스 시스템은 SVC(Scalable Video Coding)의 다중 ROI를 사용한다. 또한 제안된 시스템에서는 다양한 방식의 비디오 품질과, 다중 ROI에 대한 선택 과정에서 콘텐츠 소비 주체와 시스템간의 쌍방향 제어 수단을 개발하고 콘텐츠의 관심 영역 지정 과정에서 사용자의 인터렉션 정보를 이용하는 방법을 제안한다. 제안하는 시스템의 유효성을 테스트하기 위해 사용자의 인터랙션에 의해 변환하는 SVC 콘텐트를 만들었고, 사용자 단말에 인터렉션 기능으로 SVC 콘텐츠를 디코딩하는 시스템을 구현하여 유용성을 검증하였다.

  • PDF

백터양자화가의 구조적 코더 찾기 (STRUCTURED CODEWORD SEARCH FOR VECTOR QUANTIZATION)

  • 우홍체
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 추계학술대회 학술발표 논문집
    • /
    • pp.467-470
    • /
    • 2000
  • Vector quantization (VQ) is widely used in many high-quality and high-rate data compression applications such as speech coding, audio coding, image coding and video coding. When the size of a VQ codebook is large, the computational complexity for the full codeword search method is a significant problem for many applications. A number of complexity reduction algorithms have been proposed and investigated using such properties of the codebook as the triangle inequality. This paper proposes a new structured VQ search algorithm that is based on a multi-stage structure for searching for the best codeword. Even using only two stages, a significant complexity reduction can be obtained without any loss of quality.

  • PDF

주파수 적응 채널 잡음 모델링에 기반한 변환영역 Wyner-Ziv 부호화 방법 (Transform domain Wyner-Ziv Coding based on the frequency-adaptive channel noise modeling)

  • 김병희;고봉혁;전병우
    • 방송공학회논문지
    • /
    • 제14권2호
    • /
    • pp.144-153
    • /
    • 2009
  • 최근, 사용자 제작 콘텐츠(UCC: User Created Contents) 또는 다시점 비디오(Multiview Video) 등의 응용을 위한 경량화 부호화 기술의 필요성이 대두됨에 따라 비디오 부호화 복잡도의 대부분을 차지하는 움직임 예측/보상 과정을 부호화기가 아닌 복호화기 측에서 수행하는 분산 비디오 부호화 기술(Distributed Video Coding)에 대한 연구가 활발히 이루어지고 있다. Wyner-Ziv 부호화 기술은 채널 코딩을 이용하여 원본 영상에 대한 복호화기 측의 예측영상인 보조정보에 포함된 잡음을 제거함으로써 영상을 복원하는 구조를 가진다. 일반적인 Wyner-Ziv 부호화 기술은 키 프레임 간의 움직임 예측/보상 과정에 기반한 프레임 보간법을 통해 보조정보를 생성하며, Shannon limit에 근접한 성능을 보이는 Turbo 코드나 LDPC 코드를 통해 잡음을 제거한다. Wyner-Ziv 부호화 기술은 채널 코드의 복호화를 위해 보조정보에 포함된 잡음의 정도를 예측하는데, 이를 '가상 채널 잡음(Virtual Channel Noise)'이라 하며 일반적으로 Laplacian이나 Gaussian으로 모델화 한다. 본 논문은 변환영역에서의 주파수 단위에 적응적인 채널 잡음 모델링에 기반한 Wyner-Ziv 부호화 방법을 제안한다. 다양한 영상에 대한 제안 방법의 실험 결과는 기존 방법과 비교하여 최대 약 0.52dB에 해당하는 율-왜곡 성능의 향상을 보여준다.

다시점 비디오 부호화를 위한 저 복잡도 움직임 추정 탐색 기법 (Low Complexity Motion Estimation Search Method for Multi-view Video Coding)

  • 윤효순;김미영
    • 한국멀티미디어학회논문지
    • /
    • 제16권5호
    • /
    • pp.539-548
    • /
    • 2013
  • 움직임 추정은 비디오 영상 압축에 있어서 중요한 역할을 하지만 최적의 움직임 벡터를 추정하기 위해 많은 계산량을 요구한다. 다시점 비디오는 하나의 3차원 장면을 여러 시점에서 다수의 카메라로 촬영한 동영상으로 다시점 비디오 부호화를 위한 움직임 추정의 계산량은 카메라 수에 비례하여 증가한다. 본 논문에서는 다시점 비디오 부호화를 위한 움직임 추정의 계산량을 줄이면서 영상 화질을 유지하는 저 복잡도 움직임 추정 기법을 제안하였다. 제안한 기법은 계층적인 탐색 기법으로 4-그리드 다이아몬드 탐색 패턴, 2-그리드 다이아몬드 탐색 패턴 그리고 TZ 2 point 탐색 패턴으로 구성되었다. 이들 탐색 패턴들은 움직임 벡터의 분포 특성을 이용하여 탐색 점들을 배치함으로써 적은 계산량으로 움직임 벡터를 추정할 수 있다. 제안한 기법의 성능을 JMVC의 고속 움직임 추정 기법인 TZ 탐색 기법의 성능과 비교하였을 경우, 영상 화질 면에서 약 0.01~0.24(dB) 화질 저하를 보였지만 움직임 추정의 계산량을 약 42%~80% 줄임으로서 약 1.8~4.5배 속도 향상을 보였다.

H-264 동영상 압축의 문법적 제한요소를 이용한 MAP기반의 Channel Decoder 성능 향상에 대한 연구 (A Study on Channel Decoder MAP Estimation Based on H.264 Syntax Rule)

  • 전용진;서동완;최윤식
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 A
    • /
    • pp.295-298
    • /
    • 2003
  • In this paper, a novel maximum a posterion (MAP) estimation for the channel decoding of H.264 codes in the presence of transmission error is presented. Arithmetic codes with a forbidden symbol and trellis search techniques are employed in order to estimate the best transmitted. And, there has been growing interest of communication, the research about transmission of exact data is increasing. Unlike the case of voice transmission, noise has a fatal effect on the image transmission. The reason is that video coding standards have used the variable length coding. So, only one bit error affects the all video data compressed before resynchronization. For reasons of that, channel needs the channel codec, which is robust to channel error. But, usual channel decoder corrects the error only by channel error probability. So, designing source codec and channel codec, Instead of separating them, it is tried to combine them jointly. And many researches used the information of source redundancy In received data. But, these methods do not match to the video coding standards, because video ceding standards use not only one symbol but also many symbols in same data sequence. In this thesis, We try to design combined source-channel codec that is compatible with video coding standards. This MAP decoder is proposed by adding semantic structure and semantic constraint of video coding standards to the method using redundancy of the MAP decoders proposed previously. Then, We get the better performance than usual channel coder's.

  • PDF

몰입형 비디오 압축을 위한 스크린 콘텐츠 코딩 성능 분석 (Screen Content Coding Analysis to Improve Coding Efficiency for Immersive Video)

  • 이순빈;정종범;김인애;이상순;류은석
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.911-921
    • /
    • 2020
  • 최근 MPEG-I (Immersive) 그룹에서는 몰입형 비디오(Immersive Video)에 대한 표준화 프로젝트를 통해 압축 성능 탐색을 진행하고 있다. MIV(MPEG Immersive Video) 표준 기술은 다수의 시점 영상과 깊이 맵을 통한 깊이 맵 기반 이미지 렌더링(DIBR)을 바탕으로 제한적인 6DoF을 제공하고자 하는 기술이다. 현재 MIV에서는 바탕 시점(Basic View)과 각 시점의 고유한 영상 정보를 패치 단위로 모아둔 추가 시점(Additional View)으로 처리하는 모델을 채택하고 있다. MIV에서 생성된 아틀라스는 포함되는 시점의 성격에 따라 다른 영상의 특성을 나타내어 비디오 코덱의 압축 효율에 대한 고찰이 필요하다. 따라서 본 논문에서는 다양한 시점과 패치들이 반복되는 패턴에 착안하여 화면 내 블록 카피(IBC: intra block copy) 등의 압축 기법이 포함된 스크린 콘텐츠 코딩 툴에 대한 성능 비교 분석을 진행하여 복원 영상에서 최대 -15.74% Peak Signal-to-Noise Ratio (PSNR) 관점에서의 부호화 성능 향상을 제공하였다.

전영역 탐색 방식의 움직임 예측에서 매칭 스캔 방법을 이용한 불가능한 후보 벡터의 고속 제거 알고리즘 (A Past Elimination Algorithm of Impossible Candidate Vectors Using Matching Scan Method in Motion Estimation of Full Search)

  • 김종남
    • 한국멀티미디어학회논문지
    • /
    • 제8권8호
    • /
    • pp.1080-1087
    • /
    • 2005
  • 움직임 예측의 전영역 탐색 (full search)에서 방대한 계산량은 실시간 비디오 압축에 큰 장애물이 되어왔으며, 이는 최근 MPEG-4 AVC (Advanced Video Coding) 표준이 기존의 MPEG-2 보다 움직임 예측에서 더 많은 계산량을 요구하고 있다. 전영역 움직임 예측의 계산량을 줄이기 위해, 본 논문에서는 기존의 전영역움직임 예측에 비하여 예측 화질의 저하가 없는 새로운 고속 매칭 알고리즘을 제안한다. 가능한 후보의 움직임 벡터를 빨리 제거함으로써 예측화질의 저하 없이 계산량만 줄일 수 있게 되는 것이다. 본 논문에서는 영상의 복잡한 영역의 효율적인 매칭 단위와 디더링 (dithering) 순서에 기초한 매칭 방식을 통하여 불가능한 후보 벡터를 더 빨리 제거한다. 제안된 알고리즘은 예측 화질의 저하 없이 기존의 PDE (partial distortion elimination) 알고리즘을 이용한 전영역 탐색 방법에 비해 $30\%$의 계산량을 줄였으며, MPEG-2 및 MPEG-4 AVC를 이용하는 비디오 부호화 응용분야에 유용하게 사용될 수 있을 것이다.

  • PDF