• 제목/요약/키워드: 인트라 예측

검색결과 145건 처리시간 0.024초

영상 블록에서의 에지 맵을 이용한 단일 필드 디인터레이싱 알고리듬 (A Single Field Deinterlacing Algorithm Using Edge Map in the Image Block)

  • 강근화;전광길;정제창
    • 한국통신학회논문지
    • /
    • 제34권4C호
    • /
    • pp.355-362
    • /
    • 2009
  • 본 논문에서는 영상 블록내의 에지 맵을 이용한 새로운 인트라 필드 디인터레이싱 알고리듬을 제안한다. 기존의 방향성 기반 라인 평균 방식들은 화소단위 상관도를 이용하기 때문에 화소값의 변화에 민감하다는 단점을 가지고 있다. 또 방향성 에지를 탐색할 때 탐색 영역 내에 에지들이 다수 존재할 경우 부적절한 에지 방향을 찾게 되고 이는 화질의 열화를 가져온다는 단점이 있다. 이러한 단점을 극복하기 위해 본 논문은 에지 맵에 의해 계산되는 에지 방향 벡터와 이 벡터가 이용된 보간방식을 제안한다. 먼저 소벨 마스크를 이용하여 에지 방향 벡터를 구한 후, 구해진 에지방향 벡터를 이용해 다섯 개의 에지 방향 벡터의 가중치 값을 구한다. 구해진 값들은 이후에 여러 에지방향으로부터 구해지는 보간값들과 중해짐으로써 최종 보간값을 예측하게 된다. 본 논문의 핵심 아이디어는 에지 검출기를 통해 구해진 하나의 에지 방향 정보만으로 보간작업을 수행하지 않고 사용 가능한 모든 에지방향의 정보로부터 구해지는 결과값들에 가중치를 곱하여 보간작업을 수행하는 방식이다.

GOP 레이어 비트율 제어를 위한 초기 QP 모델링 (Initial QP Modeling for GOP Layer Rate Control)

  • 박상현
    • 한국전자통신학회논문지
    • /
    • 제7권6호
    • /
    • pp.1377-1383
    • /
    • 2012
  • 비디오 코딩에서 GOP의 첫 번째 프레임은 많은 비트를 발생시키는 인트라 모드로 압축되고 다음 프레임의 인터 모드 압축에 사용되기 때문에 첫 프레임을 위한 초기 QP 값은 첫 프레임뿐만 아니라 이후 프레임에도 영향을 주게 된다. 일반적으로 초기 QP 값은 bpp 값에 따라 4가지 값 중에 하나로 설정된다. 이렇게 설정하는 것은 간단한 반면 부정확한 문제가 있다. 정확한 초기 QP 값 예측을 위해서는 bpp 뿐만 아니라 영상의 복잡도와 전송률도 함께 고려하여야 한다. 본 논문에서는 GOP의 인코딩 특성을 분석하여 전체 GOP의 PSNR 값을 최대로 하는 초기 QP 값을 찾기 위한 트래픽 모델과 실시간 영상 압축에서 모델 파라미터를 실시간으로 구하는 방법을 제안한다. 실험 결과는 제안하는 모델이 초기 QP 계산에 필요한 트래픽 특성을 잘 반영하고 있으며 또한 실시간으로 모델 파라미터를 구하는 방법도 효과적으로 작동함을 보여준다.

인트라 예측의 Semi-Diagonal을 EHD 에지 정보로 맵핑하는 방법 (A Method for Mapping Semi-Diagonal of Intra Prediction to Edge Information of MPEG-7 EHD)

  • 권용광
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제46차 하계학술발표논문집 20권2호
    • /
    • pp.87-88
    • /
    • 2012
  • Because intra prediction modes in H.264 are determined by the brightness continuity between neighboring blocks, they can be used as a method for extracting edge information in the compression domain. However, if we just consider 9 intra prediction modes in H.264 as 9 different edge directions, we have the following two problems. First, intra prediction modes tend to yield too many edge blocks, generating unnecessary edge information. Second, we may not need all 9 directional edges (including the DC type) in H.264 intra prediction modes. For example, the EHD (edge histogram descriptor) in MPEG-7 defines only 4 directional edge types, namely horizontal, vertical, diagonal (HVD) edges with $0^{\circ}$, $90^{\circ}$, $45^{\circ}$, and $135^{\circ}$. Here, semi-diagonal (SD) edge types with $112.5^{\circ}$, $157.5^{\circ}$, $22.5^{\circ}$, and $67.5^{\circ}$ in the intra prediction modes in H.264 are not used. In this paper. we prepose a method that removes unnecessary edges from the intra prediction modes by utilizing the total average coefficient of 4x4 blocks in each slice and assign SD edges to HVD (horizontal, vertical, diagonal, $0^{\circ}$, $90^{\circ}$, $45^{\circ}$, $135^{\circ}$) edges by the contextual information of the neighboring blocks. Experimental results show that the edges determined by the proposed method in the compression domain are comparable to those of the previous edge detection methods in the spatial domain.

  • PDF

다차원 DCT를 이용한 비디오 부호화기 설계 (Design of video encoder using Multi-dimensional DCT)

  • 전수열;최우진;오승준;정세윤;최진수;문경애;홍진우;안창범
    • 방송공학회논문지
    • /
    • 제13권5호
    • /
    • pp.732-743
    • /
    • 2008
  • 본 논문은 H.264/AVC가 이전의 비디오 코덱에서 사용하는 8$\times$8 변환이 아닌 4$\times$4 변환을 도입하면서 인트라 및 인터 예측 성능을 높인 반면 공간적 압축도가 낮은 점을 개선하기 위한 다차원 변환 방법을 제안한다. 다차원 변환 방법은 H.264/AVC가 갖는 시간적 예측의 장점과 공간적 압축도를 동시에 충족시킬 수 있는 방법이다. 먼저 실험을 통해 다차원 DCT가 H.264/AVC의 2차원 정수 변환(Integer Transform)보다 에너지 압축율이 높다는 것을 보였다. 다차원 DCT를 위한 정수형 변환과 양자화기를 설계하였으며, H.264에서 사용하는 컨텍스트 기반 적응 가변 길이 코딩 (CAVLC)을 엔트로피 코더로 사용하여 다차원 부호화기를 설계하였다. 다차원 부호화기에는 다차원 변환에 따른 블록 주사 방식과 파라미터 갱신, 다차원 변환 모드 선택 등의 도구가 적용되었다. 실험 결과, 다차원 부호화기는 낮은 비트율에서 H.264/AVC와 유사한 압축 효율을 보였지만, 엔트로피와 0이 아닌 계수를 계산하여 비교한 통계적 성능 비교에서는 높은 성능을 보였다. 따라서, 다차원 부호화에 대한 추가적인 연구가 진행된다면 기존의 H.264/AVC의 성능을 보완할 수 있는 부호화 알고리즘으로서 발전할 수 있을 것이다.

잡음 모델 선택을 이용한 Wyner-Ziv 비디오 압축 (Wyner-Ziv Video Compression using Noise Model Selection)

  • 박천호;심혁재;전병우
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.58-66
    • /
    • 2009
  • 최근 경량화 비디오 부호화를 위함 분산 비디오 부호화 기술 (DVC: Distributed Video Coding)에 대한 연구가 활발히 이루어지고 있으며, Wyner-Ziv 부호화 기술은 이의 대표적인 기술로써 각광받고 있다. Wyner-Ziv (WZ) 부호화기는, 영상을, 기존의 인트라 부호화기를 이용하는 키 (Key) 프레임과 WZ 부호화를 하는 WZ 프레임으로 나누어 독립적으로 부호화 한다. WZ 복호화기로 전송된 키 프레임은 복원된 뒤 키 프레임 사이의 WZ 프레임을 추정하는데 사용되며 추정된 WZ 프레임을 보조정보 (Side Information)라고 한다. 보조정보는 WZ 프레임에 대한 정보가 없는 상태에서 추정되므로 필연적으로 WZ 프레임과 다르며 WZ 복호화기에서는 보조정보와 WZ 프레임과의 차이를 가상의 채널 잡음으로 간주한다. WZ 복호화 과정은 가상의 채널잡음을 WZ 복호화기 내에 존재하는 채널코드를 이용하여 제거함으로써 이루어지므로 채널 정보를 정확히 아는 것은 채널코드의 에러정정능력에 큰 영향을 미친다. WZ 복호화기에서는 추정된 WZ 영상만이 존재하므로 정확한 잡음의 양을 알 수 없으며, 일반적으로 선형 움직임에 근거한 키 프레임 간의 차를 하나의 예측 수단으로 사용한다. 또한 이와 같이 예측이 갖는 불확실성으로 채널코드의 효율이 저하되는 것을 막기 위하여 주변의 잡음과 비교를 통한 잘못된 잡음을 정정하는 방법도 제안되었다. 하지만 이런 방법들이 모든 프레임이나 비트 플레인에 존재하는 잡음을 제대로 측정한다고 할 수는 없다. 따라서 본 논문에서는 여러 개의 후보 잡음 모델을 생성한 후, 복호화 과정에서 가장 효율적인 모델을 선택하는 방법을 제안한다. 제안 방법에 대한 실험결과는 최대 0.8 dB의 PSNR이득을 보여준다.