• 제목/요약/키워드: Adaptive video

검색결과 806건 처리시간 0.025초

시점 기반 가상 현실 영상 복호화 시스템을 위한 복호기 적응적 타일 클러스터링 알고리즘 (Decoder Adaptive Tile Clustering Algorithm for Viewport-Dependent Virtual Reality Video Decoding System)

  • 박준호;정종범;정세훈;류은석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.197-200
    • /
    • 2021
  • 몰입형 고품질 가상 현실 영상 스트리밍을 위한 360도 영상 부호화 및 전송 기술 중 하나로 사용자 시점 기반 타일 스트리밍 기법이 활발히 연구되고 있다. 360도 영상은 용량이 크기 때문에 개별 타일 기반 스트리밍 방법을 사용해 사용자 시점만 보내는 것이 효율적이다. 본 논문은 시점 기반 가상 현실 영상 복호화 시스템을 위한 복호기 적응적 타일 클러스터링 알고리즘을 제안한다. 제안하는 방법은 클라이언트의 복호기가 최대로 복호화 가능한 해상도를 탐색한 후, 사용자 시점 데이터와 복호기 적응적 타일 클러스터링 알고리즘을 이용해 클러스터화할 복수 개의 사용자 시점 타일들의 목록을 생성한 후, 타일 병합기를 이용해 타일들을 병합하여 클러스터 비트스트림을 생성한다. 이후 클라이언트는 병합된 클러스터 비트스트림들을 복호화한 후 사용자 시점을 생성한다. 제안하는 방법을 이용하면 클라이언트의 복호기 환경에 제약받지 않는 복호화가 가능하며, 제안하는 방법 중 하나인 4K_clustering 방법의 경우 8%의 복호화 속도 개선 효과를 얻을 수 있어 몰입형 고품질 가상 현실 영상을 위한 실시간 타일 스트리밍이 가능하다.

  • PDF

Temporally adaptive and region-selective signaling of applying multiple neural network models

  • 기세환;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.237-240
    • /
    • 2020
  • The fine-tuned neural network (NN) model for a whole temporal portion in a video does not always yield the best quality (e.g., PSNR) performance over all regions of each frame in the temporal period. For certain regions (usually homogeneous regions) in a frame for super-resolution (SR), even a simple bicubic interpolation method may yield better PSNR performance than the fine-tuned NN model. When there are multiple NN models available at the receivers where each NN model is trained for a group of images having a specific category of image characteristics, the performance of Quality enhancement can be improved by selectively applying an appropriate NN model for each image region according to its image characteristic category to which the NN model was dedicatedly trained. In this case, it is necessary to signal which NN model is applied for each region. This is very advantageous for image restoration and quality enhancement (IRQE) applications at user terminals with limited computing capabilities.

  • PDF

확장형 비디오 부호화(SVC)의 AR-FGS 기법에 대한 부호화 성능 개선 기법 (Improved AR-FGS Coding Scheme for Scalable Video Coding)

  • 서광덕;정순흥;김진수;김재곤
    • 한국통신학회논문지
    • /
    • 제31권12C호
    • /
    • pp.1173-1183
    • /
    • 2006
  • 본 논문에서는 H.264의 확장형(scalable extension) 부호화 기법인 SVC(Scalable Video Coding)에서 채택하고 있는 AR-FGS(Adaptive Reference FGS) 기법의 재생화면 화질 향상을 위한 효과적인 방법을 제안한다. 표준 FGS(Fine Granularity Scalability) 기법에서는 FGS 계층의 부호화 성능 향상을 위하여 기본계층(base layer) 재생화면과 향상계층(enhancement layer) 참조화면에 대해 가중평균(weighted average)을 적용하여 FGS 부호화를 수행하는 AR-FGS 기법을 채택하고 있다. 그러나, 향상계층 부호화 정보가 비트스트림 절삭(bitstream truncation)에 의하여 FGS 복호기에 전달이 되지 못 할 경우 FGS 부호기와 복호기에 이용이 되는 참조화면의 차이로 인하여 움직임 보상 과정에서 오류의 전파(error drift)가 발생하여 FGS 계층에서 화질 저하를 초래하게 된다. 이를 해결하기 위하여 본 논문에서는 FGS 계층에서 움직임 보상에 이용될 예측신호를 구하기 위해 활용이 되는 향상계층 참조화면을 효과적으로 생성하기 위하여 사이클 블록 부호화(cyclical block coding)의 원리를 이용한다. 사이클 블록 부호화에서는 FGS 계층의 복호화 화질에 큰 영향을 미치는 중요 양자화 변환계수(quantized transform coefficient)를 초기 부호화 사이클에 포함시킴으로써 우선적으로 부호화 및 전송이 되게 하는 부호화 기술이다. 양자화 변환계수가 사이클 블록 부호화에 포함되는 순서가 앞설 경우 대역폭 감소로 인한 비트스트림 절삭이 적용될 때에도 복호기에 우선적으로 전달될 확률이 상대적으로 높다. 이러한 원리를 바탕으로 사이클 블록 부호화에 서 각 사이클 별로 생성되는 비트스트림이 향상계층 참조화면의 생성에 기여하는 중요도에 따라 그 가중치를 다르게 조절함으로써 특정 부호화 사이클에서 생성된 비트스트림 정보가 절삭에 의해 FGS 복호기에 전달되지 못하더라도 복호화 시 그 영향을 최소화하여 화질 저하를 줄이는 방법을 제안한다. 제안된 방법을 이용하여 개선된 AR-FGS 기법을 구현할 경우 기존의 표준 방법에 비하여 재생화면의 화질이 최대 1dB 안팎으로 개선이 됨을 실험을 통해 확인하였다.

POCS와 정규화를 기반으로한 프레임간 압출 영사의 후처리 (Postprocessing of Inter-Frame Coded Images Based on Convex Projection and Regularization)

  • 김성진;정시창;황인경;백준기
    • 대한전자공학회논문지SP
    • /
    • 제39권3호
    • /
    • pp.58-65
    • /
    • 2002
  • 본 논문에서는 프레임간 압축된 영상의 블록화 현상을 감소시키기 위해 재구성하기 전 차분 영상을 처리하는 새로운 복원 알고리듬을 제안한다. 프레임내 압축 영상의 블록화 현상은 오직 8×8 DCT에 의해서 일어나는 반면에, 프레임간 압축된 영상에서는 8×8 DCT뿐만 아니라 움직임 보상을 위해 사용한 16×16의 매크로 블록에 의해서 발생된다. 이러한 이유로 본 논문에서는 차분 영상에 대한 새로운 열화모델을 제시하고, 블록 경계와 내부의 불연속에 대한 POCS를 이용한 복원 알고리듬을 제시한다. 제안된 알고리듬은 DCT계수의 일부를 이용해 블록 경계의 방향을 고려하는 공간 적응적 저대역 통과 필터를 포함하는 표준 정규화의 변환된 형태이다. 일반적인 비디오 압축 표준은 블록을 기준으로 하는 움직임 보상과 블록 이산여현 변환(BDCT)을 이용한 혼성(hybrid) 구조를 채택하고 있다. 이러한 이유에서 블록화 현상은 블록 경계와 블록 내부에서 일어난다. 두 종류의 블록화 현상을 좀 더 완벽히 제거하기 위해서 복원된 차분 영상은 블록 경계와 블록 내부에서의 방향성 불연속과 같은 제약조건을 만족시켜야만 한다. 그러한 제약조건은 차분 영상을 복구하기 위한 convex set을 정의하는데 이용한다.

저 복잡도 비디오 복호화기를 위한 디블록킹 필터 (Deblocking Filter for Low-complexity Video Decoder)

  • 조현호;남정학;정광수;심동규;조대성;최웅일
    • 대한전자공학회논문지SP
    • /
    • 제47권3호
    • /
    • pp.32-43
    • /
    • 2010
  • 본 논문은 저 복잡도 비디오 복호화기를 위한 디블록킹 필터를 제안한다. 휴대전화와 같은 모바일 장치에서 많이 사용되는 H.264/AVC Baseline 프로파일은 MPEG-4 Visual 보다 압축 성능은 두 배 이상 높지만, 1/4-픽셀 보간 필터, 적응적 엔트로피 모델 및 디블록킹 필터를 사용함에 따라 복호화기의 복잡도가 높다는 문제점이 있다. 본 논문에서는 H.264/AVC의 부호화 성능은 유지하면서 복호화기의 복잡도를 감소시키기 위하여 저 복잡도 디블록킹 필터를 제안한다. 본 논문에서 제안된 저 복잡도 디블록킹 필터는 BS (Boundary Strength)값에 대해 CBP (Coded Block Pattern)값을 이용하여 계산함으로써, 기존의 방법보다 분기문의 수를 49% 감소시켰다. 또한, 인트라 매크로블록 경계에서 적용되는 강한 필터링 (Strong Filtering)에 대해 필터링의 적용 범위를 두 픽셀로 제한하였다. 실험 결과, 제안하는 저 복잡도 디블록킹 필터는 H.264/AVC Baseline 프로파일에 비해 BDBitrate를 -0.02% 감소 시켰고, 디블록킹 필터의 복잡도는 42%, 복호화기 전체의 복잡도는 8.96% 감소 시켰다.

패리티 요구량 예측을 이용한 적응적 경판정 출력 기반 고속 분산 비디오 복호화 기술 (Adaptive Hard Decision Aided Fast Decoding Method using Parity Request Estimation in Distributed Video Coding)

  • 심혁재;오양근;전병우
    • 방송공학회논문지
    • /
    • 제16권4호
    • /
    • pp.635-646
    • /
    • 2011
  • 분산 비디오 압축 기술은 부호화기의 복잡한 과정을 복호화기로 이동시킴으로써 저복잡도 부호화기를 가능하게 한다. 하지만 WZ 복호화기는 움직임 예측/보상 과정뿐만 아니라 채널 복호 과정까지 수행하기 때문에 복호화 과정의 높은 복잡도가 문제점으로 지적되고 있다. LDPC 부호의 복호화는 상당히 반복적인 과정으로 수행되기 때문에 그 수행 횟수만큼 복잡도가 늘어나는데, 실제로 이러한 반복적인 복호 과정은 전체 WZ 복호화 복잡도의 60% 이상을 차지하고 있기 때문에 복잡도 절감의 주요 대상이다. 따라서 이러한 복잡도 절감을 위해 과거에 HDA(Hard Decision Aided) 방법을 적용하는 방법이 제안되었다. HDA 방법은 해당 패리티에 대한 복호 과정의 복잡도를 상당량 줄여주지만, 채널 복호가 성공하기에 부족한 패리티량에 대해서도 여전히 복호 과정을 수행하는 문제점을 가지고 있다. 따라서 이러한 소모적인 과정을 줄임으로써 추가적인 복잡도 절감 효과를 얻을 수 있다. 이에 본 논문에서는 비트 플레인 간의 상관도와 시간적 상관도에 기반하여 최소 연산으로 패리티 요구량을 예측하는 방법을 제안한다. 제안 방법과 HDA 방법을 함께 적용할 경우 채널 복호 과정에서는 평균 72% 정도의 고속 복호가 가능하며, 저하되는 율 왜곡 성능은 -0.0275 dB (BDPSNR) 정도로상당히 낮다.

H.264 표준의 가변 움직임 블록을 위한 고속 움직임 탐색 기법 (Fast Motion Estimation for Variable Motion Block Size in H.264 Standard)

  • 최웅일;전병우
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.209-220
    • /
    • 2004
  • 기존 비디오 표준과 비교해 볼 때, H.264 비디오 표준이 갖는 중요한 두 가지 특징으로는 높은 부호화 효율과 네트워크 친화성을 들 수 있다. 그러나 이러한 중요한 특성에도 불구하고 H.264 표준은 구현시 요구되는 메모리 대역폭과 연산량의 복잡도가 높기 때문에 실시간 응용에 적용하는데 어려움이 있다. H.264 부호화 기술 가운데 특히 복수 참조 영상을 이용한 다양한 블록 단위 움직임 탐색은 높은 부호화 효율을 갖도록 하는 핵심 요소지만 최적의 움직임 벡터를 찾기 위해 다양한 블록 단위 조합의 모든 경우에 대하여 SAD (Sum of Absolute Difference)를 구해야 하므로 상당한 계산량을 요구한다. 그러므로 본 논문에서는 움직임 탐색의 연산량을 줄이기 위해 정수화소 움직임 탐색 및 부화소 움직임 탐색을 위한 고속 알고리즘을 제안한다. 정수화소 단위 움직임 탐색의 경우, 기존의 고속 움직임 탐색 기법은 H.264의 다양한 블록 단위 움직임 탐색 구조에 그대로 적용할 경우 효과적이지 못하기 때문에 본 논문에서는 종래 다이아몬드 탐색 기반 방법을 계층적 블록 구조에 맞게 개선한 적응적 움직임 탐색 기법을 제안하도록 한다. 또한 부화소 단위 움직임 탐색을 위해서는 움직임 벡터의 통계적 특성을 이용하여 예측벡터를 중심으로 한 다이아몬드 탐색 기반 고속 알고리즘을 제안한다.

선택적 수행블록 병합을 이용한 참조 영상 메모리 압축 기법 (Reference Frame Memory Compression Using Selective Processing Unit Merging Method)

  • 홍순기;최윤식;김용구
    • 방송공학회논문지
    • /
    • 제16권2호
    • /
    • pp.339-349
    • /
    • 2011
  • 고해상도 비디오에 대한 압축 성능 향상을 위해 내부 연산 비트 깊이를 증가시키는 IBDI (Internal Bit Depth Increase) 기법은 괄목할 만한 부호화 효율 증가 이득을 얻을 수 있었지만, 참조 영상을 저장하기 위해 소요되는 내부 메모리가 증가하는 문제가 발생한다. 따라서 IBDI 기법의 부호화 효율은 유지하면서 내부 메모리 증가 문제를 해결하기 위해 메모리 압축 기법이 제안되었다. 기존 메모리 압축 기법은 영상의 각 수행블록마다 일정량의 부가정보를 이용하여 메모리 압축을 수행함으로써, 부호화 효율은 유지하면서 내부 메모리를 성공적으로 줄일 수 있었다. 하지만 각각의 수행블록마다 발생하는 부가정보에 의해 메모리 압축 성능이 제한되는 한계가 존재한다. 따라서 본 논문에서는 기존 메모리 압축 방법의 한계를 극복하기 위해, 발생하는 부가정보량을 크게 줄일 수 있도록 선택적 수행블록 병합을 이용한 메모리 압축 방법을 제안하였다. 제안 방법을 통해 부호화 효율을 기존 메모리 압축 방법과 동일하게 유지하면서 메모리 압축에 의해 발생하는 부가정보량은 크게 감소하는 이득을 얻을 수 있었다.

무용영상콘텐츠의 정보서비스 이용에 대한 상호작용성 인식과 이용지속의도에 관한 연구- 유투브를 중심으로 (A study on perceived interactivity of Dance video contents and intention to use: Focused on YouTube)

  • 정새봄;원도연;장영진
    • 한국체육학회지인문사회과학편
    • /
    • 제55권3호
    • /
    • pp.349-363
    • /
    • 2016
  • 본 연구는 기술수용모델이론을 적용해 무용영상콘텐츠의 정보서비스 이용에 대한 상호작용성 인식과 이용지속성에 관한 모형검증을 하고자하며, 무용영상콘텐츠를 이용하는 이용자들과 홍보마케팅을 펼치고자 하는 업체나 개발자들에게 구체적이며 실질적 기초자료를 제공하는데 그 목적이 있다. 연구의 대상은 평소 유투브를 통해 무용영상콘텐츠를 이용해본 경험이 있는 일반 대상자로 선정하였으며, 자료처리는 SPSS 20.0 과 AMOS 18.0을 활용하였으며 신뢰도분석, 빈도분석, 확인적 요인분석, 상관관계분석, 구조방정식모형분석을 통해 자료를 분석하였다. 이상과 같은 절차를 통해 도출된 결과는 다음과 같다. 첫째, 유투브를 통한 무용영상콘텐츠의 정보서비스 이용에 대한 상호작용성은 지각된 사용용이성에 영향을 미치지 않았고, 지각된 유용성에 부분적으로 영향을 미치는 것으로 나타났다. 둘째, 유투브를 통한 무용영상콘텐츠의 지각된 사용용이성은 지각된 유용성에 긍정적 영향을 미치는 것으로 나타났다. 마지막으로, 유투브를 통한 무용영상콘텐츠의 지각된 유용성은 이용지속의도에 영향을 미치지 않았지만, 지각된 사용용이성은 이용지속의도에 영향을 미치는 것으로 나타났다. 이에 따라 무용영상콘텐츠를 제공하고 받는 상호 교환적 역할이 중요하며 쌍방향적 관계 구축이 필수적일 것으로 판단됨에 따라 더욱 능동적이고 편리한 시스템 개선 및 인력지원에 힘쓰도록 해야 할 것이다.

다 시점 영상 콘텐츠 특성에 따른 딥러닝 기반 깊이 추정 방법론 (Deep learning-based Multi-view Depth Estimation Methodology of Contents' Characteristics)

  • 손호성;신민정;김준수;윤국진;정원식;이현우;강석주
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.4-7
    • /
    • 2022
  • 최근 다 시점 영상 콘텐츠 기반 3차원 공간(장면) 복원을 위한 다 시점 깊이 추정 딥러닝 네트워크 방법론이 널리 연구되고 있다. 다 시점 영상 콘텐츠는 촬영 구도, 촬영 환경 및 세팅에 따라 다양한 특성을 가지며, 고품질의 3차원 복원을 위해서는 이러한 특성을 이해하고, 적절한 깊이 추정 네트워크 기법들을 적용하는 것이 중요하다. 다 시점 영상 촬영 구도로는 수렴형, 발산형이 존재하며, 촬영 세팅에는 카메라 시점 간 물리적 거리인 baseline이 있다. 본 연구는 이와 같은 다 시점 영상 콘텐츠의 종류와 각 특징에 기반하여 콘텐츠(데이터 셋)의 특성에 따른 적절한 깊이 추정 네트워크 방법론을 다룬다. 실험 결과로부터, 기존의 다 시점 깊이 추정 네트워크를 발산형 또는 large baseline 특성을 가지는 데이터 셋에 곧바로 적용하는데 한계점이 존재함을 확인하였다. 따라서, 각 영상 환경에 적합한 '참조 시점 개수' 및 적절한 '참조 시점 선택 알고리즘'의 필요성을 검증하였다. 결론적으로, 3차원 공간(장면) 복원을 위한 딥러닝 기반 깊이 추정 네트워크 구현 시, 본 연구 결과가 다 시점 영상 콘텐츠 기반 깊이 추정 기법 선택에 있어 가이드라인으로 활용될 수 있음을 확인하였다.

  • PDF