• 제목/요약/키워드: image/video coding

검색결과 355건 처리시간 0.025초

Novel Image Stabilizing Techniques toy Mobile Video Communications

  • Kang, Byoung-Su;Kim, Jae-Won;Lee, Jun-Suk;Park, kang-Sun;Ko, Sung-Jea
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -1
    • /
    • pp.433-436
    • /
    • 2000
  • In this paper, we present two types of digital image stabilization (DIS) schemes for mobile video communications. In the first scheme, the DIS system, which is used as a preprocessor of the video encoder, compensates the camera’s undesirable shakes before encoding. This method can reduce the bit rate of encoded video sequence by attenuating the prediction error to be encoded. In the second proposed scheme, the DIS system is coupled with the video decoder. The second scheme uses the K-means clustering algorithm to estimate the camera motion using motion vectors decoded from the received video stream. Simulation results show that the first scheme improves coding efficiency, while the second scheme is computationally efficient since it does not require motion estimation.

  • PDF

OpenCL을 이용한 JPEG2000 4K 초고화질 영상처리의 병렬고속화 구현 (A Parallel Implementation of JPEG2000 4K Ultra High Definition Image using OpenCL)

  • 박대승;김정길
    • 한국위성정보통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.1-5
    • /
    • 2015
  • 멀티미디어 기술의 급속한 발전과 사용자의 대형 화면에 대한 선호도가 높아지는 가운데 새로운 영상 압축 기술인 HEVC(High Efficiency Video Coding) 고화질 영상 압축 표준을 탄생시켰으며, 그 결과 기존의 HD급 영상보다 4배 이상, 16배까지 선명한 초고화질 UHD(Ultra High Definition) 영상 서비스가 새롭게 주목받고 있다. 또한 JPEG 2000 압축도 기존 처리되던 픽셀 이미지를 넘어 초고화질 해상도 이미지(4K : $3,840{\times}2,160$ 또는 8K : $7680{\times}4320$)를 처리 지원을 하고 있다. 따라서 초고화질 이미지의 획득 및 저장을 위해서는 고속의 처리 기술이 필요하다. 이에 본 논문은 초고화질 해상도 이미지의 고속 처리를 위한 병렬처리 기술에 대한 연구를 위하여, JPEG 2000의 처리 과정을 살펴보고 전처리 단계인 색공간 변환 알고리즘 적용을 위하여 GPU환경에서 병렬 컴퓨팅을 통해 처리속도를 향상시키는 방법을 제안한다. 병렬화한 알고리즘의 구현은 OpenCL(Open Computing Language)을 이용하였다. 실험 결과 사용자 정의 쓰레드 기반 고속 처리와 비교하여 초고화질 해상도 이미지(UHD 4K : $3,840{\times}2,160$)를 기준으로 최대 5배의 성능 향상의 결과를 보여주었다.

딥 러닝 기반의 이미지와 비디오 압축 기술 분석 (A Technical Analysis on Deep Learning based Image and Video Compression)

  • 조승현;김연희;임웅;김휘용;최진수
    • 방송공학회논문지
    • /
    • 제23권3호
    • /
    • pp.383-394
    • /
    • 2018
  • 본 논문에서는 최근 활발히 연구되고 있는 딥 러닝 기반의 이미지와 비디오 압축 기술에 대해 살펴본다. 딥 러닝 기반의 이미지 압축 기술은 심층 신경망에 압축 대상 이미지를 입력하고 반복적 또는 일괄적 방식으로 은닉 벡터를 추출하여 부호화한다. 이미지 압축 효율을 높이기 위해 심층 신경망은 복원 이미지의 화질은 높이면서 부호화된 은닉 벡터가 보다 적은 비트로 표현될 수 있도록 학습된다. 이러한 기술들은 특히 저 비트율에서 기존의 이미지 압축 기술에 비해 뛰어난 화질의 이미지를 생성할 수 있다. 한편, 딥 러닝 기반의 비디오 압축 기술은 압축 대상 비디오를 직접 입력하여 처리하기 보다는 기존 비디오 코덱의 압축 툴 성능을 개선하는 접근법을 취하고 있다. 본 논문에서 소개하는 심층 신경망 기술들은 최신 비디오 코덱의 인루프 필터를 대체하거나 추가적인 후처리 필터로 사용되어 복원 영상의 화질 개선을 통해 압축 효율을 향상시킨다. 마찬가지로, 화면 내 예측 및 부호화에 적용된 심층 신경망 기술들은 기존 화면 내 예측 툴과 함께 사용되어 예측 정확도를 높이거나 새로운 화면 내 부호화 과정을 추가함으로써 압축 효율을 향상 시킨다.

물체탐색과 전경영상을 이용한 인공지능 멀티태스크 성능 비교 (Comparison of Artificial Intelligence Multitask Performance using Object Detection and Foreground Image)

  • 정민혁;김상균;이진영;추현곤;이희경;정원식
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.308-317
    • /
    • 2022
  • 딥러닝 기반 머신 비전 기술을 이용한 영상분석 과정에서 전송되고 저장되는 방대한 양의 동영상 데이터의 용량을 효율적으로 줄이기 위한 연구들이 진행 중이다. MPEG(Moving Picture Expert Group)은 VCM(Video Coding for Machine)이라는 표준화 프로젝트를 신설해 인간을 위한 동영상 부호화가 아닌 기계를 위한 동영상 부호화에 대한 연구를 진행 중이다. 그 중 한 번의 영상 입력으로 여러가지 태스크를 수행하는 멀티태스크에 대한 연구를 진행하고 있다. 본 논문에서는 효율적인 멀티태스크를 위한 파이프라인을 제안한다. 제안하는 파이프라인은 물체탐지를 선행해야 하는 각 태스크들의 물체탐지를 모두 수행하지 않고 한번만 선행하여 그 결과를 각 태스크의 입력으로 사용한다. 제안하는 멀티태스크 파이프라인의 효율성을 알아보기 위해 입력영상의 압축효율, 수행시간, 그리고 결과 정확도에 대한 비교 실험을 수행한다. 실험 결과 입력 영상의 용량이 97.5% 이상 감소한데 반해 결과 정확도는 소폭 감소하여 멀티태스크에 대한 효율적인 수행 가능성을 확인할 수 있었다.

Multiresolution Wavelet-Based Disparity Estimation for Stereo Image Compression

  • Tengcharoen, Chompoonuch;Varakulsiripunth, Ruttikorn
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.1098-1101
    • /
    • 2004
  • The ordinary stereo image of an object consists of data of left and right views. Therefore, the left and right image pairs have to be transmitted simultaneously in order to display 3-dimentional video at the remote site. However, due to the twice data in comparing with a monoscopic image of the same object, it needs to be compressed for fast transmission and resource saving. Hence, it needs an effective coding algorithm for compressing stereo image. It was found previously that compressing left and right frames independently will achieve the compression ratio lower than compressing by utilizing the spatial redundancy between both frames. Therefore, in this paper, we study the stereo image compression technique based on the multiresolution wavelet transform using varied disparity-block size for estimation and compensation. The size of disparity-block in the stereo pair subbands are scaling on a coarse-to-fine wavelet coefficients strategy. Finally, the reference left image and residual right image after disparity estimation and compensation are coded by using SPIHT coding. The considered method demonstrates good performance in both PSNR measures and visual quality for stereo image.

  • PDF

Very Low Bit Rate Video Image Coder Using the Fractals

  • Kim, Yong-Hon;Jang, Jong-Whan;Jeong, Jae-Gil;Park, Doo-Yeong
    • The Journal of the Acoustical Society of Korea
    • /
    • 제15권2E호
    • /
    • pp.85-91
    • /
    • 1996
  • New very low bit rate segmentation video image coding technique is proposed by segmenting image into textually homogeneous regions. Regions are classified into one of three perceptually distinct texture classes(perceived constant intensity, smooth texture, and rough texture) using the Human Visual System(HVS) and the fractals. To design very low bit rate video image coder, it is very important to determine the best block size for estimation the fractal dimension and the thresholding of the fractal dimension for each texture class. Good quality reconstructed images are obtained with about 0.10 to 0.21 bit per pixel(bpp) for many different types of imagery.

  • PDF

다중해상도 영상을 이용한 동영상 압축 (Video coding using multi-resolution image)

  • 배성호;박길흠
    • 전자공학회논문지S
    • /
    • 제34S권2호
    • /
    • pp.33-42
    • /
    • 1997
  • In this paper, a video coding method in wavelet transformed multi-resolution image using variable block sized motion estimation and multi-codebook is proposed. In the propoed method, the accuracy of motion estimation is increased by using variable block matching algorithm based on edge type of blocks which estimation is increased by using variable block matching algoritm based on edge type of blocks which is classified accoridng to the magnitude of wavelet coefficients in vertical subband and horizontal subband of the highest layer. Also, we increased the flexibility of bit allocation and decreased vector quantization error for motion compensated error transmission by using importance of each subband. Some experimental results confirm that he proposed mothod has fine reconstructed images without blocking effect at low bit rate, and especially reconstructs edges well to which human eyes are sensitive.

  • PDF

움직임보상 시간적 필터링을 이용한 홀로그램 압축 기법 (Hologram Compression Technique using Motion Compensated Temporal Filtering)

  • 서영호;최현준;김동욱
    • 한국통신학회논문지
    • /
    • 제34권11B호
    • /
    • pp.1296-1302
    • /
    • 2009
  • 본 논문에서는 MCTF와 표준 비디오 압축 도구를 이용하여 디지털 홀로그램을 효율적으로 부호화하는 방법을 제안한다. 홀로그램은 객체 영상과 깊이 정보를 바탕으로 하여 컴퓨터 생성 알고리즘으로부터 생성되었다. 제안한 알고리즘은 홀로그램을 분리하는 국부화 과정, $64\times64$ 크기의 세그먼트를 나누는 과정, 상관성을 유도하기 위한 DCT 과정, MCTF 과정, 압축을 위해 비디오 시퀀스를 만드는 과정, 그리고 H.264/AVC를 이용하여 압축하는 과정으로 구성된다. 제안한 알고리즘은 이전의 연구와 비교할 때 복원된 객체에 대해서 10%만큼 압축 효율이 향상되었다.

프레임간 및 양갈래 탐색 벡터 양자화기를 혼합한 영상 부호화 시스템 (A Hybrid Interframe/BTVQ Image Coding System)

  • 금낙연;최종수
    • 한국통신학회:학술대회논문집
    • /
    • 한국통신학회 1987년도 춘계학술발표회 논문집
    • /
    • pp.31-34
    • /
    • 1987
  • A new efficientcoding system which can transmit video conferenceof viedeophone signals at a 64kbps is proposed. In addition to the interframe and CRC (Conditional Repleni shment Coding) system, BTVQ (Binary Tree searched Vector Quantizer)and RLC (Run Length Coding) methods are incorporated. Couble buffer memory is used for simple comtrol of channel symbol transmission and memory underflow And also buffer memory onerfolw is easily controlled by the thresholds of a MAD (Moving Area Betector)

  • PDF

Overlapping method와 SPIHT Algorithm과 Lifting Steps을 이용한 3차원 손실 의료 영상 압축 방법 (3-D Lossy Volumetric Medical Image Compression with Overlapping method and SPIHT Algorithm and Lifting Steps)

  • 김영섭
    • 한국산학기술학회논문지
    • /
    • 제4권3호
    • /
    • pp.263-269
    • /
    • 2003
  • 이 논문은 3차원 정수 웨이브릿 변환을 이용한 손실 의료 영상 압축에 대한 방법을 보여준다. 의료영상에 3차원 웨이브릿 분할법과 3차원 spatial dependence tree를 이용한 Set Partitioning in Hierarchical Trees(SPIHT) algorithm을 제공한다. 또한 3차원 웨이브릿 분할법에서 정수 웨이브릿 필터들을 이용한 lifting방법을 이용하고, unitary 변환을 만들기 위하여 정확한 scaling을 이용한다. 압축률이 증가하면 할수록 인접한 coding unit사이에선 boundary effect가 생긴다. Video와 같지 않아서 인접한 coding unit사이에서의 boundary artifact는 보여서는 안 된다. 이러한 현상을 제거하기 위해서 인접한 coding unit사이에 axial domain으로 overlapping방법을 사용한다. 또한 코딩 할 때 여러 종류의 정수 필터들을 사용한다. 결과로 어떤 특정한 필터를 사용할 때 좋은 결과를 얻었고 overlapping방법을 사용했기 때문에 ringing artifacts는 거의 찾아 볼 수가 없게 되었다. 그리고 어두운 면을 코딩 할 때도 좋은 결과를 얻었다.

  • PDF