• 제목/요약/키워드: object-based video coding

검색결과 65건 처리시간 0.026초

A FAST ALGORITHM FOR REGION-ORIENTED TEXTURE CODING

  • Bae, Cheol-Soo;Kim, Hyun-yul
    • 한국정보전자통신기술학회논문지
    • /
    • 제7권4호
    • /
    • pp.205-211
    • /
    • 2014
  • This paper addresses the framework of object-oriented image coding, describing a new algorithm, based on monodimensional Legendre polynomials, for texture approximation. Through the use of 1D orthogonal basis functions, the computational complexity which usually makes prohibitive most of 2D region-oriented approaches is significantly reduced, while only a slight increment of distortion is introduced. In the aim of preserving the bidimensional intersample correlation of the texture information as much as possible, suitable pseudo-bidimensional basis functions have been used, yielding significant improvements with respect to the straightforward 1D approach. The algorithm has been experimented for coding still images as well as motion compensated sequences, showing interesting possibilities of application for very low bitrate video coding.

Visual Modeling and Content-based Processing for Video Data Storage and Delivery

  • Hwang Jae-Jeong;Cho Sang-Gyu
    • Journal of information and communication convergence engineering
    • /
    • 제3권1호
    • /
    • pp.56-61
    • /
    • 2005
  • In this paper, we present a video rate control scheme for storage and delivery in which the time-varying viewing interests are controlled by human gaze. To track the gaze, the pupil's movement is detected using the three-step process : detecting face region, eye region, and pupil point. To control bit rates, the quantization parameter (QP) is changed by considering the static parameters, the video object priority derived from the pupil tracking, the target PSNR, and the weighted distortion value of the coder. As results, we achieved human interfaced visual model and corresponding region-of-interest rate control system.

이동멀티미디어 방송을 위한 미디어 처리기 설계 및 구현 (Design and implementation of a media processor for mobile multimedia broadcasting)

  • 안상우;이용주;최진수;김진웅
    • 방송공학회논문지
    • /
    • 제8권3호
    • /
    • pp.259-267
    • /
    • 2003
  • 본 논문에서는 이동 멀티미디어 방송 환경에서 대화형 서비스를 제공하기 위한 이동 멀티미디어 방송 미디어 처리기를 제안한다. 제안한 미디어 처리기는 오디오/비디오 부호화기로 MPEG-4 AVC(Advanced Video Coding) 및 MPEG-4 BSAC(Bit Sliced Arithmetic Coding) 부호화기를 사용하여, MPEG-4 IOD(Initial Object Descriptor)/OD(Object Descriptor)/BIFS(Binary Format for Scene) 데이터를 생성하는 기능, MPEG-4 AVC/BSAC 및 생성된 MPEG-4 OD/BIFS 데이터를 SL(Sync Layer) 패킷으로 캡슐화하는 기능, SL 패킷을 MPEG-2 TS(Transport Stream)로 패킷화하는 기능 및 다중화하는 기능을 지원할 수 있도록 설계하였다. 본 논문에서 제안한 이동 멀티미디어 방송 미디어 처리기는 사용자에게 MPEG-4 시스템 규격을 기반으로 대화형 서비스를 지원할 수 있다.

비선형 다중스케일 필터링을 사용한 비디오 객체 분할에 관한 연구 (A Study on Video Object Segmentation using Nonlinear Multiscale Filtering)

  • 이웅희;김태희;이규동;정동석
    • 한국통신학회논문지
    • /
    • 제28권10C호
    • /
    • pp.1023-1032
    • /
    • 2003
  • MPEG-4와 같은 객체 기반 부호화는 멀티미디어 응용을 위한 다양한 내용 기반 기능들을 제공한다. 압축 효율의 향상과 더불어 이러한 기능들이 지원되도록 하기 위해서는 비디오 데이터의 각 프레임은 비디오 객체로 분할되어야 한다. 본 논문에서는 비선형 다중스케일 필터링과 시공간 정보를 사용한 효과적인 비디오 객체 분할 기법을 제안한다. 제안된 방법은 안정화된 역 확산 방정식(Stabilized Inverse Diffusion Equation : SIDE)에 기반한 비선형 다중스케일 필터링을 사용하여 공간적 분할을 수행한다. 또한 구해진 초기 분할된 영역들은 인접 영역 그래프 (Region Adjacency Graph : RAG)를 사용하여 병합된다. 본 논문에서는 통계적 유의성 검사(Statistical significance test)와 시변 메모리(Time-variant memory)를 시간적 분할 방법으로 사용하며 구해진 공간적 분할과 시간적 분할을 결합하여 최종 객체 영역을 효과적으로 분할한다. 본 논문에서 제안된 공간적 분할 방법은 기존의 형태학적 Watershed 알고리즘에 비해 잡음에 강인한 분할 특성을 나타내었으며 기존의 A. Neri의 방법과 비교하였을 때, 최종 분할된 객체 영역의 정확도 비율이 Akiyo는 43%, Claire는 29% 정도 향상됨을 확인할 수 있었다.

Adaptive Transcoding for Object-based MPEG-4 Scene using Optimal Configuration of Objects

  • Cha, Kyung-Ae
    • 한국멀티미디어학회논문지
    • /
    • 제9권12호
    • /
    • pp.1560-1571
    • /
    • 2006
  • In order to transmit multimedia streams over the network with a timely changing channel bandwidth such as Internet, scalable video coding schemes have been studied to represent video in flexible bitstream. Much research has been made on how to represent encoded media(such as video) bitstream in scalable ways. In this paper, rte propose an optimal selection of the objects for MPEG-4 bitstream adaptation to meet a given constraint. We adopt a multiple choice knapsack problem with multi-step selection for the MPEG-4 objects with different bit-rate scaling levels in the MPEG-4 bitstream. The bitstream adaptation based on the optimal selection result is then to fetch the necessary parts of the MPEG-4 bitstream to constitute an adapted version of the original MPEG-4 binary resource. The experiment results show that the optimal selection of MPEG-4 objects for a given constraint can promisingly be made which meets the given constraint.

  • PDF

실시간 객체기반 비디오 서비스를 위한 MPEG-4 Encoder 분석 (Analysis of MPEG-4 Encoder for Object-based Video)

  • 김민훈;이선영;문석주;장의선
    • 대한전자공학회논문지SP
    • /
    • 제41권1호
    • /
    • pp.13-20
    • /
    • 2004
  • 본 논문에서는 현재 MPEG-4 비디오의 인코더를 분석하고 인코더의 복잡함을 줄일 수 있는 효율적인 압축기술을 제안하였다. 지금까지의 객체기반 비디오에서는 유/무선 저 전송률 부호화환경에 맞추기 위하여 형상부호화(Shape coding)를 제외한 인코더 최적화가 주를 이루었다. 최근에 본 연구팀이 수행한 형상부호화의 복잡도를 줄이기 위한 실험을 통하여 객체기반 부호화에서 형상부호화가 차지하는 계산비중이 상대적으로 높다는 것을 밝혀냈다 본 논문에서는 최근까지의 영상부호화 분야와 형상부호화 분야의 최적화 기술이 성공적으로 결합되어 최적의 객체기반 부호화 기술을 유도할 수 있는지 실험하였다 먼저 영상부호화 부분에서는 기존의 MEMC(Motion Estimation Motion Compensation)에서 사용된 검색 방법인 나선형 검색 대신에 MVFAST(Motion Vector Field Adaptive Search Technique) 기술을 채택하였고, 형상부호화 부분에서는 복잡함을 줄이기 위해 기존의 MEMC에서 사용된 나선형 검색을 생략하고 IVOPF(Intelligent VOP Formation) 대신 TRB(Tightest Rectangular Boundary)을 채택하여 최적화에 적용해 보았다. 실험결과, 객체기반 부호화를 위한 제안된 최적화 방식이 기존의 reference software 보다 $57.3\%$ 향상되었음을 알 수 있었다. 아울러, 본 논문에서 제안된 기술은 형상부호화 부분에만 적용된 최적화 기술보다 $50.8\%$ 향상된 실험결과를 보여주었다.

MPEG-4 Shape Decoder의 적합성 검사 (Conformance Test for MPEG-4 Shape Decoders)

  • 황혜전;박인수;박수현;이병욱
    • 한국통신학회논문지
    • /
    • 제25권6B호
    • /
    • pp.1060-1067
    • /
    • 2000
  • MPEG-4 영상압축 방식은 객체지향적이다. 기존의 H.261, MPEG-1, MPEG-2에서 화면 전체를 부호화 해주는 것과 달리 MPEG-4에서는 한 화면을 물체, 배경 등 여러 객체들로 나누어 각각의 객체를 따로 부호화한다. 이렇게 전송된 객체들은 수신 단말기에서 다시 합성하여 완성된 화면으로 보여준다. MPEG-4의 형상 부호화는 화면에서 visual 객체에 해당하는 부분만을 부호화 해주는 부분이다. 본 논문에서는 MPEG-4 디코더가 형상 복호화의 표준 규격을 따르는지를 시험하는 방법을 제안한다. 본 논문은 BAB type을 결정하는 mode 복호화의 모든 경우와 Context-based Arithmetic 복호화의 Context computation에 대한 모든 경우에 대해 확인하는 방법을 제안하였다.

  • PDF

A Fast Algorithm for Region-Oriented Texture Coding

  • Choi, Young-Gyu;Choi, Chong-Hwan;Cheong, Ha-Young
    • 한국정보전자통신기술학회논문지
    • /
    • 제9권6호
    • /
    • pp.519-525
    • /
    • 2016
  • This paper addresses the framework of object-oriented image coding, describing a new algorithm, based on monodimensional Legendre polynomials, for texture approximation. Through the use of 1D orthogonal basis functions, the computational complexity which usually makes prohibitive most of 2D region-oriented approaches is significantly reduced, while only a slight increment of distortion is introduced. In the aim of preserving the bidimensional intersample correlation of the texture information as much as possible, suitable pseudo-bidimensional basis functions have been used, yielding significant improvements with respect to the straightforward 1D approach. The algorithm has been experimented for coding still images as well as motion compensated sequences, showing interesting possibilities of application for very low bitrate video coding.

비디오 시퀸스에서 움직임 객체 분할과 VOP 추출을 위한 강력한 알고리즘 (A Robust Algorithm for Moving Object Segmentation and VOP Extraction in Video Sequences)

  • 김준기;이호석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권4호
    • /
    • pp.430-441
    • /
    • 2002
  • 비디오 객체 분할은 MPEG-4와 같은 객체기반 비디오 코딩을 위한 중요한 구성 요소이다. 본논문은 비디오 시퀸스에서 움직임 객체 분할을 위한 새로운 알고리즘과 VOP(Video Object Plane)추출 방법을 소개한다. 본 논문의 핵심은 시간적으로 변하는 움직임 객체 에지와 공간적 객체 에지 검출 결과를 효율적으로 조합하여 정확한 객체 경계를 추출하는 것이다. 이후 추출된 에지를 통하여 VOP를 생성한다. 본 알고리즘은 첫 번째 프레임을 기준영상으로 설정한 후 두 개의 연속된 프레임 사이의 움직임 픽셀 차이 값으로부터 시작된다. 차이영상을 추출한 후 차이영상에 Canny 에지 연산과 수리형태 녹임 연산(erosion)을 적용하고, 다음 프레임의 영상에 Canny 에지 연산과 수리형태 녹임 연산을 적용하여 두 프레임 사이의 에지 비교를 통하여 정확한 움직임 객체 경계를 추출한다. 이 과정에서 수리형태학 녹임 연산은 잘못된 객체 에지의 검출을 방지하는 작용을 한다. 두 영상 사이의 정확한 움직임 객체 에지(moving object edge)는 에지 크기를 조절하여 생성한다. 본 알고리즘은 픽셀 범위까지 고려한 정화한 객체의 경계를 얻음으로서 매우 쉬운 구현과 빠른 객체 추출을 보였다.

비디오객체의 경계향상을 위한 VLSI 구조 (VLSI Architecture for Video Object Boundary Enhancement)

  • 김진상
    • 한국통신학회논문지
    • /
    • 제30권11A호
    • /
    • pp.1098-1103
    • /
    • 2005
  • 에지나 윤곽 정보는 인간의 시각 시스템에 의하여 가장 잘 인식되며 객체의 인식과 지각에 사용되는 중요한 정보이다. 그러므로 비디오내의 객체간의 상호작용, 객체기반 코딩과 표현과 같은 응용을 위하여, 비디오객체의 추출과정에 에지정보를 적용하면 인간의 시각 시스템과 근접한 객체 경계를 얻을 수 있다. 대부분의 객체추출 방식은 연산량이 많고 반복적인 연산을 수행하므로 실시간 처리가 어렵다. 본 논문에서는 비디오객체 분할 과정에 에지 정보를 적용하여 정확한 객체 경계를 추출하는 VLSI 구조를 제안한다. 제안된 하드웨어 구조는 연산방식이 간단하므로 하드웨어로 쉽게 구현될 수 있으며, 제안된 VLSI 하드웨어 구조를 이용하면 객체기반 멀티미디어 응용을 위하여 실시간으로 비디오객체를 분할할 수 있다.