• Title/Summary/Keyword: MPEG-4 scene

Search Result 79, Processing Time 0.02 seconds

Scene Change Detection in MPEG-1 Video Stream using MAcroblock Information (매크로블록 정보를 이용한 MPEG-1 비디오 스트림의 장면 변화검출)

  • Im, Yeong-In;Nang, Jong-Ho
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.26 no.4
    • /
    • pp.527-537
    • /
    • 1999
  • 비디오 데이터를 이용한 응용 프로그램을 개발하기위해서 비디오 데이터베이슬ㄹ 구축하고자하는 경우에는 비디오의 내용(Content)에 따라 자동으로 장면 변화를 검출(Scene Change Detection)하는 기술이 필요하다. 본 논문에서는 MPEG-1 형식으로 저장된 비디오 데이터에 대하여 장면의 변화를 자동적으로 검출할 수 있는 방법을 제안하고 실험을 통하여 그 유용성을 보인다. 제안한 검출 방법에서는 B 프레임의 각 매크로 블록들에 대하여 시간적으로 과거 B 프레임의 대응되는 매크로블록의 타입과 비교를 하고, 이런 각 매크로블록들에 대한 비교 결과의 합이 입계치보다 큰 경우에 장면이 변한 것으로 판단한다. 제안한 방법에서는 입력 비디오 스트림에서 B 프레임의 매크로블록층 정보만을 이용하여 I프레임과 P 프레임의 장면 변화 검출도 가능하므로 정교한 검출이 가능하다. 또한 이런 검출 방법은 단순히 한 B 프레임안의 매크로 블록개수만을 조사하여 장면 변화여부를 검출하는 기존의 방법에 대하여 각 매크로블록의 타입 정보뿐만 아니라 위치 정보도 이용하기 때문에 장면 변화 검출이 견고하다. MPEG-1 형식으로 부호화한 뉴스 및 영화 비디오 데이터에 대한 실험에 의하면, 본 논문에서 제안한 검출 방법은 95% 이상의 정확성을 보임을 알 수있다. 본 논문에서 제안한 MPEG-1 비디오 장면변화검출방법은 MPEG-1 형식의 비디오 데이터를 이용한 디지털 라이브러리 등의 구축등에 유용하게 사용될수 있을 것이다.

Implementation of DMIF & BIFS Parser in Java3D-based MPEG4 System (Java3D 기반 MPEG-4 시스템의 DMIF 및 BIFS 파서 구현)

  • 최정단;장병태;오광만;이민석;곽진석
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.253-259
    • /
    • 2001
  • 인터넷을 통해 멀티미디어 데이터의 접근이 보편화됨에 따라 다양한 형태의 데이터와 사용자 인터렉션이 요구되었고, 또한 유선 및 무선등과 같은 다양한 통신 선로에서 Desktop-PC, PDA, Hand-Held PC등과 같은 다양한 단말기를 통해 멀티미디어 데이터 서비스를 받으려는 사용자의 요구가 증가되고 있다. 따라서 이런 요구를 효율적으로 지원할 수 있는 멀티미디어 시스템에 대한 개발이 요구되었고, 이를 위해 MPEG4 표준이 등장하게 되었다. MPEG-4(ISO/IEC 국제표준 14496)는 오디오, 비디오, 합성 오디오, 그리고 그래픽스 요소(material)를 포함하는 멀티미디어 데이터로 구성된 복잡한 씬(scene)을 구성하고, 이를 통신라인을 통해 사용자와 상호작용이 가능한 멀티미디어 시스템을 정의하는 표준규약을 말한다. 본 논문에서는 Java와 Java3D기반의 MPEG-4 표준 규약에 충실한 MPEG-4 시스템 구현에 대하여 기술한다.

  • PDF

The Development of Terrestrial DMB System for Video Associated Data Services (비디오 부가데이터 서비스를 위한 지상파 DMB 시스템 개발)

  • Kim, Hyun-Soon;Kyung, Il-Soo;Kim, Sang-Hun;Kim, Man-Sik
    • Journal of Broadcast Engineering
    • /
    • v.11 no.4 s.33
    • /
    • pp.541-553
    • /
    • 2006
  • Since DMB on-air was started, not high-qualified audio, video services but various service models have been required. This paper is about systems for one of these services, video associated data service. A terrestrial DMB system to make contents of video associated data services and transmit them on DMB channel is proposed in this paper. This system satisfies standard of the video associated data services for terrestrial DMB; MPEG-4 BIFS (BInary Format for Scene) Core2D scene description profile and graphics profile. This system is designed to support two major features of broadcasting, real-time authoring non automatic transmission and non real-time authoring automatic transmission, and focuses on the abilities to make high-qualified contents efficiently and transmit them to video encoder reliably. This system proved its performance through conformance tests with various receivers, so can be used in future on-air.

The Design of Object-based 3D Audio Broadcasting System (객체기반 3차원 오디오 방송 시스템 설계)

  • 강경옥;장대영;서정일;정대권
    • The Journal of the Acoustical Society of Korea
    • /
    • v.22 no.7
    • /
    • pp.592-602
    • /
    • 2003
  • This paper aims to describe the basic structure of novel object-based 3D audio broadcasting system To overcome current uni-directional audio broadcasting services, the object-based 3D audio broadcasting system is designed for providing the ability to interact with important audio objects as well as realistic 3D effects based on the MPEG-4 standard. The system is composed of 6 sub-modules. The audio input module collects the background sound object, which is recored by 3D microphone, and audio objects, which are recorded by monaural microphone or extracted through source separation method. The sound scene authoring module edits the 3D information of audio objects such as acoustical characteristics, location, directivity and etc. It also defines the final sound scene with a 3D background sound, which is intended to be delievered to a receiving terminal by producer. The encoder module encodes scene descriptors and audio objects for effective transmission. The decoder module extracts scene descriptors and audio objects from decoding received bistreams. The sound scene composition module reconstructs the 3D sound scene with scene descriptors and audio objects. The 3D sound renderer module maximizes the 3D sound effects through adapting the final sound to the listner's acoustical environments. It also receives the user's controls on audio objects and sends them to the scene composition module for changing the sound scene.

A 3D Audio Broadcasting Terminal for Interactive Broadcasting Services (대화형 방송을 위한 3차원 오디오 방송단말)

  • Park Gi Yoon;Lee Taejin;Kang Kyeongok;Hong Jinwoo
    • Journal of Broadcast Engineering
    • /
    • v.10 no.1 s.26
    • /
    • pp.22-30
    • /
    • 2005
  • We implement an interactive 3D audio broadcasting terminal which synthesizes an audio scene according to the request of a user. Audio scene structure is described by the MPEG-4 AudioBIFS specifications. The user updates scene attributes and the terminal synthesizes the corresponding sound images in the 3D space. The terminal supports the MPEG-4 Audio top nodes and some visual nodes. Instead of using sensor nodes and route elements, we predefine node type-specific user interfaces to support BIFS commands for field replacement. We employ sound spatialization, directivity/shape modeling, and reverberation effects for 3D audio rendering and realistic feedback to user inputs. We also introduce a virtual concert program as an application scenario of the interactive broadcasting terminal.

An Efficient Type Codec for Point Data in Lightweight Applications Scene Representation (LASeR)

  • Joung, Ye-Sun;Cha, Ji-Hun;Cheong, Won-Sik;Lim, Young-Kwon;Kim, Kyu-Heon
    • ETRI Journal
    • /
    • v.27 no.6
    • /
    • pp.818-821
    • /
    • 2005
  • Recently, MPEG has opened activity to standardize scene representation for lightweight applications such as in mobile phones. The standard is named lightweight applications scene representation (LASeR) and can be applied to improve and make efficient rich media applications and services on mobile devices. In this standard, we proposed an efficient type codec for point data to maximize the bit efficiency of LASeR. In this paper, we describe the new method and the test results of the proposed scheme.

  • PDF

Scene Change Detection and Key Frame Selection Using Fast Feature Extraction in the MPEG-Compressed Domain (MPEG 압축 영상에서의 고속 특징 요소 추출을 이용한 장면 전환 검출과 키 프레임 선택)

  • 송병철;김명준;나종범
    • Journal of Broadcast Engineering
    • /
    • v.4 no.2
    • /
    • pp.155-163
    • /
    • 1999
  • In this paper, we propose novel scene change detection and key frame selection techniques, which use two feature images, i.e., DC and edge images, extracted directly from MPEG compressed video. For fast edge image extraction. we suggest to utilize 5 lower AC coefficients of each DCT. Based on this scheme, we present another edge image extraction technique using AC prediction. Although the former is superior to the latter in terms of visual quality, both methods all can extract important edge features well. Simulation results indicate that scene changes such as cut. fades, and dissolves can be correctly detected by using the edge energy diagram obtained from edge images and histograms from DC images. In addition. we find that our edge images are comparable to those obtained in the spatial domain while keeping much lower computational cost. And based on HVS, a key frame of each scene can also be selected. In comparison with an existing method using optical flow. our scheme can select semantic key frames because we only use the above edge and DC images.

  • PDF

Semantic Scenes Classification of Sports News Video for Sports Genre Analysis (스포츠 장르 분석을 위한 스포츠 뉴스 비디오의 의미적 장면 분류)

  • Song, Mi-Young
    • Journal of Korea Multimedia Society
    • /
    • v.10 no.5
    • /
    • pp.559-568
    • /
    • 2007
  • Anchor-person scene detection is of significance for video shot semantic parsing and indexing clues extraction in content-based news video indexing and retrieval system. This paper proposes an efficient algorithm extracting anchor ranges that exist in sports news video for unit structuring of sports news. To detect anchor person scenes, first, anchor person candidate scene is decided by DCT coefficients and motion vector information in the MPEG4 compressed video. Then, from the candidate anchor scenes, image processing method is utilized to classify the news video into anchor-person scenes and non-anchor(sports) scenes. The proposed scheme achieves a mean precision and recall of 98% in the anchor-person scenes detection experiment.

  • PDF

A Bit Rate Control of MPEG-4 AVC Video Coding Using Adaptive Quantization (적응 양자화를 이용한 MPEG-4 AVC의 비디오 율 제어 방법)

  • 유충열;신규철;박재두;이명호
    • Journal of Broadcast Engineering
    • /
    • v.9 no.2
    • /
    • pp.142-150
    • /
    • 2004
  • MPEG-4 AVC is an international video coding standard that is being developed. The standardization is mainly targeted at a very high compression ratio. MPEG-4 AVC is a general video coding technology that may be used in various applications. Therefore, MPEG-4 AVC needs an efficient rate control method to be applied in various communication environments. This paper is based on the rate control method that considers human visual characteristic. In this paper, we propose the constant bit rate control method using adaptive quantization and scene change detection. Experiments performed using various test images and experimentation results exhibits a favorable performance over existing rate control methods.

Design of Object Manager for Scalability and Scene Control of MPEG-4 Stream in Multimedia Service Environment (멀티미디어 서비스 환경에서 MPEG-4 스트림의 스케일러빌리티와 장면 제어를 위한 객체 관리기의 설계)

  • 최숙영
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2002.06a
    • /
    • pp.266-275
    • /
    • 2002
  • 현재 멀티미디어 서비스 분야에서 핵심적인 기술로 부상되고 있는 MPEG-4는 고압축률을 제공하며, 그 자체 구조의 모든 요소을 기술하는데 객체지향적인 기법을 사용하고 있다. 본 연구에서는 다양한 통신망과 단말 환경에 잘 대응하고 강력한 상호작용을 지원함으로서 효과적인 멀티미디어 서비스를 제공할 수 있도록, MPEG-4 시스템에 객체 관리기의 기능을 추가하도록 한다. 이 객체 관리기를 통해, 장면트리를 구성하는 객체들에 우선 순위를 부여하고 관리하며, 사용자 상호작용에 따른 장면트리의 변경 및 각 객체의 정보 및 버전들을 관리하도록 한다. 또한 객체간의 시간 관계 모델을 정의함으로서 동기화를 효과적으로 지원 할 수 있도록 한다.

  • PDF