• Title/Summary/Keyword: 객체 오디오

Search Result 94, Processing Time 0.023 seconds

Polygon based 3D graphic engine for interactive TV (Interactive TV를 위한 Polygon 기반의 3D Graphic Engine)

  • Kim, Jung-Hwan;Jung, Moon-Ryul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2005.11a
    • /
    • pp.243-247
    • /
    • 2005
  • 디지털 방송은 비디오, 오디오와 더불어 데이터를 전송할 수 있다. 데이터 영역에는 셋톱박스(STB)에서 수행되는 애플리케이션(Xlet)이 포함된다. 디지털 방송은 애플리케이션을 이용해 보다 진보된 인터랙티브 프로그램을 제공할 수 있다. 그러나 이러한 인터렉티브 TV에서 3차원 객체의 활용은 아직 여러 제한사항으로 인해 어려움이 있다. 현재 제정된 DVB-MHP, SCTE-OCAP, ATSC-ACAP 등의 데이터 방송 표준은 3D 객체를 표현하기 위한 구체적인 방법을 기술하지 않고 있다. 또한, 상용셋톱박스에 탑재된 자바 가상 머신(Java Virtual Machine)은 3D 객체를 렌더링(Rendering)하기 위한 API를 제공하지 않고 있다. 그리고 이를 위한 별도의 플러그인(Plug-in)도 제공하지 않는다. 본 논문에서는 Interactive TV에서 3차원 객체를 표현하기 위해 필요한 기본개념과 기술 및 데이터 방송 표준을 분석하고, 이들을 통합하여 polygon 기반의 3D Graphic Engine을 제안한다. 특히, 본 논문에서 제안하는 3D Graphic Engine API는 각각의 표준에서 가용한 공통 API를 기반으로 설계 되었으며, Java Virtual Machine 1.1 환경에서 구동될 수 있도록 구현되었다.

  • PDF

Synchronized MP3 Playing System Using XML Extension of MP3 Tag (MP3 태그의 XML 확장을 이용한 동기화된 재생 시스템)

  • Gwak, Mi-Ra;Jo, Dong-Seop
    • The KIPS Transactions:PartB
    • /
    • v.9B no.1
    • /
    • pp.67-76
    • /
    • 2002
  • MP3 audio format has good quality and high compression rate ; therefore, the use of MP3 format increases. The requirement of keeping the extra information such as author and lyrics in MP3 files increases. And the tagging systems designed to meet this requirement are suggested. ID3 vl tag and Lyrics3 v2 tag are two most widely used tagging systems. But ID3 vl tag and Lyrics3 v2 tag are the last things to arrive when the file is being streamed. Therefore, users cannot get the tag information until the entire audio file is downloaded. Moreover information synchronized with audio stream may lose its feature. In this paper, a system searching and playing audio files based on tag information in MP3 files is implemented. This system solves the problem that the tag information is ignored when an MP3 files is played on internet. An audio object is described in an XML document, and timing and synchronization between elements in that In document is provided in HTML+TIME style using XSL.

Implementation of the TMS320C6701 DSP Board for Multichannel Audio Coding (멀티채널 오디오 부호화를 위한 TMS320C6701 DSP 보드 구현)

  • 장대영;홍진우;곽진석
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 1999.11a
    • /
    • pp.199-203
    • /
    • 1999
  • This paper is on the DSP system design and implementation for real time MPEG-2 AAC multichannel audio, and MPEG-4 object oriented audio coding. This DSP system employs two DSPs of the state of the art TMS320C6701, developed by TI semiconductor. DSP board has PCI interface for downloading application program and control the system. DSP board was designed to use for both encoder and decoder, by setting several switches. The system contains external input and output box also, for A/D and D/A conversion for eight channel audio. The input box converts multi channel digital audio to ADI format, that provides serial interface for eight channel digital audio. And the output box converts ADI format signal to multi channel audio. Through this ADI interface, DSP boards can be connected to input, output box. Implemented DSP system was tested for integration with MPEG-2 AAC encoder and decoder S/W. Currently the DSP system performs realtime AAC 4-channel audio encoding with two DSPs, and 8-channel decoding with one DSP.

  • PDF

Icon-based Synchronization Representation for SMIL Authoring Tool (SMIL 저작도구를 위한 아이콘 기반의 동기화 표현 기법)

  • 노승진;장진희;성미영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.403-405
    • /
    • 2001
  • 이 연구는 오디오, 비디오, 이미지, 텍스트 등의 다양한 멀티미디어 객체들을 동기적으로 통합하여 표현하기 위한 SMIL(Synchronized Multimedia Integration Language) 표준을 지원하는 GUI 기반 저작도구의 구현에 대한 것이다. 현재까지 멀티미디어 저작을 위한 다양한 인터페이스가 개발되어 왔다. 본 논문에서는 멀티미디어의 논리적인 프리젠테이션 과정을 직관적으로 표현하기 위한 그래픽 사용자 인터페이스를 제안한다. 본 논문에서 제안하는 사용자 인터페이스는 일반적인 미디어객체들 간의 시간관계를 직관적으로 표현하고 편집할 수 있는 아이콘 기반의 인터페이스와, 미디어간의 세부적인 편집을 지원하는 시간기반의 인터페이스, 미디어 객체들의 공간적 재생 위치를 지정하는 배치(layout) 인터페이스 등이다. 이와 같은 다양한 인터페이스를 통합하여 위지위그(WYSIWYG) 방식으로 SMIL파일을 생성할 수 있다.

  • PDF

Quantity-based Proxy Caching Policy for Continuous Media Streams (연속미디어 스트림의 재생량에 기반한 proxy caching 기법)

  • 임은지;최태욱;박성호;정기동
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10c
    • /
    • pp.588-590
    • /
    • 2000
  • 인터넷의 사용이 일반화되어 WWW 기반 서비스와 사용자가 급증함에 따라서 서버의 과부하, 네트워크의 혼잡, 사용자에 대한 응잡 지연 등의 문제가 심각하게 나타나고 있다. 또한, 현재 인터넷상에는 오디오나 비디오와 같은 연속미디어 데이터가 급격히 증가하는 추세에 있다. 본 논문은 인터넷상의 연속미디어 객체의 일부분 또는 전체를 캐슁하는 프락시 캐슁 기법을 제안한다. 제안하는 기법은 객체의 인기도에 따라서 캐슁할 최적의 데이터 양을 결정하고, 결정된 양만큼의 앞부분 데이터를 캐슁한다. 또한, 본 논문은 연속미디어 데이터의 특성을 고려하여, 각 객체에 대한 클라이언트의 재생량에 기반한 인기도 측정 방법을 제안한다. 마지막으로, 실험을 통하여 제안하는 기법의 성능을 평가한 결과, 제안한 캐슁 기법이 BHR면에서는 다른 알고리즘과 비슷하였으나, 전송 지연과 재배치 횟수면에서 다른 알고리즘들에 대하여 최고 2배 이상 성능이 우수하였다. 재생량을 이용한 인기도 측정법도 접근빈도를 이용한 경우보다 성능이 우수하였다.

  • PDF

MPEG-H 3D Audio Decoder Structure and Complexity Analysis (MPEG-H 3D 오디오 표준 복호화기 구조 및 연산량 분석)

  • Moon, Hyeongi;Park, Young-cheol;Lee, Yong Ju;Whang, Young-soo
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.42 no.2
    • /
    • pp.432-443
    • /
    • 2017
  • The primary goal of the MPEG-H 3D Audio standard is to provide immersive audio environments for high-resolution broadcasting services such as UHDTV. This standard incorporates a wide range of technologies such as encoding/decoding technology for multi-channel/object/scene-based signal, rendering technology for providing 3D audio in various playback environments, and post-processing technology. The reference software decoder of this standard is a structure combining several modules and can operate in various modes. Each module is composed of independent executable files and executed sequentially, real time decoding is impossible. In this paper, we make DLL library of the core decoder, format converter, object renderer, and binaural renderer of the standard and integrate them to enable frame-based decoding. In addition, by measuring the computation complexity of each mode of the MPEG-H 3D-Audio decoder, this paper also provides a reference for selecting the appropriate decoding mode for various hardware platforms. As a result of the computational complexity measurement, the low complexity profiles included in Korean broadcasting standard has a computation complexity of 2.8 times to 12.4 times that of the QMF synthesis operation in case of rendering as a channel signals, and it has a computation complexity of 4.1 times to 15.3 times of the QMF synthesis operation in case of rendering as a binaural signals.

An efficient multichannel spatial audio coding method based on inter channel correlation (채널상관성에 기반한 효율적인 멀티채널 spatial audio coding 방법)

  • Lee Byonghwa;Beack Seungkwon;Seo Jeongil;Hahn Minsoo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.157-160
    • /
    • 2004
  • Spatial Audio Coding 방법 중 하나인 Binaural Cue Coding 방법은 다채널 다객체 오디오 신호를 모노나 스테레오로 다운 믹스한 신호와 spatial 큐를 전송해 디코더에서 복원하는 기술로 작은 비트 율로 다채널 오디오 신호를 전송 복원해 내는 기술이다. 본 논문은 BCC 코딩 방법에서 채널 상관도를 나타내는 ICC 파라메터에 따라 spatial cue 종류를 달리함으로써 전송되는 부가정보의 비트 율을 줄이는 방법을 제안한다.

  • PDF

Simulation of DMB System with GPAC OSMO Player in PDA Environments (모바일 환경에서 GPAC OSMO 재생기를 이용한 DMB 시스템 시뮬레이션)

  • Li, Song-Iu;Kim, Sang-Wook
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.134-137
    • /
    • 2006
  • 디지털멀티미디어방송(DMB)은 고품질의 방송 영상 및 부가 데이터를 이동 중인 차량내에서나 휴대형 단말에서 수신할 수 있는 이동 멀티미디어 방송 서비스이다. 그러나 현재 국내에서 상용화 되고 있는 지상파와 위성 DMB 서비스는 아직 비디오와 오디오에 기반한 단순한 컨텐츠에 중심을 두고 있어 사용자의 기대치에 미치지 못하고 있는 상황이다. 그리하여 현재처럼 단순히 기존의 오디오와 비디오에 기반한 케이블 TV프로그램을 그대로 옮겨올 것이 아니라, 다양한 미디어 객체들을 추가하여 사용자 인터랙티브한 대화형 멀티미디어 컨텐츠를 지원하고 더 나아가서 사용자와 서비스 제공자와의 인터랙션을 지원하는 양방향 데이터 서비스에 대한 연구가 필요하다. 본 논문에서는 실시간 양방향 대화형 DMB 서비스를 최종목표로 먼저 PC환경에서 뿐만아니라 모바일 환경에서 MPEG-4 컨텐츠의 스트리밍 시스템을 구현함으로써 DMB시스템을 시뮬레이션 한다.

  • PDF

Adaptation Techniques of an Object-based MPEG-4 Player to PDA (객체 기반 MPEG-4 재생 기술의 PDA 적응 기법)

  • Kim, Nam-Young;Kim, Sang-Wook
    • Journal of KIISE:Software and Applications
    • /
    • v.33 no.2
    • /
    • pp.220-230
    • /
    • 2006
  • As the computing technique and mobile devices get developed, the demand of multimedia contents for mobile environment has been increased. The multimedia contents provided on PDA has so far been limited to the materials such as video and audio. MPEG-4 is the international standard used for supporting to properly save, communicate multimedia in formation such as video, audio, image, text and two-dimensional object, which can present various, multimedia contents by using adaptation techniques. However, since most MPEG-4 contents are not used for PDA but desktop, it seems not to be played on PDA where needs low power consumption, limited memory capability and GUI, and so on. In this paper, we propose the adaptation techniques, which can present the MPEG-4 contents on PDA, using scene composition with MPEG-4. The proposed scheme consists of three subparts: physical adaptation, variation adaptation and resource adaptation. Physical adaptation adjusts the physical difference of between the authoring environment and playback environment. Event adaptation part transforms events used for desktop to the events used for playback on PDA. The resource adaptation enables efficiency of playback to promote by using the essential information table on BIFS parser. As the proposed scheme is applied to MPEG-4 player, we see that the MPEG-4 contents are efficiently played on PDA.