Search | Korea Science

A sturdy on the blind audio source separation based on multi-step NMF-EM algorithm (다중 단계 NMF-EM 알고리즘 기반의 오디오 소스 분리 방법에 대한 연구)

Cho, Choongsang;Kim, Jewoo
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2014.06a
- /
- pp.9-11
- /
- 2014
본 논문에서는 오디오 신호의 특성 표현에 유용한 nonnegative matrix factorization(NMF)에 대해 설명하였으며, expectation maximization (EM)을 이용한 NMF 파라미터 추출 및 EM-NMF 기반한 오디오 소스 분리 기술에 대해서 설명했다. 또한, 다중 단계 NMF-EM 구조의 객체 분리를 통해서 객체 분리 성능을 향상시키기 위한 알고리즘을 제안하며, 제안된 알고리즘은 K-pop 음원과 SDR(source distortion ratio)를 통해서 객체 분리 성능을 평가한다. 성능 평가 결과 제안된 알고리즘은 다중 단계를 통해 약 3dB 의 보컬 분리 성능이 향상되며, 상업적 음원 제작에서 사용되는 가상 오디오 효과가 많이 적용된 음원에서 약 5dB 의 분리 성능을 향상시켰다. 그러므로 제안된 방식은 오디오 객체 분리에 유용한 방법이 될 것으로 생각된다.
PDF

Object Audio Coding Standard SAOC Technology and Application (객체 오디오 부호화 표준 SAOC 기술 및 응용)

Oh, Hyen-O;Jung, Yang-Won
- Journal of the Institute of Electronics Engineers of Korea SP
- /
- v.47 no.5
- /
- pp.45-55
- /
- 2010
Object-based audio coding technology has been interested with its expectation to apply in wide areas. Recently, ISO/IEC MPEG has standardized a parametric object audio coding method, the SAOC (Spatial Audio Object Coding). This paper introduces parametric object audio coding techniques with special focus on the MPEG SAOC and also describes several issues and solutions that should be considered for a success in its application.
PDF KSCI

Three Dimensional Audio Technologies for Realistic Broadcasting (실감방송을 위한 3차원 오디오 기술)

Jang, D.Y.;Seo, J.I.;Lee, T.J.;Park, G.Y.;Kang, K.O.
- Electronics and Telecommunications Trends
- /
- v.19 no.4 s.88
- /
- pp.53-62
- /
- 2004
차세대 방송 서비스는 입체감있는 3차원 AV 콘텐츠와 자연스럽게 사용자와 인터랙션하는 대화형 콘텐츠를 기반으로 하는 실감방송으로 변화되어 갈 것으로 예상된다. 이러한 실감방송 서비스에서는 현장감을 효율적으로 나타낼 수 있는 음상 정위 및 음장 재현 등 3차원 오디오 기술과 사용자 인터랙션을 위한 객체기반 오디오 처리 기술들이 필요하다. 본 고에서는 이러한 현장감과 사용자 인터랙션을 통하여 가상현실에 근접한 서비스를 제공하기 위한 대표적인 3차원 오디오 기술의 개발 동향을 살펴본다. 우선 3차원 오디오 기술의 기본 개념 및 개요를 기술하며, 이러한 3차원 오디오 기술에 기반한 대화형 3차원 오디오 기술 개발에 대한 최근 동향을 살펴보고, 국내에서 개발하고 있는 객체기반 3차원 오디오 기술에 대하여 간략히 설명한다.
https://doi.org/10.22648/ETRI.2004.J.190407 인용 PDF

Non-uniform Linear Microphone Array Based Source Separation for Broadcasting Audio Content Production (방송용 오디오 콘텐츠 제작을 위한 비균등 선형 마이크로폰 어레이 기반의 음원분리 방법)

Chun, Chan Jun;Kim, Hong Kook
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2015.11a
- /
- pp.21-22
- /
- 2015
현재 UHDTV (Ultra-High-Definition TV) 시대에 사용될 멀티미디어 부호화로 MPEG-H를 표준화로 진행하고 있다. 향후 방송용 오디오 콘텐츠는 채널 오디오 콘텐츠에서 진화하여 객체 오디오 콘텐츠까지도 필요하게 된다. 이에 따라, 본 논문에서는 고품질의 방송용 오디오 콘텐츠를 제작하기 위한 비균등 선형 마이크로폰 어레이 기반의 음원분리 방법을 제안한다. 제안된 방법은 주어진 어레이 배치에 따라 채널간의 시간차를 분석하고, 이에 따른 객체 오디오 생성을 위한 음원분리 기술을 적용한다. 제안된 기법의 성능을 검증하기 위하여 음원분리도를 측정하였고, MVDR (Minimum Variance Distortionless Response) 빔형성기와 성능을 비교하였다. 비교 결과, 제안된 기법이 MVDR 빔형성기에 비하여 12.8% 높은 음원분리도 수치를 나타낸 것을 확인하였다.
PDF

Design and Implementation of Distributed Object Framework Supporting Audio/Video Streaming (오디오/비디오 스트리밍을 지원하는 분산 객체 프레임 워크 설계 및 구현)

Ban, Deok-Hun;Kim, Dong-Seong;Park, Yeon-Sang;Lee, Heon-Ju
- Journal of KIISE:Computing Practices and Letters
- /
- v.5 no.4
- /
- pp.440-448
- /
- 1999
본 논문은 객체지향형 분산처리 환경 하에서 오디오나 비디오 등과 같은 실시간(real-time) 스트림(stream) 데이타를 처리하는 데 필요한 소프트웨어 기반구조를 설계하고 구현한 내용을 기술한다. 본 논문에서 제시한 DAViS(Distributed Object Framework supporting Audio/Video Streaming)는, 오디오/비디오 데이타의 처리와 관련된 여러 소프트웨어 구성요소들을 분산객체로 추상화하고, 그 객체들간의 제어정보 교환경로와 오디오/비디오 데이타 전송경로를 서로 분리하여 처리한다. 분산응용프로그램 작성자는 DAViS에서 제공하는 서비스들을 이용하여, 기존의 분산프로그래밍 환경이 제공하는 것과 동일한 수준에서 오디오/비디오 데이타에 대한 처리를 표현할 수 있다. DAViS는, 새로운 형식의 오디오/비디오 데이타를 처리하는 부분을 손쉽게 통합하고, 하부 네트워크의 전송기술이나 컴퓨터시스템 관련 기술의 진보를 신속하고 자연스럽게 수용할 수 있도록 하는 유연한 구조를 가지고 있다. Abstract This paper describes the design and implementation of software framework which supports the processing of real-time stream data like audio and video in distributed object-oriented computing environment. DAViS(Distributed Object Framework supporting Audio/Video Streaming), proposed in this paper, abstracts software components concerning the processing of audio/video data as distributed objects and separates the transmission path of data between them from that of control information. Based on DAViS, distributed applications can be written in the same abstract level as is provided by the existing distributed environment in handling audio/video data. DAViS has a flexible internal structure enough to easily incorporate new types of audio/video data and to rapidly accommodate the progress of underlying network and computer system technology with very little modifications.

Enhanced MP4 Streaming by using Schedule Information of Image Objects (영상 객체 스케줄 정보를 이용한 MP4 스트리밍 개선)

Jeong, Se-Yoon;Cha, Ji-Hun;Kim, Hyun-Cheol;Kim, Kyu-Heon
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2005.11a
- /
- pp.159-162
- /
- 2005
본 논문에서는 기존의 비디오와 오디오 중심의 멀티미디어 스트리밍 방법과는 달리 정지 영상의 스케줄 정보도 고려하여 전체 스트리밍의 QoS (Quality of Service)를 높이는 스트리밍 방법을 제안한다. MP4 콘텐츠의 분량이 커지고 내용이 복잡해질수록 비디오와 오디오 이 외의 데이터들을 더 이상 무시할 수 없게 된다. MP4의 장면 구성 정보를 알면 임의의 시점에서 재생되는 화면과 소리를 알 수가 있고, 이 정보, 즉 스케줄 정보를, 고려하여 정지영상 객체를 전송한다면 보다 효율적인 스트리밍이 가능하다 또한, 비디오와 오디오에 스케일러블 부호화를 적용하면 QoS를 높일 수 있듯이, 정지영상의 경우 Progressive JPEG을 이용하면 스케일러블한 전송이 가능하다. 이에 제안된 스트리밍 서버에서는 정지 영상 스케줄 정보와 정지 영상 객체를 Progressive JPEG으로 변환하여 스트리밍 서비스를 제공하고 있다.
PDF

An Integration of Mpeg-4 Video Decoder and IM1 Decoder Framework (IM1 프레임워크 상에 MPEG-4 비디오 디코더 통합)

민옥기;정영우;이광의;김학영
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.10b
- /
- pp.260-262
- /
- 2000
MPEG-4에서는 다양한 객체를 취급하기 위하여 시스템 부분(Part1)이 차지하는 비중이 MPEG-1이나 MPEG-2에서 보다 훨씬 높아졌다. 이러한 MPEG-4의 시스템 부분을 구현한 참조 모델을 IM1이라고 한다. IM1에는 다양한 오디오/비디오(A/V) 객체를 수용하기 위하여 디코더 프레임워크를 마련하고, 어떤 A/V 객체든 이 프레임워크에 맞추어 디코더를 구현하면 IM1 프리젠터에서 플레이가 가능토록 하고 있다. 현재 IM1 버전 3.8에서는 H.263 비디오, G.723 오디오, JPEG 이미지, AAC 오디오를 지원하고 있다. 이 논문에서는 MPEG-4 비디오 디코더를 IM1 디코더 프레임워크를 맞추어 설계, 수정한 내용을 기술하였다.
PDF

Design and Implementation of a Distributed Audio/Video Stream Service Framework based on CORBA (CORBA 기반의 분산 오디오/비디오 스트림 서비스 프레임워크의 설계 및 구현)

Kim, Jong-Hyeon;No, Yeong-Uk;Jeong, Gi-Dong
- The KIPS Transactions:PartA
- /
- v.9A no.2
- /
- pp.207-216
- /
- 2002
This paper present a design and implementation of a distributed audio, Video stream service framework based on CORBA for efficient processing and control of audio/video stream. We design software components which support processing, control and transmission of audio/video streams as distributed objects. For optimization of stream transmission performance, we separate the transmission path of control data and media data. Distributed objects are defined by IDL and implemented using JAVA. And device dependent facilities like media capturing, playing and communication channels are implemented using JMF (Java Media Framework) components. We show a connection establishment and control procedure of streams communication. And for evaluation, we implement a test system and experiment a system performance. Our experiments show that test system has somewhat longer connection latency time compared to TCP connection establishment, but has optimized media transmission time compared to CORBA IIOP. Also test system show acceptable service quality of media transmission.
https://doi.org/10.3745/KIPSTA.2002.9A.2.207 인용 PDF KSCI

360VR 오디오 기술 및 표준화 동향

Lee, Yong-Ju;Lee, Tae-Jin;Kim, Hwi-Yong
- Broadcasting and Media Magazine
- /
- v.23 no.4
- /
- pp.67-81
- /
- 2018
최근 영화, 스포츠 중계, 게임 등 다양한 종류의 콘텐츠가 VR 형태로 서비스되고 있는데, 이러한 360도 영상 서비스 환경에서 영상과 오디오를 더욱 실감나게 제공하는 기술에 대한 연구도 많이 이루어지고 있다. 오디오의 경우 스테레오, 5.1 채널 오디오 등과 같은 채널 기반 오디오가 방송, 영화 등에서 주로 사용되었는데, 최근에는 객체 기반 오디오, 장면 기반 오디오 기술의 적용이 시도되고 있다. VR 서비스에서도 더욱 실감 있는 오디오를 제공하기 위하여 이러한 최신 오디오 기술의 적용이 시도되고 있다. 본 고에서는 증강 현실 및 가상 현실에 활용될 수 있는 최신 오디오 기술에 대해 간략하게 살펴보고, 최신 오디오 기술이 어떻게 VR 서비스에 적용이 되고 있는지에 대해 살펴본다. 그리고, VR 서비스를 위한 규격 제정 측면에서 오디오 기술은 어떻게 진행이 되고 있는지에 대하여 간략하게 살펴본다.
PDF KSCI

A Desigin of real sound service based-on object in Smart mobile devices (스마트 모바일 기기에서의 객체 기반 실감 음원 서비스 구현)

Jung, Jong-Jin;Lim, Tae-Beom;Lee, Seok-Pil
- Proceedings of the Korea Information Processing Society Conference
- /
- 2011.04a
- /
- pp.685-688
- /
- 2011
앞으로의 멀티미디어 기기시장은 기존의 단순 복합 디지털 기기들이 아닌 사용자 감성 및 취향 제어가 가능한 인간 친화적 지능형 멀티미디어 기기가 주류를 이룰 것이다. 이미 IT 기능이 기존의 '정보의 소통'에서 '감성의 소통'으로 진화 중에 있으며, 미래시대에는 느낌까지 디지털 신호로 전달 가능한 기술이 발달 될 것이다. 이에 맞추어 사람의 감성, 주변 분위기, 섬세한 공간 정보를 전달하는 사실적인 오디오 개발 및 인프라가 구축되어 모든 멀티미디어 제품에 적용된다면, 사용자는 보다 현장감 있게 멀티미디어를 즐길 수 있을 것이다. 최근 스마트폰의 확산과 더불어 각종 다양한 음악서비스를 제고하는 웹/앱 형태의 어플리케이션이 증대되고 있는 바, 본 논문에서는 안드로이드 기반 스마트 모바일 기기에서 다양한 오디오 정보를 청취자에게 제공하고 이를 활용하여 청취자가 다양하게 오디오 재생 / 제어하여, 일방적으로 청취자가 오디오를 듣는 수준이 아니라 청취자 취향에 따라 다양하게 오디오를 감상 할 수 있는 서비스를 구현하였다.
https://doi.org/10.3745/PKIPS.y2011m04a.685 인용 PDF

Search Result 94, Processing Time 0.021 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)