• 제목/요약/키워드: 방송음악

검색결과 197건 처리시간 0.027초

STT 성능 향상을 위한 딥러닝 기반 발화 음성 분리학습 (Deep Learning-based Speech Voice Separation Training To Enhance STT Performance)

  • 김보경;양영준;황용해;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.851-853
    • /
    • 2022
  • 인공지능을 활용한 다양한 딥러닝 기술의 보급과 상용화로 오디오 음성 인식 분야에서도 음성 인식의 정확도를 높이기 위한 다양한 연구가 진행되고 있다. 최근 STT 를 위한 음성 인식 엔진은 딥러닝 기술을 기반으로 과거에 비해 높은 정확도를 보이고 있다. 하지만 예능 프로그램, 드라마, 스포츠 방송 등과 같이 비음성 신호와 음성 신호가 함께 녹음되는 오디오의 경우 음성 인식 정확도가 크게 낮아지는 문제가 발생한다. 이에 본 연구에서는 다양한 장르의 오디오를 음성과 음악을 분리하는 딥러닝 모델을 활용하여 음성 신호와 비음성 신호로 분리하는 방법을 제시하고, STT 결과를 분석하여 음성 인식의 정확도를 높이기 위한 연구 방향을 제시한다.

  • PDF

DMB 데이터 서비스에서의 유아 대상 EDUTAINMENT 어플리케이션 개발 (Development of EDUTAINMENT Application on DMB Data Service)

  • 공신;김효용;박태진;최윤철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.223-228
    • /
    • 2007
  • 근래 주목받는 키워드인 유비쿼터스(Ubiquitous), UCC(User Created Contents) 등은 기술적 발달과 함께한 사람들의 행동 양식 변화를 잘 반영하고 있다. 기술적인 측면에서 모바일 환경으로의 진화는 사람들에게 시공간적 제약을 없애주었으며, '호모 루덴스'로 표현된 유희적 인간의 개념은 현대인의 행동 양식을 잘 표현했다. 이중 지상파 이동 멀티미디어 방송(Digital Multimedia Broadcasting, DMB)은 방송에 있어서 시공간적 제약을 없앤 대표적인 사례이며, 'EDUTAINMENT(에듀테인먼트)'는 교육에 유희를 결합한 실례라고 하겠다. 특히 DMB는 정보와 유희의 욕구를 기본적으로 충족시킬 수 있는 방송이라는 매체를 이용한다는 점에서 에듀테인먼트의 기술적 기반이 될 수 있으며, 이를 통해 저 연령의 학습자에게 유희와 교육을 동시에 제공함으로써, 학습효과를 높일 수 있는 장점이 있다. 본 논문에서는 DMB 시스템을 위한 유아 대상의 에듀테인먼트 어플리케이션을 설계하고, 구현한다. 이 어플리케이션을 위해 스토리텔링, 음악과 악기 선택 시스템, 타임라인 및 자유표면 게임 시스템 등 DMB 시스템에 적절하며, 에듀테인먼트의 조건을 충족하는 몇 가지 방법론을 제안하여 방송을 통해 콘텐츠와 대상자가 서로 상호작용 할 수 있도록 한다. 이를 위해서는 기존 방송의 음성, 영상 서비스를 넘어 상호작용의 필수적인 요소라고 할 수 있는 데이터 서비스를 요구하며, 이는 MPEG-4 Part 11: BIFS(Binary Format for Scenes) 기술을 기반으로 그 구현에는 VRML에 기초한 BT(BIFS Text) 언어를 사용한다.

  • PDF

IPTV 환경에서의 콘텐츠 정보 강화 서비스의 설계 및 구현 (Design and Implementation of content information enrichment service in the IPTV environment)

  • 이종설;장세진;이석필
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.424-427
    • /
    • 2011
  • 방송 환경과 인터넷 환경이 융합되고 스마트 TV의 등장에 따라, 사용자는 복잡한 미디어 서비스 환경에 노출되었다. 이로 인해 사용자가 접하는 미디어 콘텐츠의 종류와 데이터의 양은 기하급수 적으로 증가 하고 있다. 웹과 인터넷을 기반으로 하는 정보기술은 모바일 전자 기술의 발달에 따라 데스크탑 이라는 공간적인 한계를 벗어나 유기적인 유비쿼터스 환경으로 변화하고 있으며, 정보 및 콘텐츠의 개념은 웹문서와 텍스트를 넘어서 UCC, 음악, 영화 등의 모바일 멀티미디어 콘텐츠들로까지 빠르게 확장되고 있다. 또한, N-스크린과 IPTV 서비스의 등장은 사용자로 하여금 장소와 시간에 관계없이 미디어를 취득할 수 있는 이득을 제공할 수 있으나 사용자가 선택은 더욱 힘들어 졌다. 방송 통신 융합 단말에서 콘텐츠에 대한 정보를 제공 받기 위해서는 TV-Anytime 인터페이스, MPEG Query Format 인터페이스, OPEN API 등이 사용 가능하다. TV-Anytime 인터페이스는 대용량 저장 장치를 갖는 방송 단말기에서 메타데이터를 제공 및 검색하기 위한 인터페이스를 제공하며, MPEG Query Format 인터페이스는 MPEG-7을 기반으로 하는 메타데이터를 검색하기 위한 인터페이스를 제공한다. 또한, OPEN API는 업체들을 중심으로 공개적으로 제공 되어지는 API로 개방과 참여를 목적으로 한다. 이에 본 논문에서는 사용자의 콘텐츠 사용 정보를 바탕으로 선호 정보를 생성하고, 이를 바탕으로 콘텐츠에 대해서 강화된 정보를 생성하기 위한 서비스를 설계 및 개발한다.

  • PDF

MMT-CI 기반 멀티 소스를 활용한 효율적 장면구성정보 설계 (Design the Scene Coposition-Information using Multi-Source based on MMT-CI)

  • 홍지예;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.107-110
    • /
    • 2014
  • 방통융합시대가 도래함에 따라 방송망뿐만 아니라 IP망을 통해 콘텐츠를 소비할 수 있는 스마트TV의 보급이 급속히 확산되고 있다. 또한 영상과 음악 및 광고와 같은 멀티미디어 콘텐츠의 소비 환경이 한 화면에 한 가지의 미디어 서비스만 제공받는 환경에서 다양한 정보를 동시에 소비할 수 있는 환경으로 확대되면서 다양한 정보를 하나의 화면에서 혼용적으로 전달하기 위한 장면구성정보가 필요하게 되었다. 장면구성정보는 미디어가 소비되는 특정 시간과 해당 공간의 정보를 기술하므로써 다수의 미디어를 복합적으로 소비하는 방법으로, IP 기반에서도 여러 개의 화면을 통해 여러 소스의 콘텐츠를 소비하여 다양한 사용자 경험(User Experience)를 제공하고자 ISO/IEC JTC1/SC29/WG11(별칭 MPEG)에서는 방송서비스에서 방송망 및 IP망을 활용하여 멀티미디어 데이터를 전송할 때 사용하는 MPEG Media Transport(MMT)를 기반으로 장면구성정보를 제공하기 위한 MMT-Composition Information(MMT-CI)를 기술표준화하였다. 본 논문에서는 MMT-CI의 표준문서에 따라 W3C의 웹언어인 HTML5와 확장성 언어인 XML을 이용하여 멀티소스를 활용한 장면구성정보를 기술하는 것을 제안하고 장면구성서비스에 적용을 위한 플레이어를 구현 및 검증한다.

  • PDF

방송용 다목적 홀에서 배너 가변에 따른 음향 환경 변화 (Effects of changes in banner size on acoustic environments in multipurpose halls for broadcasting)

  • 박호철;서로사;서춘기;전진용
    • 한국음향학회지
    • /
    • 제38권5호
    • /
    • pp.558-567
    • /
    • 2019
  • 스피치, 국악, 뮤지컬, 대중음악과 콘서트까지 다양한 장르의 공연이 이루어지는 방송용 다목적 홀의 경우 공연에 필요한 전기, 건축 음향적 요구 조건이 다양하다. 하지만 실제 음향 환경 가변을 위한 효율적인 운용 방법은 많지 않다. 본 연구는 무대 반사판의 설치 유 무와 전기 음향 사용 조건하에서 배너의 가변에 따른 홀의 음향 환경 변화를 살펴보았다. 그 결과 벽체 면적의 15 %에 해당하는 배너를 설치한 실제 측정에서 잔향 시간(Reverberation Time, $T_{30}$)은 최대 0.12 s, 초기감쇠시간(Early Decay Time, EDT)은 0.15 s, 음악 명료도(Clarity, $C_{80}$)는 0.76 dB, 음성 명료도(Definition, $D_{50}$)는 6.43 % 변하였다. 배너의 면적을 확장시킨 컴퓨터 시뮬레이션을 통해 전체 벽체 면적의 40 %에 해당하는 배너를 설치할 경우 잔향 시간은 0.11 s에서 최대 0.55 s까지 가변되는 것을 확인했다.

방송.통신 융합 환경에 적합한 다중 플랫폼 융합 콘텐츠 육성 전략 (A Study on Promotion Strategies for Examining Platforms of Convergence Contents)

  • 박수일;신동필;전상권
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.197-202
    • /
    • 2009
  • 과학기술의 발달로 인한 사회 문화적 트렌드의 변화는 새로운 기회와 가능성을 제공해 주며, 정보통신기술은 통신과 방송, 통신과 콘텐츠 등 영역간의 경계를 허물며 융합을 가능하게 하고, 우리의 감성과 상상력을 자극하여 새로운 문화적 가능성을 열어주고 있다. 이러한 상황들은 방송 통신 융합이라는 이름으로 방송과 통신, TV와 PC 온라인과 오프라인 등의 모든 영역에서 다양한 노력이 진행되고 있다. 방송과 통신의 융합은 마치 역사상 신대륙의 개척 과정처럼 새로운 제품과 새로운 시장을 창출해내는 능력을 가지고 있기 때문에, 국내는 물론 세계의 모든 비즈니스 업체들은 이 기회의 땅을 향해 전력 질주하고 있다. 또한, 이에 따르는 콘텐츠의 융합 역시 괄목할만하며, 게임과 영화, 다큐멘터리와 드라마 등의 콘텐츠 간의 융합은 물론이고, 최근에는 모바일에서 영화를 제작하고, 게임과 소설 네트워크가 결합하고, 심지어는 게임 안에서 음악을 유통시키는 유통의 융합까지도 이뤄지고 있다. 이와 같은 다양한 융합의 확산은 미디어와 플랫폼의 등장뿐만 아니라 플랫폼 간 교차와 연결 및 통합이 가능한 미디어 전경(landscape)을 창출해 내고 있으며, 인터넷과 TV의 결합은 다양한 애플리케이션을 구현할 수 있는 전송 메커니즘을 서로 연결시켜 수많은 형태의 다중 플랫폼을 등장시키고 있다. 이로 인하여 방송 서비스와 인터넷 서비스가 네트워크나 전송 플랫폼의 구별 없이, 그리고 디바이스의 선택과 상관없이 활용되는 통합 플랫폼 환경이 폭 넓게 조성되고 있다. 따라서, 방송 통신 융합 환경에 적합한 다중 플랫폼 융합 콘텐츠는 사용자의 요구 및 새로운 비즈니스 모텔에 대한 요구를 만족할 수 있어야 하며, 일관된 기술로 통선 및 서비스간의 호환성을 유지하는 인터페이스의 표준화가 이루어져야한다. 방송 통신 융합 환경에 적합한 다중 플랫폼 융합 콘텐츠는 초고속 데이터 통신망을 활용하는 멀티미디어 및 IP 멀티캐스트 기능을 활용한 서비스들과 연계하여, 관련된 소재 산업들의 파급효과가 매우 크며, 관련 분야에 미치는 효과가 막대하므로, 이에 대한 적절한 육성전략을 고찰해보도록 한다.

  • PDF

화면해설방송 저작을 위한 비 대사 구간 검출 (Non-Dialog Section Detection for the Descriptive Video Service Contents Authoring)

  • 장인선;안충현;장윤선
    • 방송공학회논문지
    • /
    • 제19권3호
    • /
    • pp.296-306
    • /
    • 2014
  • 본 논문에서는 방송 오디오에서로부터 화면해설 삽입을 위한 비 대사 구간 검출 방법을 제시한다. 방송 오디오에서의 대사와 비 대사 구간을 분류하기 위해서는 대사와 배경 음악 등 다양한 종류의 소리가 혼합되어 있는 스테레오 신호로부터 음성 활성 여부의 검출이 우선되어야 한다. 본 논문에서는 방송 오디오 제작과정을 파악함으로써 신호의 채널 특성 분석 결과를 대사 음성 활성 여부 검출에 적용한다. 본 논문에서 제안하는 비 대사 구간 검출 방법은 방송 오디오의 센터채널과 서라운드 성분 간의 에너지 비율을 추가적인 오디오 특징으로 이용하여 센터채널의 음성 활성도와의 결합을 통해 성능 향상을 이루어 낸다. 또한, 실제 화면해설 방송물의 분석을 통해 생성한 규칙 기반의 후처리를 통해 화면해설 삽입이 가능한 비 대사 구간을 검출한다. 이를 실제 방송 컨텐츠를 대상으로 한 실험을 통하여 검증한다.

홈 네트워크에서 콘텐츠 통합 관리를 위한 Contents List Aggregation 구현 (Implementation of Content List Aggregation for Home Network)

  • 금승우;김경원;임태범;이석필
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.75-77
    • /
    • 2011
  • 최근 수년간 방송과 통신의 융합이 지속적으로 진행되고 있으며, 특히 홈 네트워크를 통한 방송 및 통신의 멀티미디어 콘텐츠의 공유 기기 시장이 비약적으로 성장하고 있다. 스마트폰을 비롯한 스마트 기기의 진보를 통하여 사진, 음악, 영상의 멀티미디어 콘텐츠에 대한 공유가 홈 네트워크 상에서 이루어 지고 있으며, 이러한 기술은 업계 표준으로 사용되고 있는 UPnP 및 DLNA에 기반하고 있다. 다만, 이러한 홈 네트워크 표준은 Peer-to-peer 네트워크를 근간으로 하고 있어 홈 네트워크 내에 복수의 서버가 있을 경우 사용자의 편의성이 상대적으로 약하다. 이에 본 논문은 홈 네트워크 내에서 콘텐츠 리스트를 통합 관리할 수 있는 Contents List Aggregation 서비스를 제안한다. 제안되는 서비스는 홈 네트워크 내의 미디어 서버들로부터 Contents List를 전송받아 통합된 형태로 저장 및 관리할 수 있으며, 기존 서비스와 호환성을 유지할 수 있다. 서비스의 제안과 함께 서비스를 지원하는 UPnP Device 및 Control Point의 서비스 시나리오, 그리고 서비스 연동에 대한 운용환경 및 사용예가 함께 제시되었다.

  • PDF

피치 히스토그램과 MFCC-VQ 동적 패턴을 사용한 음악 검색 (Music Identification Using Pitch Histogram and MFCC-VQ Dynamic Pattern)

  • 박철의;박만수;김성탁;김회린
    • 한국음향학회지
    • /
    • 제24권3호
    • /
    • pp.178-185
    • /
    • 2005
  • 본 논문에서는 내용기반 음악 정보 검색 방법으로써 멜로디의 시간 변화 특성과 통계적 특성을 모두 이용할 수 있는 hybrid 방법에 대해 제안하였다. 실제 방송 환경에의 적용을 위해 드라마 OST의 좁은 검색 범위뿐만 아니라 가요 1,005곡의 넓은 검색 범위에서도 제안한 방법을 이용하여 실험하였다. 제안된 방법은 특징 벡터로써 pitch와 MFCC(Mel Frequency Cepstral Coefficient)를 사용하여 음의 특성을 나타내었으며 멜로디를 표현하기 위해 피치 히스토그램과 VQ (Vector Quantization) 코드화한 MFCC의 템포럴 시퀀스를 이용함으로써 음악 검색 방법에 멜로디의 시간 변화 특성과 통계적 특성을 함께 적용할 수 있었다. 또한 pitch 히스토그램과 MFCC-VQ 템포럴 방법을 모두 사용한 hybrid 방식에 적절한 패턴 매칭 방법을 제안함으로써 기존의 각 단일 방식을 이용한 성능 결과 (MFCC-VQ 템포럴)와 비교하여 볼 때 드라마 OST 검색 범위에서는 평균 $9.9\%$, 가요 1,005곡의 검색 범위에서는 $10.2\%$의 오류 감소율을 나타내었다.

전문대학의 K-Pop 전공 개설 및 교과과정에 관한 연구 (The Study on the Issue of K-Pop Major in Colleges and Opportunity for New Curriculum)

  • 오한승
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2012년도 춘계학술논문집 1부
    • /
    • pp.91-93
    • /
    • 2012
  • 본 논문에서는 새롭게 떠오르고 있는 대중음악계의 K-Pop이라는 트렌드 속에서 전문대학이 이 특정한 분야의 학과 또는 전공을 개설하려고 하는 시도에 대한 제안적인 연구이다. 실용음악과와 방송연예과 등 기존의 유관 학과 및 전공과의 유사점과 차별성을 잘 활용하여 교과과정을 만든다면 K-Pop 전공이 대학에 개설되는 것이 불가능한 일은 아닐 것이다.

  • PDF