Audio Contents Classification based on Deep learning for Automatic Loudness Control

Lee, Young Han;Cho, Choongsang;Kim, Je Woo;

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

2018.06a
/
Pages.320-321
/
2018

The Korean Institute of Broadcast and Media Engineers (한국방송∙미디어공학회)

Audio Contents Classification based on Deep learning for Automatic Loudness Control

오디오 음량 자동 제어를 위한 콘텐츠 분류 기술 개발

Lee, Young Han (Korea Electronics Technology Institute (KETI)) ;
Cho, Choongsang (Korea Electronics Technology Institute (KETI)) ;
Kim, Je Woo (Korea Electronics Technology Institute (KETI))

이영한 (전자부품연구원) ;
조충상 (전자부품연구원) ;
김제우 (전자부품연구원)

Published : 2018.06.20

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

오디오 음량을 자동으로 제어하는데 있어 음성이 있는 구간에 대해서 음량이 급격히 줄어드는 것을 막기 위해 콘텐츠에 대한 분석이 필요하다. 본 논문에서는 방송 음량을 조절을 위한 세부 기술로 딥러닝 기반의 콘텐츠 분류 기술을 제안한다. 이를 위해 오디오를 무음, 음성, 음성/오디오 혼합, 오디오의 4개로 정의하고 이를 처리하기 위한 mel-spectrogram을 이용하여 2D CNN 기반의 분류기를 정의하였다. 또한 학습을 위해 방송 오디오 데이터를 활용하여 학습/검증 데이터 셋을 구축하였다. 제안한 방식의 성능을 확인하기 위해 검증 데이터셋을 활용하여 정확도를 측정하였으며 약 81.1%의 정확도를 가지는 것을 확인하였다.

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

Audio Contents Classification based on Deep learning for Automatic Loudness Control

오디오 음량 자동 제어를 위한 콘텐츠 분류 기술 개발

Abstract

Keywords

Detail Search