• 제목/요약/키워드: 오디오 이벤트 검출

검색결과 13건 처리시간 0.015초

약지도 음향 이벤트 검출을 위한 파형 기반의 종단간 심층 콘볼루션 신경망에 대한 연구 (A study on the waveform-based end-to-end deep convolutional neural network for weakly supervised sound event detection)

  • 이석진;김민한;정영호
    • 한국음향학회지
    • /
    • 제39권1호
    • /
    • pp.24-31
    • /
    • 2020
  • 본 논문에서는 음향 이벤트 검출을 위한 심층 신경망에 대한 연구를 진행하였다. 특히 약하게 표기된 데이터 및 표기되지 않은 훈련 데이터를 포함하는 약지도 문제에 대하여, 입력 오디오 파형으로부터 이벤트 검출 결과를 얻어내는 종단간 신경망을 구축하는 연구를 진행하였다. 본 연구에서 제안하는 시스템은 1차원 콘볼루션 신경망을 깊게 적층하는 구조를 기반으로 하였으며, 도약 연결 및 게이팅 메커니즘 등의 추가적인 구조를 통해 성능을 개선하였다. 또한 음향 구간 검출 및 후처리를 통하여 성능을 향상시켰으며, 약지도 데이터를 다루기 위하여 평균-교사 모델을 적용하여 학습하는 과정을 도입하였다. 본 연구에서 고안된 시스템을 Detection and Classification of Acoustic Scenes and Events(DCASE) 2019 Task 4 데이터를 이용하여 평가하였으며, 그 결과 약 54 %의 구간-기반 F1-score 및 32%의 이벤트-기반 F1-score를 얻을 수 있었다.

실시간 필터링을 위한 축구 비디오의 장면 검출 (Detection Algorithm of Shoot Scenes in Soccer Video for Real-time Content Filtering)

  • 조준호;진성호;노용만;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2004년도 정기총회 및 학술대회
    • /
    • pp.229-232
    • /
    • 2004
  • 축구 비디오의 슛 장면과 같은 이벤트 검출에는 많은 연구가 있었으나 기존의 방법은 정확성과 실시간으로 필터링하는 부분에서는 문제가 있다 이에 대해서 본 논문은 현재 실시간으로 가장 딸이 방송되는 스포츠 장르 중 축구 비디오에 대한 효율적인 슛 장면 검출 알고리즘을 제안하고자 한다. 제안한 방법은 우선 입력 프레임으로부터 뷰 타입을 결정한다. 슛 장면에 대한 뷰 타입 패턴 변화, 리 플레이의 검출과 오디오 파워의 변화를 이용하여 필터링을 수행한다. 실험 결과를 통하여 제안한 방법이 효율적이고 효과적으로 슛 장면을 검출하였고 다채널의 디지털 방송환경에서 실시간으로 컨텐츠를 필터링하는 서비스가 가능함을 보였다.

  • PDF

DNN을 이용한 오디오 이벤트 검출 성능 비교 (Comparison of Audio Event Detection Performance using DNN)

  • 정석환;정용주
    • 한국전자통신학회논문지
    • /
    • 제13권3호
    • /
    • pp.571-578
    • /
    • 2018
  • 최근 딥러닝 기법이 다양한 종류의 패턴 인식에 있어서 우수한 성능을 보이고 있다. 하지만 소규모의 훈련데이터를 이용한 분류 실험에 있어서 전통적으로 사용되던 머신러닝 기법에 비해서 DNN의 성능이 우수한지에 대해서는 다소 간의 논란이 있어 왔다. 본 연구에서는 오디오 검출에 있어서 전통적으로 사용되어 왔던 GMM, SVM의 성능과 DNN의 성능을 비교하였다. 동일한 데이터에 대해서 인식실험을 수행한 결과, 전반적인 성능은 DNN이 우수하였으나 세그먼트 기반의 F-score에서 SVM이 DNN에 비해 우수한 성능을 보임을 알 수 있었다.