• 제목/요약/키워드: Vocal and nonvocal separation

검색결과 1건 처리시간 0.016초

커널 모델과 장단기 기억 신경망을 결합한 보컬 및 비보컬 분리 (Vocal and nonvocal separation using combination of kernel model and long-short term memory networks)

  • 조혜승;김형국
    • 한국음향학회지
    • /
    • 제36권4호
    • /
    • pp.261-266
    • /
    • 2017
  • 본 논문에서는 커널 모델과 장단기 기억(Long-Short Term Memory, LSTM) 신경망을 결합한 보컬 및 비보컬 분리 방식을 제안한다. 기존의 음원 분리 방식은 비보컬 음원만 있는 구간에서 음원을 오추정하여 불필요한 비보컬 음원을 출력하는 한계가 있다. 따라서 본 논문에서는 커널 모델 기반의 보컬음 분리 방식에 LSTM 신경망 기반의 보컬 구간 분류 방식을 결합하여 보컬 음원의 오추정 문제를 개선하고 분리 성능을 향상시키고자 하였다. 또한 본 논문에서는 방식간의 결합 구조에 따라 병렬 결합형 분리 알고리즘과 직렬 결합형 분리 알고리즘을 제안하였으며, 실험을 통해 제안하는 방식들이 기존의 방식에 비해 더욱 향상된 분리 성능을 보이는 것을 확인할 수 있었다.