DOI QR코드

DOI QR Code

Speech data preprocessing for detection of depression based on 2D-CNN

2D-CNN 기반 우울증 감지를 위한 음성데이터 전처리

  • Park, JunHee (Dept. of Computer Engineering, Hoseo University) ;
  • Moon, NamMee (Dept. of Computer Science, Hoseo University)
  • 박준희 (호서대학교 컴퓨터공학과) ;
  • 문남미 (호서대학교 컴퓨터공학부)
  • Published : 2021.11.04

Abstract

세계보건기구(WHO)에 따르면 전 세계적으로 우울증 장애를 앓고 있는 사람이 3 억 2,200 만명에 달하며, 매년마다 빠르게 늘어나는 환자로 인해 전세계적으로 문제가 되고 있다. 이에 따라 우울증을 감지하기 위한 시스템에 대한 연구가 진행되어지고 있다. 본 논문에서는 우울증 감지에 있어 높은 정확도를 얻을 수 있는 최적의 음성 세그먼트 길이와 멜 밴드의 수를 확인하고자 한다. DAIC-WOZ(Distress Analysis Interview Corpus Wizard of Oz) 데이터셋을 기반으로 2D-CNN(2Dimension - Convolutional Neural Network)를 사용하여 음성 세그먼트 길이와 멜 밴드의 수에 변화를 주며 테스트를 진행하였다. 최종적으로 12 초 길이의 음성 세그먼트와 512 개의 멜 밴드에서 86.3%의 정확도로 최적의 결과를 확인하였다.

Keywords

Acknowledgement

본 연구는 2021년 과학기술정보통신부 및 정보통신기획평가원의 SW 중심대학사업의 연구결과로 수행되었음(20190018340031001)