Feature-Vector Normalization for SVM-based Music Genre Classification

SVM에 기반한 음악 장르 분류를 위한 특징벡터 정규화 방법

  • Lim, Shin-Cheol (Department of Information and Communication Engineering, Sejong University) ;
  • Jang, Sei-Jin (Korea Electronics Technology Institute) ;
  • Lee, Seok-Pil (Korea Electronics Technology Institute) ;
  • Kim, Moo-Young (Department of Information and Communication Engineering, Sejong University)
  • 임신철 (세종대학교 정보통신공학과) ;
  • 장세진 (전자부품연구원 디지털미디어연구센터) ;
  • 이석필 (전자부품연구원 디지털미디어연구센터) ;
  • 김무영 (세종대학교 정보통신공학과)
  • Received : 2011.04.22
  • Accepted : 2011.08.11
  • Published : 2011.09.25

Abstract

In this paper, Mel-Frequency Cepstral Coefficient (MFCC), Decorrelated Filter Bank (DFB), Octave-based Spectral Contrast (OSC), Zero-Crossing Rate (ZCR), and Spectral Contract/Roll-Off are combined as a set of multiple feature-vectors for the music genre classification system based on the Support Vector Machine (SVM) classifier. In the conventional system, feature vectors for the entire genre classes are normalized for the SVM model training and classification. However, in this paper, selected feature vectors that are compared based on the One-Against-One (OAO) SVM classifier are only used for normalization. Using OSC as a single feature-vector and the multiple feature-vectors, we obtain the genre classification rates of 60.8% and 77.4%, respectively, with the conventional normalization method. Using the proposed normalization method, we obtain the increased classification rates by 8.2% and 3.3% for OSC and the multiple feature-vectors, respectively.

본 논문에서는 Mel-Frequency Cepstral Coefficient (MFCC), Decorrelated Filter Bank (DFB), Octave-based Spectral Contrast (OSC), Zero-Crossing Rate (ZCR), 그리고 Spectral Contract/Roll-Off를 복합 특징벡터로 결합하여 Support Vector Machine (SVM)을 이용한 음악 장르 분류 시스템을 설계하였다. 기존 방식에서는 전체 학습 데이터에 대한 특징벡터를 정규화를 한 후 SVM 모델을 생성하여 분류를 시행하였다. 본 논문에서는 비교 대상이 되는 한 쌍의 클래스에 대해서 One-Against-One (OAO) SVM으로 모델을 생성할 때 선택된 두 클래스의 특징벡터에 대해서만 정규화를 시행하는 방식을 제안한다. 기존 정규화 방식을 이용하면 단일 특징벡터로 OSC를 사용할 경우에는 60.8%, 복합 특징벡터를 모두 이용하는 경우에는 77.4%의 인식율을 얻을 수 있었다. 또한, 제안된 정규화 방식을 이용하면 OSC와 복합 특징벡터에 대해서 각각 8.2%와 3.3%의 추가적인 성능 향상을 얻을 수 있었다.

Keywords

References

  1. N. Scaringella, G. Zoia, and D. Mlynek, "Automatic genre classification of music content: A survey," IEEE Signal Process., vol. 23, no. 2, pp. 133-141, 2006.
  2. G. Tzanetakis and P. Cook, "Musical genre classification of audio signals," IEEE Trans. Speech Audio Process., vol. 10, no. 5, pp. 293-302, 2002. https://doi.org/10.1109/TSA.2002.800560
  3. D. N. Jiang, L. Lu, H. J. Zhang, J. H. Tao, and L. H. Cai, "Music type classification by spectral contrast feature," in Proc. IEEE Int. Conf. Multimedia and Expo, vol. 1, pp. 113-116, 2002.
  4. C-H. Lee, J-L. Shih, K-M. Yu, and J-M Su, "Automatic music genre classification using modulation spectral contrast feature," in Proc. IEEE Int. Conf. Multimedia and Expo, pp.204-207, 2007.
  5. 이성훈, 배건성, "Text-dependent한 화자인식 시스템에 관한 연구," 대한전자공학회, 대한전자공학회 학술대회 논문집, 제7권, 제1호, 312-317쪽, 1994년 1월
  6. J. Jung, K. Kim, and M. Y. Kim, "Noise robust speaker identification based on the advanced missing feature theory," Electronics Letters, vol. 46, no. 14, pp. 1027-1029, 2010. https://doi.org/10.1049/el.2010.0368
  7. 임정수, 송지현, 장준혁, "SVM의 미세조정을 통한 음성/음악분류 성능향상," 대한전자공학회 전자공학회 논문지-SP , 제47권 SP편 제2호, 141-148쪽, 2011월 3월
  8. GTZAN Genre Collection Database, "http://marsyas.info/download/data_sets"
  9. 임신철, 장세진, 이석필, 김무영, "Decorrelated Filter Bank를 이용한 음악 장르 분류 시스템," 한국음향학회지, 제30권, 제2호, 100-106쪽, 2011년 2월