Multistage Feature-based Classification Model

다단계 특징벡터 기반의 분류기 모델

  • Published : 2009.01.25

Abstract

The Multistage Feature-based Classification Model(MFCM) is proposed in this paper. MFCM does not use whole feature vectors extracted from the original data at once to classify each data, but use only groups related to each feature vector to classify separately. In the training stage, the contribution rate calculated from each feature vector group is drew throughout the accuracy of each feature vector group and then, in the testing stage, the final classification result is obtained by applying weights corresponding to the contribution rate of each feature vector group. In this paper, the proposed MFCM algorithm is applied to the problem of music genre classification. The results demonstrate that the proposed MFCM outperforms conventional algorithms by 7% - 13% on average in terms of classification accuracy.

본 논문은 다단계 특징벡터를 이용한 분류기 모델(Multistage Feature-based Classification Model: MFCM)을 제안하는데, MFCM은 주어진 데이터에서 추출된 특징벡터 전체를 한 번에 이용하지 않고, 같은 성질들의 특징벡터들끼리 모아서, 여러 단계에 걸쳐서 분류에 이용한다. 학습단계에서, 같은 성질을 가지는 특징벡터 그룹 각각을 이용하는 국지적 분류기의 분류 정확도 산출을 통해 각 특징벡터그룹의 기여도를 측정한다. 분류단계에서는 각 특징벡터그룹의 기여도에 따라 차등적으로 가중치를 적용하여 최종적인 분류결론을 이끌어 낸다. 본 논문에서는 MFCM의 개념을 기존의 몇 가지 분류 알고리즘에 적용하고, 음악 장르 분류 문제에 응용하여, 제안된 알고리즘의 유용성에 관한 실험을 수행하였다. 실험의 결과 제안된 MFCM을 이용하는 분류기는 기존의 알고리즘과 비교하여 분류정확도에서 평균적으로 7%-13%의 성능향상을 보여준다.

Keywords

References

  1. N. Scaringella, G. Zoia, and D. Mlynek, 'Automatic genre classification of music content: a survey,' IEEE Signal. Proc. Mag., V. 23, No.2, pp. 133-141, 2006 https://doi.org/10.1109/MSP.2006.1598089
  2. K. Kim, S. Kim, J. Jeon, K. Park'Quick Audio Retrieval Using Multiple Feature Vectors,' IEEE Trans. Consumer Electronics. V. 52, No.1, 2006
  3. E. Wold, T. Blum, D., Keislar, and J. Wheaton, 'Content-based classification, search, and retrieval of audio', IEEE Trans. Multimedia, V.3, No.3, pp 27-36. 1996 https://doi.org/10.1109/93.556537
  4. J. Foote, 'Content-based retrieval of music and audio', Proc. SPIE, Multimedia Storage and Archiving Systems, pp 138-147. 1997
  5. G. Li, and A. Khokar, 'Content-based indexing and retrieval of audio data using wavelets', Proc. Int. Conf. Multimedia Expo. pp 885-888. 2000
  6. G. Tzanetakis, and P. Cook, 'Musical genre classification of audio signals', IEEE Trans. Speech Audio Process.V. 10, No.5, pp. 293-302, 2002 https://doi.org/10.1109/TSA.2002.800560
  7. Y. Song and C. Zhang, 'Content-Based Information Fusion for Semi-Supervised Music Genre Classification,' IEEE Trans. Multimedia, V.10, No.1, pg. 145-152, 2007 https://doi.org/10.1109/TMM.2007.911305
  8. 정성윤, 김민성, 손종목, 배건성, 'PCA-optimized 필터뱅크 기반의 MFCC 특징파라미터 추출 및 한국어 4연숫자 전화음성에 대한 인식실험,' 전자공학회논문지, 제41권 SP편, 6호, 279-2839쪽, 2004년 6월
  9. 박찬응, '은닉 마코프 모델과 켑스트럴 계수들에 따른 한국어 속삭임의 인식 비교,' 전자공학회논문지, 제43권 IE편, 제2호, 22-29쪽, 2006년 2월
  10. H. Christensen, B. Lindberg, and O. Andersen, 'Employing heterogeneous information in a multi-stream framework', Proc. IEEE Int. Conf. ICASSP '00 Vol 3. pp 1571-1574. 2000
  11. S. Okawa, and E. Bocchieri, A. Potamianos, 'Multi-band speech recognition in noisy environments', Proc. IEEE Int. Conf. ICASSP '98 Vol 2. pp 641-644. 1998
  12. T. Kohonen, 'The Self-Organizing Map', Proc. IEEE, Vol. 78. pp 1464-1480. 1990 https://doi.org/10.1109/5.58325
  13. J. C. Bezdek, 'A convergence theorem for the fuzzy ISODATA clustering algorithms', IEEE Trans. Pattern Anal. Mach. Int, Vol. 2. pp 1-8. 1980 https://doi.org/10.1109/TPAMI.1980.4766964
  14. 곽현욱, 오준택, 손영호, 김욱현, '엔트로피 기반의 가중치와 분포크기를 이용한 향상된 FCM 알고리즘,' 전자공학회논문지 제43권 SP편, 제4호, 1-8쪽, 2006년 4월
  15. D.-C Park, and Y.-J. Woo, 'Weighted Centroid Neural Network for Edge Preserving Image Compression', IEEE Trans. Neural Networks, V.12, No. 5, pp 1134-1146. 2001 https://doi.org/10.1109/72.950142
  16. D.-C Park et al., 'Centroid Neural Network with a Divergence Measure for GPDF Data Clustering', IEEE Trans. Neural Networks, V.19, No. 6, pp 948-957. 2008 https://doi.org/10.1109/TNN.2007.2000051
  17. Carl Looney, Pattern Recognition Using Neural Networks, Oxford University Press, New York, pp 252 -254, 1997