Abstract
In this paper a commute time embedding is implemented by organizing patches according to the graph-based metric, and its properties are investigated via changing the number of nodes on the graph.. It is shown that manifold embedding methods generate the intrinsic geometric structures when waveforms such as speech or music instrumental sound signals are embedded on the low dimensional Euclidean space. Basically manifold embedding algorithms only project the training samples on the graph into an embedding subspace but can not generalize the learning results to test samples. They are very effective for data clustering but are not appropriate for classification or recognition. In this paper a commute time guided transform is adopted to enhance the generalization ability and its performance is analyzed by applying it to the classification of 6 kinds of music instrumental sounds.
본 논문에서는 파형 신호에서 패치를 추출하고 이를 패치 그래프로 구성한 다음, 이로부터 대표적인 다양체 임베딩 방식인 컴뮤트 타임 임베딩 기법을 구현하고, 이의 특성을 분석한다. 특히 음성 신호나 악기 음 등, 시간에 따라 스펙트럼이 가변적인 신호를 임베딩하면 스펙트럼의 변화에도 불구하고 그 신호 고유의 기하 구조를 생섬함을 실험으로 확인한다. 다양체 임베딩은 비선형 공간에 놓여 있는 고차원 데이터를 저차원 공간으로의 효율적인 맵을 가능하게 하지만 그래프 구성에 이용된 데이터에 대한 정보만 알 수 있고 그렇지 않은 데이터(out-of-sample data)에 대해서는 정보를 얻기 어렵다. 따라서 다양체 임베딩은 데이터 클러스터링에 적절히 적용 가능하지만, 훈련 과정을 통해 얻은 정보를 기초로 유추 기능이 요구되는 인식 등에는 응용하기 어려운 제약이 따른다. 이를 해결하기 위하여 본 논문에서는 다양체 임베딩이 인식 분야에도 적용 가능하도록 새로운 알고리즘을 제안하고 악기 음 분류 실험을 통하여 그 특성을 분석한다.