Abstract
This paper describes a music information retrieval system which uses humming as the key for retrieval Humming is an easy way for the user to input a melody. However, there are several problems with humming that degrade the retrieval of information. One problem is a human factor. Sometimes people do not sing accurately, especially if they are inexperienced or unaccompanied. Another problem arises from signal processing. Therefore, a music information retrieval method should be sufficiently robust to surmount various humming errors and signal processing problems. A retrieval system has to extract pitch from the user's humming. However pitch extraction is not perfect. It often captures half or double pitches. even if the extraction algorithms take the continuity of the pitch into account. Considering these problems. we propose a system that takes multiple pitch candidates into account. In addition to the frequencies of the pitch candidates. the confidence measures obtained from their powers are taken into consideration as well. We also propose the use of an algorithm with three dimensions that is an extension of the conventional DP algorithm, so that multiple pitch candidates can be treated. Moreover in the proposed algorithm. DP paths are changed dynamically to take deltaPitches and IOIratios of input and reference notes into account in order to treat notes being split or unified. We carried out an evaluation experiment to compare the proposed system with a conventional system. From the experiment. the proposed method gave better retrieval performance than the conventional system.
본고에서는 악곡정보 검색을 위한 검색키로써 허밍을 이용한 검색 방법에 관한 내용을 기술하였다. 고정도의 악곡 검색 시스템은 사용자의 불안정한 음정 및 템포 그리고 애매한 기억에 의한 음표의 삽입 및 탈락에 대응이 가능해야 한다. 또한 입력된 음향신호로부터 검색에 필요한 정확한 특징량의 추출과 효과적인 멜로디 표현 기법이 요구된다. 일반적으로 사용자의 허밍으로부터 음고 정보를 얻기 위해 입력된 음향신호로부터 피치정보를 추출하지만, 피치 추출 알고리즘은 이러한 입력 허밍으로부터 때때로 하모닉 피치를 추출한다. 이러한 문제점을 고려하여, 본 논문에서는 음고 정보의 특징량으로 복수 피치 후보를 고려한 방법을 제안한다. 게다가 복수 피치 후보에 신뢰도라는 파라미터를 도입하여 신뢰도가 높은 피치후보의 선택 가능성을 높였다. 검색엔진에서는 제안하는 복수 피치 후보의 수용을 위해 DP알고리즘을 3차원으로 확장하였다. 또한 제안하는 알고리즘은 DP패스에 따라 음표의 삽입/탈락에 다이내믹하게 대응이 가능하도록 멜로디 표현 방법을 변경하였다. 성능 평가를 위해 종래 기법과의 비교 실험 결과 보다 높은 검색 결과를 얻었다.