DOI QR코드

DOI QR Code

A Study on Improving Pitch Search for Vocoder

보코더에서 피치검색 성능개선에 관한 연구

  • Baek, Geum-Ran (Sori Sound Engneering Lab of Information and Telecommunication Department, Soongsil University) ;
  • Bae, Myung-Jin (Sori Sound Engneering Lab of Information and Telecommunication Department, Soongsil University)
  • 백금란 (숭실대학교 정보통신공학과) ;
  • 배명진 (숭실대학교 정보통신공학과)
  • Received : 2012.06.27
  • Accepted : 2012.08.24
  • Published : 2012.10.31

Abstract

The pitch searching is a vital process in a vocoder. Generally, the method of pitch searching is employed after highlighting the periodicity, where a correlation is identified with the signal by changing the interval of two pulses. When the correlation value reaches the peak, the pitch can be found by the pulse interval because it is the repetition interval with most striking period. However if the identified period happens to be one of half period, double period or triple period, this cannot be considered as the pitch period. Many methods were suggested to solve this problem. An inaccurate pitch could be obtained as well, when there is an interval where signal amplitude is not constant but varies abruptly in the frame. To solve this matter, searching the pitch by dividing a frame into various subframes is adopted, but too much calculation has to be followed while it leads the correct value. This paper suggests an algorithm to resolve these two problems. First, to search the pitch after advance correction of the signal energy level with an estimated overall energy change ratio in the frame before pitch search to reduce half period, double period and triple period is suggested. Second, to vary the number of subframes by predicting the amplitude change rate in the frame by the energy ratio obtained by the above-mentioned method is advised. If these two methods are applied, the pitch searching time can be reduced and the general pitch searching performance can be improved without affecting the sound quality in the synthesized signal.

보코더 에서 의 피치 분석 과정은 매우 중요하다. 일반적으로 먼저 신호의 주기성을 강조한 후 피치를 검색하는 방법을 주로 사용한다. 프레임 내에서 두 개의 펄스 간격을 변화시켜가며 신호와의 상관관계를 구하는 것으로 상관관계 값이 가장 높을 때가 주기가 가장 두드러지는 반복 구간이므로 이때 의 펄스 간격을 피치 주기로 찾는다. 그러나 찾아진 주기가 반주기, 배주기 및 세배주기인 경우에는 이 간격을 피치 주기라 할 수 없어 이를 해결하기 위한 여러 가지방법들이 제안되어있다. 또한 프레임 내에서의 신호의 진폭이 일정하지 않고 갑자기 변하는 구간이 있는 경우 정확하지 않는 피치가 얻어진다. 이를 해결하기 위해 프레임을 여러 개의 서브프레임으로 다시 나누어 피치를 검색하는 방법을 사용하고 있는데 이 방법은 피치를 정확하게 검색할 수 있지만 계산 량이 많아진다. 본 논문에서는 위에 제시한 두 가지 문제점을 개선하기 위한 알고리즘을 제안한다. 첫째 반주기, 배주기 및 세배주기를 줄이기 위해 피치를 검색하기 전에 프레임 내의 전체 에너지변화 비율을 추정하여 신호의 에너지 레벨을 미리 보상해 준 후 피치를 검색하는 방법을 제안한다. 둘째, 이렇게 구한 에너지 비율로 프레임 내의 진폭 변화율을 예측하여 서브프레임 수를 가변시키는 방법을 제안한다. 이 방법들을 적용하면 합성 음질에는 영향을 주지 않는 상태에서 피치검색 시간을 단축할 수 있고, 피치 검색의 정확도를 높일 수 있어 전반적인 피치 검색에 관한 성능 개선이 된다.

Keywords

References

  1. M. J. Bae, Digital Speech Coding, Dongyoung, Incheon, 1996.
  2. 민소연, 정현욱, 배명진 " CELP 보코더에서의 델타 피치검색법의 개선에 관한 연구, " 대한전자공학회 2004년도 하계학술발표대회 논문집, 27권, 1호, pp. 1181-1184, 2004.
  3. 조왕래,최성영,배명진, "개선된 혼성영역 교차상관법에 의한 G.723.1의 피치검색시간 단축에 관한 연구," 전기학회논문지, 59권, 12호, pp. 2324-2328, 2010.
  4. Joo Hun Lee, MyungJin Bae, SouGil Ann, "A Fast Pitch Searching Algorithm Using Correlation Characteristics in CELP Vocoder," J. Acoust. Soc. Kor., vol. 13. no. 2E, pp. 20, 1994.
  5. Jae Ok Bae, Ki Chun Han, Jin Jong Cha and Myung Jin Bae, "On a Fast Searching of the Random Codebook using the Searching Technique of the Regular Pulse Excitation," International Conference on Speech Processing, Proceedings of ICSP'97, pp. 281-286, August, 1997.
  6. J. S. Han, Speech Processing, Osung Media, seoul, 2003.
  7. L. R. Rabiner, R. W. Schafer, Digital Processing of Speech Signal, Prentice Hall, New Jersey, 1978.