초록
본 논문에서는 음성신호의 정현파 합성방법 중 하나인 선형위상을 사용한 중첩합산방법에 대하여 합성응성의 연속성을 개선시킨 새로운 방법을 제안한다. 기존의 중첩합산 정현파 합성방법은 프레임의 중간 지점에 대한 위상 값을 예측하기 위해 합성 파형의 경계면에 대한 위상 차이를 최소화하는 방법을 사용하였으나, 제안된 방법은 중간지점의 위상만이 아닌 최종 합성된 신호들 간의 차이를 최소화하는 방법을 사용한다. 이러한 합성신호의 오차 함수를 최소화하는 과정은 정현파 크기 값을 가중치로 사용한 위상오차 함수로 근사화 될 수 있다. 제안된 합성 방법의 연속성에 대한 성능을 검증하기 위해 합성신호의 전 구간에 대한 합성 신호들 간의 평균 오차 값 및 청취자 테스트를 하였다. 기존의 위상 오차함수와 비교하여 개선된 연속성 성능을 얻을 수 있었다.
In this paper, we propose a new overlap and add speech synthesis method which demonstrates improved continuity performance. The proposed method uses a weighted phase error function and minimizes the wave discontinuity of the synthesis signal, rather than the phase discontinuity, to estimate the mid-point phase. Experimental results show that the proposed method improves the continuity between the synthesized signals relative to the existing method.