• 제목/요약/키워드: 정현파 모델링

검색결과 24건 처리시간 0.032초

Damping 요소를 첨가한 매칭 퍼슈잇 정현파 모델링 (Matching Pursuit Sinusoidal Modeling with Damping Factor)

  • 정규혁;김종학;임정우;주기호;이인성
    • 대한전자공학회논문지SP
    • /
    • 제44권1호
    • /
    • pp.105-113
    • /
    • 2007
  • 본 논문은 정현파 모델 기반의 코덱을 위한 매칭 퍼슈잇(Matching Pursuit)의 성능을 개선시킨 새로운 정현파 모델링을 제안한다. 제안하는 damping 요소를 첨가한 매칭 퍼슈잇 정현파 모델링은 과거와 현재 프레임에서 파라미터들간의 상관성을 이용하여 damping 요소를 정의하고 현재 프레임에서 보다 정확한 정현파 파라미터를 damping 요소에 따라 매칭 퍼슈잇 방법으로 추출한 후 합성한다. 따라서 인접 프레임과의 보간 없이 현재 프레임에서의 정현파 파라미터만으로 효율적인 모델링이 가능하다. 제안한 모델링 방법은 보간법을 사용한 일반적인 정현파 모델과 달리 추가지연을 가지지 않으면서 유성음 구간 신호뿐만 아니라 모든 구간에서 개선된 음질을 보인다. 제안한 모델링 방법의 성능을 SNR, MOS값, LR(Itakura-Saito likelihood ratio), CD(cepstral distance)를 통해 보간법을 사용한 매칭 퍼슈잇과 비교 평가한다.

정현파 모델링을 이용한 폴리포닉 오디오 신호의 시간축 변화 (Time-Scale Modification of Polyphonic Audio Signals Using Sinusoidal Modeling)

  • 장호근;박주성
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.77-85
    • /
    • 2001
  • 본 논문에서는 폴리포닉 음과 같은 복잡한 스펙트럼을 갖는 오디오 신호를 정현파 성분으로 모델링하고, 이를 바탕으로 고음질의 시간축 변화된 음을 얻는 방법을 제안한다. 입력 신호는 옥타브 밴드 구조의 다중 해상도 필터 뱅크를 통과하고 여기에서 나온 각 서브밴드 신호로부터 정현파 성분이 축출된다. 서브밴드 신호의 정현파 분석시 정현파 성분을 추출하는 구간의 크기를 국지적인 신호의 특성에 따라 다르게 해 주는 동적 세그멘테이션 방법을 적용한다. 이렇게 함으로써 기존 정현파 모델링에서 신호의 천이 구간에서 발생하는 퍼짐 현상을 개선하고, 시간축 변화 시에도 원래 음에 가까운 음질을 얻을 수 있다. 정현파 분석을 위한 스펙트럼 분석 도구로는 심리 음향 모델을 적용한 matching pursuit을 사용함으로써 정현파 성분의 갯수를 줄이고, matching pursuit의 반복 과정에 대한 합리적인 정지 조건을 제공할 수 있다. 정현파 성분으로 표현하기 어려운 신호의 잡음 성분은 원래 신호에서 정현파 성분으로 합성된 신호를 뺀 것으로 얻을 수 있으며, 스펙트럼 포락선 근사화 방법으로써 모델링된다. 본 논문의 알고리즘을 적용해 다양한 폴리포닉 음에 대해 실험한 결과 제안한 정현파 모델링 방법이 원래 신호의 음질을 잘 복원할 수 있고, 시간축 변화율이 큰 경우에도 신호의 천이 구간을 잘 표현할 수 있음을 확인하였다.

  • PDF

동적 세그멘테이션을 이용한 폴리포닉 오디오 신호의 정현파 모델링 (Sinusoidal Modeling of Polyphonic Audio Signals Using Dynamic Segmentation Method)

  • 장호근;박주성
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.58-68
    • /
    • 2000
  • 본 논문에서는 폴리포닉 오디오 신호에 대한 정현파 모델링 방법을 제안한다. 정현화 모델링을 폴리포닉 오디오 신호에 적용하는데 있어서 가장 큰 문제점은 스펙트럼 분석을 위한 분석 윈도우의 크기를 결정할 수 없다는 것이다. 또한 고음질의 합성음을 위해서는 악기음의 특성을 결정짓는 어택이 잘 보존되어야 한다. 본 논문에서는 입력 신호를 6개의 옥타브 벤드 구조의 다중 해상도 필터 뱅크를 통과시키고, 각 서브벤드 신호에 대해 서로 다른 크기의 분석 윈도우를 적용시킴으로써 폴리포닉 오디오 신호에 대한 분석 윈도우 크기 결정 문제를 해결한다. 정현파 모델링에서 발생하는 어택과 같은 천이 구간에서의 퍼짐 현상을 개선하기 위해 각 서브밴드 신호에 동적 세그맨테이션 방법을 적용하여 천이 구간 근처에서는 분석과 합성 프레임 크기를 작게 하는 방법을 사용한다. 이 방법을 통해 서브밴드 신호의 구간별 시간-주파수 특성에 따라 적절한 크기의 윈도우를 선택할 수 있다. 동적 세그멘테이션 방법으로는 기존의 방법보다 계산량과 성능 면에서 더 나은 특성을 보이는 방법을 제안한다. 여러가지 폴리포닉 오디오 신호에 대한 시뮬레이션 결과 제안한 정현파 모델링 방법이 음질의 손상 없이 원래 신호를 잘 복원할 수 있음을 확인하였다.

  • PDF

지각적으로 가중된 매칭 퍼슈잇을 이용한 오디오 신호의 정현파 모델링 (Sinusoidal Modeling of Audio Signals Using Perceptually Weighted Matching Pursuit)

  • 김연지;이인성
    • 한국음향학회지
    • /
    • 제22권2호
    • /
    • pp.96-103
    • /
    • 2003
  • 본 논문은 매칭 퍼슈잇 (Matching Pursuit)에 인지적인 가중치를 사용하여 오디오 신호를 정현파 모델링하는 것에 대해 기술한다. 매칭 퍼슈잇은 입력 신호에서 에너지가 가장 큰 성분들을 반복적으로 추출해 원 신호와 재생 신호의 차이가 영에 도달될 때까지 계속된다. 본 논문에서는 매칭 퍼슈잇에 심리음향모델을 사용한 인지적인 매칭 퍼슈잇으로 입력 신호로부터 인지적으로 중요한 성분을 차례대로 추출하였다 인지적인 매칭 퍼슈잇의 성능을 평가하기 위해 인지적인 가중치를 주지 않은 정현파 매칭 퍼슈잇과 비교 평가하였다. 여러 가지 입력 신호에 대한 실험 결과 정현파 매칭 퍼슈잇보다 인지적인 매칭 퍼슈잇의 성능이 좋았고, 특히 시간축 변화율이 큰 신호일 경우에 인지적인 매칭 퍼슈잇을 통해 원래 신호의 음질을 더 잘 복원할 수 있었음을 확인하였다.

정현파 모델을 이용한 2.4kbps 음성부호화 알고리즘 (2.4kbps Speech Coding Algorithm Using the Sinusoidal Model)

  • 백성기;배건성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.123-126
    • /
    • 2000
  • STC(Sinusoidal Transform Coding) 방식은 음성신호의 주파수 영역에서 스펙트럼 피크치들을 정현파로 모델링하여 합성하는 방식을 말한다. 저전송률 STC 방식에서는 전송되는 정보량을 줄이기 위해 스펙트럼 피크를 대신해 음성신호의 스펙트럼 포락선 정보와, 피치정보를 이용하여 얻어지는 고조파 성분들을 정현파로 모델링하여 음성을 합성한다. 본 논문에서는 음성신호의 정현파 모델에 기반하여 2.4kbps 전송속도를 갖는 음성부호화 알고리즘을 제안하였으며, 실험결과로 합성음의 파형과 스펙트럼 특성, 위상특성, 그리고 MOS(Mean Opinion Score) 테스트를 이용한 합성음의 음질을 비교/분석 하였다.

  • PDF

캡스트럼 포락선을 이용한 해금 소리의 포만트 합성 (Formant Synthesis of Haegeum Sounds Using Cepstral Envelope)

  • 홍연우;조상진;김종면;정의필
    • 한국음향학회지
    • /
    • 제28권6호
    • /
    • pp.526-533
    • /
    • 2009
  • 본 논문에서는 전통 현악기 해금의 스펙트럼 모델링을 위해 캡스트럼 포락선을 이용한 포만트 합성법을 제안한다. 스펙트럼 모델링은 입력 신호를 정현파 성분과 노이즈 성분의 합으로 해석하여 음을 합성하는 기술로 주기성이 있는 현악기나 관악기의 음 합성에 효과적이다. 캡스트럼 포락선의 포만트는 정현파 성분 합성을 위한 파라미터로 활용하였다. 정현파 성분을 합성하기 위해 기존의 가산합성 방식과는 달리 IIT (Impulse Invariant Transform)로 공명기를 설계하였으며 배음간 크기 보완을 위해 대역 통과 필터를 추가하였다. 원음과 합성된 정현파 성분의 차로 구해진 노이즈 성분에 포함된 일부 유효배음을 제거하면 완전한 노이즈 성분을 구할 수 있으며 선형 보간법 (linear interpolation)에 기초하여 그 주파수 특성을 파라미터화 하였다. 최종적으로 합성된 노이즈 성분과 정현파 성분을 더하여 해금 단위음을 합성하였고 합성음은 원음과 매우 유사하였다.

웨이블릿 변환을 이용한 음성신호의 AbS/OLA 정현파 모델링 (AbS/OLA Sinusoidal Modeling of Speech Signal Using Wavelet Transform)

  • 김기홍;홍진근;정용익;이상이
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2004년도 추계학술대회
    • /
    • pp.114-117
    • /
    • 2004
  • 본 논문에서는 합성에 의한 분석(Analysis-by-Synthesis) 및 가산중첩(Overlap-Add) 방식을 채택하고 있는 음성신호의 AbS/OLA 정현파 모델에 웨이블릿 변환을 적용한 새로운 모델을 제안하였다. 즉, 기존의 모델에 웨이블릿 변환을 적용하여 입력신호를 몇 개의 부대역 신호로 나눈 다음 각각 다른 길이의 분석 윈도우를 적용한다. 이는 기존 모델의 정현파 파라미터 추출 시 고정된 길이의 분석 윈도우를 이용하는 단점을 극복하여 좀 더 정확한 파라미터 추출을 가능하게 한다. 시험결과 제안된 정현파 모델이 기존 모델에 비해 합성음의 스펙트럼 및 위상 특성, 음질 등에서 성능이 개선됨을 확인할 수 있었다.

  • PDF

Text-to-speech 시스템에서의 화자 변환 기능 구현 (Implementation of the Voice Conversion in the Text-to-speech System)

  • 황철규;김형순
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.33-36
    • /
    • 1999
  • 본 논문에서는 기존의 text-to-speech(TTS) 합성방식이 미리 정해진 화자에 의한 단조로운 합성음을 가지는 문제를 극복하기 위하여, 임의의 화자의 음색을 표현할 수 있는 화자 변환(Voice Conversion) 기능을 구현하였다. 구현된 방식은 화자의 음향공간을 Gaussian Mixture Model(GMM)로 모델링하여 연속 확률 분포에 따른 화자 변환을 가능케 했다. 원시화자(source)와 목적화자(target)간의 특징 벡터의 joint density function을 이용하여 목적화자의 음향공간 특징벡터와 변환된 벡터간의 제곱오류를 최소화하는 변환 함수를 구하였으며, 구해진 변환 함수로 벡터 mapping에 의한 스펙트럼 포락선을 변환했다. 운율 변환은 음성 신호를 정현파 모델에 의해서 모델링하고, 분석된 운율 정보(피치, 지속 시간)는 평균값을 고려해서 변환했다. 성능 평가를 위해서 VQ mapping 방법을 함께 구현하여 각각의 정규화된 켑스트럼 거리를 구해서 성능을 비교 평가하였다. 합성시에는 ABS-OLA 기반의 정현파 모델링 방식을 채택함으로써 자연스러운 합성음을 생성할 수 있었다.

  • PDF

비브라토음의 비정현파적인 주파수 궤적의 특성 분석에 관한 연구 (A study on the characteristic analysis of non-sinusoidal frequency trajectories of vibrato tones)

  • 방희석
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.473-478
    • /
    • 2021
  • 비브라토는 보컬음과 악기음에 대한 주파수의 변조를 의미하며, 음악의 음색을 풍부하게 만들기 위해서 사용되는 대표적인 기법들 중의 하나이다. 비브라토음의 기본주파수 궤적은 정현파 신호로 모델링이 되는 것이 일반적이지만, 궤적의 모양이 비정현파적인 경우들도 존재한다. 본 논문에서는 비브라토음의 기본주파수 궤적 중 비정현파적인 형태를 가지는 경우에 대해 그 특성을 분석하는 방법을 제안한다. 제안되는 방법은 주파수 궤적에 대해 Fast Fourier Transform(FFT) 분석을 통해 배음 분석을 실행하고, 비브라토 파라미터들을 분석하고, 또한 궤적의 정현파 순도 인자를 계산하는 과정들로 이루어진다. 플루트, 비올라, 색소폰 악기음들에 대해 제안된 방법을 적용하였고 실험 결과를 통해 제안된 방법이 유용함을 보였다.

저연산 정현파 합성을 이용한 악기음의 모델링 (Modeling of Instrumental Tone Using Low Computation Sinusoidal Synthesis)

  • 오복환;이동규;송인호;이두수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.185-188
    • /
    • 1999
  • 음향 신호의 모델링방법은 크게 분석,해석,합성의 3가지 과정으로 나눌 수 있다. 본 논문에서는 분석과 합성에 가산 합성방법의 한가지인 Analysis-by-synthesis/overlap-Add 방법을 사용한다. 그리고 해석에 해당하는 주파수 영역에서의 피크추출은 제안한 방법에 의한다. 제안한 피크 추출 방법은 고조파 성분이 기본 주파수의 정수배가 된다는 점을 고려하여 적은 연산량으로 음향학적으로 의미있는 순음을 검출하는 방법이다. 음질보다 연산량에 더 주를 두었지만 모의 실험 결과를 통하여 음질 면에서도 원음과 거의 차이가 없음을 알 수 있었다.

  • PDF