• 제목/요약/키워드: 켑스트럼 분석

검색결과 58건 처리시간 0.021초

남녀의 음향학적 특징벡터의 비교 분석에 관한 연구

  • 최재승;정병구
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.887-890
    • /
    • 2012
  • 본 논문에서는 켑스트럼 계수의 변화에 따른 남성화자와 여성화자의 음향학적인 특징벡터를 비교하여 분석하는 기초적인 연구를 수행한다. 특히 FFT 켑스트럼 및 LPC 켑스트럼에 대한 남녀의 음향학적인 특징벡터의 차이점을 나타낸다. 향후 이러한 차이점을 기초로 하여 신경회로망 등에 의한 성별 인식에 대한 연구를 수행함으로써 남성화자 및 여성화자를 분리할 수 있는 근거를 마련하는 기초연구이다.

  • PDF

잡음에 강한 음성 인식을 위한 성문 가중 켑스트럼에 관한 연구 (Glottal Weighted Cepstrum for Robust Speech Recognition)

  • 전선도;강철호
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.78-82
    • /
    • 1999
  • 본 연구는 잡음에 강한 음성 파라미터로써 널리 사용하는 가중 켑스트럼에 관한 연구이다. 특히 청각 모델인 PLP(Perceptual Linear Predictive)에서 켑스트럼을 추출 후 비대칭형 성문 펄스 파형 형태를 가중치 함수로 사용하는 방법을 제안한다. 또한 이러한 가중 켑스트럼을 성도 모델에서의 성도파형과 켑스트럼과 연관하여 분석하였다. 그리고 청각 모델인 PLP의 켑스트럼에 가중시켜 청각 모델과 성도 모델을 모두 적용한 음성 파라미터를 얻었다. 이러한 방법의 성능 평가를 위해 차량내 잡음과 길거리에서의 잡음 환경에서의 고립 단어 인식 실험을 하였다. 그리고 기존의 LP(Linear Prediction)에 의한 가중된 윈도우 켑스트럼 및 PLP에 의한 가중된 Liftering 켑스트럼 등과 비교하였다. 모의 실험 결과는 기존의 가중된 cepstrum 보다 제안하는 성문 가중 켑스트럼이 보다 높은 인식율을 보여준다.

  • PDF

LPC 켑스트럼 계수와 신경회로망을 사용한 화자인식 (Speaker Recognition using LPC cepstrum Coefficients and Neural Network)

  • 최재승
    • 한국정보통신학회논문지
    • /
    • 제15권12호
    • /
    • pp.2521-2526
    • /
    • 2011
  • 본 논문에서는 퍼셉트론 신경회로망과 선형예측부호화 켑스트럼 계수를 사용한 화자인식 알고리즘을 제안한다. 제안하는 화자인식 알고리즘은 입력받은 음성신호에 대해서 유성음 구간을 추출한다. 추출된 유성음 구간에 대하여 선형예측 분석에 의하여 화자의 특성을 가지고 있는 선형예측부호화 켑스트럼 계수를 구한다. 구해진 선형예측부호화 켑스트럼 계수를 분류하기 위하여 이 켑스트럼 계수를 퍼셉트론 신경회로망의 입력으로 사용하여 네트워크의 학습을 수행한다. 본 실험에서는 선형예측부호화 켑스트럼 계수와 신경회로망을 사용하여 본 화자인식 알고리즘이 유효하다는 것을 인식률을 통하여 확인한다.

채널에 강인한 화자 인식을 위한 채널 정규화 피치 동기 켑스트럼에 관한 연구 (A Study on the Channel Normalized Pitch Synchronous Cepstrum for Speaker Recognition)

  • 김유진;정재호
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.61-74
    • /
    • 2004
  • 본 논문에서는 채널 환경에 강인한 화자 인식 시스템을 위하여 문맥과 화자에 종속적인 켑스트럼 추출 방법과 추출된 켑스트럼에서 화자 정보의 손실을 최소화하는 채널 정규화 방법을 제안하였다. 제안된 추출 방법은 화자의 고유한 피치를 이용한 피치 동기 분석 방법에 기반을 두어 켑스트럼을 추출한다. 따라서 일명 피치 동기 켑스트럼 (PSC)은 유성음 구간에서 성도의 임펄스 응답을 보다 정확하게 표현할 수 있다. 또한 피치는 채널 환경에서 스펙트럼에 비해 강인하므로 피치 동기 켑스트럼은 채널에 의한 스펙트럼의 왜곡을 보상할 수 있다. 제안된 채널 정규화방법인 포먼트 평활화 피치 동기 켑스트랄 평균 차감법 (FBPSCMS)은 포먼트 평활화 켑스트랄 평균 차감법을 PSC에 적용하여 프레임 내 처리의 정확도를 개선시킨다. 제안된 방법들의 화자 인식 성능을 비교하기 위해 남자 112명과 여자 56명에 대해 WMIT과 전화선 환경의 NTIMIT을 이용한 화자 식별을 수행하였다. 실험 결과 피치 동기 LPCC는 기존 단구간 켑스트럼과 비교하여 에러 감소율을 최대 7.7%까지 향상시켰고, FBPSCMS는 극점 필터링 CMS에 비해 보다 안정되고 낮은 에러율을 나타내었다.

LPC 켑스트럼 및 FFT 스펙트럼에 의한 성별 인식 알고리즘

  • 최재승;정병구
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.63-65
    • /
    • 2012
  • 본 논문에서는 입력된 음성이 남성화자인지 여성화자인지를 구분하는 FFT 스펙트럼 및 LPC 켑스트럼 입력에 의한 성별인식 알고리즘을 제안한다. 본 논문에서는 특히 남성화자와 여성화자의 특징벡터를 비교 분석하여, 이러한 남녀의 음향학적인 특징벡터의 차이점을 이용하여 신경회로망에 의한 성별 인식에 대한 실험을 수행한다. 특히 12차의 LPC 켑스트럼 및 8차의 저역 FFT 스펙트럼의 특징벡터를 사용한 경우에, 남성화자 및 여성화자에 대해서 양호한 남녀 성별인식률이 구해졌다.

  • PDF

감정 음성 인식을 위한 강인한 음성 파라메터 (Robust Speech Parameters for the Emotional Speech Recognition)

  • 이규현;김원구
    • 한국지능시스템학회논문지
    • /
    • 제22권6호
    • /
    • pp.681-686
    • /
    • 2012
  • 본 논문에서는 강인한 감정 음성 인식 시스템을 개발하기 위하여 감정의 영향을 적게 받는 음성 파라메터에 대한 연구를 수행하였다. 이러한 목적을 위하여 다양한 감정이 포함된 데이터를 사용하여 감정이 음성 인식 시스템과 음성 파라메터에 미치는 영향을 분석하였다. 본 연구에서는 멜 켑스트럼, 델타 멜 켑스트럼, RASTA 멜 켑스트럼, 루트 켑스트럼, PLP 계수와 성도 길이 정규화 방법에서 주파수 와핑된 멜 켑스트럼 계수를 사용하였다. 또한 신호 편의 제거 방법으로 CMS 방법과 SBR 방법이 사용되었다. 실험결과에서 성도정규화 방법을 사용한 RASTA 멜 켑스트럼, 델타 멜 켑스트럼 및 CMS 방법을 사용한 경우가 HMM 기반의 화자독립 단독음 인식 실험 결과에서 가장 우수한 결과를 나타내었다.

켑스트럼 분석합성형 음성합성 시스템에서의 피치변경에 따른 스펙트럼 포락 왜곡 현상에 관한 연구 (Distortion of Spectrum Envelope with Change of Pitch Period in the Cepstrum Analysis-synthesis System)

  • 김연준
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1992년도 학술논문발표회 논문집 제11권 1호
    • /
    • pp.54-57
    • /
    • 1992
  • 음성합성에 있어서 음의 자연성을 합성시키는 문제는 크게 두가지로 나누어진다. 첫째는 합성음을 원음에 가깝게 구현하려는 합성방법 자체의 문제로, 언어 합성이 가지고 있는 일반적인 문제이다. 또 다른 문제는 운율에 관한 것으로 낱말 또는 문장 내에서의 운율에 따라 합성음의 자연성이 좌우된다. 이러한 운율에 따라 합성음의 자연성이 좌우된다. 이러한 운율의 조절에는 지속시간, 피치, 그리고 음의 세기 등이 이용된다. 켑스트럼을 이용하여 분석합성을 하는 경우, pole-zero 모델로 스펙트럼 포락을 근사하므로 원음에 충실하고, 필터계수와 구동정보를 분리하여 분석, 합성하므로 인위적인 운율의 조절이 용이하여 음성합성이 가지는 위의 두가지 문제를 해결하는데 적합하다고 판단된다. 본 연구에서는 켑스트럼을 이용하여 분석합성 시스템을 구성하였다. 음성 합성 과정에서, 운율 조절 파라미터중의 하나인 피치 주기의 변경에 따라 스펙트럼 포락의 왜곡에 대해 살펴보고, 왜곡을 최소화하는 방안을 제안한다.

  • PDF

전화 음성 인식을 위한 특징 추출 방법 비교 (Comparison of Feature Extraction Methods for the Telephone Speech Recognition)

  • 전원석;신원호;김원구;이충용;윤대희
    • 한국음향학회지
    • /
    • 제17권7호
    • /
    • pp.42-49
    • /
    • 1998
  • 본 논문에서는 전화망 환경에서 음성 인식 성능을 개선하기 위한 특징 벡터 추출 단계에서의 처리 방법들을 연구하였다. 먼저, 고립 단어 인식 시스템에서 채널 왜곡 보상 방 법들을 단어 모델과 문맥 독립 음소 모델에 대하여 인식 실험을 하였다. 켑스트럼 평균 차 감법, RASTA 처리, 켑스트럼-시간 행렬을 실험하였으며, 인식 모델에 따른 각 알고리즘의 성능을 비교하였다. 둘째로, 문맥 독립 음소 모델을 이용한 인식 시스템의 성능 향상을 위하 여 정적 특징 벡터에 대하여 주성분 분석 방법(principal component analysis)과 선형 판별 분석(linear discriminant analysis)과 같은 선형 변환 방법을 적용하여 분별력이 높은 벡터 공간으로 변환함으로써 인식 성능을 향상시켰다. 또한 선형 변환 방법을 켑스트럼 평균 차 감법과 결합하여 더욱 뛰어난 성능을 보여주었다.

  • PDF

남녀 성별인식을 위한 음성 특징벡터의 비교 (Comparison of Characteristic Vector of Speech for Gender Recognition of Male and Female)

  • 정병구;최재승
    • 한국정보통신학회논문지
    • /
    • 제16권7호
    • /
    • pp.1370-1376
    • /
    • 2012
  • 본 논문에서는 남성화자 혹은 여성화자인지를 구분하는 성별인식 알고리즘을 제안한다. 본 논문에서는 남성화자와 여성화자의 특징벡터를 분석하며, 이러한 남녀의 특징벡터를 이용하여 신경회로망에 의한 제안한 성별인식에 대한 인식실험을 수행한다. 신경회로망의 입력신호로 사용한 특징벡터로는 10차의 LPC 켑스트럼 계수, 12차의 LPC 켑스트럼 계수, 12차의 FFT 켑스트럼 및 1차의 RMS, 12차의 LPC 켑스트럼 및 8차의 FFT 스펙트럼들이다. 본 실험에서는 특히 12차의 LPC 켑스트럼 및 8차의 저역 FFT 스펙트럼의 특징벡터를 사용하여 20-20-2의 네트워크에 의하여 신경회로망이 학습되었다. 실험결과, 남성화자에 대하여 학습 시에는 평균 99.8%, 여성화자에 대해서는 평균 96.5%의 성별인식률이 구해졌다.

가중된 예측 오차 파라미터를 사용한 화자 확인 성능 개선 (Speaker Verification Performance Improvement Using Weighted Residual Cepstrum)

  • 위진우;강철호
    • 한국음향학회지
    • /
    • 제20권5호
    • /
    • pp.48-53
    • /
    • 2001
  • LPC분석 기반 화자 확인에서 잔여성분(residue) 예측은 보통 무시되고, LPCC(LPC-cepstrum)만이 특징 파라미터로 사용된다. 본 연구에서는 잔여성분으로부터 추출된 예측파라미터인 잔여 켑스트럼(residual cepstrum)을 LPCC와 함께 여러 환경에서 구축된 데이터 베이스에서 화자특징 파라미터로 사용하였다. 또한, 잔여 켑스트럼에 포함되어있는 화자 고유성분인 피치(pitch)성분에 큰 가중치(weighting)를 줌으로써 화자간 변이(inter-speaker variation)가 커지도록 하는 가중치 함수를 제안한다. 실험 결과, LPCC만을 특징 파라미터로 사용하였을 경우보다 잔여 켑스트럼 (RCEP)과 LPCC를 동시에 사용했을 경우 약 6%가량의 인식 오류율이 향상 되었으며, 제안한 가중치 함수를 적용한 잔여 켑스트럼 (RCEP)과 LPCC를 동시에 사용했을 경우 인식 오류율이 가중치를 주지 않은 경우보다 약 2.45%가량 개선되었다.

  • PDF