• 제목/요약/키워드: Sustained Vowel Modeling

검색결과 2건 처리시간 0.018초

최소 제곱 서포트 벡터 회귀 기반 비선형 자귀회귀 방법을 이용한 지속 모음 모델링 (Sustained Vowel Modeling using Nonlinear Autoregressive Method based on Least Squares-Support Vector Regression)

  • 장승진;김효민;박영철;최홍식;윤영로
    • 한국지능시스템학회논문지
    • /
    • 제17권7호
    • /
    • pp.957-963
    • /
    • 2007
  • 본 연구에서는 비선형 지속 모음 모델링을 위한 최소 제곱 서포트 벡터 회귀 기반 비선형 자귀회귀 방법을 소개하고 분석하였다. 비주기적인 파형 특성을 갖는 양성 후두 질환자 43명의 지속 모음을 대상으로 한 실험에서 제안된 비선형 합성기는 거의 완벽하게 혼란한 지속 모음을 생성하고 선형 예측 코딩은 할 수 없는 주파수 변동과 같은 자연스러운 음의 특성 또한 보존할 수 있었다. 하지만 일부 모음의 합성 결과 실제 원음과 다른 차이점을 보였다. 이러한 결과들은 단일 밴드 모델이 음의 고주파 성분을 조정, 분해 못하기 때문에 발생한 것이라 가정된다. 그러므로 웨이블릿 필터 뱅크를 이용한 멀티 밴드 모델을 단일 밴드 모델과 대치하여 실험을 수행한 결과 향상된 안정성을 보였다. 결과적으로 최소 제곱 서포트 벡터 회귀 기반 비선형 자귀회귀 방법은 성공적으로 원음에 가까운 합성음을 생성할 수 있다는 것을 확인 할 수 있었다.

켑스트럼 변수와 랜덤포레스트 알고리듬을 이용한 MTD(근긴장성 발성장애) 여성화자 음성과 정상음성 분류 (Classification of muscle tension dysphonia (MTD) female speech and normal speech using cepstrum variables and random forest algorithm)

  • 윤주원;심희정;성철재
    • 말소리와 음성과학
    • /
    • 제12권4호
    • /
    • pp.91-98
    • /
    • 2020
  • 근긴장성 발성장애(cepstral peak prominence, MTD) 환자의 모음 발성과 문장읽기 과제를 켑스트럼 기반 변수를 이용하여 분석하였으며 음성장애 환자의 GRBAS청지각적 특성과 음향학적 특성의 상관관계를 살펴보고, 랜덤포레스트 머신러닝 분류 알고리듬을 이용한 MTD 감별 진단 가능성을 논의하였다. 내원 시 MTD로 진단받은 여성 36명과 정상음성을 사용하는 여성 36명이 연구에 참여했으며, 수집한 음성샘플은 ADSVTM를 사용하여 분석하였다. 연구 결과, 음향학적 측정치 중 MTD의 CSID(cepstral spectral index of dysphonia)는 대조군보다 높았으며, CPP(cepstral peak prominence), CPP_Fo 값이 대조군보다 유의하게 낮았다. 이는 모음 발성과 읽기 과제에서 모두 동일하게 나타났다. MTD 환자의 음질 특성은 전반적인 음성중증도(G)가 가장 두드러졌으며, 조조성(R), 기식성(B), 노력성(S)순으로 음성 특성을 보였다. 이 특성이 높아질수록 CPP가 감소하는 부적 상관을 보이고, CSID는 증가하는 정적 상관이 관찰되었다. 켑스트럴 변수 중 모음과 문장읽기과제 모두에서 집단간 유의한 차이를 보여준 CPP와 CPP_F0를 이용하여 MTD와 대조군의 음성분류를 시도하였다. 머신러닝 알고리듬인 랜덤포레스트로 모델링한 결과 문장읽기 과제에서 모음연장발성보다 조금 더 높은 분류 정확도(83.3%)가 나왔으며, 모음 발성과 문장 읽기 과제 모두에서 CPP변수가 더 중심적 역할을 수행하였음을 알 수 있었다.