• 제목/요약/키워드: 켑스트럼 분석

검색결과 59건 처리시간 0.023초

명료발화와 보통발화에서 파킨슨병환자 음성의 켑스트럼 및 스펙트럼 분석 (Characteristics of voice quality on clear versus casual speech in individuals with Parkinson's disease)

  • 신희백;심희정;정훈;고도흥
    • 말소리와 음성과학
    • /
    • 제10권2호
    • /
    • pp.77-84
    • /
    • 2018
  • The purpose of this study is to examine the acoustic characteristics of Parkinsonian speech, with respect to different utterance conditions, by employing acoustic/auditory-perceptual analysis. The subjects of the study were 15 patients (M=7, F=8) with Parkinson's disease who were asked to read out sentences under different utterance conditions (clear/casual). The sentences read out by each subject were recorded, and the recorded speech was subjected to cepstrum and spectrum analysis using Analysis of Dysphonia in Speech and Voice (ADSV). Additionally, auditory-perceptual evaluation of the recorded speech was conducted with respect to breathiness and loudness. Results indicate that in the case of clear speech, there was a statistically significant increase in the cepstral peak prominence (CPP), and a decrease in the L/H ratio SD (ratio of low to high frequency spectral energy SD) and CPP F0 SD values. In the auditory-perceptual evaluation, a decrease in breathiness and an increase in loudness were noted. Furthermore, CPP was found to be highly correlated to breathiness and loudness. This provides objective evidence of the immediate usefulness of clear speech intervention in improving the voice quality of Parkinsonian speech.

차륜의 찰상결함 진단을 위한 켑스트럼 분석 방법 연구 (A Study on Cepstrum Analysis for Wheel Flat Detection in Railway Vehicles)

  • 김거영;김현태;구정서
    • 한국안전학회지
    • /
    • 제31권3호
    • /
    • pp.28-33
    • /
    • 2016
  • Since defects in the wheels of railway vehicles, which occur due to wears with the rail, cause serious damage to the running device, the diagnostic monitoring system for condition-based maintenance is required to secure the driving safety. In this paper, we studied to apply a useful Cepstrum analysis to detect periodic structure in spectrum among the vibration signal processing techniques for the fault diagnosis of a rotating body such as wheel. In order to analyze in variations of train velocity, the Cepstrum analysis was performed after a domain change of the vibration signal from time domain to rotation angle domain. When domains change, it is important to use a interpolation for a uniform interval of the rotation angle. Finally, the Cepstrum analysis for wheel flat detection was verified by using the vibration signal including the disturbance resulting from the rail irregularities and the vibration of bogie components.

음성 및 음향분석 프로그램 Praat의 임상적 활용법 (Guidance to the Praat, a Software for Speech and Acoustic Analysis)

  • 성철재
    • 대한후두음성언어의학회지
    • /
    • 제33권2호
    • /
    • pp.64-76
    • /
    • 2022
  • Praat is a useful analysis tool for linguists, engineers, doctors, speech-language pathologits, music majors, and natural scientists. Basic parameters including duration, pitch, energy and perturbation parameters such as jitter and shimmer can be easily measured and manipulated in the sound editor. When a more in-depth analysis is needed, it is recommended to understand the advanced menus of the object window and learn how to use them. Among the object window menus, vowel formant analysis, spectrum analysis, and cepstrum analysis can be cited as useful ones in the clinical field. The spectrum object can be usefully used for voice quality measurement and diagnosis of patients with voice disorders by showing the energy distribution according to frequency axis (domain). A cepstrum object is useful for speech analysis when periodicity of the sound object is not measurable. The low to high ratio obtained from the spectral object and the CPPs measured from the cepstrum object have attracted many researchers, and it has been proven that the CPPs measured in Praat are relatively excellent.

머리 전달 함수의 보간에 적합한 왜곡 척도 (A Relevant Distortion Criterion for Interpolation of the Head-Related Transfer Functions)

  • 이기승;이석필
    • 한국음향학회지
    • /
    • 제28권2호
    • /
    • pp.85-95
    • /
    • 2009
  • 양이 재생 환경에서 다양하고 정확한 공간 이미지 형성을 위해서는 다양하고 세분화된 머리 전달 함수가 요구된다. 방대한 양의 머리 전달 함수를 효과적으로 감축하기 위한 방법으로, 모든 방향에 대한 머리 전달 함수를 몇 개의 대표 값들을 이용해 보간을 통해 얻는 방법이 주로 사용되고 있다. 본 논문에서는 머리 전달 함수의 보간 시 중요한 역할을 하는 보간 왜곡의 측정 방법에 대해 연구하였다. 다양한 객관적 왜곡 측정 방법을 이용하여 보간된 머리전달 함수와 본래의 머리전달 함수 간 차이를 표현하였으며 차이 값과 청취 테스트의 결과를 비교, 분석하였다. 분석 결과로부터 음원의 공간 이미지 차이를 가장 잘 반영하는 객관적 왜곡 측정 방법을 선택하였으며 이를 실제 보간 기법에 적용하였다. 3명의 사람으로부터 측정된 머리전달함수와 1개의 마네킹에서 측정된 머리 전달함수에 제안된 방법을 적용한 결과, 3명의 사람에 대한 머리전달 함수에 대해서는 멜-주파수 켑스트럼 왜곡이, 4 종류의 머리전달 함수에 대해서는 시간 영역의 신호 대 왜곡비자 음원의 공간 이미지 차이를 가장 잘 예측하는 왜곡 척도임을 알 수 있었다.

실시간 임베디드 음성 인식 시스템 (A Real-Time Embedded Speech Recognition System)

  • 남상엽;전은희;박인정
    • 전자공학회논문지CI
    • /
    • 제40권1호
    • /
    • pp.74-81
    • /
    • 2003
  • 본 연구에서는 음성인식 엔진과 데이터베이스에 필요한 메모리 규모를 최소화시킨 실시간 임베디드 음성인식 시스템을 구현하였다. 실험을 위해 PCS 전화기에서 사용하는 40가지의 명령어와 10개의 숫자음으로 구성된 단어 목록을 만들고, 이들 단어들을 남,여 화자가 발성하여 음성 시료를 구했다. 채록된 음성을 대상으로 창크기 256표본외 단기 분석을 통해 선형 예측 계수를 구한다. 이때 고역강조를 통해 직류 성분을 제거하고 성문 등의 저역 필터효과를 제거하였다. 선형 예측 계수는 Levinson-Durbin 알고리즘을 사용해 구했고 이를 다시 켑스트럼 계수로 변환하여 인식을 위한 특징 벡터열로 구축하였다. 각 단어의 특징 벡터 열에 대해 Baum-Welch 추정법을 이용하여 HMM을 훈련시킨 다음, 기능성 계산을 통해 각 단어에 대한 인식을 수행하도록 하였다. 단어 인식을 위해 ARM CPU코어가 장착된 보드에 음성인식 엔진과 데이터 베이스를 포팅하여 실험용 임베디드 시스템을 구축하였다 5가지 인식 계수집단에 대한 인식 실험을 실시하여 인식률이 좋은 계수 집단을 선정하였다. 전체적인 음성인식 엔진의 인식률은 95%이었고 명령어에 대한 인식률은 96%, 숫자음에 대한 인식률은 94%로 나타났다.

초음파 도플러 신호를 이용한 음성 합성 (Speech synthesis using acoustic Doppler signal)

  • 이기승
    • 한국음향학회지
    • /
    • 제35권2호
    • /
    • pp.134-142
    • /
    • 2016
  • 본 논문에서는 40 kHz 초음파 신호를 입 주변에 쏘고, 되돌아오는 초음파 신호를 이용해 음성신호를 합성하는 방법을 소개하고 성능을 평가하였다. 발성하고 있는 입주변에 초음파를 방사하게 되면, 입술, 턱, 뺨 등의 움직임으로 인한 변위로 도플러 현상이 발생하고, 이에 따라 반사 신호에는 본래의 주파수 성분과는 다른 도플러 주파수가 관찰되는데, 본 논문에서는 이러한 도플러 주파수를 이용하여 음성 파라메터를 추정하도록 하였다. 음성합성에 앞서서 초음파 도플러 신호와 음성 신호 간의 상관관계를 각 주파수 별로 분석하였으며, 이로부터 초음파 도플러 신호를 이용한 음성 신호의 합성 가능성을 살펴보았다. 변환에는 초음파 도플러의 정적, 동적 특성을 함께 반영한 특징 변수를 사용하였으며 결합-혼합 가우시안 기법을 이용하여 음성 파라메터로 변환하였다. 5명의 피 실험자를 이용한 음성 합성 실험에서 필터뱅크 에너지 값을 초음파신호의 특징변수로, LPC(Linear Predictive Coefficient) 켑스트럼 계수를 음성 변수로 사용하는 경우 가장 우수한 변환 성능을 나타내었다. 음성신호에서 추출한 여기신호를 이용하여 합성음을 생성하고, 이를 청취하였을 때 72.2 %의 평균 인식율이 얻어짐을 확인할 수 있었다.

노화에 따른 음질과 구어 유창성의 음향학적 특성 변화 (Change in acoustic characteristics of voice quality and speech fluency with aging)

  • 박희준;박진
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.45-51
    • /
    • 2023
  • 나이가 들면서 발생하는 음성 문제는 사회적, 정서적으로 영향을 미칠 수 있으며, 나아가 고립감과 우울증으로 이어질 수 있다. 이에 본 연구에서는 노화로 인한 음향학적 특성 변화를 음질과 구어 유창성의 변화를 알아보고자 한다. 이를 위해 노년층 남성 20명과 청년층 남성 20명이 산출한 연장발성과 구절 읽기 과제를 녹음하여 분석하였다. 음질 분석 변수로 기본주파수(F0), 주기 변동률(jitter), 진폭 변동률(shimmer), 켑스트럼 정점(cepstral peak prominence, CPP) 값을 분석하였으며 구어 유창성 분석 변수로는 평균 음절 길이(average syllable duration, ASD), 조음 속도(articulation rate, AR), 구어 속도(SR)를 분석하였다. 연구결과, 음질 측정에서 노년층의 경우 F0가 높게 나타났으며 jitter, shimmer, CPP의 결과값을 통해 음질이 저하된 것으로 나타났다. 구어 유창성 분석 결과, 노년층은 ASD, AR, SR의 결과값을 통해 느리게 발화하는 것으로 나타났다. 음질과 구어유창성 간 상관관계 분석 결과, shimmer와 CPP 값과 각각 ASD와 SR에서 높은 상관관계가 나타났다. 본 연구결과를 통해 노화에 따른 음성과 구어 유창성 변화를 조기에 발견하고 이에 대한 적절한 훈련법을 제공할 수 있을 것으로 기대된다.

정상 성인에서 스마트폰 녹음을 위한 마이크 유형 간 음향학적 측정치 비교 (A comparison of acoustic measures among the microphone types for smartphone recordings in normal adults)

  • 박정인;이승진
    • 말소리와 음성과학
    • /
    • 제16권2호
    • /
    • pp.49-58
    • /
    • 2024
  • 본 연구에서는 정상음성사용자를 대상으로 음성검사를 위한 고가의 음성 녹음 장비인 Computerized Speech Lab(CSL) 대신 스마트폰에 적용 가능한 단일지향성 유선 핀마이크(WIRED), 스마트폰의 자체 내장 무지향성 마이크(SMART), 블루투스 무선 이어폰인 갤럭시 버즈2 프로(WIRELESS)로 녹음된 음성샘플의 음향학적 측정치를 비교하고자 하였다. 연구대상은 최근 3개월 이내 호흡기 질환으로 이비인후과에 내원한 적이 없는 정상성인 40명(남 12명, 여 28명)이었으며, 소음이 통제된 방음 부스에서 모음 /아/ 연장 발성(4초) 과제와 '산책' 문장, '가을' 문단 읽기 과제를 네 가지의 기기로 동시에 녹음하였다. 4종의 샘플들에 대하여 CSL 녹음을 기준으로 동기화 작업을 진행하였으며, MDVP와 ADSV, VOXplot 프로그램을 이용하여 분석하였다. 연구 결과, F0, shimmer, noise-to-harmonic ratio를 제외한 다른 변수들에서 유의미한 차이가 있었다. 특히 SRV, SRS, CSIDV, CSIDS, AVQI의 경우 CSL에 비해 WIRED의 CSIDV, CSIDS, AVQI 중증도가 낮았던 반면, SMART에서는 높게 나타났다. SRV, SRS의 경우 반대의 경향이 나타났으며, WIRELESS는 과제에 따라 다른 경향이 있었다. CSL과 다른 마이크 유형들은 동일한 변수 간에는 모두 양의 상관관계를 보였으며, F0와 CPPV가 모든 유형에서 공히 강한 양의 상관관계를 보였다. ICC 또한 F0와 CPPV가 모두 0.9 이상으로 가장 높았다. 본 연구에서 사용된 마이크를 음향학적 분석을 위한 녹음 도구로 사용할 때, F0와 CPPV의 경우 신뢰도 높은 분석 변수로 마이크 유형과 무관하게 포함할 수 있고, SR, CSID, AVQI의 경우 마이크 유형에 따라 분석 및 해석에 주의를 기울일 필요가 있을 것으로 판단된다.

언어재활사의 주관적 음성피로도와 관련된 음향적 특성 (Acoustic characteristics of speech-language pathologists related to their subjective vocal fatigue)

  • 전혜원;김지연;성철재
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.87-101
    • /
    • 2022
  • 대전·충남지역 20-30대 여성 언어재활사 50명을 대상으로 주관적 음성 피로도 설문과 더불어 하루 4회기를 기준으로 언어치료 전/후 음성 샘플 수집을 하였다. 연구 결과, Korean Vocal Fatigue Index의 음성 피로로 인한 음성 사용회피 항목과 음성 사용으로 인한 신체 피로 항목에서 피로 집단과 피로 없는 집단 간 유의한 차이가 있었다. 두 집단의 음향음성학적 특성과 관련하여, 두 집단 모두 치료 후 저주파 대역 에너지가 상대적으로 낮아지고 고주파 대역 에너지가 상승하는 패턴을 보였다. 이러한 특징이 분산분석 결과, 주 효과로 나타난 low to high-ratio[t1(time.1)>t2(time.2)], slope_ltas(t2>t1), 3rd formant's energy(t1>t2), high energy(t2>t1) 등에 잘 반영되어 있다. 집단 간 차이는 음향변수들 중 치료 전 모음 연장발성 스펙트럼 저주파 대역의 에너지인 low energy에서만 관찰되었고 피로 없는 집단의 값이 더 컸다(no.fatigue>fatigue in t1). 음향변수에서의 이러한 특징과 더불어 치료 세션 후 피로 없는 집단의 연결발화에서의 왜도 증가는 장시간의 목소리 노동으로 인한 성대 과긴장(higher muscle tonus)과 목소리 남용 때문으로 해석할 수 있다. 섭동변수 shimmer_local은 피로 없는 집단이 언어치료 후 낮아졌고(t1>t2), 켑스트럼 변수인 RNR(rhamonics to noise ratio)은 언어치료 후 값이 높아졌다(t2>t1). NHR(noise to harmonic ratio)은 두 집단 모두 치료 후 낮아졌다. NHR의 감소와 shimmer_local의 하강은 치료 세션을 진행하면서 발성 과정이 안정화되었거나 혹은 전문 지식이 있는 언어재활사(특히 피로 없는 집단)들의 효율적 목소리 사용이 기여했다고 결론지을 수 있다. 피로 없는 집단의 경우는 치료 후에 RNR값이 유의하게 커졌으므로 치료 후 오히려 조화음(harmonic) 구조가 더 안정되었다고도 말할 수 있을 것이다.