• 제목/요약/키워드: VOCAL SIGNAL

검색결과 85건 처리시간 0.024초

Vibratory pattern analysis of vocal folds for layngeal function assessment usig electroglottograph system

  • Song, Chulgyu;Lee, Myoungho
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1994년도 Proceedings of the Korea Automatic Control Conference, 9th (KACC) ; Taejeon, Korea; 17-20 Oct. 1994
    • /
    • pp.583-585
    • /
    • 1994
  • In this study, we have evaluated the effect of amplitude and frequency perturbation of EGG signal during single vowels associated with laryngeal pathology. The normal EGG signal is properly characterized by an autoregressive model which has the optimal order of ninth using the parametric method. This can be analyzed by determining the transfer function. Perturbations in the fundamental pitch and in the peak amplitude of EGG signal derived with a four-electrode system using the modulation/demodulation techniques were investigated for the purpose of developing a decision criteria for the laryngeal function identification.

  • PDF

선형 스펙트럼쌍을 이용한 성문특성이 제거된 성도특성 추출법에 관한 연구 (A Study on Extraction of Vocal Tract Characteristic After Canceling the Vocal Cord Property Using the Line Spectrum Pairs)

  • 민소연;장경아;배명진
    • 한국음향학회지
    • /
    • 제21권7호
    • /
    • pp.665-670
    • /
    • 2002
  • 프리엠퍼시스 필터의 일반적인 형태는 y(n)=s(n)-As(n-1)이고, 여기서 A값은 유성음의 경우 0.9∼l.0사이의 값이다. 또한 A값은 프리엠퍼시스의 기울기 값을 반영하고 기존의 방법에서는 자기상관계수 값인 R(1)/R(0)를 사용한다. 본 논문에서는 성문특성으로 인해 고주파특성이 약화되는 것을 보상하기 위하여 새로운 평탄화 기법을 제안한다. 우선 포만트 주파수 예측을 위해 LSP 파라미터의 간격정보를 사용하였다. 찾아진 포만트 주파수들간의 선형보간을 통해 기울기와 역기울기 값을 구하여 평탄화 과정을 수행한다. 실험결과에서는 제안한 방법이 기존의 방법보다 평탄화 특성이 우수한 것으로 나타났다. 즉 본 논문에서는 약화된 고주파 성분을 보상하는 과정에서 평탄화 요소로 LSP의 간격정보를 사용하였다.

정상인과 성대용종 환자에서의 공기역학적 검사 (Aerodynamic Study in Normal Korean and Patients with Vocal Polyp)

  • 서장수;송시연;정유선;김정수;지덕환;이무경
    • 대한후두음성언어의학회지
    • /
    • 제10권1호
    • /
    • pp.5-11
    • /
    • 1999
  • 최근 음성장애에 관한 관심이 높아지면서 성대질환 내지는 후두질환의 정확한 진단을 위한 발성기능의 측정이 더욱 중요시되기에 이르렀다 이에 본 연구에서는 정상 한국인 남자 81명, 여자 76명과 성대용종 환자 남자 78명, 여자 65명을 대상으로 공기역학적 검사 중 컴퓨터화된 측정기구와 기류저지법으로 최대발성지속시간, 발성기류량, 평균호기류율, 및 성문하압을 연령별 및 성별에 따라 평균치를 측정, 이를 비교 분석하였다. 최대발성지속시간은 정상인 남자가 20.6${\pm}$6.34초, 여자가 17.2${\pm}$4.20초였고, 성대용종 환자에서 남자가 13.1${\pm}$4.26초, 여자가 11.6${\pm}$4.43초였다. 평균호기류율은 정상인 남자가 170.0${\pm}$67.00ml/sec, 여자가 131.1${\pm}$49.03ml/sec였고, 성대용종 환자에서 남자가 255.7${\pm}$216.52ml/sec, 여자가 183.24${\pm}$107.16ml/sec였다. 발성기류량은 정상인 남자가 3179.0${\pm}$648.94ml. 여자가 2144.1${\pm}$650.81ml였고, 성대용종 환자에서 남자가 2905.8${\pm}$1295.35ml, 여자가 1904.4${\pm}$1068.59ml였다 성문하압은 정상인 남자가 4.0${\pm}$1.88cm$H_2O$, 여자가 3.5${\pm}$4.20cm$H_2O$였고, 성대용종 환자에서 남자가 4.2$\pm$1.48cm$H_2O$, 여자가 3.9${\pm}$1.12cm$H_2O$였다. 성대용종 환자에서 통계학적으로 유의성있게 최대발성지속시간은 감소하고, 평균호기류율은 증가하였으며, 발성기류량과 성문하압은 여자환자에서만 의미 있게 각각 감소하거나 증가하였다. 이상의 결과는 정상인과 성대용종 환자에 있어서 객관적인 공기역학적 검사결과를 보여주며 이는 성대용종 환자의 음성이상에 대한 상태판정이나 치료 후 효과 판정에 기본자료로 이용할 수 있을 것으로 생각된다.

  • PDF

음원과 마이크로폰 사이의 거리변화에 의한 음향 특성 보정에 관한 연구 (A Study on the Compensating System for the Acoustic Characteristics Caused by the Variation of Distance from Sound Source to Microphone)

  • 정병철;최윤식
    • 한국음향학회지
    • /
    • 제31권3호
    • /
    • pp.197-204
    • /
    • 2012
  • 본 연구에서는 마이크로폰에 입사되는 음성 신호를 거리의 변동에 의해 크기와 주파수 응답특성 변화를 최소화시키는 방법에 대한 연구를 하였다. 우선 마이크로폰과 음성음원 사이의 거리를 변화시키며 거리변화에 따른 응답특성을 측정하였다. 본 연구에 사용된 마이크로폰은 일반적으로 사용되는 마이크로폰 중에 무지향성 마이크로폰과 초단일지향성 마이크로폰, 단일지향성 마이크로폰 등, 3가지 종류의 마이크로폰을 선정하였다. 측정한 이들 마이크의 주파수 응답특성 변화 결과를 기준치와 비교하여 보정치를 구하고 이를 주파수 대역별로 변화된 음성신호를 원음과 근사하게 보상하도록 하였다. 저주파대역은 근접효과에 의한 증폭현상, 그리고 거리에 의한 감쇠효과를 보정하도록 하였다. 중음대역에서는 저음대역보다 거리의 변화에 의한 주파수특성 편차가 비교적 적었지만 음성정보신호에 중요한 영향을 주는 부분이기 때문에 기준신호와 비교하여 복원하도록 하였다. 고주파대역의 음성정보의 변화는 극히 미소하여 고주파대역 조정은 큰 문제가 없이 원음에 가깝게 복원되었다.

영상과 음성 처리를 이용한 오미자차의 효능 분석 (Efficiency Analysis of Schisandra Tea Using Image & Acoustic Signal Processing)

  • 김봉현;조동욱;한길성;배영래
    • 한국산학기술학회논문지
    • /
    • 제12권7호
    • /
    • pp.2975-2981
    • /
    • 2011
  • 본 논문에서는 얼굴 영상 처리와 음성 신호처리를 적용하여 오미자차가 인체 장기에 효과가 있는 차인지 그리고 있다면 어느 장기에 효용이 있는지에 대한 분석 방법을 제안하고자 한다. 이를 위해 우선 영상처리를 통해 오미자차를 섭취하기 전과 후의 얼굴 영상에서 우측 뺨 영역의 색상 변화를 비교 분석하였다. 아울러 오미자차 효능에 대해 보다 많은 사실 확보를 위해 성대 진동 및 음성 에너지의 크기를 분석하는 음성분석 실험을 수행하였다. 실험 결과 오미자차 섭취에 의해 폐의 기능이 원활해지면서 성대 진동 및 에너지 크기가 안정적으로 변했으며 오른쪽 뺨 부위의 b값이 증가하는 현상이 나타났다.

음성신호와 전기성문파를 이용하는 새로운 매개변수 ; 성대 폐쇄 지연비율(Glottal Closure Delay Ratio) (New Parameter on Speech and EGG; Glottal Closure Delay Ratio)

  • 최종민;권택균;정은정;이명철;김광현;성명훈;박광석
    • 대한후두음성언어의학회지
    • /
    • 제18권1호
    • /
    • pp.22-25
    • /
    • 2007
  • Background and Objectives: Biomedical signals have been usually used for the diagnosis of the laryngeal function such as speech, electroglottograph(EGG), airflow and other signals. But, in most cases these signals were analysed separately. Here, we propose a new interchannel parameter Glottal Closure Delay Ratio(GCDR) which is estimated from speech and EGG measured simultaneously. Materials and Method: Speech and EGG signal were recorded simultaneously from 13 normal subjects, 39 patients. The patients' data included 16 polyps and 23 vocal folds palsy. Time difference between glottal closing instance on EGG and the first maximum peak on speech in a pitch period was calculated. Glottal closing instance was defined as the maximum peak on the first derivative of EGG signal(dEGG). Results: The standard deviation and jitter were calculated using 20-30 GCDRs extracted from each data, and they are significant different between normal and vocal fold paralysis group. Conclusion: The GCDR may be the first index reflecting speech and EGG characteristics and the perturbation of this parameter was significant different between normal and vocal fold paralysis group.

  • PDF

음성 변환을 사용한 감정 변화에 강인한 음성 인식 (Emotion Robust Speech Recognition using Speech Transformation)

  • 김원구
    • 한국지능시스템학회논문지
    • /
    • 제20권5호
    • /
    • pp.683-687
    • /
    • 2010
  • 본 논문에서는 인간의 감정 변화에 강인한 음성 인식 시스템을 구현하기 위하여 음성 변환 방법 중의 한가지인 주파수 와핑 방법을 사용한 연구를 수행하였다. 이러한 목표를 위하여 다양한 감정이 포함된 음성 데이터베이스를 사용하여 감정의 변화에 따라 음성의 스펙트럼이 변화한다는 것과 이러한 변화는 음성 인식 시스템의 성능을 저하시키는 원인 중의 하나임을 관찰하였다. 본 논문에서는 이러한 음성의 변화를 감소시키는 방법으로 주파수 와핑을 학습 과정에 사용하는 방법을 제안하여 감정 변화에 강인한 음성 인식 시스템을 구현하였고 성도 길이 정규화 방법을 사용한 방법과 성능을 비교하였다. HMM을 사용한 단독음 인식 실험에서 제안된 학습 방법은 사용하면 감정이 포함된 데이터에 대한 인식 오차가 기존 방법보다 감소되었다.

경험적 모드 재구성 방법을 이용한 성문파형 신호의 기계선 변동 제거 (Cancelation of Baseline Wandering of Electroglottograph Signal using Empirical Mode Decomposition)

  • 장승진;김효민;박영철;최홍식;윤영로
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.475-476
    • /
    • 2007
  • Electroglottography (EGG) is a technique used to register laryngeal behavior indirectly by a measuring the change in electrical impedance across the throat during speaking. However, EGG waveform is affected by laryngeal muscles which fluctuate the vocal cords, and which result in baseline wander. It is required to reduce baseline wander in EGG waveform, because EGG waveform is used for input signal of nonlinear speech synthesizer in next chapter. In vocal cords, the abduction-adduction of glottis is mainly controlled by the posterior cricoarytenoid (abductor) and interarytenoid (adductor) muscles respectively. Empirical Mode Decomposition method was adopted in cancellation of EGG waveform baseline wandering, and showd better performance than that of high pass filter with 500 order.

  • PDF

성문전도를 이용한 발성훈련 시스템 (Vocal Exercise System Using Electroglottography)

  • 이제현;김지혜;강구태;정동근
    • 센서학회지
    • /
    • 제22권2호
    • /
    • pp.156-161
    • /
    • 2013
  • This study was aimed to implement the electroglottography (EGG) system for analyzing fundamental frequency of the phonation. EGG was recorded from the conductance between ring electrodes attached to the neck skin area near thyroid cartilage with high frequency carrier electric signals during vocalization, and voice signal was recorded with microphone simultaneously. EGG and voice signals were transmitted to the audio port in PC and recorded with stereo sound recording program. From the digitized data, several parameters such as pitch, jitter, shimmer, CQ and SQ were analyzed from the vowel sounds. For the voice training, sound fundamental frequency was displayed during the vocalization and singing a song using pitches analyzed from the EGG. The system implemented in this study could be used for vocal exercise.

성문특성 측정을 통한 유/무성음 결정에 관한 연구 (A Study on Decision of Voiced/Unvoiced Region through Measuring the Vocal Cord Property)

  • 민소연;강은영;신동성;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.281-284
    • /
    • 2001
  • Speech is classified into voiced signal and unvoiced signal. Since the amplitude of voiced fall off at about -20dB/decade, dynamic range is often compressed prior to spectral analysis so that details at weak, high frequencies may be visible[5][6] There is a distinct difference in spectrum slope between voiced signal and unvoiced signal. In this paper, we got the slope of each frame by using autocorrelation method, and determined voiced /unvoiced region. Also, we used energy to decide region of silence. To show experimental results, we allot to 1 value in voiced region, -1 value in unvoiced region and 0 value in silence region.

  • PDF