• 제목/요약/키워드: formants

검색결과 149건 처리시간 0.017초

동일 후적자가 산출하는 기관식도 발성($PROVOX^{(R)}$ 발성)과 식도 발성에 대한 음향학적 및 공기역학적 특성 비교 (The Comparison of the Acoustic and Aerodynamic Characteristics of $PROVOX^{(R)}$ Voice and Esophageal Voice Produced by the Same Laryngectomee)

  • 표화영;최홍식;임성은;최성희
    • 음성과학
    • /
    • 제5권1호
    • /
    • pp.121-139
    • /
    • 1999
  • Our experimental subject was a laryngectomee who had undergone total laryngectomy with $PROVOX^{(R)}$ insertion, and learned esophageal speech after the surgery, so he could produce both $PROVOX^{(R)}$ voice and esophageal voice. With this subject's production of $PROVOX^{(R)}$ and esophageal voice, we are to compare the acoustic and aerodynamic characteristics of the two voices, under the same physical conditions of the same person. As a result, the fundamental frequency of esophageal voice was 137.2 Hz, and that of $PROVOX^{(R)}$ was 97.5 Hz. $PROVOX^{(R)}$ voice showed lower jitter, shimmer and NHR than esophageal voice, which means that $PROVOX^{(R)}$ voice showed better voice quality than esophageal voice. In spectrographic analysis, the formation of formants and pseudoformants were more distinct in esophageal voice and several temporal aspects of acoutic features such as VOT and closure duration were more similar with normal voice in $PROVOX^{(R)}$ voice. During the sentence utterance, esophageal voice showed longer pause or silence duration than $PROVOX^{(R)}$ voice. Maximum phonation time and mean flow rate of $PROVOX^{(R)}$ voice were much longer and larger than esophageal voice, but mean and range of sound pressure level, subglottic pressure and voice efficiency were similar in the two voices. Glottal resistance of esophageal voice was much larger than $PROVOX^{(R)}$ voice which showed still larger glottal resistance than normal voice.

  • PDF

심장(心臟) 질환(疾患) 진단(診斷)을 위한 한의학적 청진(聽診) 기반의 설음(舌音) 분석 (A Lingual Sound Analysis based on Oriental Medicine Auscultation for Heart Diseases Diagnosis)

  • 김봉현;조동욱;허성호
    • 한국통신학회논문지
    • /
    • 제34권8B호
    • /
    • pp.830-838
    • /
    • 2009
  • 다양한 진단 기기들의 개발로 인해 발전을 거듭하고 있는 서양의학에 비해, 한의학은 임상의의 직관에 의존하여 환자들에게 시각적이며 객관적으로 질환 상태를 표현해줄 수 있는 정량화된 진단 데이터들이 부족한 실정이다. 이를 위해 본 논문에서는 한의학적 진단 방법의 시각화를 통한 객관화를 구현하기 위해 먼저, 한의학에서 몸을 다스리는 중심기관이며 생명과 정신의 근원처로 간주하고 있는 심장과 음성 신호와의 관계를 한방에 기초하여 규명하고 분석하였다. 따라서 심장은 오관 중 혀와 관련이 되어 있어 음성과 연계하여 생각하면 심장 질환자는 설음(舌音), 즉 혓소리의 발음이 불명확하다는 것에 초점을 맞추어 심장 질환의 유무를 판단하는 방법을 설계하였다. 이를 위해 심장 질환자와 정상인으로 피실험자 집단을 구성하고 이들의 음성에서 헛소리에 해당하는 부분에 대한 제2포먼트 주파수의 통계적 대역폭 분석과 형태적 모델링 분석을 수행하여 상호간의 비교, 분석을 수행하였다. 최종적으로 설계한 방법에 대해 실험 결과를 통한 상관성을 분석하였다.

$F_1$$F_2$ 모음공간에서 합성된 한국어 모음 지각 (The Perception of Vowels Synthesized in Vowel Space by $F_1\;and\;F_2$: A Study on the Differences between Vowel Perception of Seoul and Kyungnam Dialectal Speakers)

  • 최양규;신현정;권오식
    • 음성과학
    • /
    • 제1권
    • /
    • pp.201-211
    • /
    • 1997
  • Acoustically a naturally-spoken vowel is composed of five formants. However, the acoustic quality of a vowel is known to be mostly determined by $F_1\;and\;F_2$. The main purpose of this study was to examine how synthesized vowels with $F_1\;and\;F_2$ are perceived by Korean native speakers. In addion, we are interested in finding whether the synthesized vowels are perceived differently by standard Korean speakers and Kyungnam regional dialect speakers. In the experiment 9 Seoul standard Korean speakers and 9 Kyungnam dialect speakers heard 536 vowels synthesized in vowel space with $F_1\;by\;F_2$ and categorized them into one of 10 Korean vowels. The resultant vowel map showed that each Korean vowel occupies an unique area in the two-dimensional vowel space of $F_1\;by\;F_2$, and confirmed that $F_1\;and\;F_2$ play important roles in the perception of vowels. The results also showed that the Seoul speakers and the Kyungnam speakers perceive the synthesized vowels differently. For example, /e/ versus /$\varepsilon$/ contrast, /y/, and /$\phi$/ are perceived differently by the Seoul speakers, whereas they were perceptually confused by the Kyungnam speakers. These results might be due to the different vowel systems of the standard Korean and the Kyungnam regional dialect. While the latter uses a six-vowel system which has no /e/ vs /$/ contrast, /v/ vs /i/ contrast, /y/, and /$\phi$/, the former recognizes these as different vowels. This result suggests that the vowel system of differing dialect restricts the perception of the Korean vowels. Unexpectedly /i/ does not occupy any area in the vowel apace. This result suggests that /i/ cannot be synthesized without $F_3$.

  • PDF

보청기에서 음성 대비 강조에 의해 발생할 수 있는 마스킹 현상 (Acoustic Masking Effect That Can Be Occurred by Speech Contrast Enhancement in Hearing Aids)

  • 전유용;양동권;방동혁;길세기;이상민
    • 재활복지공학회논문지
    • /
    • 제1권1호
    • /
    • pp.21-28
    • /
    • 2007
  • 대부분의 보청기에서는 난청인의 청력 손실을 보상하기 위해 음성 증폭 알고리즘과 잡음 및 피드백을 제거하기 위한 알고리즘 등을 사용하고 있고, 음성의 인지율을 높이기 위해서 음성의 대비를 강조하는 알고리즘을 사용한다. 음성 대비 강조 알고리즘 사용 시 과도한 대비증폭에 의해서 포먼트(formant) 사이에서 마스킹 현상이 발생할 수 있다. 마스킹 현상을 확인하기 위해서 6가지의 주관적인 평가와 1가지의 객관적인 평가를 수행하였다. 주관적인 평가로는 순음 검사, 어음 청취 역치 검사, 낱말 분별력 검사, 순음 마스킹 검사, 포먼트 순음 마스킹 검사, 어음 마스킹 검사로 이루어져있고 객관적인 평가를 위해서 LLR(log likelihood ratio)을 도입하였다. 정상 청각 피험자와 난청 피험자의 결과로 미루어 볼 때, 난청 피험자가 마스킹이 잘 일어난다는 것을 볼 수 있었고, 어음을 이용한 마스킹 검사에서는 마스킹에 의해서 난청 피험자에서 어음에 대한 인지율이 떨어지는 결과를 볼 수 있다. 이러한 현상은 포먼트 향상에 의한 왜곡 때문이 아닌 마스킹 때문이다. 그러므로 마스킹 효과의 특성을 조사하여, 보청기 적합 시, 이러한 마스킹 특성을 고려하는 것이 필요하다.

  • PDF

직.간접흡연 환경에서의 성대 및 음형대 변화에 대한 음성 분석학적 연구 (A Study on Voice Analytical the Vocal Cord and Formant Change in the Smoking and Secondhand Smoking Environments)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제36권6B호
    • /
    • pp.720-727
    • /
    • 2011
  • 웰빙이 새로운 미래 사회적 이슈로 부각되면서 건강관리 및 유지에 대한 현대인들의 관심이 증대되고 있다. 특히, 흡연에 대한 좋지 않은 인식이 높아지면서 대대적인 금연 운동이 확산되고 있는 실정이다. 흡연은 인체의 호흡기와 순환기 등에 많은 악영향을 미치며 직접적인 흡연뿐만 아니라 간접흡연도 동일한 증상이 유발되는 치명적인 행위로 인식되고 있다. 따라서 본 논문에서는 직접흡연과 간접흡연 환경에서 성대 및 음형대에 미치는 영향을 음성 분석학적 요소 기술의 적용을 통해 비교, 분석하는 연구를 수행하였다. 이를 위해 20대 남성을 대상으로 흡연자와 비흡연자로 피실험자 집단을 구성하고 직 간접흡연 전과 후의 음성을 수집하여 Pitch, Jitter, Shimmer 및 5~8 Formant Frequency를 적용한 실험 결과를 추출, 분석하는 연구를 수행하였다.

음성신호처리 기술을 적용한 음식물이 인체 장기에 미치는 영향 분석 (Influence Analysis of Food on Body Organs by Applying Speech Signal Processing Techniques)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제37권5A호
    • /
    • pp.388-394
    • /
    • 2012
  • 본 논문에서는 음성신호처리 기술을 적용하여 음식물이 인체 장기에 미치는 영향에 대해 분석하는 방법을 제안한다. 그 간 음식물이 장기에 미치는 영향에 대한 연구는 그 음식물에 A라는 성분이 있음으로 이것이 B장기에 좋은 영향을 미칠 수 있다는 연구가 주를 이루어왔다. 그러나 그 음식물을 섭취했을 때 그것이 실제 인체 장기에 어느 정도 영향을 미치는지에 대한 수치화, 정량화된 연구는 전무한 실정이었다. 이에 본 논문에서는 음식물이 인체 장기에 미치는 영향을 수치화된 자료로 규명하고 이를 정량화하여 새로운 사실과 정보를 취득해 내는 방법에 대해 제안한다. 특히 본 논문은 우리가 흔히 접하는 음식물 중 심장 기능 강화에 도움이 된다는 토마토를 대상으로 이것이 인체에 미치는 영향을 수치화, 정량화를 행하고 이를 통해 새로운 사실을 규명해 내는 방법에 대해 제안한다. 실험은 심장에 이상이 없는 20대 남성 15명을 피실험자로 선정하고 토마토 섭취 전과 섭취 5분후, 30분 후, 1시간 후의 음성 자료를 각각 수집하고 심장 상태 변화를 측정하는 음성 분석 요소를 적용하여 토마토가 심장에 미치는 영향을 수치화, 정량화 그리고 이를 통한 새로운 사실을 규명한다.

포만트 기반의 가우시안 분포를 가지는 필터뱅크를 이용한 멜-주파수 켑스트럴 계수 (Mel-Frequency Cepstral Coefficients Using Formants-Based Gaussian Distribution Filterbank)

  • 손영우;홍재근
    • 한국음향학회지
    • /
    • 제25권8호
    • /
    • pp.370-374
    • /
    • 2006
  • 음성인식의 특징벡터로서 멜-주파수 켑스트럴 계수 (MFCC, mel-frequency cepstral coefficients)가 가장 널리 사용되고 있다. FMCC 추출과정은 입력되는 음성신호를 푸리에 변환한 후, 주파수 대역별로 필터를 취하여 에너지 값을 구하고 이산 코사인 변환을 하여 그 계수 값을 구한다. 본 논문에서는 멜-스케일 된 주파수 대역필터를 취할 때 가중함수에 의해서 구해진 각 대역필터별 가중치를 적용하여 필터의 출력 에너지를 계산한다. 여기서 가중치를 구하기 위해 사용된 가중함수는 포만트가 존재하는 대역을 중심으로 인접한 대역들이 가우시안 분포를 가지는 함수이다. 제안한 방법으로 실험한 결과, 잡음이 거의 없는 음성신호에 대해서는 기존의 MFCC를 사용했을 때와 비슷한 인식률을 보이고 잡음성분이 많을수록 가중치가 적용된 방법이 인식률에서 보다 높은 성능 향상을 가져온다.

캡스트럼 분석을 이용한 해금의 스펙트럼 모델링 (Spectral Modeling of Haegeum Using Cepstral Analysis)

  • 홍연우;강명수;조상진;김종면;이정철;정의필
    • 한국음향학회지
    • /
    • 제29권4호
    • /
    • pp.243-250
    • /
    • 2010
  • 본 논문에서는 해금 소리의 시간에 따른 변화를 사실적으로 묘사하기 위해 캡스트럼 분석을 이용한 전통 악기 해금의 스펙트럼 모델링을 제안한다. 정확한 캡스트럼 분석 결과를 얻기 위해 프레임 사이즈는 입력 신호의 3주기로 하였고 포만트 추출에 더 많은 캡스트럼 계수를 활용하였다. 정현파 성분 합성 과정에서 대역통과 필터의 차단주파수를 공명점 별로 유동적으로 조절하고 노이즈 성분에 남아있는 피크 성분들을 제거하는 과정을 추가하여 성능을 향상시켰다. 음 높이의 변화를 판단하기 위해 입력 프레임을 묵음구간, 어택구간, 지속구간으로 분류하였고 기본주파수에 따라 프레임 사이즈를 가변적으로 조절하였으며 지속구간에서의 기본주파수 검출 오류를 수정함으로써 정확도를 향상시켰다. 해금 연주 전문가의 청취테스트를 통해 원음과 합성음이 96~100 % 유사하다는 평가 결과를 얻었다.

캡스트럼 포락선을 이용한 해금 소리의 포만트 합성 (Formant Synthesis of Haegeum Sounds Using Cepstral Envelope)

  • 홍연우;조상진;김종면;정의필
    • 한국음향학회지
    • /
    • 제28권6호
    • /
    • pp.526-533
    • /
    • 2009
  • 본 논문에서는 전통 현악기 해금의 스펙트럼 모델링을 위해 캡스트럼 포락선을 이용한 포만트 합성법을 제안한다. 스펙트럼 모델링은 입력 신호를 정현파 성분과 노이즈 성분의 합으로 해석하여 음을 합성하는 기술로 주기성이 있는 현악기나 관악기의 음 합성에 효과적이다. 캡스트럼 포락선의 포만트는 정현파 성분 합성을 위한 파라미터로 활용하였다. 정현파 성분을 합성하기 위해 기존의 가산합성 방식과는 달리 IIT (Impulse Invariant Transform)로 공명기를 설계하였으며 배음간 크기 보완을 위해 대역 통과 필터를 추가하였다. 원음과 합성된 정현파 성분의 차로 구해진 노이즈 성분에 포함된 일부 유효배음을 제거하면 완전한 노이즈 성분을 구할 수 있으며 선형 보간법 (linear interpolation)에 기초하여 그 주파수 특성을 파라미터화 하였다. 최종적으로 합성된 노이즈 성분과 정현파 성분을 더하여 해금 단위음을 합성하였고 합성음은 원음과 매우 유사하였다.

Angle씨 II급 1류 부정교합아동의 발음에 관한 음향학적 연구 (AN ACOUSTIC ANALYSIS OF PRONUNCIATION IN CHILDREN WITH ANGLE'S CLASS II DIV. 1 MALOCCLUSION)

  • 박윤정;이상훈;손동수
    • 대한소아치과학회지
    • /
    • 제24권1호
    • /
    • pp.95-111
    • /
    • 1997
  • The human speech organ consists of respiration system (lung, larynx), phonation system (vocal cord), articulation system (esophagus, pharynx, uvula, teeth, gingiva, palate, tongue, lip) and resonating system(oral cavity, nasal cavity, paranasal sinus). Because teeth are components of the articulation system, it has been reported that the persons with abnormally positioned teeth generally have abnormal occlusion and pronunciation. In this study, using /ㅅ(s)/, the most commonly mispronunced consonant in children with malocclusion, and the seven single vowels, /사(sa), 서($s\delta$), 소(so), 수(su), 스($s\omega$), 시(si), 세(se)/ and / ㅏ(a), ㅓ($\delta$), ㅗ(o), ㅜ(u), ㅡ($\omega$), 1(i), ㅔ(e)/ were recorded and analyzed using speech analysis program on computer by measuring formants and compared them for investigating the differences in pronunciation in children with Angle's class I occlusions and those with Angle's class II div.1 malocclusion. The result were as follows: 1. In the Angle's Class II div.1 group, there were no significant differences in F1 of all recorded sounds as compared with Angle's Class I group(p>0.05). 2. In the consonants, there were significant differences in F2 of /스($s\omega$)/ and F2/F1 ratio of /사(sa), 서($s\delta$), 시(si)/ between the two group(p<0.05). 3. In the vowels, there were significant differences F2/F1 ratio of /ㅓ($\delta$)/(p<0.05) and no significant differences in F2/F1 ratio between two group(p>0.05). 4. In the consonants, there were significant differences in F2 and F2/F1 ratio when succeeding vowels were high or low, and F2/F1 ratio when front in accordance with tongue position (p<0.05). 5. In the vowels, there were no significant differences in formant in accordance with tongue position(p>0.05)

  • PDF