• 제목/요약/키워드: F0 (fundamental frequency) range

검색결과 26건 처리시간 0.022초

Effect of language on fundamental frequency: Comparison between Korean and English produced by L2 speakers and bilingual speakers

  • Lim, Soo Bin;Lee, Goun;Rhee, Seok-Chae
    • 말소리와 음성과학
    • /
    • 제8권4호
    • /
    • pp.15-22
    • /
    • 2016
  • This study aims to examine whether the fundamental frequency (F0) varies depending on languages or distinguishes between L1 (first language) and L2 (second language) speech and whether the type of materials which vary in control of consonant voicing affects the use of F0-especially, mean F0. For this purpose, we compared productions of two languages produced by Korean L2 learners of English to those of Korean-English bilingual speakers. Twelve Korean L2 speakers of English and twelve Korean-English bilingual speakers participated in this study. The subjects read aloud 22 declarative sentences-balanced and unbalanced-once in English and once in Korean. Mean F0 of Korean was higher than that of English for both speaker groups, and the difference in the value of mean F0 between the Korean and English sentences was different depending on the type of materials that the participants read. With regard to F0 range, the L2 speakers had a larger F0 range in English than in Korean; however, the effect of language on F0 range was not statistically significant for the bilingual speakers. These results indicate that language-specific properties may affect the use of F0, in particular, mean F0.

Praat과 R로 분석한 한국인 대화 음성 말뭉치의 fundamental frequency(f0)값 분포 (The fundamental frequency (f0) distribution of Korean speakers in a dialogue corpus using Praat and R)

  • 양병곤
    • 말소리와 음성과학
    • /
    • 제15권3호
    • /
    • pp.17-25
    • /
    • 2023
  • 이 논문은 국립국어원에서 배포한 한국인 대화 음성 말뭉치에서 화자의 성대의 진동을 나타내는 fundamental frequency(f0)값을 측정해서 한국인이 일상 대화를 할 때 f0값의 기초적인 통계자료를 살펴보고, 나이와 f0값의 분포는 어떤 관계를 보이는지를 조사했다. 연구자료 수집과 분석은 Praat과 R을 이용했고, 개인별 억양구마다 상자도를 구하고 사분위값을 활용하여 극단값을 제거하는 방법으로 최종 f0값 자료를 구했다. 그 결과 전체 한국인들의 f0값의 평균값은 185 Hz이고 중앙값은 187 Hz로 나왔다. 자료의 분포모양을 나타내는 왜도는 0.11의 정적분포를 보였고, 첨도는 -0.09로 정상분포에 거의 가까운 모양을 보였다. 일상대화의 피치값의 변화범위로는 238 Hz로 나타났다. 남녀 간의 f0값의 차이는 남성의 중앙값 114 Hz의 거의 두 배에 해당하는 199 Hz가 여성의 중앙값으로 나타났고 t검증결과 유의미한 차이를 보였다. 분포모양을 나타내는 왜도는 남성이 1.24이었고, 여성은 그것의 반에 해당하는 0.58이었다. 첨도는 남녀집단 각각 5.21과 3.88로 나타나 남성의 값이 34% 정도 더 뾰족한 모양을 보였다. 연령대별로는 남녀집단을 합하여 볼 때, 나이가 들수록 f0값이 서서히 내려가는 경향을 보였다. 연령대별 f0중앙값과 나이 간의 회귀분석을 실행한 결과 기울기가 남성집단에서는 0.15, 여성집단에서는 -0.586으로 서로 반대되는 경향을 기록했다. 결론적으로, 대규모 참여자가 녹음한 대화 음성에서 한국인의 집단별 연령별 다양한 f0분포를 규명할 수 있지만, 나이와 f0관계는 더 정밀한 자료수집이 필요함을 알 수 있었다.

The fundamental frequency (f0) distribution of American speakers in a spontaneous speech corpus

  • Byunggon Yang
    • 말소리와 음성과학
    • /
    • 제16권1호
    • /
    • pp.11-16
    • /
    • 2024
  • The fundamental frequency (f0), representing an acoustic measure of vocal fold vibration, serves as an indicator of the speaker's emotional state and language-specific pattern in daily conversations. This study aimed to examine the f0 distribution in an English corpus of spontaneous speech, establishing normative data for American speakers. The corpus involved 40 participants engaging in free discussions on daily activities and personal viewpoints. Using Praat, f0 values were collected filtering outliers after removing nonspeech sounds and interviewer voices. Statistical analyses were performed with R. Results indicated a median f0 value of 145 Hz for all the speakers. The f0 values for all speakers exhibited a right-skewed, pointy distribution within a frequency range of 216 Hz from 75 Hz to 339 Hz. The female f0 range was wider than that of males, with a median of 113 Hz for males and 181 Hz for females. This spontaneous speech corpus provides valuable insights for linguists into f0 variation among individuals or groups in a language. Further research is encouraged to develop analytical and statistical measures for establishing reliable f0 standards for the general population.

한국 중학생의 영어 읽기 발화에서 문장유형에 따른 유창성 등급과 초분절 요소의 관계 (The relationship between fluency levels and suprasegmentals according to the sentence types in the English read speech by Korean middle school English learners)

  • 김화영
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.51-66
    • /
    • 2022
  • 본 연구의 목적은 한국인 영어 학습자가 영어문장을 읽을 때 어떠한 초분절 요소가 영어 원어민 화자에 가깝게 구현되는데 영향을 미치는지를 밝혀 영어 발음교육에 도움이 되고자 하는 것이다. 본 연구에서는 연구대상자를 중학생 영어학습자로 선택하고, 다양한 유형의 문장(평서문, 의문문, 명령문, 감탄문)과 음절수로 연구 자료를 구성하였다. 이들 영어 문장 발화의 분석대상으로는 초분절 요소 중 발화속도, 휴지빈도, 휴지길이, F0 범위, 리듬을 이용하였고 음성분석 결과는 평균분석, 상관분석 및 회귀분석을 실시하였다. 그 결과, 발화속도, 휴지빈도, 휴지길이, F0 범위가 유창성 등급 평가에 영향을 미친다는 결과를 얻었다. 모든 초분절 요소와 유창성 등급 간의 회귀분석에서는 유창성 등급에 영향을 미치는 초분절 요소는 발화속도와 F0 범위이다. 리듬은 유창성 등급과의 관계에서 통계적으로 유의미하지 않았다. 따라서, 영어 발음교육을 할 때 발화속도를 높이고, F0 범위를 크게 하도록 교육하는 것이 필요하다. 또한, 발화시 휴지개수와 휴지시간을 줄이도록 하는 교육이 유창성을 높이는데 도움이 된다. 문장유형을 분류하여 분석한 결과, 감탄문의 경우 다른 문장유형에 비해 발화속도가 더 빠르고, 휴지빈도는 더 적고, 휴지길이는 더 짧으며, 리듬값은 더 높았다.

The f0 distribution of Korean speakers in a spontaneous speech corpus

  • Yang, Byunggon
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.31-37
    • /
    • 2021
  • The fundamental frequency, or f0, is an important acoustic measure in the prosody of human speech. The current study examined the f0 distribution of a corpus of spontaneous speech in order to provide normative data for Korean speakers. The corpus consists of 40 speakers talking freely about their daily activities and their personal views. Praat scripts were created to collect f0 values, and a majority of obvious errors were corrected manually by watching and listening to the f0 contour on a narrow-band spectrogram. Statistical analyses of the f0 distribution were conducted using R. The results showed that the f0 values of all the Korean speakers were right-skewed, with a pointy distribution. The speakers produced spontaneous speech within a frequency range of 274 Hz (from 65 Hz to 339 Hz), excluding statistical outliers. The mode of the total f0 data was 102 Hz. The female f0 range, with a bimodal distribution, appeared wider than that of the male group. Regression analyses based on age and f0 values yielded negligible R-squared values. As the mode of an individual speaker could be predicted from the median, either the median or mode could serve as a good reference for the individual f0 range. Finally, an analysis of the continuous f0 points of intonational phrases revealed that the initial and final segments of the phrases yielded several f0 measurement errors. From these results, we conclude that an examination of a spontaneous speech corpus can provide linguists with useful measures to generalize acoustic properties of f0 variability in a language by an individual or groups. Further studies would be desirable of the use of statistical measures to secure reliable f0 values of individual speakers.

갑상선 수술범위에 따른 음성의 음향적 분석 (Acoustic Analysis of Voice Change According to Extent of Thyroidectomy)

  • 강영애;구본석
    • 말소리와 음성과학
    • /
    • 제7권4호
    • /
    • pp.77-83
    • /
    • 2015
  • Voice complication without the laryngeal nerve injury can occur after thyroidectomy. The purpose of this study is to investigate voice changes according to extent of thyroidectomy with acoustic analysis. Thirty-five female patients with papillary thyroid carcinoma took voice evaluation at before and 1 month, and 3 months after thyroidectomy. Acoustic analysis parameters were speaking fundamental frequency(SFF), min $F_0$, max $F_0$, dynamic range $F_0$, jitter, shimmer, noise-to-harmonic ratio(NHR), and Cepstral prominence peak(CPP). Repeated-measured analysis of variance was applied. Time-related voice changes showed significant differences in all parameters except NHR. At 1 month after surgery, voice quality was worse and pitch was decreasing, but voice quality and pitch were improving at 3-month follow-up. Voice changes according to the extent of surgery were in SFF, max $F_0$, and dynamic range $F_0$. Time by surgery-related voice change existed only in min $F_0$. The result showed that the severity of voice complication depended on the extend of thyroidectomy which had a negative impact on $F_0$-related parameters. The deterioration of voice quality at 1 month after thyroidectomy may be affected by the loss of thyroid hormone in the blood. The descent of $F_0$-related parameters may be impacted by laryngeal fixation of surgical site adhesion.

소프라노 1인의 모음곡 발성 시 제 1 포먼트의 변화양상 (The First Formant Characteristics in Vocalize of One Soprano)

  • 송윤경;진성민
    • 대한후두음성언어의학회지
    • /
    • 제16권1호
    • /
    • pp.10-14
    • /
    • 2005
  • Background and Objectives : Vowels are characterized on the basis of formant patterns. The first formant(F1) is determined by high-low placement of the tongue, and the second formant (F2) by front-back placement of the tongue. The fundamental frequency(F0) of a soprano often exceed the normal frequency of the first formant. And the vocal intensity is boosted when F0 is high and a harmonic coincides with a formant. This is called a formant tuning. Experienced singers thus learned how to tune their formants over a resonable range by lowering the tongue to maximize their vocal intensity. So, the current study aimed to identify the formant tuning in one experienced soprano by comparing the first formants of vowel [i] in three different voice production : speech, ascending scale, and vocalize. Materials and Method : All voices recordings of vowel [i] in speech, ascending scale (from F4 note to A4 note), and vocalize(:Ridente la calam") were made with digital audio tape-corder in a sound treated room. And the captured data were analyzed by the long term average(LTA) power spectrum using the FFT algorithm of the Computerized Speech Lab(CSL, Kay elementrics, Model, 4300B). Results : Although the first formant of vowel [i] in speech was 238Hz, those of ascending scale [i] were 377Hz, 405Hz, 453Hz respectively in F4(349z), G4(392Hz), A4(440Hz) note, and 722Hz, 820Hz, 918Hz respectively in F5 (698Hz), G5(784Hz), A5(880Hz) note. In vocalize, first formants of [i] were 380Hz, 398Hz, 453Hz respectively in F4, G4, A4 note, and 720Hz, 821Hz, 890Hz respectively in F5, G5, A5 note. Conclusion : These results showed that the first formant of ascending scale and vocalize sustained higher frequency than fundamental frequency in high pitch. This finding implicates that the formant tuning of vowel [i] in ascending scale was also noted in vocalize.

  • PDF

TM Joint의 물리치료를 통한 훈련이 모음의 음향학적 특성에 미치는 영향 (Influence of Temporo-mandibular Joint Training Using Physical Therapy on the Vowel Acoustic Characteristics)

  • 민동기;이재홍
    • 한국산학기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.2203-2208
    • /
    • 2011
  • 턱관절의 물리치료를 통한 훈련으로 모음 조음에 관여하는 구강 공명강을 증가시켜, 턱관절의 정상적인 발성패턴을 유지하도록 하여 턱관절장애 환자의 모음의 음향학적 특성 변화를 보고자 하였다. 연구 대상은 턱관절장애로 진단 받은 3명의 20~30대 성인 남자를 대상으로 하였다. 실험방법은 대상자간 중다기초선 설계를 이용하여 기초선 단계, 치료 단계, 유지 단계로 진행하였다. 치료는 한 회기를 30분으로 하여 주 3회 실시하였고 3회기를 한 평가단위로 5회의 중간평가를 실시하였다. 평가방법은 Praat 음성 분석프로그램을 이용하여 /ㅏ/ 모음의 연장 발성에 대한 제 1포먼트 주파수(F1), 제 2포먼트 주파수(F2) 그리고 기본주파수(F0)를 분석하였다. 물리치료를 통한 훈련 프로그램을 실시한 결과 턱관절장애 환자의 제 1포먼트 주파수(F1), 제 2포먼트 주파수(F2) 그리고 기본주파수(F0)는 치료 전 보다 증가하는 변화를 보였고, 이는 모음의 개구도와 관계된 제 1 포먼트 주파수(F1) 뿐만 아니라 모음의 전후설, 성대의 움직임과 관련이 있는 제 2포먼트 주파수(F2) 그리고 기본주파수(F0)의 변화도 함께 보임으로써 턱관절과 모음 및 음성 산출의 연관성을 보여주었다.

음성장애 성인 여성과 정상음성 성인 여성 간 진성구와 가성구의 음성범위프로파일 비교 (Comparison of voice range profiles of modal and falsetto register in dysphonic and non-dysphonic adult women)

  • 김재옥;이승진
    • 말소리와 음성과학
    • /
    • 제14권4호
    • /
    • pp.67-75
    • /
    • 2022
  • 본 연구는 53명의 음성장애 성인 여성과 53명의 정상음성 성인 여성의 진성구와 가성구 음역대 및 진성구-가성구 성구전환이 발생하는 구간을 비교하였다. 최고기본주파수(F0MAX), 최고음성강도(IMAX), 기본주파수범위(F0RANGE) 및 음성강도범위(IRANGE) 모두 음성장애군이 정상음성군에 비해 유의하게 낮았다. 또한 두 집단 모두 F0MAX와 F0RANGE가 진성구에 비해 가성구가 유의하게 높았다. IMAX와 IRANGE는 정상음성군에서 가성구가 진성구보다 유의하게 높았으나 음성장애군은 진성구와 가성구 간에 차이가 없었다. F0MIN과 IMIN은 두 집단 간에 통계적으로 유의한 차이는 없었다. 진성구-가성구 성구전환이 발생하는 지점의 주파수는 음성장애군은 378.86Hz(F4#), 정상음성군은 557.79Hz(C5#)로 음성장애군이 유의하게 낮았다. 본 연구를 통해 음성장애가 있는 성인 여성의 진성구와 가성구 음역대 모두 정상음성 성인 여성에 비해 감소하여 성대가 고주파수에서 진동하기 어렵다는 것을 알 수 있다. 본 연구결과는 성인 여성 음성장애 화자의 진성구와 가성구의 VRP를 함께 살펴봄으로써 음성장애가 미치는 음향학적 특성을 파악하기 위한 기초자료로 사용될 수 있을 것이다.

F0 Extrema Timing of HL and LH in North Kyungsang Korean: Evidence from a Mimicry Task

  • Kim, Jung-Sun
    • 말소리와 음성과학
    • /
    • 제4권3호
    • /
    • pp.43-49
    • /
    • 2012
  • This paper describes the categorical effects of pitch accent contrasts in a mimicry task. It focuses, specifically, on examining how fundamental frequency (f0) variation reflects phonological contrasts from speakers of two distinct varieties of Korean (i.e., North Kyungsang and South Cholla). The results showed that, in a mimicry task using synthetic speech continua, there was a categorical effect in f0 peak timing for North Kyungsang speakers, but the timing of f0 peaks and valleys in the responses of South Cholla speakers was more variable, presenting a gradient or non-categorical effect. Evidence of categorical effects was represented as the shift of f0 peak times along an acoustic continuum for North Kyungsang speakers. The range for the shift of f0 valley times was much narrower, compared to that of f0 peak times. The degree of a shift near the middle of the continuum showed variability across individual mimicry responses. However, the categorical structure in mimicry responses regarding the clustering of f0 peak points was more significant for North Kyungsang speakers than for South Cholla speakers. Additionally, the finding of the current study implies that the location of f0 peak times depends on individuals' imitative (or cognitive) abilities.