• 제목/요약/키워드: High Vowel

검색결과 144건 처리시간 0.019초

성문전도를 이용한 발성훈련 시스템 (Vocal Exercise System Using Electroglottography)

  • 이제현;김지혜;강구태;정동근
    • 센서학회지
    • /
    • 제22권2호
    • /
    • pp.156-161
    • /
    • 2013
  • This study was aimed to implement the electroglottography (EGG) system for analyzing fundamental frequency of the phonation. EGG was recorded from the conductance between ring electrodes attached to the neck skin area near thyroid cartilage with high frequency carrier electric signals during vocalization, and voice signal was recorded with microphone simultaneously. EGG and voice signals were transmitted to the audio port in PC and recorded with stereo sound recording program. From the digitized data, several parameters such as pitch, jitter, shimmer, CQ and SQ were analyzed from the vowel sounds. For the voice training, sound fundamental frequency was displayed during the vocalization and singing a song using pitches analyzed from the EGG. The system implemented in this study could be used for vocal exercise.

The comparative study of resonance disorders for Vietnamese and Korean cleft palate speakers using nasometer

  • Shin, Yu-Jeong;Kim, Yongsoo;Kim, Hyun-Gi
    • Maxillofacial Plastic and Reconstructive Surgery
    • /
    • 제39권
    • /
    • pp.9.1-9.5
    • /
    • 2017
  • Background: Nasalance is used to evaluate the velopharyngeal incompetence in clinical diagnoses using a nasometer. The aim of this study is to find the nasalance differences between Vietnamese cleft palate children and Korean cleft palate children by measuring the nasalance of five oral vowels. Methods: Ten Vietnamese cleft palate children after surgery, three Vietnamese children for the control group, and ten Korean cleft palate children after surgery with the same age participated in this experimentation. Instead of Korean control, the standard value of Korean version of the simplified nasometric assessment procedures (kSNAP) was used. Result: The results are as follows: (1) the highest nasalance score among the Vietnamese normal vowels is the low vowel /a/; however, that of Korean normal vowels is the high vowel /i/. (2) The average nasalance score of Korean cleft palate vowels is 18% higher than that of Vietnamese cleft palate vowels. There was a nasalance score of over 45% among the vowels /e/ and /i/ in Vietnamese cleft palate patients and /i/, /o/, and /u/ in Korean cleft palate patients. Conclusion: These different nasalance scores of the same vowels seem to cause an ethnic difference between Vietnamese and Korean cleft palate children.

Distinct Segmental Implementations in English and Spanish Prosody

  • Lee, Joo-Kyeong
    • 음성과학
    • /
    • 제11권4호
    • /
    • pp.199-206
    • /
    • 2004
  • This paper attempts to provide a substantial explanation of different prosodic implementations on segments in English and Spanish, arguing that the phonetic modification invoked by prosody may effectively reflect phonological structure. In English, a high front vowel in accented syllables is acoustically realized as higher F1 and F2 frequencies than in unaccented syllables, due to its more peripheral and sonorous articulation (Harrington et al. 1999). In this paper, an acoustic experiment was conducted to see if such a manner of segmental modification invoked by prosody in English extends to other languages such as Spanish. Results show that relatively more prominent syllables entail higher F1 values as a result of their more sonorous articulation in Spanish, but either front or back vowel does not show a higher F2 or a lower F2 frequency. This is interpreted as an indication that a prosodically prominent syllable entails its vocalic enhancement in both horizontal and vertical dimensions of articulation in English. In Spanish, however, only the vertical dimensional articulation is maximized, resulting in a higher F1. I suggest that this difference may be attributed to the different phonological structures of vowels in English and Spanish, and that sonority expansion alone would be sufficient in the articulation of prosodic prominence as long as the phonological distinction of vowels is well retained.

  • PDF

한국 EFL 학생들의 자음군 축약: 삽입 대 탈락 전략 (Cluster Reduction by Korean EFL Students: Insertion vs. Deletion Strategies)

  • 초미희
    • 한국콘텐츠학회논문지
    • /
    • 제6권1호
    • /
    • pp.80-84
    • /
    • 2006
  • 모음을 삽입시키거나 자음을 탈락시킴으로써 한 음절 내의 영어 연속음을 없애는 자음군 축약 전략이 기존의 연구들마다 다르다는 점에 동기를 부여받아서 한국 학생들의 영어 자음군 축약 전략을 탐구하게 되었다. 대학생 60명의 어두와 어말 자음군 발음을 조사한 결과, 초성이냐 종성이냐 하는 운율적 위치와 자음군이 몇 개로 구성되어 있느냐는 자음군 숫자에 따라 모음 삽입이냐 자음 탈락이냐 하는 자음군 축약 전략에 영향을 미치는 것으로 나타났다. 삽입과 탈락의 오류 비율은 초성보다는 종성에서 높았고 두 개의 자음군보다는 세 개의 자음군에서 높았다. 전반적으로 삽입 오류 비율이 탈락 오류 비율보다 높았으나, 종성 위치의 세 개의 자음군에서는 탈락 비율이 삽입 비율보다 중요하게 높았다. 종성 위치 세 개의 자음군에서 탈락 비율이 높은 것 때문에 운율 위치에 상관없이 세 개의 자음군에서 삽입보다 탈락 비율이 높게 나타났으며 전반적으로 종성에서 탈락 비율이 높이 나타났다.

  • PDF

모음 주파수 범위에 따른 성문전도 스펙트럼 기울기 (Electroglottographic Spectral Tilt in Frequency Ranges of Vowel Sound)

  • 김지혜;장애란;정동근
    • 센서학회지
    • /
    • 제24권4호
    • /
    • pp.247-251
    • /
    • 2015
  • In this study, electroglottographic spectral tilt (EST) was investigated for characterization of vocal cords vibration. EST was analyzed from the power spectrum of electroglottographic signals by dividing frequency analysis range as full range (0~4 octave), low range (0~2 octave), and high range (2~4 octave). EST of all ranges in female were greater than those in male. In female and male groups, EST of high range was higher than that of low range. This result suggests that EST has at least two components and dividing frequency range in analysis of EST is effective for investigating characteristics of vocal cords vibration.

한국인 영어학습자의 명사구 발화에서 영어 능숙도에 따른 관사와 단음절 명사 모음 길이 비교 (Comparison of vowel lengths of articles and monosyllabic nouns in Korean EFL learners' noun phrase production in relation to their English proficiency)

  • 박우지;모란;이석재
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.33-40
    • /
    • 2020
  • 본 연구는 기능어인 관사 및 1음절 내용어 명사로 구성된 명사구 내 두 단어의 모음 길이 비율과 영어 능숙도 사이의 상관관계를 밝히는 데 목적이 있다. 영어와 한국어 발음에 있어서 대표적 차이 중 하나는 발음상의 리듬이라는 특정적인 요소가 규칙적으로 나타나는지 여부이다. 특히 영어 발화시 내용어는 기능어 대비 상대적으로 더 두드러진(prominent) 소리를 가지게 되는데 이는 영어에서 내용어의 경우 강세를 갖게 되나 기능어의 경우 그 강세가 미비하거나 강세를 갖지 않기 때문이다. 따라서 영어의 내용어 단어 내 모음은 기능어 단어의 모음보다 길게 발음되며, 더 큰 소리로 발화되며, 더 높은 소리를 가지고 리듬을 만들어 내게 된다. 이를 근거로 본 연구에서는 내용어 내 강세를 갖는 모음과 기능어 내 강세를 갖지 않는 모음의 길이 차이에 초점을 두고 유창성이 평가된 L2 영어 음성 코퍼스(Rated K-SEC) 중 한국인 초등학생이 발화한 879(원어민 발화 20개 포함)개의 문장 내 명사구 음성 파일을 연구자료로 사용하였다. 이 879개의 문장은 영어 유창성 평가에 따라 4개의 등급으로 각각 재분류되었으며 이들 문장안에 들어 있는 명사구 내의 관사의 모음 길이와 명사의 모음 길이를 확인하고 그 비율을 측정하였다. 분석 결과 관사 모음 대비 명사 모음 길이 비율은 영어 능숙도와 양의 상관관계를 갖는 것을 확인하였다[Advanced(2.453)>Intermediate High(1.26)>Intermediate Low(1.034)>Novice(0.857)]. 또한 각 능숙도 그룹 간 내용어-기능어 간 모음 길이의 차이 및 그 비율의 차이가 통계적으로 유의미한 것으로 나타났다(p< .001). 이는 한국인 화자의 경우 영어 유창성이 높아질수록 영어 단어 발화 시 명사구 내의 기능어인 관사 모음보다 내용어인 명사 모음을 통계적으로 유의하게 더 길게 발화한다는 것을 의미한다.

HMM기반 자동음소분할기의 음소분할 오류 유형 분석 (The Error Pattern Analysis of the HMM-Based Automatic Phoneme Segmentation)

  • 김민제;이정철;김종진
    • 한국음향학회지
    • /
    • 제25권5호
    • /
    • pp.213-221
    • /
    • 2006
  • 합성음의 음질을 향상시키기 위하여 분할된 corpora로부터 합성유닛을 선택하여 사용하는 연속음성합성에서 정확한 음소분할은 매우 중요하다. 일반적으로 음소분할은 사람에 의해 수행되지만 많은 작업량으로 인한 시간적 지연, 일관 성 유지 어려움 등 많은 문제가 발생한다. 이에 따라 음성인식에서 도입된 HMM 기반의 자동음소분할이 음성인식, 음성 합성에서 널리 사용되어지고 있지만 음성전문가의 수작업 결과와 비교할 때 HMM 기반 자동음소분할은 오류가 있고, 이는 합성음 품질의 열화의 주요 원인이 되고 있다. 본 논문에서는 HMM 기반의 자동음소분할기를 사용하여 나타난 자동음소분할 결과와 수작업에 의한 음소분할 결과를 비교하고 유형별로 분석함으로써 음성합성의 성능향상을 위해 개선해야 할 문제점들을 제시한다. 실험에서는 ETRI의 표준형 한국어 공통 음성 DB을 사용하였고, 오차의 범위가 20ms를 벗어난 경우를 분절 오류로 간주하였다. 실험 결과 여성화자의 경우 파열음 + 모음, 파찰음 + 모음, 모음 + 유음 음소쌍에서는 각각 약 99%, 99.5%, 99%의 높은 정확률을 보인 반면, 폐쇄음 + 비음, 폐쇄음 + 유음, 비음 + 유음 음소쌍에서는 44.89%, 50%, 55% 의 낮은 정확률을 보였으며, 남성화자에 대한 실험결과에서도 유사한 경향을 보였다.

고카페인 섭취 전·후 음성 특성 비교 (Comparison of Voice Characteristics Before and After High-Caffeine Intake)

  • 이아름;김은연;유현자;최예린
    • 말소리와 음성과학
    • /
    • 제7권4호
    • /
    • pp.59-65
    • /
    • 2015
  • This study was conducted to identify the differences in voice characteristic variables before and after taking a certain amount of high-caffeine. Linear PCM-M10 Recorder (SONY) was used for the recorder and basic frequency of the voice (Fo), frequency fluctuation rate (jitter), amplitude fluctuation rate (shimmer) and Signal-to-Noise Ratio (SNR) were measured using TF-32(University of Wisconsin-Madison, USA). First, prolonged phonation analysis results of /ah/ by male subjects showed the shimmer values after taking high-caffeine increased statistically significantly(p<.05) compared with before the intake and SNR values significantly decreased. (p<.05). On the other hand, female subjects didn't show any statistically significant differences in all variables. Second, male subjects showed statistically significant increased shimmer values after the intake compared with before the intake at /ah/ of syllable 'na' and /ah/ in 'ra' in 'autumn' paragraph (p<.05), and jitter values significantly increased at /ah/ in 'ah' (p<.05). However, female subjects didn't show any statistically significant differences in all variables. Results of this study showed that high-caffeine intake more affects male subjects than female subjects. In male subjects, shimmer and SNR changed at vowel prolonged phonation, /ah/, and study results showed that shimmer and SNR in 'Autumn' paragraph /na/, /ra/ and jitter in /ah/ could be identified as the variables to show the voice change.

인쇄체 한글의 광학적 인식을 위한 다중 MACE 필터의 합성 (Synthesis of Multiplexed MACE Filter for Optical Korean Character Recognition)

  • 김정우;김철수;배장근;도양회;김수중
    • 한국통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2364-2375
    • /
    • 1994
  • 효율적인 인쇄체 한글 인식을 위하여 다중 최소평균 상관 에너지 필터를 제안하였다. 제안된 방법은 기존의 나무구조 알고리듬의 단점인 인식시스템의 방대함과 인식방법의 복잡함을 해결하였다. 오직 하나의 자음 MMACE 필터와 모음 MMACE 필터를 사용하여 완전한 한글을 인식하였다. 각 MMACE 필터는 24개의 자모음으로 합성된 4개의 K-tuple MACE 필터를 이용하여 다중화시켰다. 따라서 제안된 MMACE 필터의 필터평면과 상관분포 평면은 4개의 부평면으로 나누어 진다. 각 상관분포 부평면으로 한글 인식을 위한 코드를 얻었다. 얻어진 코드와 컴퓨터에 내장된 자모음을 인식하기 위한 진리표와 비교하였다. 일치하는 코드의 해당자모음을 찾아 출력상관평면상의 상관첨두 위치에 치환하면 완전한 한글을 인식할 수 있다. 컴퓨터 시뮬레이션과 광 실험을 통하여 제안된 MMACE 필터를 이용한 한글 인식 시스템의 높은 변별력을 확인하였다.

  • PDF

문장음성인식을 위한 VCCV 기반의 언어모델과 Smoothing 기법 평가 (Language Model based on VCCV and Test of Smoothing Techniques for Sentence Speech Recognition)

  • 박선희;노용완;홍광석
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.241-246
    • /
    • 2004
  • 본 논문에서는 언어모델의 언어처리 단위로 VCCV(vowel consonant consonant vowel) 단위를 제안하구 기존의 언어처리 단위인 어적 형태소 단위와 비교한다. 어절과 형태소는 어휘수가 많고 높은 복잡도를 가진다. 그러나 VCCV 단위는 작은 사전과 제한된 어휘를 가지므로 복잡도가 적다. 언어모델 구성에 smoothing은 반드시 필요하다. smoothing 기법은 정확한 확률 예측이 불확실한 데이터가 있을 때 더 나은 확률 예측을 위해 사용된다. 본 논문에서는 형태소, 어절, VCCV 단위에 대해 언어모델을 구성하여 복잡도를 계산하였다. 그 결과 VCCV 단위의 복잡도가 형태소나 어절보다 적게 나오는 것을 볼 수 있었다. 복잡도가 적게 나온 VCCV를 기반으로 N-gram을 구성하고 Katz. Witten-Bell, absolute, modified Kneser-Ney smoothing 등의 방법을 이용한 언어 모델에 대해 평가하였다. 그 결과 VCCV 단위의 언어모델에 적합한 smoothing 기법은 modified Kneser-Ney 방법으로 평가되었다.