• 제목/요약/키워드: Sound spectrogram

검색결과 69건 처리시간 0.027초

An Acoustic Study on the Pronunciation of English [kwJ Sequences by Korean EFL Students

  • Kim, Jung-Eun;Cho, Mi-Hui
    • 음성과학
    • /
    • 제9권1호
    • /
    • pp.193-206
    • /
    • 2002
  • The aim of this study is to find out how the labiovelar onglide /w/ in English kwV sequences that have minimal pairs with kV sequences is pronounced differently among Korean EFL learners based on acoustic evidence. This study tries to identify /w/ sound in English kwV sequences through spectrograms and to examine the duration ratios of each segment in kwV words to compare the patterns of an English native speaker with those of Korean speakers of English. In spectrographic analyses, the complete deletion of /w/ and partial pronunciation of /w/ dubbed [$k^{w}$] were identified as well as the targetappropriate production of /w/. The general production patterns with respect to the duration ratios in English [kw] sequence words showed that the subjects who produced /w/ had similar ratio patterns that the native speaker had in that the vowel duration ratio in kwV sequences was shorter than that in kV sequences. By contrast, the subjects who deleted [w] had a long ratio of the onset [$k^{h}$] while the speaker with a partial pronunciation of /w/ had a long ratio of the following vowel.

  • PDF

비음 측정기, 전기 구개도 및 음성 분석 컴퓨터 시스템을 이용한 구개열 언어 장애의 특성 연구 (The Speech of Cleft Palate Patients using Nasometer, EPG and Computer based Speech Analysis System)

  • 신효근;김오환;김현기
    • 음성과학
    • /
    • 제4권2호
    • /
    • pp.69-89
    • /
    • 1998
  • The aim of this study is to develop an objectively method of speech evaluation for children with cleft palates. To assess velopharyngeal function, Visi-Pitch, Computerized Speech Lab. (CSL), Nasometer and Palatometer were used for this study. Acoustic parameters were measured depending on the diagnostic instruments: Pitch (Hz), sound pressure level (dB), jitter (%) and diadochokinetic rate by Visi-Pitch, VOT and vowels formant ($F_1\;&\;F_2$) by a Spectrography and the degree of hypernasality by Nasometer. In addition, Palatometer was used to find the lingual-palatal patterns of cleft palate. Ten children with cleft palates and fifty normal children participated in the experiment. The results are as follows: (1) Higher nasalance of children with cleft palates showed the resonance disorder. (2) The cleft palate showed palatal misarticulation and lateral misarticulation on the palatogram. (3) Children with cleft palates showed the phonatory and respiratory problems. The duration of sustained vowels in children with cleft palates was shorter than in the control groups. The pitch of children with cleft palates was higher than in the control groups. However, intensity, jitter and diadochokinetic rate of children with cleft palates were lower than in the control group. (4) On the Spectrogram, the VOT of children with cleft palates was longer than control group. $F_1\;&\;F_2$ were lower than in the control group.

  • PDF

자연스런 인간-로봇 상호작용을 위한 음성 신호의 AM-FM 성분 분해 및 순간 주파수와 순간 진폭의 추정에 관한 연구 (AM-FM Decomposition and Estimation of Instantaneous Frequency and Instantaneous Amplitude of Speech Signals for Natural Human-robot Interaction)

  • 이희영
    • 음성과학
    • /
    • 제12권4호
    • /
    • pp.53-70
    • /
    • 2005
  • A Vowel of speech signals are multicomponent signals composed of AM-FM components whose instantaneous frequency and instantaneous amplitude are time-varying. The changes of emotion states cause the variation of the instantaneous frequencies and the instantaneous amplitudes of AM-FM components. Therefore, it is important to estimate exactly the instantaneous frequencies and the instantaneous amplitudes of AM-FM components for the extraction of key information representing emotion states and changes in speech signals. In tills paper, firstly a method decomposing speech signals into AM - FM components is addressed. Secondly, the fundamental frequency of vowel sound is estimated by the simple method based on the spectrogram. The estimate of the fundamental frequency is used for decomposing speech signals into AM-FM components. Thirdly, an estimation method is suggested for separation of the instantaneous frequencies and the instantaneous amplitudes of the decomposed AM - FM components, based on Hilbert transform and the demodulation property of the extended Fourier transform. The estimates of the instantaneous frequencies and the instantaneous amplitudes can be used for modification of the spectral distribution and smooth connection of two words in the speech synthesis systems based on a corpus.

  • PDF

원형 톱과 엔드밀의 복합재료 절단 음향과 버 비교연구 (Acoustic Emission and Burr Comparison of Circular Sawing and Milling in Fiber Reinforced Plastic Cutting)

  • 주창민;백종현;김수진;이건명
    • 한국기계가공학회지
    • /
    • 제21권7호
    • /
    • pp.98-104
    • /
    • 2022
  • Circular sawing and milling are general machining processes used for routing fiber-reinforced plastics (FRP). In this study, the productivity and cutting quality of a circular saw and flat endmill were compared. As a result, the productivity of the circular saw was approximately ten times higher than that of the endmill for the same tool life, and the burr size of the circular saw was 14 times smaller than that of the flat-end mill. The spectrogram analysis of the cutting sound also showed that the acoustic emission of the circular saw was more uniform than that of the flat end mill. Circular sawing is thus a more suitable process for the straight cutting of pultrusion FRP than a flat endmill.

DWT영역에서 LMS를 이용한 저 샘플링 비율 오디오 신호의 음질 향상 (Sound Enhancement of low Sample rate Audio Using LMS in DWT Domain)

  • 백수진;윤원중;박규식
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.54-60
    • /
    • 2004
  • 44.1 kHz 샘플링 비율의 표준 CD음질의 오디오 신호를 인터넷 상에서 전송 및 분배하기 위해서 네트워크 대역폭과 저장 공간의 제한점을 고려해야 한다. 이러한 제한은 오디오 신호의 샘플링 비율을 낮추거나 MP3와 같은 오디오 데이터 압축 기법을 이용하여 해결할 수 있지만, 공통적으로 고 주파수 (High frequency) 대역의 정보가 손실 된다는 문제가 발생한다. 이러한 고 주파수 손실은 결국 저 샘플링 비율의 오디오 신호를 생성하게 되며 표준 CD음질을 가지는 오디오 신호보다 제한된 저 주파수 대역만을 재생할 수 있게 된다. 일반적으로 오디오 신호의 고주파 성분은 위치정보와 명료도, 재생 환경 등에 대한 음의 풍부한 정보를 제공한다. 본 논문의 목적은 LMS 적응 필터링과 DWT 분석/합성을 이용하여 저 샘플링 비율을 가지는 오디오 신호로부터 고 주파수 대역의 정보를 효과적으로 추정하는 것이다. 제안된 알고리즘은 DWT 영역에서 LMS 적응 알고리즘을 이용하여 고 주파수 정보를 추정하고 DWT 합성을 이용하여 고 주파수 정보가 강화된 고음질의 오디오 신호를 재생한다. 제안된 알고리즘의 성능 평가를 위해 실제 음성신호와 음악 신호를 이용하여 컴퓨터 모의 실험과 청취 평가를 수행하여 기존 알고리즘과 비교하였으며, 실험 결과 제안된 알고리즘의 우수성을 확인하였다.

Praat소프트웨어 프로그램을 이용한 영어모음 길이에 관한 실험적 연구 (An Experimental Study on the English Vowel Lengths Using the Praat Software Program)

  • 박희석
    • 디지털콘텐츠학회 논문지
    • /
    • 제13권3호
    • /
    • pp.279-290
    • /
    • 2012
  • 본 연구는 Praat 소프트웨어 프로그램을 이용하여 영어이중모음 /eɪ/ 와 /aɪ/, 그리고 영어전설저모음 /æ/의 발음 길이에 관해 한국인 피 실험자와 원어민 피 실험자를 대상으로 그 차이를 비교분석해보고자 한 연구이다. 이 연구를 위해서 영어문장이 발화되고 녹음되었으며, 피 실험자는 한국인과 원어민 각각 6명씩 참가하였으며, 모두 여성이었고 나이는 23세에서 35세에 위치하고 있다. 음향특질중 하나인 길이측정을 위해서 Praat소프트웨어 프로그램을 활용하였으며, 그 결과를 통계 처리하였다. 실험결과 /eɪ/ 와 /aɪ/에서는 한국인들이 더 길게 발음하였지만 그 차이가 통계상 유의미한 수준은 아니었다. 그러나 /æ/의 발음에서는 한국인들의 발음 길이가 원어민에 비해 훨씬 짧았으며, 그 차이도 통계상 유의미한 수준으로 나타났다.

Convolutional neural network 기법을 이용한 턱수염물범 신호 판별 (Classification of bearded seals signal based on convolutional neural network)

  • 김지섭;윤영글;한동균;나형술;최지웅
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.235-241
    • /
    • 2022
  • 수동 음향 관측을 통해 수집된 방대한 양의 데이터에서 해양포유류의 소리를 탐지하고 식별하기 위해 합성곱 신경망(Convolutional Neural Network, CNN)을 활용한 연구가 많이 수행되고 있다. 본 연구는 2017년 8월부터 2018년 8월까지 동시베리아 해에서 수집된 수중음향 스펙트럼 이미지를 기반으로 CNN을 활용하여 턱수염물범 소리의 분류 자동화 가능성을 확인해 보았다. 학습 데이터로서 다른 소음이 거의 포함되지 않은 뚜렷한 턱수염물범 소리를 사용하였을 때, 암기로 인한 과적합이 발생하였다. 일부 데이터를 소음이 포함된 데이터로 교체하여 학습시켜 수집된 전체 데이터로 평가한 결과 정확도(0.9743), 정밀도(0.9783), 재현율(0.9520)으로 모델이 이전보다 일반화되어 과적합이 방지되는 것을 확인하였다. 본 연구를 통해 물범신호 분류는 학습 데이터에 소음이 포함되었을 때 성능이 증가하는 것으로 나타났다.

구개상 장착에 따른 한국어 어음의 조음시간 변화에 관한 연구 (A STUDY ON THE INFLUENCE OF THE PALATAL PLATES UPON THE DURATION OF KOREAN SOUNDS)

  • 고여준;김창회;김영수
    • 대한치과보철학회지
    • /
    • 제32권1호
    • /
    • pp.77-102
    • /
    • 1994
  • Many studies have been made on the masticatory and esthetic effects of prosthodontic treatments, but few on the restoration of pronunciation, especially in complete denture wearers. The purpose of this study is to provide a basis that could be of help to the complete denture wearers' speech adaptation by analyzing the influence of the palatal coverage upon the duration of consonants and vowels with the method of experimental phonetics. For this study, metal plates and resin plates were made for 3 male subjects in their twenties, who have good occlusion, and do not have speech and hearing disorders. Then 8 Korean consonants and 4 Korean vowels were selected, systemically considering phonetic variants such as the place and manner of articulation, lenis/fortis, mutual effect of each phoneme, etc. They were combined into meaningless tested words in the form of /VCV/, and were included in the carrier sentences. Each informant uttered the sentences 1) without the plate, 2) with the metal plate, 3) with the resin plate. The recorded data were analyzed through the waveform of sounds and spectrogram by using the program SoundEdit, Signalize, Statview 512+for the Macintosh computer. The duration of each segment was measured by searching for the boundaries between the preceding vowels and consonants, and between the consonants and the following vowels. The study led to the conclusion that. 1. With the palatal plate, the duration of all the tested words increased and the duration increased more with the resin plate than with the metal plate. 2. With the palatal plate, the duration of all the preceding vowels, consonants, and following vowels increased, but the temporal structure of the tested words was maintained. 3. As for the manner of articulation, fricative /s/(ㅅ) was greatly influenced by both kinds of palatal plates. 4. As for the place of articulation, alveolar sounds /d/(ㄷ), /n/(ㄴ) were greatly influnced by the kinds of palatal plates, and the velar sounds /n/(ㅇ), /g/(ㄱ) were influenced by the platal plates, but the kind of the palatal plates did not show any significance. 5. As for the lenis/fortis, lenis was influenced more by the kind of the palatal plates. 6. As for the influence of vowels upon each segment in the tested words, palatal vowel /i/(ㅣ) had greater influence than pharyngeal vowel /a/(ㅏ), and following vowels than preceding vowels.

  • PDF

Praat을 활용한 영어발음특성의 시각적 연구 (A Visual Study of the Quality of English Pronunciation Using the Praat Program)

  • 박희석
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권3호
    • /
    • pp.323-331
    • /
    • 2013
  • Praat프로그램을 활용하면 시각적인 영어교육효과를 얻을 수 있다. 시청각교육이 중시되는 영어교육의 방법론에 비추어볼 때 시각적인 연구의 활용은 교육의 효율성 측면에서 기대되는바가 크다고 할 수 있다. 이러한 점에 착안하여 본 연구에서는 현재 고등학교에 재학 중인 학생들 중 영어성적이 1,2등급에 해당되는 학생과 5,6등급에 해당되는 학생들을 두 그룹으로 나누어 각각의 그룹이 원어민의 발음과 어떤 차이를 보이는지를 알아보고, 그 차이가 어떻게 다른지를 시각적인 면으로 규명해보고자 시도하였다. 이를 위해 원어민이 녹음한 CD가 내장되어있는 영어발음교재를 실험자료로 활용하였다. 구체적으로 영어발음에서 외국인어투를 보일 가능성이 있는 영어저모음과 이중모음이 들어있는 단어와 문장을 대상으로 하였으며, 단어와 문장들은 캠브리지대학교 출판국에서 출간된 English Pronunciation in Use의 교재내용 중의 일부를 활용하였다. 실험을 통해 나타난 결과를 보면 한국인 피 실험자의 두 집단 간에 공히 모음이나 단어단위에선 집단 간, 그리고 원어민의 녹음자료와의 사이에서도 유의미한 차이가 나타나지 않았다. 그러나 다섯 단어 이상으로 구성된 상대적으로 긴 문장단위의 실험에서는 5,6등급 집단의 발음이 유의미하게 크게 나타났다. 이러한 결과는 한국인 피 실험자들의 억양구현실패에서 기인한 것으로 보여지며, 이러한 분석은 Praat프로그램에서 제공한 시각적인 자료에 의해 뒷받침되고 있다.