• Title/Summary/Keyword: 음성 훈련

Search Result 278, Processing Time 0.022 seconds

AN INTUITIONAL METHOD OF TRAINING THE DEAF IN POINTS OF ARTICULATION FOR THE CLARIFICATION OF THEIR SPEECH -HORITA'S WAFER METHOD-

  • Horita, Katsutoshi
    • MALSORI
    • /
    • no.7_8
    • /
    • pp.72-79
    • /
    • 1984
  • 이 논문은 일본의 호리따씨가 1983년 8월 고베시에서 열린 제4차 세계음성학자 대회에서 발표한 내용의 영역본이다. "음성언어의 직감적 개발"이란 부제가 붙은 "위이훠 방법"이란 호리따씨가 개발해 낸 농아와 그 밖의 언어장애자의 발음 훈련 및 교정법인데, 혀의 감각이 둔한 장애자의 혀에 종이같이 얇은 고자 조각을 붙여서 발음하게 함으로써 정확한 조음 위치를 파악하여 올바른 발음을 익히도록 하는 방법이다. 대회에서도 상당한 관심을 끈 논문이므로 우리나라의 언어치료계를 위하여 소개한다. 이 방법은 음성훈련 및 외국어의 발음교육에도 이용될 수 있을 듯 하다.

  • PDF

Narrowband to Wideband Conversion of Speech using Modularized Neural Network (모듈화 된 신경 회로망을 이용한 음성의 Narrowband에서 Wideband로의 변환)

  • Woo Dong Hun;Ko Charm Han;Kang Hyun Min;Kim Yoo Shin;Kim Hyung Soon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.21-24
    • /
    • 2001
  • 본 논문은 신경 회로망을 이용하여, 전화망 대역의 음성, 즉, narrowband 음성에서 wideband 음성을 복원하고자 했다. BP 알고리즘을 사용하는 기존의 신경 회로망의 경우에는 음성과 같이 복잡하고 크기가 큰 훈련데이터에 대해서는 훈련이 제대로 되지 않는 단점이 있다. 그러므로 븐 논문에서는 이를 해결하기 위해 입력으로 들어온 LPC 켑스트럼 벡터를 k-means 알고리즘을 이용하여 미리 정한 개수의 cluster로 나눈 다음, 각각의 cluster에 대해 독립적인 신경 회로망을 적용했다 이로 인해 각각의 신경 회로망은 제한되고 서로 상관관계가 많은 음성들만 훈련하면 되므로, 기존의 신경 회로망에서 생기는 훈련의 정체를 개선할 수 있었다. 또 clustering 과정에서 생기는 오류를 보완하기 위해 후보신경 로망들의 출력에 fuzzy 개념을 적용해서 최종 출력을 내도록 했다 실험 결과에서, 제안한 알고리즘은 기존의 codebook mapping 알고리즘보다 스펙트럼 거리척도에 의한 비교 및 주관적인 음질 평가 양쪽에서 개선된 성능을 보였다.

  • PDF

정상인과 직업적 음성 과사용 집단간의 음성학적 비교 분석

  • 진성민;박상욱;강현국;이용배
    • Proceedings of the KSLP Conference
    • /
    • 1997.11a
    • /
    • pp.251-251
    • /
    • 1997
  • 목적 : 발성훈련을 받지 않은 각각의 직업적 음성 과사용집단의 음성분석에 대한 연구는 많이 보고되었지만, 이들 집단간의 음성분석을 통하여 각 집단의 음성문제를 비교한 연구는 미흡하다. 따라서 발성훈련을 받지 않은 직업적 음성 과사용집단의 음성 증상 및 음향학적 분석결과를 정상인과 비교함으로써 각 집단간 음성장애의 양상에 대하여 알아보고자 하였다. 대상 및 방법 : 음성장애에 대한 설문조사, 음향적 분석 및 성대화상술검사를 통하여 직업적 음성 과사용집단으로 분류되는 목사, 여자 교환수 및 고교 남녀교사를 증상 및 이학적 검사상 음성장애 소견을 보이지 않는 성인 남녀와 비교하였다. (중략)

  • PDF

음질(Voice Quality)에 관한 청지각적 훈련자료개발을 위한 기초연구

  • 심현섭
    • Proceedings of the KSLP Conference
    • /
    • 2003.11a
    • /
    • pp.198-199
    • /
    • 2003
  • 최근에 음성언어장애에 대한 언어치료사의 평가 및 치료 활동이 활발히 이루어지고 있으나, 음성평가 기준 및 치료 자료가 충분치 않은 것이 현실이다. 음성 평가를 실시할 때에도 각 치료실마다 음성 평가에 사용하는 장비가 달라 결과물의 해석에 다소 차이가 있으며, 또한 같은 장비를 사용함에도 불구하고 음성 자료를 수집하는 방법에 있어서 표준화된 절차 및 자료에 따라 평가를 하지 못하고 있는 실정이다. 이러한 표준화된 측정절차에 대한 요구는 개인적인 기준으로 좌우될 수 있는 주관적인 평가에서는 더욱 절실하다. 음성의 지각적 평가에서 중요한 측면 중에 하나는 음성의 질에 정확한 판단 및 이에 대한 자료공유 및 정보교환이다. 현재 음성의 질에 대한 측정평가를 위해 제일 많이 사용되고 있는 방법 중 하나가 GRBAS 방법이 간편하여 임상적으로 많이 사용하나 음성의 질에 대한 세밀한 평가를 하는 데는 한계가 있다. 따라서 본 연구에서는 음질을 평가하는데 있어서 자주 사용되는 음질 용어에 대한 우리말 용어를 통일의 필요성의 시급한 실정에 기초하여 이를 대표할 수 있는 음성샘플 자료의 구축마련을 위한 일종의 발제이다. 이러한 작업을 통해 각 음성 및 언어치료실에서 음성의 질에 대한 청지각적 평가에 공통 기준을 마련하고, 임상교육 적인 목적으로 청지각적 훈련 자료로 이용이 가능할 수 있으리라 사료된다. (중략)

  • PDF

Performance Improvement in Speech Recognition by Weighting HMM Likelihood (은닉 마코프 모델 확률 보정을 이용한 음성 인식 성능 향상)

  • 권태희;고한석
    • The Journal of the Acoustical Society of Korea
    • /
    • v.22 no.2
    • /
    • pp.145-152
    • /
    • 2003
  • In this paper, assuming that the score of speech utterance is the product of HMM log likelihood and HMM weight, we propose a new method that HMM weights are adapted iteratively like the general MCE training. The proposed method adjusts HMM weights for better performance using delta coefficient defined in terms of misclassification measure. Therefore, the parameter estimation and the Viterbi algorithms of conventional 1:.um can be easily applied to the proposed model by constraining the sum of HMM weights to the number of HMMs in an HMM set. Comparing with the general segmental MCE training approach, computing time decreases by reducing the number of parameters to estimate and avoiding gradient calculation through the optimal state sequence. To evaluate the performance of HMM-based speech recognizer by weighting HMM likelihood, we perform Korean isolated digit recognition experiments. The experimental results show better performance than the MCE algorithm with state weighting.

Egyptian learners' learnability of Korean phonemes (이집트 한국어 학습자들의 한국어 음소 학습용이성)

  • Benjamin, Sarah;Lee, Ho-Young;Hwang, Hyosung
    • Phonetics and Speech Sciences
    • /
    • v.11 no.4
    • /
    • pp.19-33
    • /
    • 2019
  • This paper examines the perception of Korean phonemes by Egyptian learners of Korean and presents the learnability gradient of Korean consonants and vowels through High Variability Phonetic Training (HVPT). 50 Egyptian learners of Korean (27 low proficiency learners and 23 high proficiency learners) participated in 10 sessions of HVPT for Korean vowels, word initial and final consonants. Participants were tested on their identification ability of Korean vowels, word initial consonants, and syllable codas before and after the training. The results showed that both low and high proficiency groups did benefit from the training. Low proficiency learners showed a higher improvement rate than high proficiency learners. Based on the HVPT results, a learnability gradient was established to give insights into priorities in teaching Korean sounds to Egyptian learners.

Perceptual training on Korean obstruents for Vietnamese learners (베트남 한국어 학습자를 위한 한국어 자음 지각 훈련 연구)

  • Hyosung Hwang
    • Phonetics and Speech Sciences
    • /
    • v.15 no.4
    • /
    • pp.17-26
    • /
    • 2023
  • This study aimed to reveal how Vietnamese adult learners at three different proficiency levels perceive Korean word-initial obstruents and whether errors can be corrected through perceptual training. To this end, 105 Vietnamese beginner, intermediate, and advanced learners were given perceptual training on Korean word-initial. The training materials were created by actively utilizing Korean minimal pairs as natural stimuli recorded by native speakers. Learners in the experimental group performed five 20-40 minute self-directed perceptual training sessions over a period of approximately two weeks, while learners in the control group only participated in the pretest and posttest. The results showed a significant improvement in the perception of sounds that were difficult to distinguish before training, and both beginners and advanced learners benefited from the training. This study confirmed that large-scale perceptual training can play an important role in helping Vietnamese learners learn the appropriate acoustic cues to distinguish different sounds in Korean.

Standardization Voice Training Method for Professional Voice User Based on Traditional (전통적 벨칸토 발성훈련법에 기초한 음성전문직업인 발성훈련의 표준화)

  • Kim, Chul Jun
    • Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics
    • /
    • v.28 no.1
    • /
    • pp.17-19
    • /
    • 2017
  • Opera singers train their vocal organ to have a good timbre of voice. They train and train again to have a strong resonance, large range of voice, homogenous color of voice, a voice goes far and to avoid vocal disorder, etc. This article is analyzing from scientific and medical perspective. It could approach the secret of the great art of 400 years history - . Furthermore standardizing voice training method based on will facilitate to train, therapy and care the voice professional user and voice disorders.

  • PDF

Effects of Respiration and Oral Motor Training based on Musical Elements and Singing on Voice of Healthy Elderly (음악요소와 노래 부르기를 활용한 호흡 및 구강훈련이 정상노인의 음성에 미치는 영향)

  • Jun, Hee-Un;Kim, Soo-Ji
    • The Journal of the Korea Contents Association
    • /
    • v.11 no.10
    • /
    • pp.380-387
    • /
    • 2011
  • This study was to investigate the effects of music-combined respiration and oral motor training on the voice of healthy elderly. 27 women attending a senior center in Seoul participated and were randomly assigned to the experimental (n = 16) and the control group (n = 11). Subjects attended music program(25 minutes per session) once a week for 4 weeks. For both groups, Fundamental Frequency (F0), Maximum Phonation Time (MPT) and Sequential Motion Rates (SMR) were measured using the Praat speech analysis program before and after the training. The results showed statistical significance in scores of intensity, F0, MPT, and SMR in the experimental group while only intensity was statistically significant in the control group. Considering that, the increasing life expectancy and growing number of older adults, their quality of life has been important. So this study suggests that the respiration and oral motor training would be effectively incorporated into training and services for this population.

Dynamically weighted loss based domain adversarial training for children's speech recognition (어린이 음성인식을 위한 동적 가중 손실 기반 도메인 적대적 훈련)

  • Seunghee, Ma
    • The Journal of the Acoustical Society of Korea
    • /
    • v.41 no.6
    • /
    • pp.647-654
    • /
    • 2022
  • Although the fields in which is utilized children's speech recognition is on the rise, the lack of quality data is an obstacle to improving children's speech recognition performance. This paper proposes a new method for improving children's speech recognition performance by additionally using adult speech data. The proposed method is a transformer based domain adversarial training using dynamically weighted loss to effectively address the data imbalance gap between age that grows as the amount of adult training data increases. Specifically, the degree of class imbalance in the mini-batch during training was quantified, and the loss function was defined and used so that the smaller the data, the greater the weight. Experiments validate the utility of proposed domain adversarial training following asymmetry between adults and children training data. Experiments show that the proposed method has higher children's speech recognition performance than traditional domain adversarial training method under all conditions in which asymmetry between age occurs in the training data.