• Title/Summary/Keyword: 음성 훈련

Search Result 277, Processing Time 0.022 seconds

Design and Implementation of Speech-Training System for Voice Disorders (발성장애아동을 위한 발성훈련시스템 설계 및 구현)

  • 정은순;김봉완;양옥렬;이용주
    • Journal of Internet Computing and Services
    • /
    • v.2 no.1
    • /
    • pp.97-106
    • /
    • 2001
  • In this paper, we design and implement complement based speech training system for voice disorder. The system consists of three level of training: precedent training, training for speech apprehension and training for speech enhancement. To analyze speech of voice disorder, we extracted speech features as loudness, amplitude, pitch using digital signal processing technique. Extracted features are converted to graphic interface for visual feedback of speech by the system.

  • PDF

How to Use EVT Figures for Actor Voice Training I (배우 음성 훈련을 위한 EVT 구조연습 활용방안 I)

  • Lee, Young-Su
    • The Journal of the Korea Contents Association
    • /
    • v.21 no.9
    • /
    • pp.136-148
    • /
    • 2021
  • In this study, the theoretical principle and structural practice of Estill Voice Training model that enables independent control of voice organs in the actor's acting art using voice as a medium of artistic expression. Its purpose is to explore the positive utility that can be applied to operation. The research on the speech science methodology that controls the differences in speech output due to the principle of the generation organ is a reality that has not been actively introduced in Korea compared to the existing actor's speech training that encompasses both the mind and the body. Voice can guarantee the accuracy and stability of operation when an understanding of our body is preceded based on anatomical physiology as well as contribute to the characterization of the character's phonetic character an element of character creation. Considering the training model through proprioception in actor voice training has practical value and alternative significance that the actor can be sought as a principle and practical methodology in the process of generating a series of target sounds.

Speech Viewer II

  • 한옥희
    • Proceedings of the KSLP Conference
    • /
    • 1995.11a
    • /
    • pp.137-140
    • /
    • 1995
  • Speech viewer II 소프트웨어는 IBM에서 10여 년에 걸쳐 개발한 언어 및 청각장애자들을 위한 프로그램입니다. 이 프로그램은 15개의 훈련/치료용 모듈과 6개의 피훈련자 관리용 모듈로 짜여져 있습니다 훈련/치료용의 모듈들은 각각의 적용성과 훈련/치료의 목적에 따라서 다음과 같이 3개의 범주로 나뉘어져 있습니다. (중략)

  • PDF

Minimum Classification Error Training to Improve Discriminability of PCMM-Based Feature Compensation (PCMM 기반 특징 보상 기법에서 변별력 향상을 위한 Minimum Classification Error 훈련의 적용)

  • Kim Wooil;Ko Hanseok
    • The Journal of the Acoustical Society of Korea
    • /
    • v.24 no.1
    • /
    • pp.58-68
    • /
    • 2005
  • In this paper, we propose a scheme to improve discriminative property in the feature compensation method for robust speech recognition under noisy environments. The estimation of noisy speech model used in existing feature compensation methods do not guarantee the computation of posterior probabilities which discriminate reliably among the Gaussian components. Estimation of Posterior probabilities is a crucial step in determining the discriminative factor of the Gaussian models, which in turn determines the intelligibility of the restored speech signals. The proposed scheme employs minimum classification error (MCE) training for estimating the parameters of the noisy speech model. For applying the MCE training, we propose to identify and determine the 'competing components' that are expected to affect the discriminative ability. The proposed method is applied to feature compensation based on parallel combined mixture model (PCMM). The performance is examined over Aurora 2.0 database and over the speech recorded inside a car during real driving conditions. The experimental results show improved recognition performance in both simulated environments and real-life conditions. The result verifies the effectiveness of the proposed scheme for increasing the performance of robust speech recognition systems.

How to Use EVT Figures for Actor Voice Training II (배우 음성 훈련을 위한 EVT 구조연습 활용방안 II)

  • Lee, Young-Su
    • The Journal of the Korea Contents Association
    • /
    • v.22 no.2
    • /
    • pp.647-664
    • /
    • 2022
  • This study explores the possibility that the figure of the Estill Voice Training model, which is based on speech science, can contribute to the expansion of vocal expertise in the acting art where an actor creates a character. The purpose of this study is to examine the usage plan. The training model through the fluidity and structural functionality of the voice production organ is differentiated from the existing voice training that focuses only on the results of sound due to its ambiguous abstraction. Developing the voluntary coordination ability of the occipital region and vocal tract, such as False Vocal Folds, Cricoid Cartilage, Velum, AES, and Anchoring, has scientific efficiency that makes it easier to produce artistic target sounds, and it is a technical skill that can creatively overcome the functional limitations faced by actors. It can be used as a methodology. The Estill model Figure, which is a principle training for harmony and coordination between the elements of voice production, has a practical value that can be used as an alternative training model for the voice education of actors in Korea, where images and abstractions are the mainstream.

A Study on the Variable Vocabulary Speech Recognition in the Vocabulary-Independent Environments (어휘독립 환경에서의 가변어휘 음성인식에 관한 연구)

  • 황병한
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.369-372
    • /
    • 1998
  • 본 논문은 어휘독립(Vocabulary-Independent) 환경에서 별도의 훈련과정 없이 인식대상 어휘를 추가 및 변경할 수 있는 가변어휘(Variable Vocabulary) 음성인식에 관한 연구를 다룬다. 가변어휘 인식은 처음에 대용량 음성 데이터베이스(DB)로 음소모델을 훈련하고 인식대상 어휘가 결정되면 발음사전에 의거하여 음소모델을 연결함으로써 별도의 훈련과정 없이 인식대상 어휘를 변경 및 추가할 수 있다. 문맥 종속형(Context-Dependent) 음소 모델인 triphone을 사용하여 인식실험을 하였고, 인식성능의 비교를 위해 어휘종속 모델을 별도로 구성하여 인식실험을 하였다. Unseen triphone 문제와 훈련 DB의 부족으로 인한 모델 파라메터의 신뢰성 저하를 방지하기 위해 state-tying 방법 중 음성학적 지식에 기반을 둔 tree-based clustering(TBC) 기법[1]을 도입하였다. Mel Frequency Cepstrum Coefficient(MFCC)와 대수에너지에 기반을 둔 3 가지 음성특징 벡터를 사용하여 인식 실험을 병행하였고, 연속 확률분포를 가지는 Hidden Markov Model(HMM) 기반의 고립단어 인식시스템을 구현하였다. 인식 실험에는 22 개 부서명 DB[3]를 사용하였다. 실험결과 어휘독립 환경에서 최고 98.4%의 인식률이 얻어졌으며, 어휘종속 환경에서의 인식률 99.7%에 근접한 성능을 보였다.

  • PDF

A Speaker Dependent Speech Recognition Method Using LSP Parameters for Small Training Data (적은 훈련 데이터를 이용한 LSP 파라메터 기반의 화자종속 음성인식에 관한 연구)

  • 곽수주
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.373-376
    • /
    • 1998
  • 통신 수단의 발달로 휴대단말기의 사용이 증가하고 있으며, 이와 함께 휴대단말기에서의 음성인식에 대한 수요도 증가하고 있다. 휴대단말기의 경우 저 전송율을 가지는 음성 부호화기를 사용하게 되며, 이러한 저전송율의 음성 부호화기에서의 음성인식을 수행할 경우 인식 성능이 저하되는 현상을 보이게 된다. 본 논문에서는 이러한 문제를 해결하기 위하여 LSP 파라메터 기반의 거리척도에 관하여 비교 검토하였으며, 적은 훈련 데이터에서 사용 가능한 화자 종속 음성인식 방법으로 Dynamic Time Warping(DTW)과 변형된 Hidden Markov Model(HMM)에 관하여 검토하였다. QCELP 음성 부호화기에서 인식 어휘 당 2번의 훈련 데이터만을 이용한 화자종속 인식방법을 사용한 결과 95% 이상의 인식 성능을 얻을 수 있었다.

  • PDF

Environment Adaptation by Discriminative Noise Adaptive Training Methods (잡음적응 변별학습 방식을 이용한 환경적응)

  • Kang, Byung-Ok;Jung, Ho-Young;Lee, Yun-Keun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.397-398
    • /
    • 2007
  • 본 논문에서는 환경변화에 대해 강인하게 동작하는 음성인식 시스템을 위해 잡음적응 훈련과 변별학습 방식을 결합한 형태의 환경적응 방식을 제안한다. 다중환경 훈련과 잡음제거방식을 결합한 형태인 잡음적응 훈련 방식은 음성인식을 위한 MCE (Minimum Classification Error)의 목적과는 거리가 있고, 음성인식 시스템이 사용되는 모든 환경을 반영하는 것은 현실적으로 어렵다는 점에서 한계가 있다. 이에 잡음적응 훈련방식으로 훈련된 기본 음향모델을 목적환경에서 수집한 소량의 데이터를 이용한 변별학습을 통해 환경적응 모델로 변환함으로써 이러한 단점을 보완할 수 있는 잡음 적응 변별학습을 이용한 훈련방식을 제안한다.

  • PDF

Language Identification System using phoneme recognizer and phonotactic language model (음소인식기와 음소결합확률모델을 이용한 언어식별시스템)

  • Lee Dae-Seong;Kim Se-Hyun;Oh Yung-Hwan
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.73-76
    • /
    • 2001
  • 본 논문에서는 음소인식기와 음소결합확률모델을 이용하여 전화음성을 대상으로 입력음성이 어느 나라 말 인지를 식별할 수 있는 언어식별시스템을 구현하였고 성능을 실험하였다. 시스템은 음소인식기로 입력음성에 대한 음소열을 인식하는 과정, 인식된 음소열을 이용하여 인식대상 언어별 음소결합확률모델을 생성하는 훈련과정, 훈련과정에서 생성된 음소결합확률모델로부터 확률 값을 계산하여 인식결과를 출력하는 식별과정으로 구성된다. 본 논문에서는 음소결합확률모델로부터 우도를 계산할 때 정보이론(Information Theory, Shannon and Weaver, 1949)을 이용하여 가중치를 적용하는 방법을 제안하였다. 시스템의 훈련 및 실험에는 OGI 11개국어 전화음성 corpus (OGI-TS)를 사용하였으며, 음소인식기는 HTK를 이용하여 구현하였고 음소인식기 훈련에는 NTIMIT 전화음성 DB를 이용하였다. 실험결과 11개국어를 대상으로 45초 길이의 음성에 대해서 평균 $74.1\%$, 10초 길이의 음성에 대해서는 평균 $57.1\%$의 인식률을 얻을 수 있었다.

  • PDF

Remote Articulation Training System for the Deafs (청각장애자를 위한 원격조음훈련시스템의 개발)

  • 이재혁;유선국;박상희
    • Proceedings of the KSLP Conference
    • /
    • 1996.11a
    • /
    • pp.90-90
    • /
    • 1996
  • 본 연구에서는 원격지의 청각장애자와 병원의 언어치료사간의 대화형 조음훈련시스템의 개발에 대해 소개한다. 발음에 대한 청각궤환을 얻을 수 없는 청각장애자의 경우, 컴퓨터 모니터에 자신의 조음상태의 실시간궤적을 볼 수 있다면 혼자서의 조음훈련이 가능하다 따라서 평상시에는 단독훈련이 가능하고 언어치료사와 온라인 접속이 된 상태에서는 훈련결과에 대한 확인과 교정이 가능한 시스템의 개발에 목표를 두었다. (중략)

  • PDF