• Title/Summary/Keyword: 음성 훈련

Search Result 278, Processing Time 0.021 seconds

Performance Evaluation of the Variable Vocabulary Speech Recognition System in the Noisy and Vocabulary-Independent Environments (잡음환경 및 어휘독립 환경에서의 가변어휘 음성인식기의 성능 분석)

  • 이승훈
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.56-59
    • /
    • 1998
  • POW 3848 DB 및 SNR 이 크게 다른 2 종류의 PC168 DB를 대상으로 가변어휘 음성인식 시스템을 이용하여 훈련 및 성능 평가 실험을 수행한 내용에 대해서 기술하고 있다. 실험의 목적은 위의 3종류의 DB를 조합하여 얻은 DB 환경하에서 인식기를 훈련시키면서, DB 의 조합 및 훈련방법에 따른 인식기의 성능과의 상관관계를 도출하고자 하였다. DB 의 조합은 POW DB 와 SNR 이 높은 PC DB , 및 3종류의 DB 모두로 구성하였다. 인식기는 40개의 음소로 구성된 문맥 독립형 SCHMM 모델이며, 각 음소당 3개의 상태로 이루어져 있다. 실험 결과, 대부분의 경우에서 ITERATION이 1.0인 경우에 최고 인식률을 나타내고 있으며, INTERATION 이 3.0 이상인 경우에는 항상 CASE 3의 실험방법이 우세한 결과를 나타내었다. 또한 CASE 1으로 훈련한 경우가 CASE 2 보다는 각각의 실험 DB 에 대해서 대체적으로 좋은 결과를 보였다.

  • PDF

Audiobook Text Shaping for Synesthesia Voice Training - Focusing on Paralanguages - (오디오북 텍스트 형상화를 위한 공감각적 음성 훈련 연구 - 유사언어를 활용하여 -)

  • Cho, Ye-Shin;Choi, Jae-Oh
    • Journal of Korea Entertainment Industry Association
    • /
    • v.13 no.8
    • /
    • pp.167-180
    • /
    • 2019
  • The purpose of this study is to find out the results of synesthesia speech training using similar language for shaping audiobook text. The audiobook text for training uses Tolstoy's work, and uses similar language of tone, tone, pose, speed, intonation, accent, and expression of emotions. The participants who ten visually impaired trainee in H library were selected for qualitative research. Based on the research questions raised in this study, the results are as follows. First, synesthesia training, in which more than two senses of the five senses work simultaneously in voice training for audio book text shaping, produced the result by visualizing the original purpose, meaning, and background of the text. Second, the use of similar language was helpful in the whole process of expressing the meaning of sentence and dialogue for audiobook text shaping. In addition, although there were some differences among the study subjects, they found commonalities that considered tone, pose, and intonation important. Third, the visually impaired have advanced sensory aspects and memory, which resulted in rapid acquisition of metabolism and acceptance of transmission during training. In addition, the teacher's friendly behavior was a very important key mediator in the training process.

Common ASR Interface format for increasing usability of cloud-based ASR services. (클라우드 기반 음성인식 서비스 활용도 향상을 위한 음성인식 공통 인터페이스 표준 포맷)

  • Oh, Jung-Sup;Lee, Byung-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.423-425
    • /
    • 2022
  • 음성인식은 컴퓨터가 사람의 언어를 이해하여, 소리로 발화하는 사람의 음성을 인식하여 텍스트로 바꾸는 과정을 의미하며, 최근 활용도가 높아지고 있다. 음성인식 엔진은 얼마나 많은 학습데이터를 기반으로 훈련을 했느냐에 따라서 그 성능이 결정되기 때문에, 자신의 서비스 에 맞는 음성인식 엔진을 적절히 선택할 수 있어야 한다. 음성인식 엔진의 성능이 수시로 변경될 수 있기 때문에 표준 인터페이스를 빠른 개발을 진행할 수 있도록 표준 포맷을 제안하였다.

Speech recognition in car noise environments using multiple models according to noise masking levls (잡음 마스킹 레벨에 따른 복수 모델을 이용한 자동차 소음환경에서의 음성인식)

  • 정회인
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.60-64
    • /
    • 1998
  • 음성인식 시스템의 실용화 과정에서 훈련환경과 테스트 환경의 불일치로 인한 인식성능의 저하는 반드시 극복되어야 할 문제이다. 본 논문에서는 잡음 tR인 입력음성의 비음성구간에서 잡음레벨을 추정하여 음성 스펙트럼에서 추정된 잡음레벨을 빼는 스펙트럼 차감법고 스펙트럼 영역에서 미리 정해진 마스킹 레벨보다 낮은 에너지 값을 마스킹 레벨로 올려주는 잡음 마스킹을 함께 사용함으로써 훈련 환경과 테스트환경의 불일치를 줄이는 방법을 제안한다. 그리고 복수의 마스킹 레벨에 대한 모델들을 미리 만들어 두고 추정된 잡음 레벨에 따라 적합한 마스킹 레벨의 보델을 사용하여 인식을 수해?는 다중 모델 방법을 적용하였다. 자동차 소음환경에서 두 가지 마스킹 레벨에 대한 모델을 이용한 화자독립고립단어 인식 실험을 통하여 본 논문에서 제안한 방식은 정차중 무시동 환경에서 95.8%, 정차중 시동 환경에서 95.6%, 한적한 도로환경에서 92.8%, 복잡한 시내도로 환경에서 89.6%, 고속도로 환경에서 74.4%의 인식성능을 나타내었으며, 평균 90.7%의 성능을 얻을 수 있다.

  • PDF

A Study on Speaker Adaptation in Continuous Digits Speech Recognition (연속숫자 음성인식에서 화자 적응에 관한 연구)

  • 최광표
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.319.2-322
    • /
    • 1998
  • 본 논문에서는 반음절 단위 HMM을 이용한 연속 숫자 음성인식 시스템의 2단계로 이루어지는 화자 적응 알고리즘을 수행하였다. 음성인식 시스템에서 사용되는 훈련데이터의 양이 많더라도 발성속도, 발성크기 등의 화자 발성 습관에 따라 화자독립 음성인식 시스템에서는 많은 문제점들이 발생하게 된다. 불특정 화자를 대상으로 한 음성 인식에 있어서 개인차에 의한 변동을 대처하는 방법으로 유효한 음향적 특성을 추출하기 위해 스펙트럼의 동적인(Dynamic) 특성을 주로 이용하고 있다. 따라서 본 논문에서는 화자 적을 기법의 하나인 frequency warped spectral matching 방법을 연속숫자 음성 인식시스템에 적용하였으며, 이때 인식에 의한 적절한 화자별 스케일링 계수 선정 방법을 수행하여 오인식률이 감소함을 확인하였다.

  • PDF

Acoustic Analysis of Respiration and Phonation Method

  • 문영일;정성민;김문정
    • Proceedings of the KSLP Conference
    • /
    • 1998.11a
    • /
    • pp.180-180
    • /
    • 1998
  • 목소리를 많이 사용하는 사람들에서 발생되는 음성장애는 대부분 잘못된 발성방법으로 인한 후두의 과긴장으로 인해 야기되는 것으로, 흡기 및 호기를 자발적으로 조절할 수 있는 호흡방법과 성대 및 주변 근육의 긴장을 줄이도록 하는 훈련하는 음성치료가 주된 치료 방법으로 대두되고 있다. 지금까지 음성치료의 효과는 주로 청음인지적(perceptual) 측면에서 많이 논의되어 왔으며 객관적인 자료는 아직까지 별로 없는 상태이다. 더욱이 호흡 및 발성 방법에 따른 음성 분석은 미진한 상황이다. (중략)

  • PDF

Pulmonary Functionn and the Maximal Inspiratory and Expiratory Pressure, and Maximum Phonation Time Before and After the Specially Programmed Training (호흡훈련보조기구를 이용한 호흡훈련 전 후의 폐기능 호흡근력과 최대발성지속시간의 변화)

  • 남도현;최홍식;안철민
    • Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics
    • /
    • v.14 no.2
    • /
    • pp.88-93
    • /
    • 2003
  • Whether respiratory muscle training is of benefit to the singing students is controversial. The purpose of the study is to investigate pulmonary function and the maximal inspiratory(MIP) and expiratory pressure(MET), and maximum phonation time in five female singing students before and after the specially programmed respiratory muscle training during 2 months. All singing students had average 4.8 years of formal classical voice training. Respiratory muscle training machine (Ultrabreath) was used to train respiratory muscle. Pulmonary function test data on simple pulmonary function, flow volume curve, static lung volumes are obtained from Vmax 6200. The MIP and MEP were measured using Spirovis, and the MPT were measured using hand-held stopwatch. Any pulmonary function test variables are not changed after respiratory muscle training. However, MIP and MEP were significantly increased between before and after respiratory muscle training. MPT increased significantly after training, compared to the pre-trained. MIP, MEP, and MPT after training in female singing students were 26%, 25% and 33% higher than those before training. The result indicated that the specially programmed respiratory muscle training is beneficial to improve respiratory muscle strength and vocal function without an increment in pulmonary function.

  • PDF

Development of smartphone-based voice therapy program (스마트폰기반 음성치료 프로그램 개발연구)

  • Lee, Ha-Na;Park, Jun-Hee;Yoo, Jae-Yeon
    • Phonetics and Speech Sciences
    • /
    • v.11 no.1
    • /
    • pp.51-61
    • /
    • 2019
  • The purpose of this study was to develop a smartphone based voice therapy program for patients with voice disorders. Contents of voice therapy were collected through analysis of mobile contents related to voice therapy in Korea, experts and users' demand survey, and the program was developed using Android Studio. Content needed for voice therapy was collected through analysis of mobile contents related to voice therapy. The user satisfaction evaluation for application was conducted for five patient with functional voice disorders. The results showed that the mobile contents related to voice therapy in Korea were mostly related to breathing, followed by voice and singing, but only 13 applications were practically practiced for voice therapy. Expert and user demand surveys showed that the patients and therapists both had a high need for content that could provide voice training in places other than the treatment room. Based on this analysis, 'Home Voice Trainer', an smartphone based voice therapy program, was developed. Home Voice Trainer is an application for voice therapy and management based on Android smartphones. It is designed to train voice therapy activities at home that have been trained offline. In addition, the records of voice training of patients were managed online so that patients can maintain voice improvement through continuous voice consulting even after the end of voice therapy. User evaluations show that patients are satisfied with the difficulty and content of voice therapy programs provided by home voice trainers, but lack of a portion of user interface, such as the portion of home button and interface between screens. Further study suggests the clinical application of home voice trainer to the patients with voice disorders. It is expected that the development study and the clinical application of smart contents related to voice therapy will be actively conducted.