• Title/Summary/Keyword: 음명료도

Search Result 86, Processing Time 0.02 seconds

Speech Synthesis for the Korean large Vocabulary Through the Waveform Analysis in Time Domains and Evauation of Synthesized Speech Quality (시간영역에서의 파형분석에 의한 무제한 어휘 합성 및 음절 유형별 규칙합성음 음질평가)

  • Kang, Chan-Hee;Chin, Yong-Ohk
    • The Journal of the Acoustical Society of Korea
    • /
    • v.13 no.1
    • /
    • pp.71-83
    • /
    • 1994
  • This paper deals with the improvement of the synthesized speech quality and naturality in the Korean TTS(Text-to-Speech) system. We had extracted the parameters(table2) such as its amplitude, duration and pitch period in a syllable through the analysis of speech waveforms(table1) in the time domain and synthesized syllables using them. To the frequencies of the Korean pronunciation large vocabulary dictionary we had synthesized speeches selected 229 syllables such as V types are 19, CV types are 80. VC types are 30 and CVC types are 100. According to the 4 Korean syllable types from the data format dictionary(table3) we had tested each 15 syllables with the objective MOS(Mean Opinion Score) evaluation method about the 4 items i.e., intelligibility, clearness, loudness, and naturality after selecting random group without the knowledge of them. As the results of experiments the qualities of them are very clear and we can control the prosodic elements such as durations, accents and pitch periods (fig9, 10, 11, 12).

  • PDF

Pronunciation error types and sentence intelligibility of Korean EFL learners (영어 학습자의 발음 오류 유형과 발화 명료도의 관계 연구)

  • Kim, Hyun-Jin
    • English Language & Literature Teaching
    • /
    • v.10 no.3
    • /
    • pp.159-175
    • /
    • 2004
  • This paper investigated the types of errors on English pronunciation and intelligibility of Korean EFL students, and the relationship between the pronunciation accuracy and intelligibility. Thirty one students were evaluated by six English native speakers in terms of overall intelligibility and accuracy In five areas such as nuclear stress, word stress, syllable structure, consonants and vowels. According to the findings of the study, pronunciation errors were made by the subjects more frequently In word stress than any other area of pronunciation accuracy. The Pearson correlation analysis showed that intelligibility was related with word stress, syllable structure, consonants and vowels, and the stepwise multiple regression analysis indicated that, among the above five areas of pronunciation accuracy, word stress best accounted for the intelligibility of a given sentence. In the conclusion, the importance of teaching pronunciation of in those five areas with a special focus on word stress was emphasized m terms of intelligibility.

  • PDF

Review of Standard Sound Quality Assessment Methods for the Transmitted and Processed Sounds (음질 평가법의 표준과 연구 동향 - 전송 처리음 분야)

  • Oh, Wongeun
    • The Journal of the Acoustical Society of Korea
    • /
    • v.32 no.3
    • /
    • pp.214-226
    • /
    • 2013
  • Assessing the quality of audio signals is an important consideration in making high quality sounds and various methods have been developed. This paper provides a general framework of sound quality and a technical overview of the international standard methods which are described in ITU-T, ITU-R, IEC and ANSI Recommendations in the speech intelligibility, speech quality, and audio quality areas. In addition, some recent findings and future works are included.

A Study on Performance of Speech Recognition & Acoustic Parameter in Car Environment (자동차 주행 환경에서의 음성 인식 성능 및 음향 특성의 검토)

  • Lee Kwang-Hyun;Choi Dae-Lim;Kim Young-Il;Kim Bong-Wan;Lee Yong-Ju
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.269-272
    • /
    • 2004
  • 주행 상태에서의 자동차 내부 음 환경은 다양한 소음 및 구조적 요인으로 인하여 음성에 대한 정상적인 전송 특성을 갖기 어렵다. 이는 음원으로부터 음성 입력 장치(Microphone)에 이르기까지의 채널 왜곡에 기인한 문제로써, 실제 주행 환경에서의 음성 인식 성능에 대해서도 심각한 악영향을 초래한다. 본 논문에서는 주행 소음의 크기에 따른 채널별 음성 왜곡 정도에 따른 명료도를 음성 전달 지수인 STI(Speech Transmission Index)를 통하여 분석하고 그 결과를 음성 인식률과 상호 비교하였다. 그리고 수음 패턴에 따른 명료도 척도와 음성 인식 성능과의 상관성을 검토하고, 이를 통해 단일 채널 환경에서 최적의 마이크로폰 위치에 대하여 고찰해 보았다. 실험 결과, 주행 중의 소음 환경에서도 음성의 명료도 척도와 인식률과의 관계는 높은 상관성이 얻어짐을 알 수 있었고, 각 채널 간의 성능 편차 패턴도 주행 환경에 따라 비슷한 양상을 보이는 것으로 나타났다.

  • PDF

Assessment of Synthesized Speech by Text-to-Speech Conversion (Text-to-Speech 합성음 품질 평가)

  • 정유현
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1993.06a
    • /
    • pp.98-101
    • /
    • 1993
  • 본 논문은 한국전자통신연구소 음성응용연구실에서 개발한 문자-음성변환 시스팀(Text-to-Speech Conversion System)의 음질개선 연구의 일환으로 Phoneme-Balanced Words 110개에 대해서 개선전 시스팀(V.1)과 개선 후 시스팀(v.2)을 대상으로 각각 실시한 명료도 실험결과에 대하여 기술하고 있다. 본 실험의 목적은 연구개발자 입장에서 합성음 개선에 대한 정량적 성과 및 문제점 파악을 위한 진단형 평가이며 남자 5명, 여자 5명을 대상으로 1회 실시한 청취 실험결과 V.1에 대해서는 최저 37.3%(41개) ~ 최고 55.5%(61개)이고, V.2에 대해서는 최고 39.1%(43개) ~ 최고 60.9%(67개) 결과를 얻었다.

  • PDF

Acoustic Evaluation of Seoul Arts Center Concert Hall (예술의 전당 음악당의 음향특성 분석)

  • 안철용
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.49-52
    • /
    • 1998
  • 콘서트홀의 음향상태를 평가하기 위해서는 설문지를 통하여 주관적인 선호도를 조사하는 방법과 측정을 통하여 객관적인 지표를 뽑아내는 방법이 있다. 콘서트홀의 음향특성에 영향을 주는 가장 중요한 객관적 지표로서는 친밀도, 공간감, 잔향시간, 명료도, 음의 따뜻함, 라우드니스 등을 들 수가 있다. 국내에서 가장 대표적인 콘서트홀이라고 할 수 있는 예술의 전당 음악당에 대해서 위의 개관적 지표 중 5가지 요소를 실제 측정을 통해 추출하였다. 그 결과 예술의 전당 음악당은 친밀도와 공간감 면에서 조금 부족한 면을 보여 주었고 나머지 3가지 요소에 있어서는 클래식 연주에 적합한 콘서트홀로서의 결과를 보여 주었다. 공간감과 친밀도를 향상시키기 위해서는 음악당 천장에 반사판을 설치하는 것이 필요하다고 사료된다.

  • PDF

Development of an Electrolarynx Controlled by EMG (근전위 제어형 전기 인공후두의 시작)

  • 민혜정;봉정표;최홍식;윤형로
    • Proceedings of the KSLP Conference
    • /
    • 1996.11a
    • /
    • pp.91-91
    • /
    • 1996
  • 현재 시판되고 있는 전기 인공후두는 손으로 인공후두를 경부에 장착하고, 음의 intensity와 pitch를 변하기 위하여 스위치를 손가락으로 조절해야만 하는데, 실제 회화 중에 잘 조절한다는 것은 거의 불가능하므로, 음질과 명료도가 나쁘며, 발성을 의도했을 때 자유롭게 발성하는 것도 어렵다. 또한 회화 중에는 한손은 항상 전기 인공후두를 위해 사용해야 한다. 이러한 단점을 개선하기 위해, 본 연구에서는 흉골설골근 근전위에 의해 제어되는 인공후두를 제작하여 그 성능을 평가하였다. (중략)

  • PDF

Factor Analysis on Ajective Pairs for Compatibility Evaluation of Frequency Mixed Information Sounds (주파수혼합 정보음의 적합성평가를 위한 형용사 쌍의 요인분석)

  • Kim Wuon-shik;Kim Kyo-Heon;Jho Moon-Jae
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.325-328
    • /
    • 2001
  • 본 연구는 가전제품의 정보음을 평가할 수 있는 어휘 척도의 개발을 목적으로 행해졌다. 21명의 주부를 대상으로 8개의 주파수혼 정보음을 제시하여 각 정보음에 대해 30개의 형용사 쌍 체크리스트를 이용하여 5점 척도로 평가하게 하였다. 요인분석은 SPSS S/W를 이용하였고 요인추출 방법은 주성분법(principal component method)으로 하였으며 요인추출 갯수는 scree test와 최종요인구조의 심리적 해석에 기초하여 4개로 결정하였으며 해석의 용이성을 위하여 직교회전방법을 적용하였다. 가전제품의 경고음그룹 4개와 종료음그룹 4개로 구성된 주파수혼합 정보음의 적합성평가에 사용된 30개 형용사 쌍의 요인분석 결과, 4가지 요인구조로 가장 잘 설명할 수 있었으며, 첫 번째 요인은 긴박성 요인, 두 번째 요인은 명료성 요인, 세 번째 요인은 역능 요인, 네 번째 요인은 평가 요인으로 나타났다.

  • PDF

The Effects of Surface Diffusivity on the Room Acoustics Using Scaled Models (축척모델을 이용한 실의 확산성 영향평가)

  • Yeon Chul-Ho;Park Kye-Kyun;Haan Chan-Hoon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.451-454
    • /
    • 2000
  • 실의 음향성능을 규명하기 위하여 많은 음향인자가 개발되어지고 제시되어 왔다. 음향인자 중 확산은 실의 전반적인 음향성능에 매우 유용한 것으로 여겨져 왔다. 본 연구는 장방형의 형태를 가지고 체적과 마감재료가 같은 2종류의 축척모델을 제작하여 각각의 모델에서 RT, EDT, SPL, C, IACC 등을 측정하여 확산체의 유$\cdot$무에 따른 실의 실내음향 성능을 알아보고자 한다 실험결과 실내 표면의 확산성의 차이에 따라 표면의 확산성이 좋은 공간에서 초기음장에서 음에너지가 집중되고 분산되는 것을 입증하였다. 즉 확산성이 좋은 모델에서 잔향시간(RT)은 더 짧으나 초기감쇠시간(EDT)이 더 길게 나타남으로 인하여 음에너지의 분포가 실의 확산상태에 의하여 음의 발생이후 짧은 시간내에 집중하여 전달되고 있음을 증명하였다. 또한 실의 확산상태가 좋은 공간의 명료도가 확산이 되지 않은 실에 비하여 훨씬 더 좋은 결과를 보이고 있음을 나타냈다. 이상의 결과를 종합하여 볼 때 실내 표면의 확산성이 전반적인 실내 음장의 향상에 크게 기여하고 있음을 밝혀 냈다.

  • PDF

A Study on Improving Voice Quality and Pitch Searching of the VSELP Coder (VSELP 부호화기의 음질 및 주기탐색 개선에 관한 연구)

  • 성기철;문상재
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.19 no.4
    • /
    • pp.740-749
    • /
    • 1994
  • This paper presents method for improving the performance of the VSELP speech coder. The hybrid method is employed for pitch period searching. Pitch searching time is reduced and pitch detection error, caused by quantization error of excitation signal of encoder in VSELP coder, is reduced by this method. This paper also adopts a pitch period enhancement filter and an adaptive first order filter. In this result, pitch period searching time is reduced to 26%, and MOS of reconstructed speech signal is increased by 3.19 to 4.04.

  • PDF