• 제목/요약/키워드: Changing voice

검색결과 83건 처리시간 0.033초

Jitter 합성에 의한 음질변환에 관한 연구 (Voice quality transform using jitter synthesis)

  • 조철우
    • 말소리와 음성과학
    • /
    • 제10권4호
    • /
    • pp.121-125
    • /
    • 2018
  • This paper describes procedures of changing and measuring voice quality in terms of jitter. Jitter synthesis method was applied to the TD-PSOLA analysis system of the Praat software. The jitter component is synthesized based on a Gaussian random noise model. The TD-PSOLA re-synthesize process is used to synthesize the modified voice with artificial jitter. Various vocal jitter parameters are used to measure the change in quality caused by artificial systematic jitter change. Synthetic vowels, natural vowels and short sentences are used to check the change in voice quality through the synthesizer model. The results shows that the suggested method is useful for voice quality control in a limited way and can be used to alter the jitter component of voice.

음성 분석을 이용한 청자가 호감을 느끼는 목소리에 대한 규명 (Identification of Voice for Listeners who Feel Favor Using Voice Analysis)

  • 최지현;조동욱;정연만
    • 한국통신학회논문지
    • /
    • 제41권1호
    • /
    • pp.122-131
    • /
    • 2016
  • 현재와 같은 스마트 사회는 ICT 기술 및 통신 인프라 등의 발달로 말미암아 청자들이 느끼는 호감 있는 목소리가 과거와 달리 변하고 있다. 즉, 과거에는 크고, 강하고, 빠른 목소리를 호감 있는 목소리로 여겼다면 지금은 ICT 기술과 더불어 새로운 사회 문화가 이를 변화시키고 있다. 그러면 이제는 '현재와 같은 스마트 사회에서 어떤 목소리가 호감을 느끼는 목소리일까?'를 규명해 내는 것이 중요한 일 중 하나가 된다. 이를 위해 본 논문에서는 ICT 기술을 적용하여 청자들이 호감을 느끼는 목소리는 과연 어떤 목소리인지를 규명하였다. 연구는 크게 두 가지로 나누어 진행하였다. 첫째, 언어에 있어 소통과 관련된 요소들, 특히 정서적 기반의 말들이 실제 청자들의 호감도에 미치는 영향에 대한 실증 분석 작업을 정량화된 수치로 추출하였다. 이를 위해 일반인을 대상으로 한 실험을 행하였다. 둘째, 청자들이 호감을 느끼는 음성은 어떤 음성인지를 규명해 내는 작업을 수행하였다. 이를 위해 실제 사회에서 영향력이 있다고 인정되고 있는 사람들을 실험 대상으로 하여 이들 각 각의 음성 특징은 어떤 특징이 있는지를 규명하였다. 또한 이들 음성의 공통점은 무엇인가에 대한 규명 작업을 함께 행하고자 한다. 아울러 이들 각 각의 음성 특징 및 공통점을 정량적 그리고 시각적으로 나타내어 그 간 음성 호감도에 대한 연구가 가지고 있었던 문제점인 정성적인 방법의 한계를 극복하였다.

음성인식 기술을 이용한 대화식 언어 학습기 개발 (Development of Language Study Machine Using Voice Recognition Technology)

  • 유재택;윤태섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.201-203
    • /
    • 2005
  • The best method to study language is to talking with a native speaker. A voice recognition technology can be used to develope a language study machine. SD(Speaker dependant) and SI(speaker independant) voice recognition method is used for the language study machine. MP3 Player. FM Radio. Alarm clock functions are added to enhance the value of the product. The machine is designed with a DSP(Digital Signal Processing) chip for voice recognition. MP3 encoder/decoder chip. FM tumer and SD flash memory card. This paper deals with the application of SD ad SD voice recognition. flash memory file system. PC download function using USB ports, English conversation text function by the use of SD flash memory. LCD display control. MP3 encoding and decoding, etc. The study contents are saved in SD flash memory. This machine can be helpful from child to adult by changing the SD flash memory.

  • PDF

기본주파수와 성도길이의 상관관계를 이용한 HTS 음성합성기에서의 목소리 변환 (Voice transformation for HTS using correlation between fundamental frequency and vocal tract length)

  • 유효근;김영관;서영주;김회린
    • 말소리와 음성과학
    • /
    • 제9권1호
    • /
    • pp.41-47
    • /
    • 2017
  • The main advantage of the statistical parametric speech synthesis is its flexibility in changing voice characteristics. A personalized text-to-speech(TTS) system can be implemented by combining a speech synthesis system and a voice transformation system, and it is widely used in many application areas. It is known that the fundamental frequency and the spectral envelope of speech signal can be independently modified to convert the voice characteristics. Also it is important to maintain naturalness of the transformed speech. In this paper, a speech synthesis system based on Hidden Markov Model(HMM-based speech synthesis, HTS) using the STRAIGHT vocoder is constructed and voice transformation is conducted by modifying the fundamental frequency and spectral envelope. The fundamental frequency is transformed in a scaling method, and the spectral envelope is transformed through frequency warping method to control the speaker's vocal tract length. In particular, this study proposes a voice transformation method using the correlation between fundamental frequency and vocal tract length. Subjective evaluations were conducted to assess preference and mean opinion scores(MOS) for naturalness of synthetic speech. Experimental results showed that the proposed voice transformation method achieved higher preference than baseline systems while maintaining the naturalness of the speech quality.

말소리 변조 스크립트를 이용한 호감도 청취평가 특징 (Characteristics of the auditory evaluation of good impression using speech manipulation scripts)

  • 권순복
    • 말소리와 음성과학
    • /
    • 제8권4호
    • /
    • pp.131-138
    • /
    • 2016
  • This study analyzes the characteristics of good impression using speech manipulation scripts and investigates the characteristics of preferred speech voice. Fourty male and female college students participated in this study. They have been exposed to the Gyeongsang dialect spoken by their friends and family for more than 15 years. Two sample voices(1 male and 1 female), considered as giving good impression, were subject to voice analysis. Two students were asked to read the sample paragraph of 'Walking' and their voice samples were analyzed through Praat. The collected speech data were manipulated into 4 different sets by changing pitch level, degree of loudness and speech rate. First, both men and women received good impression more from pitch-lowered sound than from the original one. Second, men tended to receive good impression more from slightly louder voice than from the natural-pitched one. Third, it was shown that men often felt more drowned to a voice at slightly faster speech rate than at the original speech rate. Overall, both male and female listeners favored lower pitch over the original pitch. Men tended to prefer louder voice sound while women preferred less loud one. Men received better impression at a lower speech rate but women at a faster speech rate.

급성(急性) 후두염(喉頭炎)에 대(對)한 문헌적(文獻的) 고찰(考察) (A Literature Study on Acute Laryngitis)

  • 정창호;김윤희
    • 혜화의학회지
    • /
    • 제14권1호
    • /
    • pp.113-128
    • /
    • 2005
  • 1. Acute laryngitis is a hoarse voice or the complete loss of the voice because of irritation to the vocal folds. 2. Acute laryngitis belongs with the GeupHuEum, HuBi, HuPung in oriental medicine. 3. GeupHuEum is caused by wind and cold, weak of lung and kidney, evil energy of liver, sore throat, etc. It is treated with the methods of cooling lung and wetting, removing heat and changing phlegm, etc. 4. Hubi is caused by fire and wind, dampness, large lung. It is treated with the methods of removing heat and antidote, reinforcing and descending fire, bleeding by acupuncture, vomiting. 5. Hupung is caused by phlegm and heat of lung and stomach, wind and heat. It is treated with the methods of dispersing wind and removing heat and changing phlegm by medicine, acupuncture, moxibustion, vomiting, fumigation.

  • PDF

음성신호 분석 요소의 적용으로 헬륨가스 흡입이 음성 기관의 특성 변화에 미치는 영향 (The Effect of Helium Gas Intake on the Characteristics Change of the Acoustic Organs for Voice Signal Analysis Parameter Application)

  • 김봉현;조동욱
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.397-404
    • /
    • 2011
  • 본 논문에서는 헬륨가스 흡입에 따른 조음기관의 특성이 변화되는 것을 측정하기 위해 음성분석학적 요소의 적용을 통한 실험을 수행하였다. 헬륨가스는 기존에 잠수부가 사용하던 질소가스가 인체에 치명적인 공기 색전증을 유발하게 되면서 이를 극복하기 위한 대체 호흡용 가스로 사용되고 있다. 그러나, 헬륨가스는 명료도가 낮은 squeaky voice를 유발하기 때문에 잠수부들의 비정상적인 음성에 대한 해석에 어려움이 많다. 따라서, 헬륨가스가 음성기관에 미치는 영향을 음성분석학적 특성 변화로 측정하기 위해 헬륨가스 흡입 전과 후의 음성을 기반으로 피치 및 스펙트로그램 측정, 분석에 대한 실험을 수행하였다.

A New Control Method for an Adaptive Noise Canceller Using Stochastic difference between Voice and Noise Signals Power Change

  • Nishi, H.;Kakinoki, T.
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.2362-2367
    • /
    • 2005
  • This paper reports a technique for discriminating double talk and echo path change using the stochastic characteristics of power change for an adaptive noise canceller. The causes of rapid error increasing are double talk and echo path change. When the echo path is changed, the system corrects the impulse response in order to reduce the error. However, in the case of double talk, the system has to suspend the updating impulse response in order to maintain the quality of the voice signal. In the conventional system, it was difficult to discriminate between the two situations. In this research, the stochastic characteristics of the voice power change in the double talk period were experimentally verified to be different from the power change during echo path changing. Based on the results, a new double talk detection method is proposed.

  • PDF

음악제작을 위한 음성합성엔진의 활용과 기술 (Application and Technology of Voice Synthesis Engine for Music Production)

  • 박병규
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권2호
    • /
    • pp.235-242
    • /
    • 2010
  • 음악제작에 쓰이는 음성합성엔진은 악기 소리와 음색의 합성에 머물던 과거의 신디사이저와는 달리, 인간의 목소리를 각 음소에 따라 샘플화하여 탑재함과 동시에 각 음소의 연결을 주파수 영역 내에서 자연스럽게 처리함으로써 실제 사람이 노래하는 것과 같은 수준까지 도달하게 되었다. 사용자들은 이러한 음성합성엔진을 음악제작에 국한하여 쓰지 않고 캐릭터를 활용한 콘서트, 영상제작, 음반, 모바일 서비스 등 2차 창작물로 새로운 음악의 형태를 창조하며 문화적 패러다임을 바꾸어 나가고 있다. 현재 음성합성엔진 기술은 악보 편집기를 통하여 사용자가 원하는 음과 가사, 그리고 음악적 표현 파라미터를 입력한 뒤, 실제 가성 샘플을 데이터베이스에서 가져와 합성엔진에서 발음들을 조합, 연결하여 노래하는 것을 가능하게 한다. 이러한 컴퓨터음악 기술의 발전으로 인해 파생된 새로운 음악 형태들은 문화적으로 큰 반향을 불러일으키고 있다. 이에 따라 본 논문은 구체적 활용 사례를 살펴보고 합성기술을 탐색함으로써, 사용자들이 음성합성엔진을 이해하고 습득하는 데 기여함과 동시에 그들의 다양한 음악제작에 도움이 되고자 한다.

VoiceXML을 이용한 음성 DB 수집 시스템 구현 (An Implementation of Speech DB Gathering System Using VoiceXML)

  • 김동현;노용완;홍광석
    • 인터넷정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.39-50
    • /
    • 2005
  • 음성 DB는 음성학, 음성인식, 음성합성 등을 연구할 때 가장 기본적으로 필요한 요소이다. 음성 DB의 양과 질이 개발하고자하는 시스템의 성능을 좌우한다고 할 정도로 음성 DB의 중요성 및 역할은 막중하다. 최근 음성포탈을 비롯한 다양한 전화 서비스 기술의 발달로 인하여 전화 음성 DB 수집의 필요성이 시급한 상황이다. 기존 CTI 분야의 IVR 애플리케이션 전화음성 DB 수집 시스템은 C/C++언어나 전용 개발 도구를 사용하여 이루어져 왔으며, 이로 인하여 각 응용서비스간 자원의 재활용이 어려운 실정이며 많은 인력과 시간을 필요하다는 문제점을 가지고 있다. 그러나, VoiceXML의 전화 음성 DB 수집시스템은 XML에 내포된 태그형식을 갖는 언어로써 쉽고, 간단한 문법체계를 가지고 있어 조금만 노력을 기울이면 손쉽게 작성할 수 있어 인력과 시간을 절약할 수 있는 장점을 가지고 있다. 또한 단지 웹서버에 연결된 DB의 내용만을 변경함으로써 다양한 전화 음성 DB를 수집할 수 있는 장점을 가지고 있다. 본 논문에서는 음성인식이나 음성합성 등 음성정보처리기술의 개발에 가장 중요한 요소인 음성 DB를 Voiceful을 사용하여 전화 음성 DB를 수집하는 시스템을 소개한다.

  • PDF