• Title/Summary/Keyword: 음색

Search Result 147, Processing Time 0.021 seconds

A study on the vocal characteristics of spoken emotional expressions (구어체 정서표현에 있어서의 음성 특성 연구)

  • 이수정
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 1999.11a
    • /
    • pp.277-291
    • /
    • 1999
  • 현 연구에서는 음성합성의 기초자료 수집을 위하여 대화체 감정표현의 음성적인 패러미터를 찾아내려고 시도하였다. 이를 위하여 일단 가장 자주 사용되는 대화체 감정 표현자료가 수집되었고 이들 표현을 발화할 때 가장 주의를 기울이는 발성의 특징들이 탐색되었다. 구어체적 감정표현의 타당한 데이타베이스를 작성하기 위하여 20대와 30로 연령층을 구분하여 자료를 수집, 분석하였다. 그 결과 다양한 감정표현의 발화특성들은 음의 강도, 강도변화, 그리고 음색이 중요한 기준으로 작용하는 것으로 나타났다. 다차원 분석 결과 산출된 20대와 30대의 음성표현의 도면은 개별정서들이 음성의 잠재차원 상에서 상당한 일관된 특징을 지님을 보여 주었다.

  • PDF

Acoustic Features and Structural Disorders in Korean Singers (가수들에 대한 음향음성학적 특성 및 성대병변에 대한 분석)

  • 홍기환
    • Proceedings of the KSLP Conference
    • /
    • 1998.11a
    • /
    • pp.211-212
    • /
    • 1998
  • 소리란 인간만이 가지는 특유한 발성구조에 의해 생성되는 음으로서 주로 언어소통을 목적으로 발성된다. 소리의 생성은 일정한 성문하압과 성대의 긴장 및 내전운동이 형성되면 공기가 성대를 통과하면서 성대가 진동하여 발생되며 발성된 음은 후두, 인두 구강등의 발성기관에서 공명되고 증폭되므로서 특이한 음색을 가진 소리로 발생되는 것이다. 그 중에서 노래소리란 이러한 발성기관의 종합적이고 이상적인 조화에 의해 발생되는 소리의 극치이다. 그러나 이러한 발성기관이 이상적으로 조화되지 않을 경우 소리의 변화 및 성대에 병변이 초래되어 치료를 요하는 경우도 있다. (중략)

  • PDF

A Study on the Effects of Speech Training for Adults Focusing on the Analysis of Voices Before and After Speech Training (성인 스피치교육 전후 효과에 관한 목소리변화스펙트로그램 비교 연구)

  • Chung, Eun-Ee;Lee, Sang-Ho
    • Journal of Digital Contents Society
    • /
    • v.18 no.6
    • /
    • pp.1049-1056
    • /
    • 2017
  • This study focused on the changes in the voices in determining the effects of speech training. This study aimed to make more visible and scientific evaluation of the changes in the voices among the substantial effects obtained from speech training. As a result, some objective differences from before the speech training could be found in the voice of every learner. Each learner showed gradual technical improvement in a variety of vocal elements, including resonance and timbre, accuracy of pronunciation, pause; that is, the voice became more powerful, more accurate pronounced, more pausing and more stable than before the speech training. This study determined if speech training could change a voice and the results are expected to help speech learners participate actively in speech training and see their speech ability improved.

The Characteristics of the Vocalization of the Female News Anchors (여성 뉴스 앵커의 발성 특성 분석)

  • Kyon, Doo-Heon;Bae, Myung-Jin
    • The Journal of the Acoustical Society of Korea
    • /
    • v.30 no.7
    • /
    • pp.390-395
    • /
    • 2011
  • This paper covers the studies on common voice parameters through the voice analysis of female main news anchors on weekday evening by the station, and differences of relative voices and sounds among stations. To examine voice characteristics, 6 voice parameters were analyzed and it showed anchors of each station had distinctive characteristics of voices and phonations over all fields except the speech rate, and there were also differences in sound systems. As major analysis parameters, basic pitch, tone of the 1st formant and pitch ratio, level of closeness by pitch bandwidth, type of sentence closing through average pitch position within pitch bandwidth, average speech rate, and acoustic tone analysis by energy distribution by frequency band were used. Analyzed values and results could be referred to and utilized in the criteria of phonation characteristics for domestic female news anchors.

Theory of Acoustic Quanta and its Application on Sound Design (음향 양자 이론의 사운드 디자인적 응용)

  • Koo, Jahwan
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.19 no.9
    • /
    • pp.420-426
    • /
    • 2018
  • Acoustic Quanta, which British Physicist Dennis Gabor created, is the theoretical background for granular synthesis and has influenced many computer music artists and sound designers. Acoustic Quanta is a very short sound burst, lasting only 1 to 100 ms. Granular synthesis is a sound synthesis technique which slices original sound into sound grains and re-combines them into a new acoustic event. Concept of sound grain is borrowed from the acoustic quanta. Granular Synthesis can make very unique sound, so that it can be useful in many ways, especially in sound design. This paper presents concept of acoustic quanta and granular synthesis. It then discusses making a synthesizer as an implementation of synchronous granular synthesis and its applications on sound design. As a result, the duration of acoustic quanta should range between 0.239 and 33.367 ms, in consideration of audible frequencies, which is different from the original concept of the acoustic quanta.

Investigation of Timbre-related Music Feature Learning using Separated Vocal Signals (분리된 보컬을 활용한 음색기반 음악 특성 탐색 연구)

  • Lee, Seungjin
    • Journal of Broadcast Engineering
    • /
    • v.24 no.6
    • /
    • pp.1024-1034
    • /
    • 2019
  • Preference for music is determined by a variety of factors, and identifying characteristics that reflect specific factors is important for music recommendations. In this paper, we propose a method to extract the singing voice related music features reflecting various musical characteristics by using a model learned for singer identification. The model can be trained using a music source containing a background accompaniment, but it may provide degraded singer identification performance. In order to mitigate this problem, this study performs a preliminary work to separate the background accompaniment, and creates a data set composed of separated vocals by using the proven model structure that appeared in SiSEC, Signal Separation and Evaluation Campaign. Finally, we use the separated vocals to discover the singing voice related music features that reflect the singer's voice. We compare the effects of source separation against existing methods that use music source without source separation.

Implementation of the Voice Conversion in the Text-to-speech System (Text-to-speech 시스템에서의 화자 변환 기능 구현)

  • Hwang Cholgyu;Kim Hyung Soon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.33-36
    • /
    • 1999
  • 본 논문에서는 기존의 text-to-speech(TTS) 합성방식이 미리 정해진 화자에 의한 단조로운 합성음을 가지는 문제를 극복하기 위하여, 임의의 화자의 음색을 표현할 수 있는 화자 변환(Voice Conversion) 기능을 구현하였다. 구현된 방식은 화자의 음향공간을 Gaussian Mixture Model(GMM)로 모델링하여 연속 확률 분포에 따른 화자 변환을 가능케 했다. 원시화자(source)와 목적화자(target)간의 특징 벡터의 joint density function을 이용하여 목적화자의 음향공간 특징벡터와 변환된 벡터간의 제곱오류를 최소화하는 변환 함수를 구하였으며, 구해진 변환 함수로 벡터 mapping에 의한 스펙트럼 포락선을 변환했다. 운율 변환은 음성 신호를 정현파 모델에 의해서 모델링하고, 분석된 운율 정보(피치, 지속 시간)는 평균값을 고려해서 변환했다. 성능 평가를 위해서 VQ mapping 방법을 함께 구현하여 각각의 정규화된 켑스트럼 거리를 구해서 성능을 비교 평가하였다. 합성시에는 ABS-OLA 기반의 정현파 모델링 방식을 채택함으로써 자연스러운 합성음을 생성할 수 있었다.

  • PDF

Implementation of Transaural filter method for sound localization (공간 음상정위를 위한 Transaural 필터 구현기법)

  • Cheung Wan-Sup;Lee Jeung-Hoon;Bhang Seungbeum;Kim Soonhyob
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.207-212
    • /
    • 1999
  • 본 논문에서는 공간에 위치한 음원으로부터 양 귀에 들리는 음향을 좌우 대칭형 스피커를 이용하여 재현하는 기술에 대한 문제점, 즉 좌우 스피커와 양 귀의 음압전달 특성에 수반되는 Cross-talk 제거와 음향학적 모델 선정에 대한 문제점들을 우선 소개한다. 이러한 문제점을 해결할 수 있는 Transaural 필터의 모델 제시와 본 모델의 음향학적 특성을 고찰한다. 본 연구에서는 인간 청각 기관의 공간 인지량적 인자인 ILB(interaural Level Difference)와 ITD(Tnteraural Time Difference)의 개념을 이용한 새로운 Cross-talk 제거 방법과 그리고 청각기관의 "Masking" 특성을 이용한 Transaural 필터의 진폭 보상 방법을 새로이 제안한다. 끝으로 제안된 기법은 음색 왜곡과 음질 저하를 최소화할 수 있는 장점 뿐 아니라 현장 음향 기사들이 직접 음향제작에 적용할 수 있는 장점 또한 제공한다.

  • PDF

Study for Audio Watermarking Using Echo Signal (반향 신호를 이용한 오디오 워터마킹에 관한 연구)

  • 오현오;김현욱;윤대희;차일환
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.767-770
    • /
    • 2000
  • 본 논문에서는 고음질 오디오 신호에 임의로 삽입된 반향(Echo)신호가 음질에 미치는 영향을 조사하고, 이를 이용한 오디오 워터마킹 기법에 대해 다룬다. 일반적으로 오디오 신호에 반향을 첨가하게 되면 음색이 더욱 풍부해지는 효과를 얻을 수 있지만. 이 때 삽입된 반향신호의 시간 지연과 크기가 충분히 작을 경우에는 심리 음향모델의 시간영역 마스킹 효과에 의해 지각되지 않을 수도 있다 한편 오디오 신호의 구간별로 임의 삽입된 반향의 시간지연을 검출할 수 있다면, 이를 이용한 정보 감춤(data hiding)및 워터마킹 기법에 활용할 수 있다. 반향신호를 이용하여 원 신호에 정보를 삽입하게 되면 가우시안 잡음이나 PN 시퀸스를 이용하는 경우처럼 오디오 신호에 이질적인 잡음을 첨가하지 않기 때문에 청감 특성상 유리하며, 오디오 신호 고유의 통계적 특성을 유지 할수 있는 장점이 있다. 그러나 반향의 첨가가 음질의 왜곡은 초래하지 않으면서 정보의 검출이 가능하도록 하기위해서는 원 신호의 특성에 따른 반향 첨가 기술이 요구된다.

  • PDF

A Study on the Voice Conversion Algorithm with High Quality (고음질을 갖는 음색변경에 관한 연구)

  • 박형빈;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.157-160
    • /
    • 2000
  • In the generally a voice conversion has used VQ(Vector Quantization) for partitioning the spectral feature and has performed by adding an appropriate offset vector to the source speaker's spectral vector. But there is not represented the target speaker's various characteristics because of discrete characteristics of transformed parameter. In this paper, these problems are solved by using the LMR(Linear Multivariate Regression) instead of the mapping codebook which is determined to the relationship of source and target speaker vocal tract characteristics. Also we propose the method for solved the discontinuity which is caused by applying to time aligned parameters using Dynamic Time Warping the time or pitch-scale modified speech. In our proposed algorithm for overcoming the transitional discontinuities, first of all, we don't change time or pitch scale and by using the LMR change a speaker's vocal tract characteristics in speech with non-modified time or pitch. Compared to existed methods based on VQ and LMR, we have much better voice quality in the result of the proposed algorithm.

  • PDF