• 제목/요약/키워드: vocal track

검색결과 13건 처리시간 0.03초

포먼트 주파수 추출 알고리즘들의 성능 비교평가 연구 (A Comparative Study on Formant Frequency Extraction Performances)

  • 손성용;김상진;김영민;한민수
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 5월 학술대회지
    • /
    • pp.141-144
    • /
    • 2003
  • In this paper, we compared formant frequency extraction algorithms with various conditions, and show their performances. The formant frequency is the resonance frequency which is decided by the vocal tract characteristics. It is related with phonemes, or characteristics of the physical condition of the vocal track. Since the speech signal is influenced by both the sound source and the vocal tract, it is difficult to calculate the exact formant frequencies. Many studies on the formant frequency extraction had been executed already Besides, any new formant frequency extraction algorithm is hardly found recently.

  • PDF

목소리에 의한 성격규명에 관한 연구 (A Study on Searching proof of character in voice)

  • 서지호;배명진
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2003년도 추계학술대회 논문집
    • /
    • pp.131-132
    • /
    • 2003
  • 사람의 음성이 나오기까지 화자가 전달하고자 하는 생각이 언어학적 구조로 바뀌고 이 과정에서 생각을 나타내는 적절한 단어나 구가 선택된다. 또 특정언어의 문법규칙에 의해 어순을 배열하고, 전체 의미에서 중요한 면을 강조하기 위해 피치ⅰ), 억양이나 강세와 같은 특성들을 첨가하는 등의 처리 절차를 통하게 된다. 음성은 기본적으로 여기ⅱ) 성분과 성도ⅲ) 성분으로 구분할 수 있다. 성도는 인두강과 구강을 합쳐서 일컫는다. 따라서 입 모양을 어떻게 하느냐에 따라서도 같은 말이라도 명료성에 영향을 미치게 되고 이러한 특성은 자신감이 넘치고 외향적인 모습으로 비춰지게 된다. 본 논문에서는 입의 모양에 따른 음성의 특징과 발성습관을 통해서 나타나는 사람의 성격을 알아보았다.

  • PDF

연속음성신호의 SNR 추정기법에 관한 연구 (A Study on SNR Estimation of Continuous Speech Signal)

  • 송영환;박형우;배명진
    • 한국음향학회지
    • /
    • 제28권4호
    • /
    • pp.383-391
    • /
    • 2009
  • 음성 신호처리 환경에서 잡음이 섞인 신호를 개선할 목적으로 음성향상 기법이 많이 이용되고 있다. 잡음추정 알고리즘은 변화하는 환경에 빠르게 적응할 수 있어야 하며 음성신호의 영향을 줄이기 위해 음성신호가 존재하지 않는 구간에서만 잡음의 파워를 갱신한다. 이러한 방법은 음성구간검출이 선행되어야 한다. 그러나 잡음에 열화된 음성신호에 묵음구간이 존재하지 않을 경우, 위와 같이 음성검출을 통한 묵음구간에서의 잡음 추정 방법 및 SNR 추정 방법이 적용될 수 없다. 본 논문에서는 묵음구간이 존재하지 않는 연속음성신호에서 SNR을 추정하는 기법을 제안한다. 유성음의 안정구간에서는 단구간 내 피치의 변화가 매우 작아 피치주기에 따른 음성신호의 파형이 유사하게 나타난다. 따라서 잡음이 음성에 부가되었을 때 피치주기에 따른 인접파형의 유사도를 통해 SNR을 추정한다. 무성음에서는 잡음의 영향이 수신신호의 성도성분 추정에 영향을 미치기 때문에 잡음환경에서 추정된 성도성분과 수신신호 스펙트럼 간의 거리를 이용하여 SNR을 추정한다. 마지막으로, 음성신호의 에너지가 유성음에 대부분 분포하기 때문에, 부가성 잡음 환경에서 유성음의 에너지를 음성신호의 에너지로 근사화하여 SNR을 추정할 수 있다.

Vocal EQ'ing 방법에 관한 연구 (A Study on Vocal EQ'ing Method)

  • 김민주
    • 한국산학기술학회논문지
    • /
    • 제19권12호
    • /
    • pp.569-573
    • /
    • 2018
  • 음악은 수많은 악기가 내는 사운드로 구성되어 있다. 그 중에서도 사람의 목소리인 '보컬' 사운드는 그 어떤 악기보다도 가장 즉각적으로 잘 인지되는 파트이다. 곡에서 중요한 부분을 차지하는 보컬을 여러 사운드 속에서 완벽하게 믹싱하는 데에는 많은 요소들이 고려되어야 하고 또 다양한 단계들이 존재한다. 그 단계 중 EQ에 집중하여 연구하고자 한다. 따라서 본 논문에서는 EQ작업과 관련된 사항들에 대해 EQ의 개념 및 종류로 부터 시작해 보컬 레코딩 시 EQing방법, Subtractive EQ, Additive EQ 등에 관해 알아보도록 할 것이다. EQ는 사운드 믹싱 과정에서 특히나 보컬 사운드를 다루는데 있어서 가장 중요한 도구 중 하나로 손꼽힌다. 보컬 이큐잉은 보컬이 완벽히 트랙 믹스 안에 어우러지게 하기 위해 각 주파수 대역을 부스트 하고 또 컷팅하여 음색을 다듬는 과정이다. 프로페셔널한 보컬사운드를 얻기 위해서는 그 무엇보다도 자신이 스타일적으로 의도하는 사운드가 무엇인지 확실한 방향성을 가지고 가야하고 그를 위해 레퍼런스 트랙을 이용하는 것도 아주 효과적이다. EQing이외에도 컴프레션, 리버브, 코러스, 딜레이 등의 이펙터 작업과 백킹 보컬과 하모니의 조정 등의 다양한 복잡한 단계의 작업이 있고 그 또한 매우 중요한 작업들이다. 그러나 믹싱의 시작에 해당하는 작업인 EQing은 무엇보다도 그 중요도가 큰 관계로 위 사항들을 두루 고려하여 세밀한 작업을 하여야 할 것이다.

A Line Spectrum Frequency Pairs Representation for Spectral Envelop Quantization

  • Park, Youngho;Lee, Won-Cheol;Bae, Myung-Jin
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.787-790
    • /
    • 2000
  • This paper introduces a new type of representation of the LSPs as a promising alternative used for transmitting the LPC parameters. Major contribution in this paper is that the vocal track information embedded on the spectral envelope can be represented in terms of the reduced number of LSF compared tn the conventional. Hence, it provides a possibility that LPC parameters could be quantized at a reduced bit rate without causing any major spectral distortion. The simulation result illustrates the capability of the proposed LSPs representation as an efficient quantization method via a proper rejection of the redundant pairs of pole and zero along the unit circle.

  • PDF

국부 봉우리와 골에 의한 피치 검출과 퍼지를 이용한 화자 인식에 관한 연구 (A Study on Speaker Recognition using the Peak and valley pitch detection and the Fuzzy)

  • 김연숙;김희주;김경재
    • 한국정보통신학회논문지
    • /
    • 제8권1호
    • /
    • pp.213-219
    • /
    • 2004
  • 본 논문에서는 국부 봉우리와 골에 의한 피치 파라미터와 퍼지를 포함한 화자 인식 알고리즘을 제안한다. 음성의 패턴 인식에서 인식 성능을 저하시키는 시간 변동과 주파수 변동에 대한 문제를 해결하여 피치를 검출한다. 비선형적인 발성 시간에 따른 시간 변동의 폭을 모두 포함하기 위하여 음성 신호의 애매성을 보완할 수 있는 퍼지의 소속 함수를 이용하여 표준 패턴을 작성하고 퍼지 패턴 매칭을 이용하여 인식을 수행한다.

LSP parameter의 위치정보를 이용한 성도특성 평탄화기법 (On the Flattening Techniques of Vocal track characteristics by using position information of the LSP (Line Spectrum Pairs))

  • 김영규;민소연;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.171-174
    • /
    • 2002
  • 음성신호는 성문특성으로 인해 고주파 특성이 약화되는 경향이 있다. 이를 보상하기 위해 Pre-emphasis filter를 사용한다. 수식으로 표현하면 y(n)=s(n)-As(n-1) 와 같이 차분방정식으로 나타낼 수 있다. 여기서 A값은 보통 0.9에서 1사이의 값을 주로 사용한다. 그러나 Pre-emphasis filter는 고주파 특성을 보상하는 과정에서 극점과 같이 영점도 왜곡된다. 본 논문에서는 음성특성에 따른 LSP(Line Spectrum Pairs) 분포특성을 이용하여 영점을 보존하고 vocoder 및 coding에 필연적인 고주파 특성 혹은 저주파 특성을 강조한다.

  • PDF

음성천이구간에서의 성도 파라메타 시변추정에 관한 연구 (Time-varying Estimation of Vocal Track Parameters During the Speech Transition Regions)

  • 최홍섭
    • 한국음향학회지
    • /
    • 제16권2호
    • /
    • pp.101-106
    • /
    • 1997
  • 음성의 천이구간에서의 특징 파라메타를 찾아내기 위하여 본 논문에서는 AR모델을 사용하여 적응적으로 성문폐쇄구간을 찾은 후, 이를 제외한 구간에서 성도 파라메타를 추정함으로써 음원의 피치바이어스 영향을 제거하는 SSRLS(Sample Selective RLS)방법을 제안한다. 성능을 비교하기 위하여 합성음과 실제음에 대하여 포만트 추정실험을 했으며, 실험결과 제안된 방법이 WRLS 보다 우수함을 알 수 있었다.

  • PDF

피치 검출과 퍼지화 패턴을 이용한 숫자음 화자 인식에 관한 연구 (A Study on Number sounds Speaker recognition using the Pitch detection and the Fuzzified pattern)

  • 김연숙;김희주;김경재
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.73-79
    • /
    • 2003
  • 본 논문에서는 피치 검출과 퍼지화 패턴 매칭을 포함하는 화자 인식 알고리즘을 제안한다. 음의 개성을 표현하는 피치를 이용한 피치 패턴을 사용하고 음성의 파라미터는 2진화 스펙트럼을 사용한다. 비선형적인 발성 시간에 따른 시간 변동의 폭을 모두 포함할 수 있도록 음성 신호의 애매성을 보완할 수 있는 퍼지의 소속 함수를 이용하여 표준 패턴을 작성하고 퍼지화 패턴 매칭을 이용하여 인식을 수행한다.

  • PDF

퍼지 이론을 이용한 한국어 및 영어 화자 인식에 관한 연구 (A Study on Korean and English Speaker Recognitions using the Fuzzy Theory)

  • 김연숙;김희주;김경재
    • 한국컴퓨터정보학회논문지
    • /
    • 제7권3호
    • /
    • pp.49-55
    • /
    • 2002
  • 본 논문에서는 피치 파라미터와 퍼지를 포함한 화자 인식 알고리즘을 제안한다. 음의 시간적인 특징을 이용하여 시간 영역에서 분해력을 높이고 주파수 영역에서 잡음에 강인함을 갖는 국부 봉우리와 골에 의한 피치 검출법을 제안하여 피치를 검출한다. 또한 화자 인식에서 음성 신호의 애매성을 보완할 수 있는 퍼지의 소속함수를 이용하여 표준 패턴을 작성하고 퍼지 패턴 매칭을 이용하여 인식을 수행한다.

  • PDF