• 제목/요약/키워드: voiced/unvoiced classification

검색결과 21건 처리시간 0.028초

프레임 분류와 합성필터의 변형을 이용한 적은 지연을 갖는 음성 부호화기의 성능 (Improving LD-CELP using frame classification and modified synthesis filter)

  • 임은희;이주호;김형명
    • 한국통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.1430-1437
    • /
    • 1996
  • 중간 주파수 대역(8kbps) 이하에서 적은 지연을 갖는 벡터여기 선형예측 음성 부호화기(LD-CELP)에 대하여 고려한다. 합성필터를 입력 프레임의 종류에 따라 변화시켜 음성 부호화기의 성능을 향상시키고자 한다. 먼저 프레임을 유성음과 무성음 그리고 개시 프레임으로 분류한다. 유성음과 무성음 프레임에서는 합성필터의 스펙트럼 포락을 음운의 특성에 적합하도록 변화시킨다. 개시 프레임에서는 합성필터의 성격을 바꾸어주기 위하여 바이어스 필터를 이용한다. 제안된 부호화기는 다른 적은 지연을 갖는 벡터여기 선형예측 음성 부호화기들에 비하여 비슷한 지연시간을 갖으면서 더 나은 음질을 제공하였다.

  • PDF

주파수대역 정보를 이용한 가변률 IMBE-LP 음성부호화 알고리즘 (Variable Rate IMBE-LP Coding Algorithm Using Band Information)

  • 박만호;배건성
    • 대한전자공학회논문지SP
    • /
    • 제38권5호
    • /
    • pp.576-582
    • /
    • 2001
  • MBE(Multi-Band Excitation) 음성부호화 방식은 프레임 단위로 유/무성음을 구분하는 기존의 분석-합성 방식과는 달리 한 프레임 내에서의 주파수 영역을 여러 대역으로 나누고, 각 대역별로 유/무성음 구간을 판정하여 그에 맞는 여기신호를 이용하여 음성을 합성한다. 이러한 MBE 방식은 프레임 단위로 유/무성음을 구분하는 기존의 방식들이 갖는 합성음의 buzziness 영향이나 잡음이 섞인 음성을 분석할 때 생길 수 있는 유/무성음 판정 오류의 영향을 최소화함으로써 음질 향상을 이룰 수 있다. IMBE-LP 방식은 MBE 방식을 이용하여 2.4 kbps의 저전송률을 얻기 위한 음성부호화 알고리즘으로 MBE 모델에서 사용되는 각 대역별 스펙트럼 정보를 LP(Linear Prediction) 계수로 모델링 한다. 본 연구에서는 2.4 kbps IMBE-LP 알고리즘을 구현하고, 주파수대역 정보를 이용하여 분석프레임의 음성특성에 따라 LP차수를 달리 함으로써 전송률을 줄일 수 있는 방법을 제안하고 실험하였다.

  • PDF

웨이브렛 변환을 이용한 음성신호의 유성음/무성음/묵음 분류 (Voiced/Unvoiced/Silence Classification of Speech Signal Using Wavelet Transform)

  • 손영호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.449-453
    • /
    • 1998
  • 일반적으로 음성신호는 파형의 특성에 따라 파형이 준주기적인 유성음과 주기성 없이 잡음과 유사한 무성음 그리고 배경 잡음에 해당하는 묵음의 세 종류로 분류된다. 기존의 유성음/무성음/묵음 분류 방법에서는 피치정보, 에너지 및 영교차율 등이 분류를 위한 파라미터로 널리 사용되었다. 본 논문에서는 음성신호를 웨이브렛 변환한 신호에서 스펙트럼상에서이 변화를 파라미터로 하는 유성음/무성음/묵음 분류 알고리즘을 제안하고 제안된 알고리즘으로 검출한 결과와 이에 따른 문제점을 검토하였다.

  • PDF

HMM 및 보정 알고리즘을 이용한 자동 음성 분할 시스템 (An Automatic Segmentation System Based on HMM and Correction Algorithm)

  • 김무중;권철홍
    • 음성과학
    • /
    • 제9권4호
    • /
    • pp.265-274
    • /
    • 2002
  • In this paper we propose an automatic segmentation system that outputs the time alignment information of phoneme boundary using Viterbi search with HMM (Hidden Markov Model) and corrects these results by an UVS (unvoiced/voiced/silence) classification algorithm. We selecte a set of 39 monophones and a set of 647 extended phones for HMM models. For the UVS classification we use the feature parameters such as ZCR (Zero Crossing Rate), log energy, spectral distribution. The result of forced alignment using the extended phone set is 11% better than that of the monophone set. The UVS classification algorithm shows high performance to correct the segmentation results.

  • PDF

숫자음성 자동 인식에 관한 일실험 (An Experiment of a Spoken Digits-Recognition System)

  • 오영환
    • 대한전자공학회논문지
    • /
    • 제15권6호
    • /
    • pp.23-28
    • /
    • 1978
  • 본 논문은 복수화자를 대상으로 한 숫자음성자동 시스템의 개발을 위한 기초 실험 결과의 보고다. ZCR, 대수 에너지등의 파라메터에 의한 무성자음의 분류, 선형예측에 의한 formant 주파수의 추정 및 그를 이용한 모음 및 유성자음의 인식을 행했다. 성인 남성 한 사람의 숫자음에 대한 인식실험의 결과, 음소(phoneme) 결합시의 과도 부분이나, 음소 인식 단계에서의 국소적 오인식을 흡수 할 수 있는 algorithm을 채용함으로써 양호한 인식 결과를 얻을 수 있었다. 앞으로, 독수제자를 대상으로 한 인식실험, 인식시스템의 개선과 한께 국어의 음성학적 제성질의 연구를 해 나갈 예정이다.

  • PDF

한국어 음소분리에 관한 연구 (A Study on the Phonemic Analysis for Korean Speech Segmentation)

  • Lee, Sou-Kil;Song, Jeong-Young
    • The Journal of the Acoustical Society of Korea
    • /
    • 제23권4E호
    • /
    • pp.134-139
    • /
    • 2004
  • It is generally known that accurate segmentation is very necessary for both an individual word and continuous utterances in speech recognition. It is also commonly known that techniques are now being developed to classify the voiced and the unvoiced, also classifying the plosives and the fricatives. The method for accurate recognition of the phonemes isn't yet scientifically established. Therefore, in this study we analyze the Korean language, using the classification of 'Hunminjeongeum' and contemporary phonetics, with the frequency band, Mel band and Mel Cepstrum, we extract notable features of the phonemes from Korean speech and segment speech by the unit of the phonemes to normalize them. Finally, through the analysis and verification, we intend to set up Phonemic Segmentation System that will make us able to adapt it to both an individual word and continuous utterances.

유, 무성음 및 묵음 식별에 관한 연구 (A study on the Voiced, Unvoiced and Silence Classification)

  • 김명환;김순협
    • 한국음향학회지
    • /
    • 제3권2호
    • /
    • pp.46-58
    • /
    • 1984
  • 본 논문은 한국어 음성 인식을 위한 유성음, 무성음, 묵음 식별에 관한 연구이다. 주어진 음성 구간을 3가지 음성 신호 부류로 식별하기 위하여 패턴 인식 방법을 사용하였다. 여기에 사용한 분석 파 라메타는 음성 신호의 영교차율, 대수 에너지, 정규화 된 첫 번째 자동 상관 계수, 선형 예측 분석에서 얻은 첫 번째 예측 계수, 그리고 예측 오차의 에너지이다. 한편 측정된 파라메타들이 다차원 가우스 확 률 밀도 함수에 따라 분산되었다는 가정하에서 어어진 최소 거리 법칙에 기본을 두고 음성 구간을 결정 하였다. 측정된 파라메타들을 여러 가지 방법으로 조합하여 식별한 결과 영교차율, 첫 번째 예측계수, 예측 오차의 에너지를 측정 파라메타로 사용했을 때 1%보다 적은 식별 오차율을 얻었다.

  • PDF

서브밴드에 기반한 스펙트럼 차감 알고리즘 (Subband Based Spectrum Subtraction Algorithm)

  • 최재승
    • 한국전자통신학회논문지
    • /
    • 제8권4호
    • /
    • pp.555-560
    • /
    • 2013
  • 본 논문에서는 거리측정, 로그전력, 실효치 방법에 의하여 유성음, 무성음, 묵음 구간을 검출하여, 서브밴드 필터에 의한 잡음제거 알고리즘을 제안한다. 제안한 알고리즘은 각 프레임에서 서브밴드 필터를 사용하여 잡음으로 오염된 음성신호로부터 백색잡음 및 도로잡음의 스펙트럼을 차감하는 방법이다. 본 실험에서는 Aurora-2 데이터베이스에 포함된 음성신호와 잡음신호를 사용하여 스펙트럼 차감 알고리즘의 결과를 나타낸다. 잡음에 의하여 오염된 음성신호에 대하여 신호대잡음비를 사용하여 본 알고리즘이 유효하다는 것을 확인한다. 실험으로부터 백색잡음에 대하여 평균 2.1 dB, 도로잡음에 대하여 평균 1.91 dB의 출력 신호대잡음비가 개선된 것을 확인할 수 있었다.

이산 웨이브렛 변환을 이용한 유효 음성 추출에 관한 연구 (A Study on Extracting Valid Speech Sounds by the Discrete Wavelet Transform)

  • 김진옥;황대준;백한욱;정진현
    • 정보처리학회논문지B
    • /
    • 제9B권2호
    • /
    • pp.231-236
    • /
    • 2002
  • 유효한 무성음이 시스템 노이즈와 합성됐을 경우 유효한 무성음 추출에 많은 어려움이 있으나 본 논문에서는 유효한 무성음 추출에 있어 이산 웨이브렛 변환을 이용한 신호 해석 내용을 기반으로 주파수와 그 위치를 블록별로 머징 규칙으로 유효 여부를 결정하기 때문에 노이즈가 많은 환경에서도 유효한 무성음 추출이 가능하다. 머징 알고리즘은 음성만으로도 처리 매개변수를 결정할 수 있고 시스템 잡음에 대하여서도 독립적이기 때문에 유효한 음성을 추출하는데 매우 효과적이다. 실험 결과를 통하여 유효한 음성 추출 처리 과정에서 보다 향상된 결과를 보이고 있으며 특히 고주파 노이즈에 대한 강한 적응력을 제시하고 시스템 구현에도 용이한 시스템 튜닝을 가능케 한다.

이산 웨이브렛 변환을 이용한 유효 음성 추출을 위한 머징 알고리즘 (A Merging Algorithm with the Discrete Wavelet Transform to Extract Valid Speech-Sounds)

  • 김진옥;황대준;백한욱;정진현
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권3호
    • /
    • pp.289-294
    • /
    • 2002
  • 데이타로부터 유효한 음성 데이타를 추출하는 것은 음성 인식분야에서 중요하다. 본 논문의 음성 추출 기술은 빠른 연산이 가능하며 음성의 전처리 과정에 적합한 이산 웨이브렛 변환을 사용하고 있으며, 이산 웨이브렛 변환의 복수 해상도 해석 특징을 이용한 머징 알고리즘으로 유효한 음성을 추출하고 노이즈 제거를 동시에 구현한다. 머징 알고리즘은 음성만으로도 처리 매개변수를 결정할 수 있고 또한 시스템 잡음에 대하여서도 독립적이기 때문에, 유효 음성을 추출하는데 매우 효과적이다. 그리고 머징 알고리즘은 시스템 잡음에 대한 적응 특성을 갖고 탁월한 노이즈 분리 특성을 갖는다.