• 제목/요약/키워드: 환경잡음

검색결과 1,907건 처리시간 0.034초

잡음 환경 음성 인식을 위한 심층 신경망 기반의 잡음 오염 함수 예측을 통한 음향 모델 적응 기법 (Model adaptation employing DNN-based estimation of noise corruption function for noise-robust speech recognition)

  • 윤기무;김우일
    • 한국음향학회지
    • /
    • 제38권1호
    • /
    • pp.47-50
    • /
    • 2019
  • 본 논문에서는 잡음 환경에서 효과적인 음성 인식을 위하여 DNN(Deep Neural Network) 기반의 잡음 오염 함수 예측을 이용한 음향 모델 적응 기법을 제안한다. 깨끗한 음성과 잡음 정보를 입력으로 하고 오염된 음성에 대한 특징 벡터를 출력으로 하는 DNN을 학습하여 비선형 관계를 갖는 잡음 오염 함수를 예측한다. 예측된 잡음 오염 함수를 음향모델의 평균 벡터에 적용하여 잡음 환경에 적응된 음향 모델을 생성한다. Aurora 2.0 데이터를 이용한 음성 인식 성능 평가에서 본 논문에서 제안한 모델 적응 기법이 기존의 전처리, 모델 적응 기법에 비해 일치, 불일치 잡음 환경에서 모두 평균적으로 우수한 성능을 나타낸다. 특히 불일치 잡음 환경에서 평균 오류율이 15.87 %의 상대 향상률을 나타낸다.

잡음 마스킹 레벨에 따른 복수 모델을 이용한 자동차 소음환경에서의 음성인식 (Speech recognition in car noise environments using multiple models according to noise masking levls)

  • 정회인
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.60-64
    • /
    • 1998
  • 음성인식 시스템의 실용화 과정에서 훈련환경과 테스트 환경의 불일치로 인한 인식성능의 저하는 반드시 극복되어야 할 문제이다. 본 논문에서는 잡음 tR인 입력음성의 비음성구간에서 잡음레벨을 추정하여 음성 스펙트럼에서 추정된 잡음레벨을 빼는 스펙트럼 차감법고 스펙트럼 영역에서 미리 정해진 마스킹 레벨보다 낮은 에너지 값을 마스킹 레벨로 올려주는 잡음 마스킹을 함께 사용함으로써 훈련 환경과 테스트환경의 불일치를 줄이는 방법을 제안한다. 그리고 복수의 마스킹 레벨에 대한 모델들을 미리 만들어 두고 추정된 잡음 레벨에 따라 적합한 마스킹 레벨의 보델을 사용하여 인식을 수해?는 다중 모델 방법을 적용하였다. 자동차 소음환경에서 두 가지 마스킹 레벨에 대한 모델을 이용한 화자독립고립단어 인식 실험을 통하여 본 논문에서 제안한 방식은 정차중 무시동 환경에서 95.8%, 정차중 시동 환경에서 95.6%, 한적한 도로환경에서 92.8%, 복잡한 시내도로 환경에서 89.6%, 고속도로 환경에서 74.4%의 인식성능을 나타내었으며, 평균 90.7%의 성능을 얻을 수 있다.

  • PDF

스펙트럼 차감법과 잡음 마스킹의 hybrid 방식을 이용한 잡음환경에서의 음성인식 (Speech Recognition in the Noisy Environments using Hybrid Method of Spectral Subtraction and Noise Masking)

  • 권영욱
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.343-346
    • /
    • 1998
  • 잡음환경에서의 음성인식 성능향상을 위하여 본 논문에서는 스펙트럼 차감법 이후에 남아 있는 잔여 잡음으로 인한 mismatch를 극복하는 수단으로 기존의 스펙트럼 차감법에서의 flooring factor를 사용하는 대신에 target 잡음레벨을 이용하여 잡음 마스킹을 적용하는 스펙트럼 차감법과 잡음 마스킹의 hybrid 방식을 사용한다. 이 방법은 낮은 SNR에서 개선되지 않는 기존의 잡음 마스킹이 가지는 약점을 극복하고 동시에 스펙트럼 차감버에서의 잔여 잡음 문제를 완화시킬 수 있었다. 특히 시간/주파수 영역 smoothing을 적용함으로써 스펙트럼 차감법과 잡음 마스킹의 hybrid 방식의 적용 이후에도 여전히 남아 있는 일부 잡음을 추가적으로 감소시켰으며, 더욱 향상된 인식성능을 얻을 수 있었다.

  • PDF

음성인식률 향상을 위한 잡음 제거

  • 황동환
    • 전기의세계
    • /
    • 제51권12호
    • /
    • pp.22-25
    • /
    • 2002
  • 많은 연구를 통해 음성 인식은 잡음이 존재하지 않는 환경에서는 매우 높은 인식률을 보이고 있으며 실제로 여러 분야에서 응용되고 있다 하지만 여러 잡음이 존재하는 환경에서는 그 성능이 급격하게 저하되어 잡음 에 둔감한 인식기와 잡음 제거가 필수적이다. 본 내용에서는 독립 요소 기법에 기반 한 잡음 제거 기법을 소개하고 이를 칩으로 구현하고 그 결과를 고찰해 보겠다.

  • PDF

확률적 스펙트럼 차감법을 이용한 잡은 환경에서의 음성인식 (Noisy Speech Recognition using Probabilistic Spectral Subtraction)

  • 지상문;오영환
    • 한국음향학회지
    • /
    • 제16권6호
    • /
    • pp.94-99
    • /
    • 1997
  • 본 논문에서는 잡음환경에서의 음성인식을 위하여 잡음의 확률적 특성과 음성모델을 이용하는 확률적 스펙트럼 차감법을 제안한다. 기존의 스펙트럼 차감법은 음성이 존재하지 않는 구간에서 추정한 잡음을 잡음음성에서 차감하여 잡음을 제거함로, 추정한 잡음의 형태가 음성인식기에 입력되는 잡음음성에 포함된 잡음과 상이한 특성을 나타낼 경우에는 효과적인 잡음의 제거가 불가능하다. 이러한 단점을 보완하기 위해서 여러 가지 형태를 가지는 잡음의 원형을 사용하여, 잡음음성에서 잡음을 제거하는 방법을 사용하였다. 잡음의 확률적인 특성을 여러 개의 잡음원형으로 나타내므로, 스펙트럼 차감법은 입력음성에 대해서 확률적으로 수행되어 잡음이 제거된 다중의 스펙트럼을 출력하게 되고, 인식시에는 조용한 환경의 음성으로 학습된 음성모델에 따른 최적의 스펙트럼을 이용하여 인식을 수행한다. 또한 정적인 파라미터와 동적인 특징파라미터를 동시에 고려하여 잡음을 영향을 최소화하므로 보다 효과적인 잡음처리가 가능하다. 제안한 방법의 타당성을 실험적으로 검증하기 위해서, 잡음환경의 음성인식에 적용하였다. SNR 10 dB인 50개의 고립단어에 대한 실험결과, 잡음처리를 하지 않았을 경우 72.75%, 스펙트럼 차감법은 80.25%, 제안한 방법을 사용하였을 경우는 86.25%의 인식률을 얻음으로써, 효과적인 잡음처리 방법임을 확인할 수 있었다.

  • PDF

전파환경 연도별 변화 및 시간대별 변화 (Changes of radio environment per annum and hour)

  • 주은정;배차호;이중일
    • 한국전자파학회:학술대회논문집
    • /
    • 한국전자파학회 2000년도 종합학술발표회 논문집 Vol.10 No.1
    • /
    • pp.259-263
    • /
    • 2000
  • 21기 정보화사회를 맞이하여 전과서비스 사용의 증가로 인공전파잡음이 계속 증가하는 추세이므로 잡음원과 전파환경 분포를 파악하기 위하여 각 지역의 전파잡음레벨을 조사하고 있다. 그 중 년도별 전파잡음레벨의 변화와 시간에 따른 잡음레벨 변화를 분석해보니 주파수 대역에 따라 특징적인 변화를 보여주고 있다. 따라서 앞으로 주파수 스펙트럼분포와 잡음원과의 관계를 분석하여 전파환경 보호에 관한 대책을 세우고 원활한 전파서비스가 제공될 수 있도록 할 것이다.

  • PDF

신경망필터를 이용한 음질향상 (Speech Enhancement using the Neural Network Filter)

  • 김종우;공성곤
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 춘계학술대회 학술발표 논문집
    • /
    • pp.102-105
    • /
    • 2000
  • 본 논문에서는 잡음환경에서의 음성신호복원(Speech Enhancement) 시스템 구현을 목적으로 한다 이를 위한 적응필터로서 LMS(Least Mean Square)알고리즘 FIR필터를 제안한다. 또 정밀 필터로서 신경망 필터를 제안한다. 잡음환경에서의 음성신호 복원 시스템은 잡음에 의해 왜곡된 음성신호에서 잡음성분만을 제거함으로써 음성신호를 복원하는 시스템이다. 일반적으로 잡음은 시변특성과, 비선형적인 전달특성을 갖는다. 그러므로 파라미터가 고정된 필터로는 제어하기가 힘들다. 이러한 이유로 본 논문에서는 LMS알고리즘 적응필터를 적용한다. 신경망 필터는 오차 역전파 학습 알고리즘에 의해 오차를 최소화하는 방향으로 필터의 파라미터를 수정한다. 제안한 필터로 잡음환경에서의 음성신호복원 시스템을 구성하고, 실험을 통해 필터의 성능을 확인한다.

  • PDF

잡음환경에서의 바이모달 음성인식 (Bi-modal speech recognition in noisy environments)

  • 박병구
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.111-114
    • /
    • 1998
  • 기존의 음성인식시스템의 잡음환경에서 인식률의 한계를 극복하기 위해 음성신호뿐만이 아니라 입술정보를 결합하여 음성인식에 이용하여 바이모달(Bi-modal) 음성인식이 근래에 제안되어지고 있다. 그래서 바이모달 음성인식 시스템을 실제로 구현해보고 인식 실험을 수행해 보았다. 입술영상은 이미지에 근거한 입술모양을 파라메터화하여 인식실험에 사용하였으며 음성과 입술영상을 각각 인식한 후 인식스코어(Score)에 가중치를 적용하여 통합하는 방법을 사용하였다. 마지막으로 바이모달 음성인식의 잡음환경에서의 성능을 알아보기 위해 음성신호에 여러 레벨의 잡음을 섞어서 실험을 하고 잡음환경에서 인식률의 한계를 입술정보를 이용하여 극복할 수 있다는 것을 보이고자 한다.

  • PDF

잡음적응 변별학습 방식을 이용한 환경적응 (Environment Adaptation by Discriminative Noise Adaptive Training Methods)

  • 강병옥;정호영;이윤근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.397-398
    • /
    • 2007
  • 본 논문에서는 환경변화에 대해 강인하게 동작하는 음성인식 시스템을 위해 잡음적응 훈련과 변별학습 방식을 결합한 형태의 환경적응 방식을 제안한다. 다중환경 훈련과 잡음제거방식을 결합한 형태인 잡음적응 훈련 방식은 음성인식을 위한 MCE (Minimum Classification Error)의 목적과는 거리가 있고, 음성인식 시스템이 사용되는 모든 환경을 반영하는 것은 현실적으로 어렵다는 점에서 한계가 있다. 이에 잡음적응 훈련방식으로 훈련된 기본 음향모델을 목적환경에서 수집한 소량의 데이터를 이용한 변별학습을 통해 환경적응 모델로 변환함으로써 이러한 단점을 보완할 수 있는 잡음 적응 변별학습을 이용한 훈련방식을 제안한다.

  • PDF

프레임 단위의 AELMS를 이용한 잡음 제거 알고리즘 (Noise Reduction Algorithm using Average Estimator Least Mean Square Filter of Frame Basis)

  • 안찬식;최기호
    • 디지털융복합연구
    • /
    • 제11권7호
    • /
    • pp.135-140
    • /
    • 2013
  • 잡음 추정과 검출 알고리즘에서는 LMS Filter를 이용하여 변화하는 잡음 환경에 빠르게 적응할 수 있도록 한다. 하지만 LMS Filter는 잡음 추정을 위한 일정 시간 동안 적응 시간이 필요하며 신호의 변화가 일어날 경우 더 많은 적응 시간이 소요되는 단점을 가지고 있다. 따라서 이를 보완하기 위하여 프레임 단위의 AELMS Filter를 이용한 잡음 제거 방법을 제안한다. 본 논문은 잡음 환경에서 입력되는 신호를 프레임 단위로 분할하고 평균과 분산을 이용한 예측 LMS Filter를 구성하여 잡음을 제거하므로 잡음 환경이 변화하더라도 빠른 적응 시간으로 잡음을 제거한다. 또한 환경 잡음과 음성 신호가 혼합되어 입력될 때 잡음을 제거하여 음성의 고유 특성을 유지하고 음성 정보 손상을 줄이기 위한 방법이다. 프레임 단위의 AELMS Filter를 이용한 잡음 제거 방법으로 잡음 제거 성능을 평가하였다. 실험 결과 변화하는 환경 잡음을 제거하여 얻은 감쇠도가 평균 6.8dB 향상되었다.