• 제목/요약/키워드: Speech Enhancement Algorithm

검색결과 134건 처리시간 0.022초

음성강화를 위한 이동 평균 예측량 기반의 검출방법 최적화 (Optimization of Detection Method Using a Moving Average Estimator for Speech Enhancement)

  • 이수정;신계현;김순협
    • 대한전자공학회논문지SP
    • /
    • 제44권3호
    • /
    • pp.97-104
    • /
    • 2007
  • 적응 반향제거기는 휴대전화나 음성 인식 시스템과 같은 음성 통신 시스템에서 중요한 부분의 하나로 자리잡았다. 이러한 응용에서 반향경로는 긴 임펄스 응답을 가지게 된다. 본 논문에서는 음향반향제거를 위해 Moving-Average Least Mean Square(MVLMS) 알고리즘을 제안하였다. 유색 입력 모델을 이용한 실험 결과는 MVLMS 검출 알고리즘이 Least Mean Square 검출 알고리즘에 비해 수렴 성능이 우위에 있음을 입증하였다. MVLMS 알고리즘은 약간의 계산 복잡도 향상이 있지만, 표준 LMS 검출 알고리즘에 비해 월등한 안정성 향상을 가져온다.

잡음환경에서 Teager 에너지와 음성부재확률 기반의 음성향상 알고리즘 (Speech Enhancement Algorithm Based on Teager Energy and Speech Absence Probability in Noisy Environments)

  • 박윤식;안홍섭;이상민
    • 대한전자공학회논문지SP
    • /
    • 제49권3호
    • /
    • pp.81-88
    • /
    • 2012
  • 본 논문에서는 다양한 잡음환경에서 효과적인 잡음 제거 (NS, noise suppression)를 위한 새로운 음성향상 (speech enhancement) 알고리즘을 제안한다. 제안된 방법에서는 음성향상 알고리즘에서 잡음전력 갱신을 위한 음성검출 (VAD, voice activity detection)의 피쳐 (feature) 파라미터로서 오염된 음성신호를 기반으로 주파수 밴드 별로 도출되는 기존의 지역 음성부재확률 (LSAP, local speech absecne probability) 대신 오염된 음성신호의 Teager energy (TE)를 적용한 LSAP를 적용한다. 또한 적용된 TE operator의 성능을 개선하기 위하여 프레임 단위로 도출되는 전역 음성부재확률 (GSAP, global SAP)을 TE의 가중치 파라미터로서 적용한다. 제안된 알고리즘은 기존의 방법과 객관적인 실험을 통해 비교 평가한 결과 다양한 배경잡음 환경에서 향상된 성능을 보였다.

잡음 감소와 불협화음 제거를 통한 음성신호 향상 (Filtering of a Dissonant Frequency Combined with Noise Reduction for Speech Enhancement)

  • Sangki Kang;Lee, Youn-Jeong;Lee, Ki-Yong
    • The Journal of the Acoustical Society of Korea
    • /
    • 제23권1E호
    • /
    • pp.16-18
    • /
    • 2004
  • There have been numerous studies on the enhancement of the noisy speech signal. In this paper, I propose a completely new speech enhancement method, that is, a filtering of a dissonant frequency combined with noise reduction algorithm. The simulation results indicate that the proposed method provides a significant gain in audible improvement compared with the conventional method. Therefore if the proposed enhancement scheme is used as a pre-filter, the perceptual quality of speech is greatly enhanced.

잡음 환경에서의 음성인식을 위한 온라인 빔포밍과 스펙트럼 감산의 결합 (Combining deep learning-based online beamforming with spectral subtraction for speech recognition in noisy environments)

  • 윤성욱;권오욱
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.439-451
    • /
    • 2021
  • 본 논문에서는 실제 환경에서의 연속 음성 강화를 위한 딥러닝 기반 온라인 빔포밍 알고리듬과 스펙트럼 감산을 결합한 빔포머를 제안한다. 기존 빔포밍 시스템은 컴퓨터에서 음성과 잡음을 완전히 겹친 방식으로 혼합하여 생성된 사전 분할 오디오 신호를 사용하여 대부분 평가되었다. 하지만 실제 환경에서는 시간 축으로 음성 발화가 띄엄띄엄 발성되기 때문에, 음성이 없는 잡음 신호가 시스템에 입력되면 기존 빔포밍 알고리듬의 성능이 저하된다. 이러한 효과를 경감하기 위하여, 심층 학습 기반 온라인 빔포밍 알고리듬과 스펙트럼 감산을 결합하였다. 잡음 환경에서 온라인 빔포밍 알고리듬을 평가하기 위해 연속 음성 강화 세트를 구성하였다. 평가 세트는 CHiME3 평가 세트에서 추출한 음성 발화와 CHiME3 배경 잡음 및 MUSDB에서 추출한 연속 재생되는 배경음악을 혼합하여 구성되었다. 음성인식기로는 Kaldi 기반 툴킷 및 구글 웹 음성인식기를 사용하였다. 제안한 온라인 빔포밍 알고리듬 과 스펙트럼 감산이 베이스라인 빔포밍 알고리듬에 비해 성능 향상을 보임을 확인하였다.

양이형 음성 음질개선 시스템을 위한 온라인 잡음 상관도 추정 알고리즘 (On-line noise coherence estimation algorithm for binaural speech enhancement system)

  • 지유나;백용현;박영철
    • 한국음향학회지
    • /
    • 제35권3호
    • /
    • pp.234-242
    • /
    • 2016
  • 본 논문에서는 양이형 음성 음질개선 시스템에 적용 가능한 잡음 상관도 온라인 추정 알고리즘을 제안한다. 양이형 시스템에서 공간 상관도(spatial coherence) 정보를 이용해 잡음의 파워 스펙트럼을 추정하거나 음질 개선 이득을 형성하는 기술들이 다수 연구되어 왔다. 이때 잡음 상관도는 통상적으로 수학적으로 모델링된 실수의 고정 값을 사용하여왔다. 하지만 실생활에서 접하게 되는 잡음의 상관도는 음향 환경에 따라 변화하는 특성을 가지게 되며 이때 발생하는 오차는 음질 개선 알고리즘의 정확도를 떨어뜨리는 원인이 된다. 따라서 본 논문에서는 변화하는 잡음의 상관도를 온라인으로 업데이트하여 정확한 잡음 상관도를 추정함으로써 양이형 음질 개선 알고리즘의 성능을 향상 시키고자 하였다. 잡음의 상관도는 음성 부재 구간에서 업데이트 될 수 있으며 실험 결과 제안 알고리즘이 기존의 수학적 모델에 비해 음질 개선 알고리즘의 성능을 향상시킴을 볼 수 있다.

결정적/확률적 요소로의 음성 분해와 심리음향 모델 기반 잡음 제거 기법 (Speech Enhancement with Decomposition into Deterministic and Stochastic components and Psychoacoustic Model)

  • 조석환;유창동
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2007년도 하계종합학술대회 논문집
    • /
    • pp.301-302
    • /
    • 2007
  • A speech enhancement algorithm based on both a decomposition of speech into deterministic and stochastic components and a psychoacoustic model is proposed. Noisy speech is decomposed into deterministic and stochastic components, and then each component is enhanced preserving its individual characteristics. A psychoacoustic model is taken into account when enhancing the stochastic component. Simulation results show that the proposed algorithm performs better than some of the more popular algorithms.

  • PDF

이기종 음성 인식 시스템에 독립적으로 적용 가능한 특징 보상 기반의 음성 향상 기법 (Speech Enhancement Based on Feature Compensation for Independently Applying to Different Types of Speech Recognition Systems)

  • 김우일
    • 한국정보통신학회논문지
    • /
    • 제18권10호
    • /
    • pp.2367-2374
    • /
    • 2014
  • 본 논문에서는 이기종 음성 인식 시스템에 독립적으로 적용할 수 있는 음성 향상 기법을 제안한다. 잡음 환경 음성 인식에 효과적인 것으로 알려져 있는 특징 보상 기법이 효과적으로 적용되기 위해서는 특징 추출 기법와 음향 모델이 음성 인식 시스템과 일치해야 한다. 상용화된 음성 인식 시스템에 부가적으로 전처리 기법을 적용하는 상황과 같이, 음성 인식 시스템에 대한 정보가 알려져 있지 않은 상황에서는 기존의 특징 보상 기법을 적용하기가 어렵다. 본 논문에서는 기존의 PCGMM 기반의 특징 보상 기법에서 얻어지는 이득을 이용하는 음성 향상 기술을 제안한다. 실험 결과에서는 본 논문에서 제안하는 기법이 미지의 (Unknown) 음성 인식 시스템 적용 환경에서 기존의 전처리 기법에 비해 다양한 잡음 및 SNR 조건에서 월등한 인식 성능을 나타내는 것을 확인한다.

EM 알고리즘을 이용한 음성 파라미터 추정 및 향상 (Paper Title : Speech Parameter Estimation and Enhancement Using the EM Algorithm)

  • 이기용;강영태;이병국
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권2E호
    • /
    • pp.68-75
    • /
    • 1994
  • 신호처리의 많은 분야에서, 심하게 비가우시안 성질을 가지는 분포, 혹은 분포의 중간은 가우시안 특성을 가지지만 양 끝에서는 편차가 크게 나는 분포를 다루어야 하는 경우가 종종 있다. 이러한 편차에 효과적으로 대처하기 위하여 본 논문에서는 음성 신호의 여기 신호로서 혼합 분포(mixture distribution)을 고려한다. 이것은 음성 분석시 피치 주파수가 미치는 영향을 감소시키며, 배경 잡음을 제거하는 데에도 효과적이다. 음성 신호 파라미터의 추정 및 향상을 위하여 EM 알고리즘을 사용하묘, 향상 과정에서는 강인 칼만 필터링 기법을, 파라미터 추정 관정에서는 검출/추정 기법을 사용한다. 실험 결과, 본 논문에서 제안하는 알고리즘이 입력 신호대잡음비가 열악한 경우에 기존의 것보다 우수한 성능을 보인다.

  • PDF

청각기강의 모델을 이용한 음성강조 시스템 (Speech Enhancement System Using a Model of Auditory Mechanism)

  • 최재승
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.295-302
    • /
    • 2004
  • 음성 신호처리의 분야에서 잡음처리의 문제는 지금도 중요한 연구 과제이다. 특히 배경잡음이 음성의 인식율을 현저히 저하시키는 것은 오래 전부터 주목 받고 있다. 배경잡음으로는 실제 환경에 존재하는 비정상적인 다양한 잡음, 예를 들면 도로에서의 자동차의 주행잡음, 프린터의 구동잡음 등이 있다. 이런 종류에 대한 잡음 대책은 단순하지 않고, 종래의 위너 필터(Wiener filter) 등에 의한 선형적인 잡음제거 법보다도, 보다 고도한 잡음억제 기술이 필요하다. 본 논문에서는, 이러한 방법의 한 가지 시도로써 백색잡음 및 위에 기술한 비정상적인 배경잡음에 의해 열화된 음성을 상호억제로 불리는 인간의 청각기관에서의 잡음억제 기능 모델을 사용하여 음성강화 법의 알고리즘을 소개한다. 제안된 알고리즘은 스펙트럴 왜곡(SD)의 평가방법을 통하여 백색잡음 및 유색잡음에 대해서 효과적인 것을 보여준다.

강인한 음성향상을 위한 Minimum Statistics와 Soft Decision의 확률적 결합의 새로운 잡음전력 추정기법 (A Probabilistic Combination Method of Minimum Statistics and Soft Decision for Robust Noise Power Estimation in Speech Enhancement)

  • 박윤식;장준혁
    • 한국음향학회지
    • /
    • 제26권4호
    • /
    • pp.153-158
    • /
    • 2007
  • 본 논문에서는 비정상적인 잡음 환경에서 음성향상을 위한 새로운 잡음 추정 기법을 제시한다. 제안된 방법은 잡음 전력 추정을 위해 주파수 채널별 음성부재확률 (SAP, Speech Absence Probability)을 선택적 가중 파라미터로 적용하여 음성 구간에서는 기존의 Minimum Statistics (MS)에 의한 잡음전력 추정치에 비중을 두고 비음성 구간에서는 Soft Decision (SD)에 기반한 잡음전력 추정치를 선택하도록 기존의 알고리즘을 결합한다. 제안된 알고리즘의 성능은 다양한 잡음 환경에서 음성향상기법에 적용하여 주관적인 음질평가 결과에 의해 평가하여 기존의 MS 또는 SD에 기반한 방법보다 향상된 결과를 나타내었다.