• 제목/요약/키워드: 환경잡음

검색결과 1,907건 처리시간 0.026초

잡음 환경에서 심리음향모델 기반 음성 에너지 최대화를 이용한 음성 검출 방법 (Voice Activity Detection Method Using Psycho-Acoustic Model Based on Speech Energy Maximization in Noisy Environments)

  • 최갑근;김순협
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.447-453
    • /
    • 2009
  • 이 논문은 음성 에너지를 최대화 하여 낮은 SNR환경에서 음성 존재 여부를 판단하고 정확한 끝점을 검출하는 방법에 대한 것이다. 전통적인 VAD (Voice Activity Detection) 알고리듬은 잡음의 추정치를 이용해 음성과 비음성 구간을 선택하여 낮은 SNR환경이나 비안정 잡음환경에서는 정확하지 못한 문턱값으로 인해 부정확한 끝점검출을 하였다. 또한 잡음의 시간적 변화를 반영하기 위해 비교적 큰 분석 구간을 두어 계산량이 증가함에 따라 실제 응용에 적합하지 않은 단점이 있다. 이 논문은 잡음환경에서 정확한 음성 구간의 검출을 위해 심리음향 모델에 기반 한 바크 스케일 필터 뱅크를 이용하여 주어진 프레임에서 음성 에너지를 최대화 시키고 잡음을 억제하는 SEM-VAD (Speech Energy Maximization-Voice Activity Detection) 방법을 제안하였다. 다양한 잡음환경, SNR 15 dB, 10 dB 5 dB 0 dB 상황에서 실험한 결과 SNR의 변화에 안정적인 문턱값을 얻었고, 음성 검출을 위한 실험에서 자동차 잡음 환경에 대한 PHR (Pause Hit Rate)은 모든 잡음 환경에서 100%의 정확도를 보였고, FAR (False Alarm Rate)는 SNR 15 dB와 10 dB에서는 0%, SNR 5 dB에서 5.6% SNR 0 dB에서 9.5%의 성능을 보였다.

다중경로 레일리 패이딩과 임펄스 잡음 환경에서 DS/CDMA 시스템의 성능 분석 (Performance Analysis of DS/CDMA System in Multipath Rayleigh fading and Impulsive Noise Environments)

  • 강희곡;조성준;조성언
    • 한국전자파학회:학술대회논문집
    • /
    • 한국전자파학회 2000년도 종합학술발표회 논문집 Vol.10 No.1
    • /
    • pp.292-296
    • /
    • 2000
  • 본 논문에서는 임펄스 잡음과 다중경로 레일리 페이딩이 함께 존재하는 최악의 채널 환경에서 비동기 DS/CDMA BPSK 시스템의 오율식을 유도하고 수치계산 하여 BER 성능을 분석하였다. 그 결과, 비교적 낮은 신호 대 잡음 전력비 영역에서 시스템의 BER 성능은 임펄스 잡음의 영향으로 크게 열화되지만 페이딩의 영향은 거의 없다. 그러나, 임펄스 잡음의 영향이 작아지는 높은 신호 대 잡음 전력비에서는 페이딩에 의해서 BER 성능이 결정된다. 다중사용자의 간섭도 낮은 신호 대 잡음 전력비 영역에서는 BER 성능에 거의 영향을 미치지 못하지만 높은 신호 대 잡음 전력비 영역에서는 BER 성능을 좌우한다 그러나, 실제 이동통신 시스템에서는 비교적 낮은 신호 전력을 사용하므로, 임펄스 환경에서 페이딩을 경감하기 위한 방법이나, 다중사용자 간섭을 줄이기 위한 기법을 적용하더라도 성능 개선이 거의 되지 않는다.

  • PDF

히스토그램 처리방법을 이용한 시변 잡음환경에서의 음성인식 (Speech Recognition in Time-varying Noisy Environments using the Histogram Technique)

  • 권영욱;김형순
    • 한국음향학회지
    • /
    • 제17권3호
    • /
    • pp.47-51
    • /
    • 1998
  • 잡음 환경에서의 음성인식을 위해서는 일반적으로 전처리 과정에서 잡음의 스펙트 럼을 잘 추정할 필요가 있다. 본 논문에서는 시변잡음 환경에서 히스토그램 처리방법에 의 해 잡음의 스펙트럼을 추정하고 이를 제거하는 방법으로 스펙트럼 차감법을 사용하였다. 히 스토그램 처리방법은 음성/비음성 구간의 구분을 할 필요가 없으며 서서히 변화하는 잡음의 스펙트럼도 추정할 수 있다는 점에서 기존 방식에 비해 장점을 지닌다. 다양한 SNR 조건하 에서 시간에 따라 에너지, 그리고 주파수가 변화하는 유색 가우시안 잡음을 부가시킨 음성 에 대해, 화자독립 고립단어 인식실험을 수행하였다. 실험결과, 히스토그램 처리방법에 기반 을 둔 스펙트럼 차감법을 적용할 경우가 기존의 잡음 스펙트럼 추정방법에 비해 인식성능이 우수하였다.

  • PDF

잡음이 첨가된 연속음성에서의 자동 음절분할 알고리즘 (Automatic Syllable Segmentation Algorithm in Noise Additional Continuous Speech)

  • 김영섭;김창근;차영동;이광석;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2006년도 하계 학술대회 논문집
    • /
    • pp.17-20
    • /
    • 2006
  • 본 논문에서는 잡음이 첨가된 연속음성에서의 자동 음절분할을 위해 기존에 사용되고 있는 특징 파라미터인 단구간 에너지 이외에 잡음에 강인한 특성을 가지고 있는 새로운 특징인 스펙트럼 밀도비교척도와 의사역행렬을 이용한 선형판별함수를 제안한다. 기존에 사용되는 단구간 에너지는 잡음이 없는 환경에서는 좋은 성능을 나타내지만 잡음환경에서는 그렇지 못하다. 반면에 논문에서 제안한 척도들은 반대의 성능을 가지므로 주변잡음의 크기에 따라 각각의 파라미터를 적절한 가중치로 조합하는 음절구간 결정함수와 유한상태 머신을 추가로 사용면 무 잡음 환경뿐만 아니라, 잡음이 첨가된 연속음성에서도 일정수준 이상의 음절구간을 분리해 낼 수 있다.

  • PDF

잡음, 나카가미 페이딩과 대수정규 shadowing이 존재하는 환경하에서 셀룰라 이동 무선 시스템의 동일 채널 간섭 확률 (Cochannel Interference Probability of Cellular Mobile Radio Systems in the Environments of Noise and Nakagami Fading plus Lognormal Shadowing)

  • 심용회;조성언;조성준
    • 한국통신학회논문지
    • /
    • 제19권9호
    • /
    • pp.1668-1679
    • /
    • 1994
  • 나카가미 페이딩과 가우스 잡음이 함께 존재하는 환경과 가우스 잡음과 나카가미 페이딩 및 대수정규 shadowing이 함께 존재하는 환경의 두가지 환경하에서 동일채널 간섭확률을 구하였다. 잡음과 나카가미 페이딩이 함께 존재하는 환경하에서의 동일채널 간섭확률은 이런 해석에 의해 구하였으며 잡음과 나카가미 페이딩 및 shadowing이 존재하는 환경하에서의 동일채널 간섭확률은 컴퓨터 시뮬레이션에 의해 구하였다. 그리고 각 경우에 대한 스펙트럼 효율을 검토하였다. 결과로부터 동일채널간섭확률은 주파수재사용 거리가 작은 경우는 잡음, noise, shadowing의 영향이 복합적으로 나타나지만 주파수재사용 거리가 커질수록 path loss의 증가로 인하여 간섭과 전력이 감소되어 희망파의 페이딩 심도와 잡음에 의해 좌우된다는 것을 알 수 있었다.

  • PDF

스펙트럼사상을 이용한 잡음환경음성인식에 관한 연구 (A Study on Speech Recognition in Noise Environment Using Spectral Mapping)

  • 이기영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.128-131
    • /
    • 1993
  • 정적지도 화자적응기법에서 스펙트럼 거리에 의존하는 비선형적인 스펙트럼사상법을 이용하여 잡음환경에서의 음성인식방법에 관하여 연구한 결과, Top2에서 인식율의 향상을 얻어 그 유효성을 확인하였다. 본 연구에서는 스펙트럼 거리에 의존하지 않는 선형 스펙트럼 사상법을 제시하고 그에 의한 잡음환경의 음성인식결과를 비선형적인 스펙트럼 사상법에 의한 결과와 비교하였다. 그 결과, 인식율이 개선되었을 뿐만 아니라, Top1에서도 인식율이 향상되어 선형 스펙트럼사상법이 잡음환경음성인식방법으로 효과적인 방법임을 확인하였다.

  • PDF

잡음에 강인한 음성인식을 위한 환경 파라미터 변환에 관한 연구 (A Study on Environment Parameter Compensation Method for Robust Scpeech Recognition)

  • 강철호;홍미정
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.195-199
    • /
    • 2003
  • 최근 음성 인식 기술의 발전으로 음성 인식 시스템의 실용화가 점차 증가함에 따른 가장 큰 문제점은 음성 인식기의 인식환경과 학습환경과의 차이로 인해 음성 인식기의 성능이 급격히 떨어지는데 있다. 이를 해결하기 위해 본 논문에서는 기존의 잡음처리 방법 중 CMS(Cepstral Mean Subtraction)와 환경 잡음 (부가 잡음, 채널 왜곡)을 동시에 추정하는 최신 모델 보상 기법인 VTS(VectorTaylorSeries)를 소개하고 그 성능을 비교하였다.

  • PDF

스펙트럼 변이를 이용한 Soft Decision 기반의 음성향상 기법 (Robust Speech Enhancement Based on Soft Decision Employing Spectral Deviation)

  • 최재훈;장준혁;김남수
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.222-228
    • /
    • 2010
  • 본 논문에서는 비정상적인 배경 잡음 환경에서 음성향상을 위한 신호의 스펙트럼 변이 (Spectral Deviation)을 적용한 Soft Decision 기반의 잡음전력 수정 기법을 제안한다. 기존의 Soft Decision 기반의 잡음전력 추정에 있어서 잡음신호의 정상성(Stationarity)을 가정한 스무딩 파라미터를 사용하여 잡음전력을 추정하고 갱신하였지만, 잡음신호의 주파수적인 특성이 상대적으로 빠르게 변하는 비정상적인 환경에서는 강인하지 못한 단점을 가지게 된다. 본 논문에서는 신호의 스펙트럼 변이를 추정하여 정상적인 잡음 환경과 비정상적인 잡음 환경에 따라 적응적으로 잡음전력을 추정하고 갱신하여 잡음신호에 의해 오염된 음성신호를 향상시킨다. 제안된 알고리즘은 다양한 배경 잡음 환경에서 객관적인 음질측정 방법인 ITU-T P.862 perceptual evaluation of speech quality (PESQ)에 의해서 평가되었으며, 기존의 Soft Decision 기반의 음성 향상 기법과 비교하여 보다 향상된 성능을 보여주었다.

신호 에너지의 지각적인 간섭현상에 의한 컨벌루션 노이즈의 해석에 관한 연구 (The Study for Perceptual Convolutional Noise by the Masking Effect of Signal)

  • 김헌중;한헌수;홍민철;차형태
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2002년도 정기총회 및 학술대회
    • /
    • pp.187-190
    • /
    • 2002
  • 본 논문에서는 잡음 환경에서의 사람의 청각 시스템에서의 신호 에너지에 대한 지각(perception) 패턴을 나타내는 임계 대역에서의 여기(excitation)에너지와 이러한 신호 에너지 사이의 지각적인 간섭 효과를 나타내는 마스킹 특성을 이용하여 지각적인 컨벌루션 잡음(covolutional noise)해석을 통한 잡음 제어 기법을 연구하였다. 이러한 지각적 컨벌루션 잡음은 지각 영역에서 잡음 에너지에 의한 간섭 현상의 영향을 나타내며, 신호의 지각 적인 특성 변화 및 부가 잡음(additional noise) 제어 후에 신호 내에 잔존하는 잔여 노이즈를 반영하는 것이다. 실험 결과 부가 잡음 제어 필터와 컨벌루션 잡음 제어 필터가 대등한 노이즈 제어 성능을 나타내었으며, 다양한 잡음 환경에서 이러한 지각 영역에서의 부가 잡음 제어와 컨벌루션 잡음 제어를 통해 높은 SNR비 개선과 더불어 MOS 측정을 통해서도 높은 음질을 보장할 수 있음을 확인 할 수 있었다.

  • PDF

고차 통계를 이용한 잡음 환경에서의 음성신호의 피치 추출과, 유, 무성음 판별 (Pitch Determination and Voiced/Unvoiced Decision of Noisy Speech Based on the Higher-Order Statistics)

  • 신태영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.55-60
    • /
    • 1995
  • 고차 통계 방법을 이용하여 잡음이 섞인 음성 신호에서 피치를 구하는 방법과 이를 이용하여 유성음 및 무성음 구간을 구분하는 방법을 구현하고 그 결과를 기술하였다. 고차 통계의 일종인 3차 cumulant 함수의 경우 Gaussian 또는 대칭적인 분포를 갖는 잡음 신호를 음성신호로부터 효과적으로 분리하여 제거시키는 특징을 가지고 있으며, 이러한 특징을 이용하면 잡음 환경에서 여러 가지 음성 특징 파라메터들을 보다 신뢰도 높게 추정할 수 있다. 본 논문에서는 dam성 신호의 3차 cumulant 함수의 자기상관함수로부터 음성의 피치 주기를 추정하였으며, 피치 위치에서의 normalized peak 크기에 의해 유성음과 무성음을 구분하였다. 또한 성능 비교를 위해 음성 신호 자체의 자기 상관 함수로부터 역시 피치 주기 및 유성음/무성음 구분을 수행하였다. 백색 및 유색 Gaussian 잡음 환경에서의 음성의 피치 주기 추정 실험 결과 SNR가 낮은 경우에 3차 cumulant를 이용한 방법이 2차 통계에 비해 우수한 성능을 나타내었다. 또한 동일한 잡음 환경에서의 유성음/무성음 판별 시험에서도 3차 cumulant를 이용한 방법이 기존의 2차 통계를 이용한 방법에 비해 성능이 크게 향상된 결과를 얻었다.

  • PDF