• Title/Summary/Keyword: 비잡음 신호

Search Result 1,929, Processing Time 0.031 seconds

Robust Speech Enhancement Based on Soft Decision Employing Spectral Deviation (스펙트럼 변이를 이용한 Soft Decision 기반의 음성향상 기법)

  • Choi, Jae-Hun;Chang, Joon-Hyuk;Kim, Nam-Soo
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.47 no.5
    • /
    • pp.222-228
    • /
    • 2010
  • In this paper, we propose a new approach to noise estimation incorporating spectral deviation with soft decision scheme to enhance the intelligibility of the degraded speech signal in non-stationary noisy environments. Since the conventional noise estimation technique based on soft decision scheme estimates and updates the noise power spectrum using a fixed smoothing parameter which was assumed in stationary noisy environments, it is difficult to obtain the robust estimates of noise power spectrum in non-stationary noisy environments that spectral characteristics of noise signal such as restaurant constantly change. In this paper, once we first classify the stationary noise and non-stationary noise environments based on the analysis of spectral deviation of noise signal, we adaptively estimate and update the noise power spectrum according to the classified noise types. The performances of the proposed algorithm are evaluated by ITU-T P. 862 perceptual evaluation of speech quality (PESQ) under various ambient noise environments and show better performances compared with the conventional method.

Voice Activity Detection Algorithm using Wavelet Band Entropy Ensemble Analysis in Car Noisy Environments (자동차 잡음 환경에서 웨이브렛 밴드 엔트로피 앙상블 분석을 이용한 음성구간 검출 알고리즘)

  • Lee, G.H.;Lee, Y.J.;Kim, M.N.
    • Journal of Korea Multimedia Society
    • /
    • v.16 no.9
    • /
    • pp.1005-1017
    • /
    • 2013
  • Voice activity detection is very important process that voice activity separated form noisy speech signal for speech enhance. Over the past few years, many studies have been made on voice activity detection, but it has poor performance in low signal to noise ratio environment or fickle noise such as car noise. In this paper, it proposed new voice activity detection algorithm using ensemble variance based on wavelet band entropy and soft thresholding method. We conduct a survey in a lot of signal to noise ratio environment of car noise to evaluate performance of the proposed algorithm and confirmed performance of the proposed algorithm.

Enhaced 2.4 kbps Harmonic Stochastic Excitation Coding for Time/Frequency Transitional Speech (시간/주파수 전이신호를 위한 향상된 2.4 kbps 하모닉 스토케스틱 여기 음성 부호화 방법)

  • 김종학;이인성
    • The Journal of the Acoustical Society of Korea
    • /
    • v.19 no.7
    • /
    • pp.53-58
    • /
    • 2000
  • 본 논문은 주파수 전이신호와 시간 전이 신호에 대해서 고조파 잡음 여기 방법과 시간 분리 여기 방법을 적용한 2.4 kbps 음성부호화 방법을 제안한다. 혼합 여기 부호화 방법은 주기 신호와 비 주기 신호를 효과적으로 표현하기 위해 하모닉 잡음 모델을 사용한다. 혼합신호에 대한 잡음 성분은 캡스트럴 분석 방법을 사용함으로써 추출되고, AR (Autoregressive Model) 모델에 의해 표현된다. 시간 전이구간 신호에서의 모호한 음성을 효과적으로 제거하기 위한 또 다른 방법이 제안된다. 제안된 시간 분리 방법은 시간 에너지 변화정도를 관찰함으로써 전이 시점을 감지하고 다른 시간 길이를 가지는 두 블록으로 분리하여 분석한다. 시간 분리 방법은 분석을 위한 비대칭 윈도우와 합성에서의 위상 합성 방법을 포함한다. 제안된 방법을 사용한 2.4 kbps 음성부호화 방법은 주관적 음질 평가에서 전이구간에서의 지각적 음질의 향상을 보여주었으며, 원본 음성 스펙트럼과의 고조파 비 매칭에 의한 윙윙거리는 기계적인 잡음을 감소시킨다.

  • PDF

Binary Mask Estimation using Training-based SNR Estimation for Improving Speech Intelligibility (음성 명료도 향상을 위한 학습 기반의 신호 대 잡음 비 추정을 이용한 이산 마스크 추정 방법)

  • Kim, Gibak
    • Journal of Broadcast Engineering
    • /
    • v.17 no.6
    • /
    • pp.1061-1068
    • /
    • 2012
  • This paper deals with a noise reduction algorithm which uses the binary masking approach in the time-frequency domain to improve speech intelligibility. In the binary masking approach, the noise-corrupted speech is decomposed into time-frequency units. Noise-dominant time-frequency units are removed by setting the corresponding binary masks as "0"s and target-dominant units are retained untouched by assigning mask "1"s. We propose a binary mask estimation by comparing the local signal-to-noise ratio (SNR) to a threshold. The local SNR is estimated by a training-based approach. An optimal threshold is proposed, which is obtained from observing the distribution of the training database. The proposed method is evaluated by normal-hearing subjects and the intelligibility scores are computed by counting the number of words correctly recognized.

Speech enhancement based on reinforcement learning (강화학습 기반의 음성향상기법)

  • Park, Tae-Jun;Chang, Joon-Hyuk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.335-337
    • /
    • 2018
  • 음성향상기법은 음성에 포함된 잡음이나 잔향을 제거하는 기술로써 마이크로폰으로 입력된 음성신호는 잡음이나 잔향에 의해 왜곡되어지므로 음성인식, 음성통신 등의 음성신호처리 기술의 핵심 기술이다. 이전에는 음성신호와 잡음신호 사이의 통계적 정보를 이용하는 통계모델 기반의 음성향상기법이 주로 사용되었으나 통계 모델 기반의 음성향상기술은 정상 잡음 환경과는 달리 비정상 잡음 환경에서 성능이 크게 저하되는 문제점을 가지고 있었다. 최근 머신러닝 기법인 심화신경망 (DNN, deep neural network)이 도입되어 음성 향상 기법에서 우수한 성능을 내고 있다. 심화신경망을 이용한 음성 향상 기법은 다수의 은닉 층과 은닉 노드들을 통하여 잡음이 존재하는 음성 신호와 잡음이 존재하지 않는 깨끗한 음성 신호 사이의 비선형적인 관계를 잘 모델링하였다. 이러한 심화신경망 기반의 음성향상기법을 향상 시킬 수 있는 방법 중 하나인 강화학습을 적용하여 기존 심화신경망 대비 성능을 향상시켰다. 강화학습이란 대표적으로 구글의 알파고에 적용된 기술로써 특정 state에서 최고의 reward를 받기 위해 어떠한 policy를 통한 action을 취해서 다음 state로 나아갈지를 매우 많은 경우에 대해 학습을 통해 최적의 action을 선택할 수 있도록 학습하는 방법을 말한다. 본 논문에서는 composite measure를 기반으로 reward를 설계하여 기존 PESQ (Perceptual Evaluation of Speech Quality) 기반의 reward를 설계한 기술 대비 음성인식 성능을 높였다.

The Effect of Coating Material of Copper-wire RF Coil on the Signal-to-Noise Ratio in MR Images (RF코일로 사용된 구리선 코팅재질이 자기공명영상에서의 신호대잡음비에 미치는 영향)

  • Lee, Hyeon-Seung;Moon, Hye-Young;Chang, Yong-Min;Hong, Kwan-Soo
    • Investigative Magnetic Resonance Imaging
    • /
    • v.13 no.2
    • /
    • pp.171-176
    • /
    • 2009
  • Purpose : To investigate the effect of coating material in RF coil, which is one of main parts in MRI machine, on the Q-factor and SNR(signal-to-noise ratio) in MR images. Materials and Methods : RF coils with inner diameter of 1.7 mm were made by using copper wires coated with polyester, polyurethane, polyimide, polyamideimide, and polyester-imide, and by using copper wires in which coating materials had been removed. Q-factors of the RF coils were measured by network analyzer, and SNR values in the spin-echo MR images obtained by 600 MHz (14.1 T, Bruker DMX600) micro-imaging system for the coated and uncoated cases. Results : The measured SNRs were almost same for the RF coils with coat-removed copper wires, however SNRs and Q-factors were different for the coated cases depending on the coating material. They were maximized in the polyurethane-coated case in which the SNR was > 30% greater than polyester-coated case. Conclusion : We made solenoid-type RF coils which were easily used for MR micro-imaging in Bruker MRI probe. There was a significant coating-material dependence in the measured Q values and SNRs for the home-made RF coils. The study demonstrated that the choice of coating material of RF coil may be a critical factor in the MRI sensitivity based on SNR value.

  • PDF

A Study on Weighted Spectral Subtraction Using Adaptive Threshold In Car Noise Environment (차량내 잡음 환경에서 적응적 경계값을 이용한 가중치 주파수 차감에 관한 연구)

  • 전선도
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.185-188
    • /
    • 1998
  • 실제의 음성 인식 및 음성 통신 등의 음성 처리 시스템에서는 음성 신호를 손상시키는 배경 잡음 신호의 존재로 그 성능이 많이 저하된다. 특히 차량 내와 같은 잡음이 극심한 상황에서는 전처리 부분에서 이러한 잡음을 제거시켜 주어야한다. 본 연구는 자동차 내의 배경 잡음에 의해 손상된 음성에서 배경 잡음을 주파수 차감에 의하여 제거시킨다. 특히 음성 정보의 손실이 적은 잡음 추정 방법으로 가중치를 이용하여 잡음을 추정하는 가중치 주파수 차감법을 이용하였다. 이러한 가중치 주파수 차감법 사용의 전제 조건은 잡음의 변화가 완만한 경우에 적당하다. 그러나 실제적인 상황에서 배경잡음신호의 변화가 큰 경우가 존재한다. 이러한 이유에서 본 연구는 잡은 추정시 잡음 추정값을 이용하여 추정 잡음 경계값을 적응적으로 변화하는 차감법을 제안한다. 이러한 방법은 추정된 잡음 신호의 변화율을 이용하여 경계값을 상황에 따라 적응적으로 변화시키는 방법이다. 모의 실험에 의하여 고정적인 경계값을 갖는 가중치 주파수 차감법에 비해 제안한 적응적 경계값을 갖는 가중치 주파수 차감법의 출력 SNR이 증가함을 확인하였고, 음성 인식 시스템에 정용한 인식 실험에서도 성능이 향상됨을 확인하였다.

  • PDF

Effect of SNR Estimation Error on MMSE-DFE in High-speed Binary CDMA System (고속 Binary CDMA 시스템에서 MMSE-DFE에 대한 SNR 추정 오차의 영향)

  • Kang, Sung-Jin
    • Journal of Advanced Navigation Technology
    • /
    • v.15 no.5
    • /
    • pp.735-741
    • /
    • 2011
  • In this paper, we have analyzed the effect of SNR estimation error on the BER performance of MMSE-DFE in high-speed binary CDMA system. Since MMSE equalization algorithm requires the SNR value of input signal, it should be estimated using CAZAC sequence in preamble. However, when AWGN and ISI exist simultaneously, it is impossible to estimate the exact SNR value of input signal and thereby equalizer's performance may be deteriorated. The simulation results can be used as a guideline for selection of SNR estimation algorithm for MMSE-DFE design.

Real-time MCG Signal Processing System (실시간 심자도 신호처리 시스템)

  • Chung, D.H.;Lim, J.S.;Kim, P.K.;Ko, K.H.;Lee, D.H.;Kim, H.J.;Ahn, C.B.
    • Proceedings of the KIEE Conference
    • /
    • 2004.07d
    • /
    • pp.2685-2686
    • /
    • 2004
  • 심자도(Magnetocardiography: MCG)는 심장에서 발생하는 자기신호로 크기가 수 pico Tesla에서 수 femto Tesla 정도로 지구 자기에 비하여 $10^{-6}{\sim}10^{-10}$ 정도로 매우 작기 때문에 보통 3층의 차폐 막 구조로 되어 있는 자기차폐실을 사용하여 외부 잡음을 줄인다. 그러나 자기차폐실의 비용이 크기 때문에, 자기차폐실의 비용을 줄이고 다양한 신호처리를 병행하여 신호대 잡음비를 높이고 있다. 본 논문에서는 1Giga FLOPS (FLoating point Operationals Per Second)의 부동 소숫점 연산능력을 가진 TMS320C6701을 사용하여 실시간 신호처리가 가능한 신호처리 시스템을 설계하였다. 개발된 DSP 보드는 PCI-bus 기반으로 설계하여 신호 측정 컴퓨터에 내장이 가능하도록 하였다. 프로그램과 데이터 처리를 위한 외부 메모리를 장착하였고, PCI 콘트롤러를 갖추어 PC 와의 대용량 메모리 공유가 가능하도록 하였다. 제작된 DSP 보드를 사용하여, 심자도 신호에서 실시간으로 적응 잡음 소거 및 필터링을 구현하여 신호대 잡음비의 향상을 확인할 수 있었다.

  • PDF

SNR and ADC Value Change before and after the injection of contrast medium during DWI test on metastatic spinal cancer patients (전이성 척추암 환자의 확산강조영상 검사 시 조영제 주입 전.후 ADC값의 변화에 대한 고찰)

  • Kim, Eng-Chan;Kim, Ki-Hong;Park, Cheol-Soo;Lee, Sun-Yeob;Yoo, Heung-Joon;Cho, Jae-Hwan;Jang, Hyun-Cheol;Kim, Bo-Hui;Han, Man-Seok
    • Journal of the Korean Society of Radiology
    • /
    • v.5 no.1
    • /
    • pp.37-49
    • /
    • 2011
  • To examine the possible changes in the SNRs, CNRs, and ADC values for lumbar spines with metastasis based on the DW images before and after contrast agent injection taken from metastatic spinal cancer patients using a 1.5 T MR machine. The quantitative analysis revealed that in case of spinal cancer subjects, both SNRs and CNRs at all of those assessed locations significantly increased on the DWI after contrast agent injection compared to before, while on the ADC map images, SNRs significantly decreased. On the other hand, significantly decreased ADC values at all the assessed locations were found on the ADC map images. With reference to the normal group, significantly increased SNRs were found at all of the assessed locations on the DWI image after injection compared to before, while significantly decreased SNRs were found on the ADC map images. Also, significantly decreased ADC values at all the assessed locations were found on the ADC map images. For the qualitative analysis, after contrast agent injection, significantly increased signal intensities were found at the locations with spinal cancer on the DWI. In contrast, significantly decreased signal intensities were found on the ADC map images. The implication from the results showing that SNR and CNR significantly increased while ADC value significantly decreased at, above, and below the location of metastatic spinal cancer on DWI after contrast agent injection is that DWI obtained after contrast agent injection can be made available for wider application to vertebral disorders.