• 제목/요약/키워드: Noisy Model

검색결과 344건 처리시간 0.026초

결정적 잡음 모델을 이용한 효율적인 잡음음성 인식 접근 방법 (An Efficient Approach for Noise Robust Speech Recognition by Using the Deterministic Noise Model)

  • 정용주
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.559-565
    • /
    • 2002
  • 본 논문에서는 잡음음성 HMM (Hidden Markov Model)의 파라미터 값을 효율적으로 추정하는 새로운 방법에 대해서 제안하였다. 기존의 방법들에서 잡음음성의 HMM 파라미터 값을 추정하기 위해서는 먼저 잡음음성의 생성 모델을 가정한 후, 잡음과 원래 음성의 통계 모델을 이용하여 잡음음성 HMM 파라미터 값을 해석적으로 얻게 된다. 하지만 이러한 해석적 방법은 항상 단순화의 가정을 취하게 되므로 실제의 잡음음성 HMM 분포에 정확히 근접하는데 어려움을 겪게 된다. 본 연구에서는 이러한 가정을 하지 않고, 원래의 깨끗한 음성에서 얻을 수 있는 HMM의 파라미터 값을 사용하고 결정적 잡음 모델을 이용함으로서 기존의 방법보다 인식시에 계산량을 줄일 수 있었을 뿐만 아니라 인식 성능의 향상도 이룰 수 있었다.

잡음음성인식을 위한 데이터 기반의 Jacobian 적응방식 (A Data-Driven Jacobian Adaptation Method for the Noisy Speech Recognition)

  • 정용주
    • 한국음향학회지
    • /
    • 제25권4호
    • /
    • pp.159-163
    • /
    • 2006
  • 본 논문에서는 잡음음성인식을 위한 데이터 기반의 향상된 Jacobian 적응 방식을 제안하였다. Jacobian 적응에서 필요로 하는 기준 HMM을 구성하기 위해서 기존에 주로 사용되던 모델결합 방식을 사용하는 대신에 잡음음성을 이용하여 직접 훈련하는 방식을 제안하였다. 이렇게 함으로서 기존의 방법에 비해서 잡음에 의한 음향모델의 변이를 보다 잘 처리할 수 있을 것으로 생각된다 제안된 방법에서는 Jacobian 행렬의 추정을 위해서 훈련과정에서 Baum-Welch 알고리듬을 사용하였다. 잡음음성에 대한 인식실험을 통해서 제안된 방식이 기존의 Jacobian 적응 방식 뿐 만 아니라 다른 형태의 모델적응 방식들에 비해서도 우수한 성능을 보임을 알 수 있었다.

연속 잡음 음성 인식을 위한 다 모델 기반 인식기의 성능 향상에 대한 연구 (Performance Improvement in the Multi-Model Based Speech Recognizer for Continuous Noisy Speech Recognition)

  • 정용주
    • 음성과학
    • /
    • 제15권2호
    • /
    • pp.55-65
    • /
    • 2008
  • Recently, the multi-model based speech recognizer has been used quite successfully for noisy speech recognition. For the selection of the reference HMM (hidden Markov model) which best matches the noise type and SNR (signal to noise ratio) of the input testing speech, the estimation of the SNR value using the VAD (voice activity detection) algorithm and the classification of the noise type based on the GMM (Gaussian mixture model) have been done separately in the multi-model framework. As the SNR estimation process is vulnerable to errors, we propose an efficient method which can classify simultaneously the SNR values and noise types. The KL (Kullback-Leibler) distance between the single Gaussian distributions for the noise signal during the training and testing is utilized for the classification. The recognition experiments have been done on the Aurora 2 database showing the usefulness of the model compensation method in the multi-model based speech recognizer. We could also see that further performance improvement was achievable by combining the probability density function of the MCT (multi-condition training) with that of the reference HMM compensated by the D-JA (data-driven Jacobian adaptation) in the multi-model based speech recognizer.

  • PDF

비지도 학습 기반 영상 노이즈 제거 기술을 위한 정규화 기법의 최적화 (Optimized Normalization for Unsupervised Learning-based Image Denoising)

  • 이강근;정원기
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제27권5호
    • /
    • pp.45-54
    • /
    • 2021
  • 최근 노이즈 제거를 위한 심층 학습 모델에 대한 연구가 활발하게 진행되고 있다. 특히 블라인드 노이즈 제거 (blind denoising) 기술이 발전하면서 깨끗한 영상을 얻기가 불가능한 영상의 영역에서 노이즈 영상만으로 심층 학습 기반 노이즈 제거 모델의 학습이 가능해졌다. 우리는 관찰된 노이즈 영상으로부터 깨끗한 영상을 얻기 위해 더는 깨끗한 영상과 노이즈 영상의 짝을 이루는 데이터를 필요하지 않는다. 하지만 노이즈 영상과 깨끗한 영상 간의 차이가 큰 데이터라면 노이즈 영상만으로 학습된 노이즈 제거 모델은 우리가 원하는 품질의 깨끗한 영상을 복원하기 어려울 것이다. 이 문제를 해결하기 위해서 짝지어지지 않는 깨끗한 영상과 노이즈 영상으로 학습한 모델 기반 노이즈 제거 기술은 최근 연구되고 있다. 가장 최신 기술인 ISCL은 깨끗한 영상과 노이즈 영상의 쌍을 기반으로 한 지도학습 기반 모델의 성능과 거의 근접한 성능을 보여 주었다. 우리는 제안된 방법이 ISCL을 포함한 다른 최신 짝을 이루지 않는 영상 기반 노이즈 제거 기술보다 성능이 우수함을 보여준다.

시간영역 수동제어기의 미세떨림현상 제거 (Removing the Noisy Behavior of the Time Domain Passivity Controller)

  • 유지환
    • 제어로봇시스템학회논문지
    • /
    • 제12권4호
    • /
    • pp.380-388
    • /
    • 2006
  • A noisy behavior of the time domain passivity controller during the period of low velocity is analyzed. Main reasons of the noisy behavior are investigated through a simulation with a one-DOF (Degree of Freedom) haptic interface model. It is shown that the PO/PC is ineffective in dissipating the produced energy when the sign of the velocity, which is numerically calculated from the measured position, is suddenly changed, and when this velocity is zero. These cases happen during the period of low velocity due to the limited resolution of the position sensor. New methods, ignoring the produced energy from the velocity sign change, and holding the control force while the velocity is zero, are proposed for removing the noisy behavior. The feasibility of the developed methods is proved with both a simulation and a real experiment.

Eigenvoice를 이용한 이진 마스크 분류 모델 적응 방법 (Eigenvoice Adaptation of Classification Model for Binary Mask Estimation)

  • 김기백
    • 방송공학회논문지
    • /
    • 제20권1호
    • /
    • pp.164-170
    • /
    • 2015
  • 본 논문에서는 잡음 환경에서 취득된 음성 신호에서 잡음을 제거하기 위한 방법으로 사용되는 이진 마스크 분류 모델의 적응과정에 대해 다루고자 한다. 기존 연구결과에 의하면, 잡음 환경 데이터에 이진 마스크 기법을 적용하면 음성 명료도를 향상시킬 수 있다고 알려져 있다. 하지만 이진 마스크 분류 모델 학습 시 테스트 환경 데이터가 포함되어야 한다는 단점을 안고 있다. 본 논문에서는 새로운 잡음 환경에서 이진 마스크 분류 모델을 적응하기 위해, 음성 인식에서 널리 사용되는 화자 적응 기법인 eigenvoice 방법을 적용하고자 한다. 실험결과에서는 모델 적응에 사용되는 데이터량에 따른 성능을 정검출율과 오검출율 관점에서 평가하였고, 그 결과 새로운 잡음 환경에서 데이터량을 증가시켜 모델을 적응함으로써 향상된 성능을 나타냄을 확인할 수 있었다.

Noise-Robust Speaker Recognition Using Subband Likelihoods and Reliable-Feature Selection

  • Kim, Sung-Tak;Ji, Mi-Kyong;Kim, Hoi-Rin
    • ETRI Journal
    • /
    • 제30권1호
    • /
    • pp.89-100
    • /
    • 2008
  • We consider the feature recombination technique in a multiband approach to speaker identification and verification. To overcome the ineffectiveness of conventional feature recombination in broadband noisy environments, we propose a new subband feature recombination which uses subband likelihoods and a subband reliable-feature selection technique with an adaptive noise model. In the decision step of speaker recognition, a few very low unreliable feature likelihood scores can cause a speaker recognition system to make an incorrect decision. To overcome this problem, reliable-feature selection adjusts the likelihood scores of an unreliable feature by comparison with those of an adaptive noise model, which is estimated by the maximum a posteriori adaptation technique using noise features directly obtained from noisy test speech. To evaluate the effectiveness of the proposed methods in noisy environments, we use the TIMIT database and the NTIMIT database, which is the corresponding telephone version of TIMIT database. The proposed subband feature recombination with subband reliable-feature selection achieves better performance than the conventional feature recombination system with reliable-feature selection.

  • PDF

잡음 환경 음성 인식을 위한 심층 신경망 기반의 잡음 오염 함수 예측을 통한 음향 모델 적응 기법 (Model adaptation employing DNN-based estimation of noise corruption function for noise-robust speech recognition)

  • 윤기무;김우일
    • 한국음향학회지
    • /
    • 제38권1호
    • /
    • pp.47-50
    • /
    • 2019
  • 본 논문에서는 잡음 환경에서 효과적인 음성 인식을 위하여 DNN(Deep Neural Network) 기반의 잡음 오염 함수 예측을 이용한 음향 모델 적응 기법을 제안한다. 깨끗한 음성과 잡음 정보를 입력으로 하고 오염된 음성에 대한 특징 벡터를 출력으로 하는 DNN을 학습하여 비선형 관계를 갖는 잡음 오염 함수를 예측한다. 예측된 잡음 오염 함수를 음향모델의 평균 벡터에 적용하여 잡음 환경에 적응된 음향 모델을 생성한다. Aurora 2.0 데이터를 이용한 음성 인식 성능 평가에서 본 논문에서 제안한 모델 적응 기법이 기존의 전처리, 모델 적응 기법에 비해 일치, 불일치 잡음 환경에서 모두 평균적으로 우수한 성능을 나타낸다. 특히 불일치 잡음 환경에서 평균 오류율이 15.87 %의 상대 향상률을 나타낸다.

소음작업장 근로자의 청력보호구 사용단계와 관련요인 (Change of Stages and Related Factors for Wearing of Hearing Protection Device among Noisy Workplace-workers)

  • 김영미;정인숙
    • 대한간호학회지
    • /
    • 제40권5호
    • /
    • pp.736-746
    • /
    • 2010
  • Purpose: This study was done to identify the distribution and related factors for stage of change for wearing hearing protection devices (HPDs) by workers in environments with high noise. Predictors of Use of Hearing Protection Model and Trans-theoretical Model were tested. Methods: The participants were 755 workers from 20 noisy work places in Busan and Gyeongnam. Data were collected from January to April 2008 using self-administered questionnaires, and analyzed using multiple logistic regression. Results: There were significant differences in social mode (OR=1.35, 95% CI: 1.06-1.73) between precontemplation/contemplation and preparation stage, in males (OR=2.36, 95% CI: 1.24-4.51), workers with high school education or less (OR=1.39, 95% CI: 1.28-2.78), shift workers (OR=1.50, 95% CI: 1.02-2.21), workers who previously worked in noisy places (OR=1.39, 95% CI: 1.20-2.34), and workers who had previous hearing examinations (OR=1.89, 95% CI: 1.25-2.85), in the social model (OR=1.59, 95% CI: 1.42-1.78), and self-efficacy (OR=1.05, 95% CI: 1.02-1.08) between workers in preparation and action stages, in length of time working in noisy work places (OR=2.26, 95% CI: 1.17-4.39), social model (OR=1.66, 95% CI: 1.33-2.08), and perceived benefit (OR=0.95, 95% CI: 0.93-0.97) between action and maintenance stage. Conclusion: Social model was a common factor showing differences between two adjacent stages for wearing HPDs. The results provide data for developing programs to encourage workers to wear HPDs and application of these programs in work settings.

잡음 환경에 효과적인 음성 인식을 위한 Gaussian mixture model deep neural network 하이브리드 기반의 특징 보상 (A study on Gaussian mixture model deep neural network hybrid-based feature compensation for robust speech recognition in noisy environments)

  • 윤기무;김우일
    • 한국음향학회지
    • /
    • 제37권6호
    • /
    • pp.506-511
    • /
    • 2018
  • 본 논문에서는 잡음 환경에서 효과적인 음성인식을 위하여 GMM(Gaussian Mixture Model)-DNN(Deep Neural Network) 하이브리드 기반의 특징 보상 기법을 제안한다. 기존의 GMM 기반의 특징 보상에서 필요로 하는 사후 확률을 DNN을 통해 계산한다. Aurora 2.0 데이터를 이용한 음성 인식 성능 평가에서 본 논문에서 제안한 GMM-DNN 하이브리드 기법이 기존의 GMM 기반 기법에 비해 Known, Unknown 잡음 환경에서 모두 평균적으로 우수한 성능을 나타낸다. 특히 Unknown 잡음 환경에서 평균 오류율이 9.13 %의 상대 향상률을 나타내고, 낮은 SNR(Signal to Noise Ratio) 잡음 환경에서 상당히 우수한 성능을 보인다.