• Title/Summary/Keyword: Spectral subtraction

Search Result 108, Processing Time 0.027 seconds

디지털음성명료도 향상을 위한 적응형 잡음제거 기법에 관한 연구 (A study on adaptive noise cancellation for enhancement of digital speech articulation)

  • 김수용;지석근
    • 한국정보통신학회논문지
    • /
    • 제11권5호
    • /
    • pp.961-968
    • /
    • 2007
  • 오늘날, 우리는 어디엔가 엔제나 무전기 통신 장치를 사용할수 있다. 때때로, 우리는 음향잡음환경에서 장치를 사용하였다. 그 음향잡음은 통신장치에서 많은 문제를 만들었다. 음향잡음환경에서는, 말은 음성신호와 잡음신호 양쪽에 신호를 포함하고, 받았기 때문에 깨끗한 정보를 받기위해 보낼수가 없었다. 디지털필터는 바라는 신호를 얻기 위해 옮기는 잡음으로서 유용하였다. 방법의 하나는 자동적으로 맞추는 필터 파라미터로서 적응 잡음 망상조직으로 적응디지털필터를 사용하는 것이다. 본 논문은 두 적응필터 방법에 의하여 현실에서 음향잡음으로서 명료도 알고리즘의 번지라고 할 수가 있다. 하나는 두 입력 채널과 함께 적응잡음 망상조직이라 할 수 있고, 또 다른 것은 하나 입력 채널과 함께 스펙트럼 빼기필터이다. 이 실험의 결과는 제안된 필터로부터 스펙트럼 진폭필터는 움직이지 않는 잡음은 효력이 있는 동안 움직이는 것을 줄이기 위해 사용되어지는 것은 적응잡음망상조직으로 보여준다.

경동맥스텐트삽입술 후의 뇌관류예비능: 뇌파파워스펙트럼과의 연관성 (Cerebral-perfusion Reserve after Carotid-artery Stenting: Relationship with Power Spectrum of Electroencephalography)

  • 정다혜;정석원;곽병근;김영수;김수경;권오영
    • 대한임상검사과학회지
    • /
    • 제48권2호
    • /
    • pp.144-152
    • /
    • 2016
  • 경동맥경화증은 대뇌혈류를 감소시킬 수 있고, 대뇌신경세포의 활성도에 영향을 미칠 수 있다. 저자들은 경동맥스텐트삽입술(carotid-artery stenting, CAS) 후 뇌혈류예비능의 회복이 뇌파의 파워스펙트럼에 미치는 영향을 조사하였다. 우선 19명의 CAS 대상자들을 모집하였다. SPECT의 subtraction imaging과 뇌파를 두 번의 시기에 검사하였다. 두 번의 시기는 CAS 시술 직전과 시술하고 1개월이 지난 시점이었다. EEG는 acetazolamide 주입 전(pre-ACZ EEG)과 주입 후(pre-ACZ EEG)에 기록하였다. 검사를 모두 하지 못했거나 뇌파기록의 질이 분석에 적절하지 못했던 환자를 제외하고 최종적으로 7명의 환자를 대상으로 연구하였다. 저자들은 각각의 대뇌 반구에서 spectral ratio (SR)를 구했다. SR은 빠른파형의 파워스펙트럼 수치를 느린파형의 파워스펙트럼 수치로 나눈 값으로 정의하였다. 또한 저자들은 저자들은 반구간인덱스(inter-hemispheric index of spectral ratio, IHISR)를 이용하여 양쪽 대뇌 반구 사이의 파워스펙트럼 수치를 비교하였고, 파워스펙트럼의 변화와 뇌혈류예비능의 변화 사이의 연관성을 관찰하였다. 총 7명의 환자 중 6명의 환자에서 CAS 시행 후 스텐트를 삽입한 쪽의 뇌혈류예비능이 호전되었다. 편측 경동맥경화증이 있었던 3명의 환자들에서는 모든 환자에서 CAS가 pre-ACZ EEG에서 SR을 증가시켰고, post-ACZ EEG의 IHISR을 증가시켰다. SR과 IHISR의 증가는 뇌혈류예비능의 증가와 연관성이 있었다. 반면에 양쪽 경동맥경화증이 있었던 나머지 환자들의 결과는 복잡한 양상을 띄었다. 경동맥협착증이 한쪽에만 있는 환자에서 pre-ACZ EEG의 SR과 post-ACZ EEG의 IHISR가 CAS를 시술한 후에 뇌혈류예비능의 변화를 평가할 수 있는 유용한 전기생리학적 지표가 될 수 있다는 것을 본 연구의 결과를 통해 알 수 있었다. 그러나 경동맥협착증이 양쪽 모두에 있었던 환자들에서는 결과가 복잡한 양상으로 나타났다. 이는 양쪽 협착이 있는 경우에는 뇌의 혈역학이 복잡하기 때문일 것으로 판단하였다.

잡음에 강한 음성 인식에서 SNR 기준 함수를 사용한 가우시안 함수 변형 및 결정에 관한 연구 (A Study on Variation and Determination of Gaussian function Using SNR Criteria Function for Robust Speech Recognition)

  • 전선도;강철호
    • 한국음향학회지
    • /
    • 제18권7호
    • /
    • pp.112-117
    • /
    • 1999
  • 잡음에 강한 음성인식시스템을 위하여 주파수 차감법을 사용할 경우 음성 신호마저 차감하여 신호를 더욱 부식시키는 경우가 존재한다. 본 연구에서는 이러한 경우를 위해서 프레임 마다 추정 잡음과 차감 신호의 SNR(Signal to Noise Ratio) 함수로부터 반연속 HMM(Hidden Markov Model)의 가우시안 함수를 변형 및 결정하는 방법을 제안한다. 이 방법의 타당성을 위해 프레임마다 추정 잡음의 오류 정도가 추정 잡음의 크기와 관계함을 신호 파형 형태로써 보였으며, 이러한 이유에서 SNR을 기준으로 가우시안 함수를 변형 및 결정하게 된다. 실험에서 80㎞/h 이상의 속도로 달리는 차량 내에서 배경 잡음과 음성이 혼합되었을 때의 음성 인식율을 평가하였다. 그 결과 주파수 차감한 경우와 차감하지 않은 경우에 비해 본 논문에서 제안한 SNR에 의한 가우시안 결정 방법이 더욱 향상된 인식율을 보였다.

  • PDF

2차원 이진 마스크를 이용한 적응형 음성향상 잡음 제거기 (Adaptive Noise Canceller for Speech Enhancement Using 2-D Binary Mask)

  • 이기현;이정현;조진호;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제19권7호
    • /
    • pp.1127-1136
    • /
    • 2016
  • Speech enhancement algorithm plays an important role in numerous speech signal processing applications. Over the last few decades, many algorithms have been studied for speech enhancement. The algorithms are based on spectral subtraction, Wiener filter, and subspace method etc. They have good performance of speech enhancement, but the performance can be deteriorated in specific noises or low SNR environment. In this paper, a new speech enhancement algorithms are proposed based on adaptive noise canceller. And the proposed algorithm improved performance of adaptive noise cancelling using 2-D binary mask. From objective experimental index, it is confirmed that the proposed algorithm is useful and has better performance than recently proposed speech enhancement algorithms.

Atmospheric Correction Problems with Multi-Temporal High Spatial Resolution Images from Different Satellite Sensors

  • Lee, Hwa-Seon;Lee, Kyu-Sung
    • 대한원격탐사학회지
    • /
    • 제31권4호
    • /
    • pp.321-330
    • /
    • 2015
  • Atmospheric correction is an essential part in time-series analysis on biophysical parameters of surface features. In this study, we tried to examine possible problems in atmospheric correction of multitemporal High Spatial Resolution (HSR) images obtained from two different sensor systems. Three KOMPSAT-2 and two IKONOS-2 multispectral images were used. Three atmospheric correction methods were applied to derive surface reflectance: (1) Radiative Transfer (RT) - based absolute atmospheric correction method, (2) the Dark Object Subtraction (DOS) method, and (3) the Cosine Of the Uun zeniTh angle (COST) method. Atmospheric correction results were evaluated by comparing spectral reflectance values extracted from invariant targets and vegetation cover types. In overall, multi-temporal reflectance from five images obtained from January to December did not show consistent pattern in invariant targets and did not follow a typical profile of vegetation growth in forests and rice field. The multi-temporal reflectance values were different by sensor type and atmospheric correction methods. The inconsistent atmospheric correction results from these multi-temporal HSR images may be explained by several factors including unstable radiometric calibration coefficients for each sensor and wide range of sun and sensor geometry with the off-nadir viewing HSR images.

음성인식 시스템에서의 잡음 제거 개선에 관한 연구 (Study of the Noise Processing to Technique Speech Recognition System)

  • 이창윤;이영훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제7권2호
    • /
    • pp.73-78
    • /
    • 2002
  • 본 논문에서는 음성인식 시스템에서의 잡음 처리 기술로서 SNR정규화와 RAS를 결합한 방법을 사용하여 여러 가지 잡음 처리 방법을 연구하여 인식 시스템의 성능을 개선하였다. 인식 시스템으로는 범용 DSP (TI사의 TM9320C31)가 내장된 모듈을 사용하였다. 실험에 사용된 인식 단어 샘플은 일반 사무 및 컴퓨터의 명령을 위한 60단어이며. 일반환경에서 잡음과 함께 가상의 여러 유색 잡음을 고려하여 샘플된 데이터를 시뮬레이션 하였다. 녹음된 데이터에 대한 컴퓨터 시뮬레이션 상에서 잡음 처리 방법으로 SNR정규화와 스펙트럼 차감법을 결합하여 실험한 경우 최고 94.61%의 높은 인식 성능을 보였다.

  • PDF

음성 강화를 위한 a priori SNR 추정기반 적응 바람소리 저감 방법 (An Adaptive Wind Noise Reduction Method Based on a priori SNR Estimation for Speech Eenhancement)

  • 서지훈;이석필
    • 전기학회논문지
    • /
    • 제64권12호
    • /
    • pp.1756-1760
    • /
    • 2015
  • This paper focuses on a priori signal to noise ratio (SNR) estimation method for the speech enhancement. There are many researches for speech enhancement with several ambient noise cancellation methods. The method based on spectral subtraction (SS) which is widely used in noise reduction has a trade-off between the performance and the distortion of the signals. So the need of adaptive method like an estimated a priori SNR being able to making a high performance and low distortion is increasing. The decision directed (DD) approach is used to determine a priori SNR in noisy speech signals. A priori SNR is estimated by using only the magnitude components and consequently follows a posteriori SNR with one frame delay. We propose a modified a priori SNR estimator and the weighted rational transfer function for speech enhancement with wind noises. The experimental result shows the performance of our proposed estimator is better Perceptual Evaluation of Speech Quality scores (PESQ, ITU-T P.862) compare to the conventional DD approach-based systems and different noise reduction methods.

드론 소음 환경에서 심층 신경망 기반 음성 향상 기법 적용에 관한 연구 (A study on deep neural speech enhancement in drone noise environment)

  • 김지민;정재희;여찬은;김우일
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.342-350
    • /
    • 2022
  • 본 논문에서는 재난 환경과 같은 환경에서의 음성 처리를 위해 실제 드론 소음 데이터를 수집하여 오염 음성 데이터베이스를 구축하고 음성 향상 기법인 스펙트럼 차감법과 심층 신경망을 이용한 마스크 기반 음성 향상 기법을 적용하여 성능을 평가한다. 기존의 심층 신경망 기반의 음성 향상 모델인 VoiceFilter(VF)의 성능 향상을 위해 Self-Attention 연산을 적용하고 추정한 잡음 정보를 Attention 모델의 입력으로 이용한다. 기존 VF 모델 기법과 비교하여 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)에 대해 각각 3.77 %, 1.66 %, 0.32 % 향상된 결과를 나타낸다. 인터넷에서 수집한 오염 음성 데이터를 75 % 혼합하여 훈련한 경우, 실제 드론 소음만을 사용한 경우에 비해 상대적인 성능 하락률 평균이 SDR, PESQ, STOI에 대해 각각 3.18 %, 2.79 %, 0.96 %를 나타낸다. 이는 실제 데이터를 취득하기 어려운 환경에서 실제 데이터와 유사한 데이터를 수집하여 음성 향상을 위한 모델 훈련에 효과적으로 활용할 수 있음을 확인해준다.

FAR-IR GALACTIC EMISSION MAP AND COSMIC OPTICAL BACKGROUND

  • Matsuoka, Y.
    • 천문학논총
    • /
    • 제27권4호
    • /
    • pp.353-356
    • /
    • 2012
  • We present new constraints on the cosmic optical background (COB) obtained from an analysis of the Pioneer 10/11 Imaging Photopolarimeter (IPP) data. After careful examination of the data quality, the usable measurements free from the zodiacal light are integrated into sky maps at the blue (${\sim}0.44{\mu}m$) and red (${\sim}0.64{\mu}m$) bands. Accurate starlight subtraction was achieved by referring to all-sky star catalogs and a Galactic stellar population synthesis model down to 32.0 mag. We find that the residual light is separated into two components: one component shows a clear correlation with the thermal $100{\mu}m$ brightness, whilst the other shows a constant level in the lowest $100{\mu}m$ brightness region. The presence of the second component is significant after all the uncertainties and possible residual light in the Galaxy are taken into account, thus it most likely has an extragalactic origin (i.e., the COB). The derived COB brightness is ($(1.8{\pm}0.9){\times}10^{-9}$ and $(1.2{\pm}0.9){\times}10^{-9}\;erg\;s^{-1}\;cm^{-2}\;sr^{-1}\;{\AA}^{-1}$ in the blue and red spectral regions, respectively, or $7.9{\pm}4.0$ and $7.7{\pm}5.8\;nW\;m^{-2}\;sr^{-1}$. Based on a comparison with the integrated brightness of galaxies, we conclude that the bulk of the COB is comprised of normal galaxies which have already been resolved by the current deepest observations. There seems to be little room for contributions from other populations including "first stars" at these wavelengths. On the other hand, the first component of the IPP residual light represents the diffuse Galactic light (DGL)-scattered starlight by the interstellar dust. We derive the mean DGL-to-$100{\mu}m$ brightness ratios of $2.1{\times}10^{-3}$ and $4.6{\times}10^{-3}$ at the two bands, which are roughly consistent with previous observations toward denser dust regions. Extended red emission in the diffuse interstellar medium is also confirmed.

인공신경망에 의한 생물공정에서 2차원 형광스펙트럼의 분석 I - 자기조직화망에 의한 형광스펙트럼의 분류 - (Analysis of Two-Dimensional Fluorescence Spectra in Biotechnological Processes by Artificial Neural Networks I - Classification of Fluorescence Spectra using Self-Organizing Maps -)

  • 이금일;임용식;김춘광;이승현;정상욱;이종일
    • KSBB Journal
    • /
    • 제20권4호
    • /
    • pp.291-298
    • /
    • 2005
  • 본 연구는 재조합 대장균과 S.cerevisiae의 발효공정에서 형광스펙트럼 데이터를 수집하였으며, SOM을 이용하여 형광스펙트럼 데이터를 특정 그룹으로 분류하고 발효공정을 분석하고자 하였다. 배출가스 내 이산화탄소농도와 세포농도 같은 공정변수들은 SOM 알고리즘으로부터 얻은 분산 및 정규화된 가중치들과 좋은 연관성을 나타내었다. 전체 스펙트럼 데이터의 분류는 생물공정 모델링을 위한 매우 중요한 단계인데 그 이유는 몇몇 여기파장과 방출파장의 유의한 조합들이 전체영역의 스펙트럼 데이터로부터 추출되기 때문이다. 예를 들면, 본 연구에서 SOM을 이용하여 추출한 98개의 스펙트럼 데이터의 예제들은 부분최소자승법이나 감독신경망 (supervised neural network)을 이용한 공정의 모델링에 사용될 수 있다.