• 제목/요약/키워드: spectrum distortion

검색결과 165건 처리시간 0.024초

액체의 특성 분류를 위한 스펙트럼 분석 방법 (Spectral Analysis Method for Classification of Liquid Characteristics)

  • 이종길
    • 한국정보통신학회논문지
    • /
    • 제20권12호
    • /
    • pp.2206-2212
    • /
    • 2016
  • 액체의 특성을 분류하기 위해서는 액상 물질의 유전율의 차이 등에 따른 특징적인 현상들을 파악하여야 한다. 이러한 현상들을 원격으로 탐지하여 추출할 수 있다면 폭발 가능성이 있는 위험물질의 검색이나 액체의 종류 등을 파악하는데 유용하게 활용할 수 있을 것이다. 따라서 본 논문에서는 광대역 전자파 신호를 이용하여 액체의 반사 및 투과신호를 하나의 송신 안테나와 2개의 수신 안테나에서 획득하여 분석하였다. 반사 또는 투과신호는 액체의 종류에 따라 주파수별 응답특성이 다르게 나타난다. 그러나 기존의 FFT 스펙트럼 추정방식은 주파수 해상도 문제 및 윈도잉에 의한 왜곡 때문에 적용하기 어렵다. 따라서 이러한 문제들을 최소화할 수 있는 고유벡터 해석 기법을 이용한 고해상도 스펙트럼 추정 및 분석 방법을 적용하였다. 이렇게 얻어진 결과들로부터 투과 또는 반사경로 들에 따른 액체의 종류별 첨두치 주파수들 및 대응전력 값들을 비교함으로서 다양한 액체들의 분류가 가능함을 보였다.

다이폰 군집화와 개선된 스펙트럼 완만화에 의한 음성합성 (Speech Synthesis using Diphone Clustering and Improved Spectral Smoothing)

  • 장효종;김관중;김계영;최형일
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.665-672
    • /
    • 2003
  • 본 논문에서는 단위음소들의 연결을 통한 음성합성 방법에 관하여 기술한다. 이때, 발생하는 가장 큰 문제점은 두 단위음소 사이의 연결부분에서 불연속이 발생하는 것이며, 특히 다른 화자로부터 녹음한 단위음소의 연결에서 불연속이 많이 발생한다. 이 문제를 해결하기 위하여 본 논문에서는 군집화된 다이폰을 이용하며, 포만트 궤적과 스펙트럼의 분포특성을 사용할 뿐 아니라 인간의 청각적인 특성을 반영하여 스펙트럼을 완만화하는 방법을 제안한다. 즉, 제안하는 방법은 단위음소 연결구간의 스펙트럼 분포특성의 유사도를 사용하여 단위음소들을 군집화하고 단위음소의 연결 구간에서 인간의 청각신경 특성을 고려하여 완만화의 양과 범위를 결정한 다음, 두 다이폰 경계의 스펙트럼 분포를 시간에 따라 가중치를 다르게 주어 스펙트럼 완만화를 수행한다. 이 방법은 불연속을 제거하며 완만화로 인하여 발생할 수 있는 음성의 왜곡을 최소화한다. 제안하는 방법의 성능을 평가하기 위하여 5명으로부터 녹음한 20개의 문장 중에서 추출한 500여 개의 다이폰을 사용하여 실험을 수행하였다.

잡음환경에서 음성인식 성능향상을 위한 바이너리 마스크를 이용한 스펙트럼 향상 방법 (Method for Spectral Enhancement by Binary Mask for Speech Recognition Enhancement Under Noise Environment)

  • 최갑근;김순협
    • 한국음향학회지
    • /
    • 제29권7호
    • /
    • pp.468-474
    • /
    • 2010
  • 음성인식의 실용화에 가장 저해되는 요소는 배경잡음과 채널잡음에 의한 왜곡이다. 일반적으로 배경잡음은 음성인식 시스템의 성능을 저하시키고 이로 인해 사용 장소의 제약을 받게 한다. DSR (Distributed Speech Recognition) 기반의 음성인식 역시 이와 같은 문제로 성능 향상에 어려움을 겪고 있다. 이러한 문제를 해결하기 위해 다양한 잡음제거 알고리듬이 사용되고 있으나 낮은 SNR환경에서 부정확한 잡음추정으로 발생하는 스펙트럼 손상과 잔존 잡음은 음성인식기의 인식환경과 학습 환경의 불일치를 만들게 되어 인식률을 저하시키는 원인이 된다. 본 논문에서는 이와 같은 문제를 해결하기 위해 잡음제거 알고리듬으로 MMSE-STSA 방법을 사용하였고 손상된 스펙트럼을 보상하기 위해 Ideal Binary Mask를 이용하였다. 잡음환경 (SNR 15 ~ 0 dB)에 따른 실험결과 제안된 방법을 사용했을 때 향상된 스펙트럼을 얻을 수 있었고 향상된 인식성능을 확인했다.

Noise Reduction Using the Standard Deviation of the Time-Frequency Bin and Modified Gain Function for Speech Enhancement in Stationary and Nonstationary Noisy Environments

  • Lee, Soo-Jeong;Kim, Soon-Hyob
    • The Journal of the Acoustical Society of Korea
    • /
    • 제26권3E호
    • /
    • pp.87-96
    • /
    • 2007
  • In this paper we propose a new noise reduction algorithm for stationary and nonstationary noisy environments. Our algorithm classifies the speech and noise signal contributions in time-frequency bins, and is not based on a spectral algorithm or a minimum statistics approach. It relies on calculating the ratio of the standard deviation of the noisy power spectrum in time-frequency bins to its normalized time-frequency average. We show that good quality can be achieved for enhancement speech signal by choosing appropriate values for ${\delta}_t\;and\;{\delta}_f$. The proposed method greatly reduces the noise while providing enhanced speech with lower residual noise and somewhat higher mean opinion score (MOS), background intrusiveness (BAK) and signal distortion (SIG) scores than conventional methods.

Encoding of Speech Spectral Parameters Using Adaptive Quantization Range Method

  • Lee, In-Sung;Hong, Chae-Woo
    • ETRI Journal
    • /
    • 제23권1호
    • /
    • pp.16-22
    • /
    • 2001
  • Efficient quantization methods of the line spectrum pairs (LSP) which have good performances, low complexity and memory are proposed. The adaptive quantization range method utilizing the ordering property of LSP parameters is used in a scalar quantizer and a vector-scalar hybrid quantizer. As the maximum quantization range of each LSP parameter is varied adaptively on the quantized value of the previous order's LSP parameter, efficient quantization methods can be obtained. The proposed scalar quantization algorithm needs 31 bits/frame, which is 3 bits less per frame than in the conventional scalar quantization method with interframe prediction to maintain the transparent quality of speech. The improved vector-scalar quantizer achieves an average spectral distortion of 1 dB using 26 bits/frame. The performances of proposed quantization methods are also evaluated in the transmission errors.

  • PDF

A Line Spectrum Frequency Pairs Representation for Spectral Envelop Quantization

  • Park, Youngho;Lee, Won-Cheol;Bae, Myung-Jin
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.787-790
    • /
    • 2000
  • This paper introduces a new type of representation of the LSPs as a promising alternative used for transmitting the LPC parameters. Major contribution in this paper is that the vocal track information embedded on the spectral envelope can be represented in terms of the reduced number of LSF compared tn the conventional. Hence, it provides a possibility that LPC parameters could be quantized at a reduced bit rate without causing any major spectral distortion. The simulation result illustrates the capability of the proposed LSPs representation as an efficient quantization method via a proper rejection of the redundant pairs of pole and zero along the unit circle.

  • PDF

4800bps CELP 음성 부호화기에 적용한 대역폭 확장에 관한 연구 (A Study on the Bandwidth Extension Adopted for 4800 bps CELP Speech Coder)

  • 박진수;김형순
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2002년도 11월 학술대회지
    • /
    • pp.175-178
    • /
    • 2002
  • Most existing telephone networks transmit narrowband speech witch has been bandlimited below 4 kHz. Compared with wideband speech up to 8 kHz, narrowband speech shows reduced intelligibility and a muffled quality. Bandwidth extension is a technique to generate wideband speech by reconstructing 4-8 kHz highband speech without any additional information. This paper presents experimental results of the bandwidth extension adopted for 4800 bps CELP speech coder. In this experiment, we examine various methods for reconstruction of wideband spectrum and excitation signal, compare and analyze their performance by performing the subjective preference test and measuring the cepstral distortion.

  • PDF

Harmonics-based Spectral Subtraction and Feature Vector Normalization for Robust Speech Recognition

  • Beh, Joung-Hoon;Lee, Heung-Kyu;Kwon, Oh-Il;Ko, Han-Seok
    • 음성과학
    • /
    • 제11권1호
    • /
    • pp.7-20
    • /
    • 2004
  • In this paper, we propose a two-step noise compensation algorithm in feature extraction for achieving robust speech recognition. The proposed method frees us from requiring a priori information on noisy environments and is simple to implement. First, in frequency domain, the Harmonics-based Spectral Subtraction (HSS) is applied so that it reduces the additive background noise and makes the shape of harmonics in speech spectrum more pronounced. We then apply a judiciously weighted variance Feature Vector Normalization (FVN) to compensate for both the channel distortion and additive noise. The weighted variance FVN compensates for the variance mismatch in both the speech and the non-speech regions respectively. Representative performance evaluation using Aurora 2 database shows that the proposed method yields 27.18% relative improvement in accuracy under a multi-noise training task and 57.94% relative improvement under a clean training task.

  • PDF

Method of Measuring the Occupied Bandwidth of IS-95 Base Station at Remote Site

  • Lim, Jong-Soo;Kim, Sang-Tae
    • Journal of electromagnetic engineering and science
    • /
    • 제3권1호
    • /
    • pp.7-11
    • /
    • 2003
  • CDMA(code division multiple access) has very large peak to average power ratio(PAR) and behave as noise-like wide band digital signals with 1.2288 Mbps transmission rate. For signals with high PAR like CDMA, it is reasonable to prescribe occupied bandwidth(OBW) as average occupied bandwidth. Bandwidth measurements of CDMA signals at remote site are affected by co-channel and adjacent channel interference from adjacent CDMA base station, distortion of signal by fading effect, spurious emission and environment noises. In this study, we have compared OBW measurements in an on-air environment with those measured in a base station using adjacent channel leakage ratio(ACLR) as a reference measurement factor. As results of analysis, the OBW at ACLR$\geq$35 ㏈ shows nearly same statistical characteristics regardless of the measurement locations and environments.

켑스트럼 분석합성형 음성합성 시스템에서의 피치변경에 따른 스펙트럼 포락 왜곡 현상에 관한 연구 (Distortion of Spectrum Envelope with Change of Pitch Period in the Cepstrum Analysis-synthesis System)

  • 김연준
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1992년도 학술논문발표회 논문집 제11권 1호
    • /
    • pp.54-57
    • /
    • 1992
  • 음성합성에 있어서 음의 자연성을 합성시키는 문제는 크게 두가지로 나누어진다. 첫째는 합성음을 원음에 가깝게 구현하려는 합성방법 자체의 문제로, 언어 합성이 가지고 있는 일반적인 문제이다. 또 다른 문제는 운율에 관한 것으로 낱말 또는 문장 내에서의 운율에 따라 합성음의 자연성이 좌우된다. 이러한 운율에 따라 합성음의 자연성이 좌우된다. 이러한 운율의 조절에는 지속시간, 피치, 그리고 음의 세기 등이 이용된다. 켑스트럼을 이용하여 분석합성을 하는 경우, pole-zero 모델로 스펙트럼 포락을 근사하므로 원음에 충실하고, 필터계수와 구동정보를 분리하여 분석, 합성하므로 인위적인 운율의 조절이 용이하여 음성합성이 가지는 위의 두가지 문제를 해결하는데 적합하다고 판단된다. 본 연구에서는 켑스트럼을 이용하여 분석합성 시스템을 구성하였다. 음성 합성 과정에서, 운율 조절 파라미터중의 하나인 피치 주기의 변경에 따라 스펙트럼 포락의 왜곡에 대해 살펴보고, 왜곡을 최소화하는 방안을 제안한다.

  • PDF