• Title/Summary/Keyword: 스펙트럼 왜곡

Search Result 168, Processing Time 0.028 seconds

Distortion Correction Method Using Spectral Characteristics of Integral Images (집적영상의 스펙트럼 특성을 이용한 왜곡 교정 방법)

  • Jin, Zhengju;Lee, Byung-Ju;Kang, Hyun-Soo
    • The Journal of the Korea Contents Association
    • /
    • v.13 no.10
    • /
    • pp.1-8
    • /
    • 2013
  • In this paper, we propose a new method to correct the perspective distortion that occurs in the process of acquiring the integral images. In the proposed method, the distortion correction is based on the spectral characteristics of integral images. As element images of an integral image are repeated nearly periodically, its Fourier spectrum is given as an impulse train. On the contrary, the impulse train do not appear in the spectra of distorted images. In the proposed method, therefore, the perspective distortion parameters are detected by using the characteristics of the spectrum obtained through the Fourier transform, and then the distorted images are corrected by using the parameters. Through experiments, we verify that the proposed method effectively works for the perspective distortion correction.

On a Pitch Alteration Technique by Cepstrum Analysis of Flatten Excitation Spectrum (평탄화된 여기 스펙트럼에서 켑스트럼 피치 변경법에 관한 연구)

  • 조왕래;함명규;배명진
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.8
    • /
    • pp.82-87
    • /
    • 1998
  • 음성합성은 합성방식에 따라 파형부호화법, 신호원부호화법, 혼성부호화법으로 분류 할 수 있다. 특히 고음질 합성을 위해서는 파형부호화를 이용한 합성방식이 적합하다. 그렇 지만, 파형부호화를 이용한 합성법은 여기 성분과 여파기 성분을 분리하지 않고 처리하기 때문에 음절단위나 음소단위의 합성기법으로는 바람직하지 못하다. 따라서 파형부호화법을 규칙에 의한 합성에 적용되도록 음원피치를 변경시키기 위한 피치 변경법이 필요하게 된다. 본 논문에서는 스펙트럼 왜곡을 최소화하기 위해 켑스트럼의 성질을 이용하여 피치를 변경 하는 방법에 대하여 제안하였다. 이 방법은 주파수영역상에서 여기 스펙트럼과 여파기 스펙 트럼을 분리하여 여기 스펙트럼을 여기 켑스트럼으로 변환한 후 영값 삽입이나 삭제에 의해 피치를 변경하고 스펙트럼영역에서 피치 변경된 스펙트럼을 재구성하는 기법을 적용하였다. 제안한 방법의 성능을 평가하기 위해 스펙트럼 왜곡율을 측정하여 본 결과 평균 스펙트럼 왜곡율은 평균 2.29%이하로 유지되었으며 주관적인 음질도 평균 3.74로 우수하였다.

  • PDF

Designing on improved combined mapping based on soft-decision for wideband LSP coefficients pattern estimation (광대역 LSP 계수의 패턴 추론을 위한 연판정 기반 개선된 조합 매핑 설계)

  • Jeon, Jong-geun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.805-807
    • /
    • 2018
  • 본 논문은 인공 대역 확장에서 스펙트럼 포락선 확장 시 발생하는 스펙트럼 왜곡을 줄이는 개선된 조합 매핑(Improved combined mapping) 알고리즘을 제안한다. 벡터양자화를 기반으로 하는 코드북 매핑(Codebook mapping)과 스펙트럼 포락선(Spectrum Envelope)의 선형 의존도를 이용한 선형 매핑(Linear mapping)을 사용하여 각각 확장된 광대역 LSP(Line Spectrum Pair)를 추론하고, 연판정(Soft-decision)을 통해 최적화된 LSP를 추론한다. 제안된 알고리즘으로 합성된 음성신호의 스펙트럼 왜곡(Spectrum Distortion)이 기존 조합매핑으로 얻은 음성 신호의 스펙트럼 왜곡보다 더 적은 왜곡을 갖는 결과를 나타내었다.

A Study on Real Time Pitch Alteration of Speech Signal (음성신호의 실시간 피치변경에 관한 연구)

  • 김종국;박형빈;배명진
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.1
    • /
    • pp.82-89
    • /
    • 2004
  • This paper describes how to reduce the effect of an occupation threshold by that the transform of mixture components of HMM parameters is controlled in hierarchical tree structure to prevent from over-adaptation. To reduce correlations between data elements and to remove elements with less variance, we employ PCA (principal component analysis) and ICA (independent component analysis) that would give as good a representation as possible, and decline the effect of over-adaptation. When we set lower occupation threshold and increase the number of transformation function, ordinary WLLR adaptation algorithm represents lower recognition rate than SI models, whereas the proposed MLLR adaptation algorithm represents the improvement of over 2% for the word recognition rate as compared to performance of SI models.

A Study on the Optimal Pitch Alteration According to the Pitch Alteration Ratio (피치변경율에 따른 최적의 피치변경법에 관한 연구)

  • 박형빈
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.460-464
    • /
    • 1998
  • 일반적으로 파형 부호화법에서는 발성자의 개성과 메시지 정보를 보존하여 음질의 명료성이 우수하다. 하지만 파형 부호화법이 규칙에 의한 합성에 적응되도록 하기 위해서는 운유 조절에서 피치 변경법이 요구되어 진다. 본 논문에서는 스펙트럼의 왜곡율을 최소화하면서도 위상을 그대로 보존할 수 있는 시간영역에서의 피치변경법을 적용하였다. 이러한 방법들은 시간영역에서만 처리됨으로써 계산량을 줄여 실시간 운율조절에 적합하다. 결과적으로 피치주기를 100%에서 50%로 압축한 경우 평균 스펙트럼 왜곡율은 5.62%이고, 피치주기를 100%에서 200%로 신장한 경우 평균 스펙트럼 왜곡율은 4.20%정도로 비교적 우수한 결과가 얻어졌다.

  • PDF

On a Study of Analysis Using Shifted Window in the Speech Signal (Shifted Window를 이용한 음성신호의 분석에 관한 연구)

  • Kang Eun Young;Min SoYeon;Bae MyungJin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.131-134
    • /
    • 2000
  • 음성신호처리에서 스펙트럼 분석은 매우 중요하다. 하지만 스펙트럼 분석을 위해서 사용되는 윈도우에 의해 생기는 누설에러지 때문에 음성신호의 스펙트럼 정보가 왜곡된다. 본 논문에서는 스펙트럼 분석 시 발생되는 창함수 사용에 의해 생기는 누설에너지를 최소화하기 위한 새로운 창함수를 제안하고자 한다. 그 형태는 전체 창함수크기의 반을 방형창으로 나머지 반을 해밍창으로 하고 창의 처음 부분은 $\pm$20표본에서 영점을 찾아주는 것이다. 이 창함수의 특징은 신호분석에 있어서 왜곡은 크지만 그 형태에 있어서 가장 이상적인 방형창함수의 장점과 side lobe가 작아 비교적 왜곡이 적은 해밍창함수의 장점을 취한 것이라 하겠다. 실제 음성 신호에의 적용에 있어서 방형창과 해밍창의 적용비는 신호의 종류 및 용도에 따라 달리할 수 있다. 제안한 창함수는 해밍창함수 보다는 좁은 main lobe 특성으로 음성신호의 단구간 스펙트럼 분석시 음성의 빠른 변화특성을 적절히 보여줄 수 있고 방형창보다는 side lobe의 영향을 줄일 수 있다.

  • PDF

A Study on the Pitch Alteration Technique by Sub-band Linear Approximation in Spectrum (서브밴드 선형근사에 의한 피치변경법에 관한 연구)

  • 김영규;김봉영;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2003.07e
    • /
    • pp.2423-2426
    • /
    • 2003
  • 음성합성은 합성방식에 따라 파형부호화법, 신호원부호화법, 혼성부호화법으로 분류할 수 있다. 특히 고음질 합성을 위해서는 파형부호화를 이용한 합성방식이 적합하다 하지만 파형부호화를 이용한 합성법은 여기 성분과 여파기 성분을 분리하지 않고 처리하기 때문에 음절단위나 음소단위의 합성기법으로는 바람직하지 못하다. 따라서 파형부호화법을 규칙에 의한 합성에 적용되도록 음원피치를 변경시키기 위한 피치 변경법이 필요하게 된다. 본 논문에서는 스펙트럼 왜곡을 최소화하기 위해 서브 선형근사에 의하여 스펙트럼 평탄화 시킨 후 스펙트럼 스케일링을 이용하여 피치를 변경하는 방법에 대하여 제안하였다. 기존 방법인 LPC법, Cepstrum법과 비교하여 어느 정도의 우수성을 보이는지 평가하였고 평가방법은 각각의 평탄화 된 신호의 분산을 구하여 평탄화의 정도를 측정하였다. 이때 평탄화 된 신호는 최고점이 영이 되도록 정규화 시키고 평균이 영인 분산을 계산하였다. 제안한 방법의 성능을 평가하기 위해 스펙트럼 왜곡율을 측정하여 본 결과 평균 스펙트럼 왜곡율은 평균 2.12% 이하로 유지되었으며 실험결과 제안한 방법이 기존의 방법보다 우수함을 보여주었다.

  • PDF

An Efficient Coding of LSP Parameters Using Multiple Type Frame Segmentation (다중 형태 프레임 분할 방법을 이용한 효율적인 LSP 계수 부호화에 관한 연구)

  • 이윤근
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.159-163
    • /
    • 1995
  • 음성 코딩에 있어서 스펙트럼 정보의 효율적인 방법으로써 다중 형태 프레임 분할 방법을 제안하였다. 일반적인 보코더의 경우 엔코더에서 전송된 스펙트럼 정보를 인접 프레임 계수간의 선형보간에 의해 하부프레임 단위의 스펙트럼 계수간의 선형보간에 의해 하부프레임 단위의 스펙트럼 정보를 재생해 낸다. 이 때 비선형적 스펙트럼 변화가 존재하는 경우에는 스펙트럼 왜곡이 발생하며 본 논문에서는 이를 intra frame spectral distortion 이라 정의한다. 제안된 다중 형태 프레임 분할 방법은 한 프레임내에서 스펙트럼 계수의 변화를 잘 나타낼 수 있도록 차수마다 다른 분할 형태를 적용하여 IFSD을 최소화시키는 방법이다. 스펙트럼 정보로써 line spectrum pair 계수를 이용하였으며, 분할 개수 및 분할 형태의 개수에 따른 IFSD을 분석하여 이를 기존의 방법과 비교하였다. 그 결과 기존의 방법보다 적은 정보량으로 왜곡이 적은 스펙트럼을 재생할 수 있었다.

  • PDF

A Spectral Compensation Method for Noise Robust Speech Recognition (잡음에 강인한 음성인식을 위한 스펙트럼 보상 방법)

  • Cho, Jung-Ho
    • 전자공학회논문지 IE
    • /
    • v.49 no.2
    • /
    • pp.9-17
    • /
    • 2012
  • One of the problems on the application of the speech recognition system in the real world is the degradation of the performance by acoustical distortions. The most important source of acoustical distortion is the additive noise. This paper describes a spectral compensation technique based on a spectral peak enhancement scheme followed by an efficient noise subtraction scheme for noise robust speech recognition. The proposed methods emphasize the formant structure and compensate the spectral tilt of the speech spectrum while maintaining broad-bandwidth spectral components. The recognition experiments was conducted using noisy speech corrupted by white Gaussian noise, car noise, babble noise or subway noise. The new technique reduced the average error rate slightly under high SNR(Signal to Noise Ratio) environment, and significantly reduced the average error rate by 1/2 under low SNR(10 dB) environment when compared with the case of without spectral compensations.

Digital predistorters for communication systems with dynamic spectrum allocation (가변 스펙트럼 할당을 지원하는 광대역 전력 증폭기를 위한 디지털 전치왜곡기)

  • Choi, Sung-Ho;Seo, Sung-Won;Mah, Bak-Il;Jeong, Eui-Rim
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.15 no.2
    • /
    • pp.307-314
    • /
    • 2011
  • A new predistortion technique for dynamic spectrum allocation systems such as cognitive radio (CR) is proposed. The system model considered in this paper occupies a small band at a time, but the center frequency can be changed in the wide range of frequency. In this scenario. the front-end filter may not eliminate the harmonics of the power amplifier (PA) output. The proposed PD reduces the spectral regrowth of the fundamental signal at the carrier frequency (${\omega}_0$) and removes the harmonics ($2{\omega}_0$, $3{\omega}_0$, ...) at the same time. The proposed PD structure is composed of multiple predistorters (PDs) centered at integer multiples of ${\omega}_0$. The PD at ${\omega}_0$ is for removing spectral regrowth of the fundamental signal, and the others are for harmonic reduction. In the proposed PD structure, parameters of PDs are found jointly. Simulation results show that the spectral regrowth can be reduced by 20dB, and the 2nd and 3rd harmonics can be reduced down to -70dB from the power of the fundamental signal.