• Title/Summary/Keyword: 음원의 분리

Search Result 89, Processing Time 0.025 seconds

Prediction of Environmental Noise using Contour Map (등고선 입력을 사용한 환경 소음 예측)

  • 박지헌;김정태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.547-549
    • /
    • 2002
  • 본 논문은 등고선을 이용한 입력된 지표면에 대하여, 소음 영향을 계산하는 프로그램 개발에 관한 것이다. 기존의 등고선 입력 방법을 구현하여 삼차원 지표면 입력을 받으며, 이것이 주위 환경의 일부이다. 삼차원 지표면 입력에 대하여, 국부에 대한 소음 영향을 예측하기 위하여, 지표면을 표현하는 다각형을 작은 삼각형으로 분리되며, 각 작은 삼각형에는 수음자들이 존재한다. 소음 원은 도로, 철도 등 다양하며, 소리가 퍼져나가는 근원이며, 모두 점 음원으로 간주된다. 지표면을 분리된 삼각형에 대하여 기하학 적인 방법을 사용하여 소음 전파 시뮬레이션이 이루어진다. 등고선 입력 방범은 저렴한 삼차원 지표면 입력 방범이며, 사용된 기하학 적인 소음 전파 영향 계산법은 제산 시간을 줄이면서 효율적으로 소음 영향을 예측할수 있게 해 준다.

  • PDF

On a Pitch Alteration Technique by Cepstrum Analysis of Flatten Excitation Spectrum (평탄화된 여기 스펙트럼에서 켑스트럼 피치 변경법에 관한 연구)

  • 조왕래;함명규;배명진
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.8
    • /
    • pp.82-87
    • /
    • 1998
  • 음성합성은 합성방식에 따라 파형부호화법, 신호원부호화법, 혼성부호화법으로 분류 할 수 있다. 특히 고음질 합성을 위해서는 파형부호화를 이용한 합성방식이 적합하다. 그렇 지만, 파형부호화를 이용한 합성법은 여기 성분과 여파기 성분을 분리하지 않고 처리하기 때문에 음절단위나 음소단위의 합성기법으로는 바람직하지 못하다. 따라서 파형부호화법을 규칙에 의한 합성에 적용되도록 음원피치를 변경시키기 위한 피치 변경법이 필요하게 된다. 본 논문에서는 스펙트럼 왜곡을 최소화하기 위해 켑스트럼의 성질을 이용하여 피치를 변경 하는 방법에 대하여 제안하였다. 이 방법은 주파수영역상에서 여기 스펙트럼과 여파기 스펙 트럼을 분리하여 여기 스펙트럼을 여기 켑스트럼으로 변환한 후 영값 삽입이나 삭제에 의해 피치를 변경하고 스펙트럼영역에서 피치 변경된 스펙트럼을 재구성하는 기법을 적용하였다. 제안한 방법의 성능을 평가하기 위해 스펙트럼 왜곡율을 측정하여 본 결과 평균 스펙트럼 왜곡율은 평균 2.29%이하로 유지되었으며 주관적인 음질도 평균 3.74로 우수하였다.

  • PDF

Vocal Separation in Music Using SVM and Selective Frequency Subtraction (SVM과 선택적 주파수 차감법을 이용한 음악에서의 보컬 분리)

  • Kim, Hyun-Tae
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.10 no.1
    • /
    • pp.1-6
    • /
    • 2015
  • Recently, According to increasing interest to original sound Karaoke instrument, MIDI type karaoke manufacturer attempt to make more cheap method instead of original recoding method. The specific method is to make the original sound accompaniment to remove only the voice of the singer in the singer music album. In this paper, a system to separate vocal components from music accompaniment for stereo recordings were proposed. Proposed system consists of two stages. The first stage is a vocal detection. This stage classifies an input into vocal and non vocal portions by using SVM with MFCC. In the second stage, selective frequency subtractions were performed at each frequency bin in vocal portions. Listening test with removed vocal music from proposed system show relatively high satisfactory level.

Audio signal clustering and separation using a stacked autoencoder (복층 자기부호화기를 이용한 음향 신호 군집화 및 분리)

  • Jang, Gil-Jin
    • The Journal of the Acoustical Society of Korea
    • /
    • v.35 no.4
    • /
    • pp.303-309
    • /
    • 2016
  • This paper proposes a novel approach to the problem of audio signal clustering using a stacked autoencoder. The proposed stacked autoencoder learns an efficient representation for the input signal, enables clustering constituent signals with similar characteristics, and therefore the original sources can be separated based on the clustering results. STFT (Short-Time Fourier Transform) is performed to extract time-frequency spectrum, and rectangular windows at all the possible locations are used as input values to the autoencoder. The outputs at the middle, encoding layer, are used to cluster the rectangular windows and the original sources are separated by the Wiener filters derived from the clustering results. Source separation experiments were carried out in comparison to the conventional NMF (Non-negative Matrix Factorization), and the estimated sources by the proposed method well represent the characteristics of the orignal sources as shown in the time-frequency representation.

A Method of Sound Segmentation in Time-Frequency Domain Using Peaks and Valleys in Spectrogram for Speech Separation (음성 분리를 위한 스펙트로그램의 마루와 골을 이용한 시간-주파수 공간에서 소리 분할 기법)

  • Lim, Sung-Kil;Lee, Hyon-Soo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.27 no.8
    • /
    • pp.418-426
    • /
    • 2008
  • In this paper, we propose an algorithm for the frequency channel segmentation using peaks and valleys in spectrogram. The frequency channel segments means that local groups of channels in frequency domain that could be arisen from the same sound source. The proposed algorithm is based on the smoothed spectrum of the input sound. Peaks and valleys in the smoothed spectrum are used to determine centers and boundaries of segments, respectively. To evaluate a suitableness of the proposed segmentation algorithm before that the grouping stage is applied, we compare the synthesized results using ideal mask with that of proposed algorithm. Simulations are performed with mixed speech signals with narrow band noises, wide band noises and other speech signals.

A Mono-To-Stereo Upmixing Algorithm Based on the Harmonic-Percussive Separation (타악기 음원 분리에 기반한 모노-스테레오 업믹싱 기법)

  • Choi, Keunwoo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.06a
    • /
    • pp.60-63
    • /
    • 2013
  • In this research, a mono-to-stereo upmixing algorithm based on music source separation is proposed. For the upmixing, a harmonic and percussive separation for jazz music is implemented. Then, the sources are re-panned by equalizing the loudness of left and right sides of listeners in the one proposed approach. In the other approach, the harmonic sources are spread by a decorrelator while the percussive sources are panned to the center. In the experiments, the re-panning algorithm showed advanced performance in terms of localization and timbral quality.

  • PDF

A Study on the Pitch Alteration Technique by Sub-band Linear Approximation in Spectrum (서브밴드 선형근사에 의한 피치변경법에 관한 연구)

  • 김영규;김봉영;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2003.07e
    • /
    • pp.2423-2426
    • /
    • 2003
  • 음성합성은 합성방식에 따라 파형부호화법, 신호원부호화법, 혼성부호화법으로 분류할 수 있다. 특히 고음질 합성을 위해서는 파형부호화를 이용한 합성방식이 적합하다 하지만 파형부호화를 이용한 합성법은 여기 성분과 여파기 성분을 분리하지 않고 처리하기 때문에 음절단위나 음소단위의 합성기법으로는 바람직하지 못하다. 따라서 파형부호화법을 규칙에 의한 합성에 적용되도록 음원피치를 변경시키기 위한 피치 변경법이 필요하게 된다. 본 논문에서는 스펙트럼 왜곡을 최소화하기 위해 서브 선형근사에 의하여 스펙트럼 평탄화 시킨 후 스펙트럼 스케일링을 이용하여 피치를 변경하는 방법에 대하여 제안하였다. 기존 방법인 LPC법, Cepstrum법과 비교하여 어느 정도의 우수성을 보이는지 평가하였고 평가방법은 각각의 평탄화 된 신호의 분산을 구하여 평탄화의 정도를 측정하였다. 이때 평탄화 된 신호는 최고점이 영이 되도록 정규화 시키고 평균이 영인 분산을 계산하였다. 제안한 방법의 성능을 평가하기 위해 스펙트럼 왜곡율을 측정하여 본 결과 평균 스펙트럼 왜곡율은 평균 2.12% 이하로 유지되었으며 실험결과 제안한 방법이 기존의 방법보다 우수함을 보여주었다.

  • PDF

Source Separation Technique for Analysis of Internal Noise of Diesel Multiple Unit (디젤 동차의 실내 소음 분석을 위한 음원 분리 기법)

  • Lee Hwa-Soo;Kim Jong-Nyeun
    • Proceedings of the KSR Conference
    • /
    • 2005.11a
    • /
    • pp.789-792
    • /
    • 2005
  • The dominant noise sources of Diesel Multiple Units are powerpack, which is composed of engine, transmission and cooling system, noise and wheel-rail rolling noise. The interior noise of a running vehicle is determined by structure-borne noise and air-borne noise from these noise sources. The contributions of interior noise from each noise source are calculated by air-borne transfer functions and structure-borne transfer functions of noise sources. In this paper, source separation technique is proposed to determine these transfer functions from the results of stationary and running tests of existing vehicle. With this technique, it is possible to get hold of contributions of interior noise from .noise sources of running vehicle. This source separation technique makes it possible to take efficient measures for reduction of interior noise at the early car-development stage.

  • PDF

Single Channel Polyphonic Music Separation Using Sparseness and Overlapping NMF (Overlapping NMF와 Sparseness를 이용한 단일 채널 다성 음악의 음원 분리)

  • Kim, Min-Je;Choi, Seung-Jin
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.769-771
    • /
    • 2005
  • In this paper we present a method of separating musical instrument sound sources from their monaural mixture, where we take the harmonic structure of music into account and use the sparseness and the overlapping NMF [1] to select representative spectral basis vectors which are used to reconstruct unmixed sound. A method of spectral basis selection is illustrated and experimental results with monaural mixture of voice/cello and trumpet/viola are shown to confirm the validity of our proposed method.

  • PDF

Analysis of the range estimation error of a target in the asynchronous bistatic sonar (비동기 양상태 소나의 표적 거리 추정 오차 분석)

  • Jeong, Euicheol;Kim, Tae-Hwan
    • The Journal of the Acoustical Society of Korea
    • /
    • v.39 no.3
    • /
    • pp.163-169
    • /
    • 2020
  • The asynchronous bistatic sonar needs to estimate direct blast arrival time at a receiver to localize targets, and therefore the direct blast arrival time estimation error could be added to target localization error in comparison with synchronous system. Direct blast especially appears as several peaks at the matched filter output by multipath, thus we compared the first peak detection technique and the maximum peak detection technique of those peaks for direct blast arrival time estimation through sea trial data. The test was performed in a shallow sea with bistatic sonar made up of spatially separated source and line array sensors. Line array sensors obtained the target signal which is generated from the echo repeater. As a result, the first peak detection technique is superior to maximum peak detection technique in direct blast arrival time estimation error. The result of this analysis will be used for further research of target tracking in the asynchronous bistatic sonar.