• 제목/요약/키워드: Speech signals

검색결과 499건 처리시간 0.027초

멀티채널 Spatial Audio Coding에서의 효율적인 Spatial Cues 사용과 그에 따른 Spectrum 보상방법 (An efficient method of spatial cues and compensation method of spectrums on multichannel spatial audio coding)

  • 이병화;백승권;서정일;한민수
    • 대한음성학회지:말소리
    • /
    • 제53호
    • /
    • pp.157-169
    • /
    • 2005
  • This paper proposes an efficiently representing method of spatial cues on multichannel spatial audio coding. The Binaural Cue Coding (BCC) method introduced recently represents multichannel audio signals by means of Inter Channel Level Difference (ICLD) or Source Index (SI). We tried to express more efficiently ICLD and SI information based on Inter Channel Correlation in this paper. We adopt different spatial cues according to ICC and propose a compensation method of empty spectrums created by using SI. We performed a MOS test and measuring spectral distortion. The results show that the proposed method can reduce the bitrate of side information without large degradation of the audio quality.

  • PDF

성도의 다이내믹 피라미터에 의한 한글 모음간의 근사도에 관한 연구 (A Study on the Affinity Between Pairs of Korean Vowels Using the Dynamic Paremeters of Vocal Tract)

  • 김중규;안수길
    • 대한전자공학회논문지
    • /
    • 제19권1호
    • /
    • pp.1-8
    • /
    • 1982
  • 적응선형자측(adaptive linear prediction) 방법에 의한 음성신묵의 parametric representation에 대한 연구는 이제까지 널리 행해져 왔다. 본 논문에서는 LPC(Linear Predictive Coding) 방법으로 한글 격모음및 일체 복함모음에 대한 parameter들을 각각 분석해 내어서 이를 이용하여 한글모음 상호간의 근사도(affinity)에 대한 통계적 연구를 하여 음성학적인 면과 비교 고찰하였다. 그리고 그에 따른 결과로서 음성학적으로 근사하여 혼동되는 경향이 있는 모음간에는 vocal tract의 dynamic parameter 간에도 근사성이 있음을 밝혔다.

  • PDF

어휘 그룹화를 이용한 음성인식시스템의 성능향상에 관한 연구 (A Study on the Efficient Speech Recognition System using Database Grouping)

  • 우상욱;권승호;한수양;이동규;이두수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2455-2458
    • /
    • 2003
  • In this paper, the Classification of Energy Labeling has been Proposed. Energy Parameters of input signal which is extracted from each phoneme is labelled. And groups of labelling according to detected energies of input signals are detected. Next, DTW processes in a selected group of labeling. This leads to DTW processing faster than a previous algorithm. In this Method, because an accurate detection of parameters is necessary on the assumption in steps of a detection of speeching duration and a detection of energy parameters, variable windows which are decided by pitch period is used. Extract algorithms don't search for exact frame energy, because 256 frame window-sizes is fixed. For this reason, a new energy extraction method has been proposed. A pitch period is detected firstly; next window scale is decided between 200 frames and 300 frames. The proposed method make it possible to cancel an influence of windows.

  • PDF

은닉 마르코프 모형을 이용한 회전체 결함신호의 패턴 인식 (Pattern Recognition of Rotor Fault Signal Using Bidden Markov Model)

  • 이종민;김승종;황요하;송창섭
    • 대한기계학회논문집A
    • /
    • 제27권11호
    • /
    • pp.1864-1872
    • /
    • 2003
  • Hidden Markov Model(HMM) has been widely used in speech recognition, however, its use in machine condition monitoring has been very limited despite its good potential. In this paper, HMM is used to recognize rotor fault pattern. First, we set up rotor kit under unbalance and oil whirl conditions. Time signals of two failure conditions were sampled and translated to auto power spectrums. Using filter bank, feature vectors were calculated from these auto power spectrums. Next, continuous HMM and discrete HMM were trained with scaled forward/backward variables and diagonal covariance matrix. Finally, each HMM was applied to all sampled data to prove fault recognition ability. It was found that HMM has good recognition ability despite of small number of training data set in rotor fault pattern recognition.

음성 파형코딩 음원피치 변경에 관한 연구 -LPC와 주기반분법에 의한 피치변경법- (On Altering the Pitch of Speech Signals in Waveform Coding -Alteration Method by the LPC and the Pitch Halving-)

  • 배명진;윤희상;안수길
    • 한국음향학회지
    • /
    • 제10권5호
    • /
    • pp.11-19
    • /
    • 1991
  • 음성 신호의 합성기법들 중에서 파형코딩법은 음질이 우수하기 때문에 분석에 의한 합성법으로 많이 사용하고 있다. 그렇지만 음원과 성도의특성을 분리하지 않고 파형의 잉여분만을 제거한 후에 파 형자체를 저장하기 때문에 규칙에 의한 합성기법으로 사용하기에는 어려움이 많다. 본 논문은 파형코딩 법 중 선형 PCM 코딩법으로 저장된 음성파형에 대해 피치를 양분할 수 있는 주기반분법을 제안하여 파형자체의 음원을 분리하지 않고 피치 주기를 변경시킬 수 있는 새로운 피치 변경법을 제안하였다. 따 라서 음질이 우수한 파형코딩 합성법으로 규칙에 의한 합성을 수행할 수 있다.

  • PDF

ADM 부호화신호를 위한 디지털필터구조에 관한 연구 (A Study on the Digital Filter Structure for ADM Coded Signal)

  • 신재호
    • 한국통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.642-649
    • /
    • 1989
  • 本 論文에서는 ADM 符號化信號를 직접 인가하여 처디지털필터의 動作原理와 그 構造에 관하여 硏究하였다. 제시된 構造의 DM 필터의 周波數特性을 도출하기 위하여 임의의 音聲信號를 標本化하여 入力데이터로 사용하였는데, 컴퓨터 simulation을 통해 나타난 결과를 검토해 본 바에 의하면, 예리한 遮斷特性을 갖지는 않았지만 충분한 이용가치가 있었다.

  • PDF

고주파 신호에 의하여 변형된 저주파신호에서의 특성변수 추정 기법 (An Estimation method for Characteristic Parameters in a Low Frequency Signal Transformed by High Frequency Signals)

  • 유경열
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제51권2호
    • /
    • pp.86-88
    • /
    • 2002
  • An estimation method for the characteristic parameters in the low frequency signal is proposed in this paper. A low frequency signal is assumed to be modulated or distorted by high frequency terms. The algorithm proposed in this paper is designed to select set of local maximums in a successive manner, hence it is denoted as the iterative peak picking(IPP) algorithm. The IPP algorithm is operating in the time domain and is using only the comparison operation between two neighboring samples. Therefore, its computational complexity is very low and the delay caused by the computation is negligible, which make the real-time operation possible with economic hardware. The proposed algorithm is verified on the pitch estimation of speech signal and blood pulse estimation.

스테레오 패닝 음원을 위한 음원 분리 알고리즘 (A Source Separation Algorithm for Stereo Panning Sources)

  • 백용현;박영철
    • 한국정보전자통신기술학회논문지
    • /
    • 제4권2호
    • /
    • pp.77-82
    • /
    • 2011
  • 본 논문에서는 패닝 기법을 이용하여 믹싱된 스테레오 음원에서 음원을 분리하는 방법에 대하여 고찰한다. 음원 분리 알고리즘은 다채널 포맷 변환을 위한 업믹스나 음질 개선, 고품질 음원 분리 등 다양한 응용분야에 사용될 수 있다. 본 논문에서 사용하는 음원 분리 알고리즘은 믹싱된 스테레오 채널을 시간-주파수 별로 PCA(Principal Component Analysis) 분석 방법을 이용하여 각각의 음원들이 패닝된 방향을 추정하며, 추정된 방향의 성분만을 추출하는 방향 필터링 과정을 거쳐 음원들을 독립적으로 분리 해 낸다. 실험을 통해 각 음원 분리 알고리즘의 성능을 평가하였다.

에밀레의 맥놀이와 다른 파동과의 상관관계 (A Correlation between Emile Sound and Other Waves)

  • 안정근;진용옥
    • 한국음향학회지
    • /
    • 제20권1호
    • /
    • pp.30-35
    • /
    • 2001
  • 에밀레 소리 울림의 최대 특징은 맥놀이 파동의 생성이다. 이는 시간영역에서는 간섭 곱셈의 결과로 나타나며 반소파는 억제하면서 신호파가 좌우에 분포하는 대역 억압 양측파대 변조방식이다. 이러한 맥놀이파는 에밀레의 파동 이외도 폴리비닐에 대한 라만 분산신호, 음성신호, 수맥파와 조석파 등에서 관찰된다. 이러한 맥놀이의 발생원인은 대칭구조에서 비대칭 구조로 발생함을 보여주고 있다.

  • PDF

성긴임펄스 응답 시스템을 위한 부밴드 IPNLMS 적응필터 (Subband IPNLMS Adaptive Filter for Sparse Impulse Response Systems)

  • 손상욱;최훈;배현덕
    • 전기학회논문지
    • /
    • 제60권2호
    • /
    • pp.423-430
    • /
    • 2011
  • In adaptive filtering, the sparseness of impulse response and input signal characteristics are very important factors of it's performance. This paper presents a subband improved proportionate normalized least square (SIPNLMS) algorithm which combines IPNLMS for impulse response sparseness and subband filtering for prewhitening the input signal. As drawing and combining the advantage of conventional approaches, the proposed algorithm, for impulse responses exhibiting high sparseness, achieve improved convergence speed and tracking ability. Simulation results, using colored signal(AR(4)) and speech input signals, show improved performance compared to fullband structure of existing methods.