• 제목/요약/키워드: Spectral coding

검색결과 146건 처리시간 0.019초

정현파 모델 부호화기를 위한 MP(Matching Pursuit) 알고리즘과 파라미터 양자화기 (Matching Pursuit Estimation and Quantizer Design for Sinusoidal Model-based Coder)

  • 안영욱;정규혁;김종학;양용호;이인성
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.402-409
    • /
    • 2005
  • 본 논문에서는 고대역 (4kHz-8kHz)의 주기적 성분이 강하게 나타나는 신호에 대해서 MP (Matching Pursuit) 알고리즘을 이용한 부호화 방법을 제안한다. 또한 분석된 스펙트럼 크기 파라미터와 위상 파라미터의 효율적인 양자화 방법을 제안한다. MP 알고리즘은 오류 상쇄 원리와 정현파 모델에 바탕을 두고 있기 때문에 정확한 피치 주기 예측이 필요하다. 고대역의 정확한 피치 주기 예측을 위해 저대역 (0kHz-4kHz) 신호에서 검출한 피치 주기를 이용함으로써 부호화와 비트할당의 효율을 높일 수 있다. 스펙트럼 크기 계수의 양자화를 위해 계수들에 대해 고정 차원 이산코사인 변환 (MDCT : Modified Discrete Cosine Transform) 및 다단계 (multi-stage) 구조를 결합시킨 양자화 기법을 사용하였고, 위상 값들은 스펙트럼 크기에 따른 가중치 필터와 위상의 $2{\pi}$ 순환 특성을 이용하여 양자화하였다. 또한 제안한 양자화 기법과 부호화 방법을 음성 분석-합성 (analysis-by-synthesis) 시스템에 적용하여, 목적 신호와의 비교를 통해 검증한다. 향후 대역 분할을 기본 구조로 하는 계층 구조의 광대역 음성부호화기에의 적용 가능성을 제시한다.

난청인의 주파수 선택도와 비대칭적 청각 필터를 고려한 난청 시뮬레이터 개발에 관한 연구 (A Study on Development of a Hearing Impairment Simulator considering Frequency Selectivity and Asymmetrical Auditory Filter of the Hearing Impaired)

  • 주상익;강현덕;송영록;이상민
    • 전기학회논문지
    • /
    • 제59권4호
    • /
    • pp.831-840
    • /
    • 2010
  • In this paper, we propose a hearing impairment simulator considering reduced frequency selectivity and asymmetrical auditory filter of the hearing impaired, and we verified the reduced frequency selectivity and asymmetrical auditory filter affected in speech perception through experiments. The reduced frequency selectivity has made embodied by spectral smearing using LPC(linear prediction coding). The shapes of auditory filter are asymmetrical different with each center frequency. Hearing impaired person which has hearing loss was differently changed with that of normal hearing people and it has different value for speech of quality through auditory filter. The experiments confirmed subjective test and objective test. The subjective experiments are composed of 4 kinds of tests: pure tone test, SRT(speech reception threshold) test, and WRS(word recognition score) test without spectral smearing, and WRS test with spectral smearing. The experiment of the hearing impairment simulator was performed from 9 subjects who have normal ears. The amount of spectral smearing was controlled by LPC order. The asymmetrical auditory filter of proposed hearing impairment simulator was simulated and then some tests to estimate the filter's performance objectively were performed. The objective experiment as simulated auditory filter's performance evaluation method used PESQ(perceptual evaluation of speech quality) and LLR(log likelihood ratio) for speech through auditory filter. The processed speech was evaluated objective speech quality and distortion using PESQ and LLR value. When hearing loss processed, PESQ and LLR value have big difference according to asymmetrical auditory filter in hearing impairment simulator.

STBC-OFDM 시스템에서 빔형성 기법의 성능평가 (Performance Evaluation of Beamformer for STBC-OFDM Systems)

  • 이상문;최형진
    • 한국통신학회논문지
    • /
    • 제29권6C호
    • /
    • pp.883-892
    • /
    • 2004
  • 최근 무선통신 시스템에서 고속 데이타의 전송 및 스펙트럼의 효율을 개선하기 위한 방법으로 시공간부호와 OFDM을 결합한 시스템에 대한 연구가 활발하다. 또한 다중사용자 시스템에서 시스템 용량을 개선하기 위한 해법으로 적응형 안테나가 고려되고 있다. STBC를 이용하는 시스템의 수신기에서 한 사용자의 두 개의 안테나로부터 전송되는 신호는 서로 중첩되어 사용자의 송신 안테나간에도 서로 간섭을 일으키게 된다. 따라서 기존의 하나의 송신 안테나를 이용하는 경우에 대한 범형성 기법을 그대로 적용하기 어렵다. 본 논문에서는 역방향 링크에서 시공간 부호화와 OFDM을 결합한 STBC-OFDM에서 훈련열을 이용한 MMSE 범형성 기법에 대해 살펴보고, 그 성능을 TU 채널과 HT채널에 대해 다양한 파라미터를 이용하여 평가하고, angle spread의 효과도 분석한다.

복호후재전송을 사용하는 양방향 OFDMA 중계 네트워크에서 다중사용자를 위한 부반송파 할당 기법 (Subcarrier Allocation for Multiuser in Two-Way OFDMA Relay Networks using Decode-and-Forward Relaying)

  • 신한목;이재홍
    • 방송공학회논문지
    • /
    • 제15권6호
    • /
    • pp.783-790
    • /
    • 2010
  • 양방향 중계 네트워크는 중계기에 중첩 부호화 또는 네트워크 부호화를 적용함으로써 기존의 단방향 중계 네트워크에 비해 향상된 주파수 효율을 제공한다. 한편, OFDMA 네트워크는 사용자에게 부반송파, 파워 등의 자원을 적응적으로 할당하여 네트워크의 성능향상을 얻을 수 있다. 본 논문에서는 복호후재전송을 사용하는 양방향 OFDMA 중계 네트워크에서 다중사용자를 위한 적응적 부반송파 할당 알고리즘을 제안한다. 제안된 알고리즘은 각 사용자 쌍의 최소 전송속도를 보장하며 모든 사용자 쌍에 대한 달성 합 전송속도를 최대화하기 위해 부반송파를 사용자 쌍과 중계기에 적응적으로 할당한다. 모의실험을 통해 제안된 알고리즘이 정적 알고리즘, 그리디 알고리즘 보다 우수한 성능을 보임을 확인한다.

광대역 신호 압축기를 위한 주파수 대역 특성에 선택적인 양자화 방법 (Selective Quantization Based on Band Property for Wideband Signal Codec)

  • 송재종;박호종;김무영;김도석;김정수
    • 한국음향학회지
    • /
    • 제20권7호
    • /
    • pp.76-82
    • /
    • 2001
  • 본 논문에서는 7 kHz 대역의 광대역 신호 압축기를 위한 새로운 양자화 방법을 제안한다. 일반적인 광대역 신호 압축기는 입력 신호를 주파수 영역으로 변환하고 청각 모델을 적용하여 주파수 대역별로 양자화하여 Huffman 코딩하는 구조를 가진다. 그러나, 주파수 대역별로 신호의 특성이 일정하지 않으므로 모든 대역을 동일한 방법으로 양자화하면 각 주파수 대역의 특성에 적합한 양자화를 하지 못하므로 전체 압축기의 성능이 저하된다. 따라서 본 논문에서는 각 주파수 대역별로 특성을 분석하여 주파수 영역 또는 시간 영역 중에서 양자화에 효율적인 영역을 선택하여 양자화 하는 새로운 방법을 제안한다. 제안한 양자화 방법의 성능을 측정하여 ITU G.722.1 표준 압축기의 양자화 방법보다 우수한 성능을 가지는 것을 확인하였다.

  • PDF

네트워크 환경에서 서버용 음성 인식을 위한 MFCC 기반 음성 부호화기 설계 (A MFCC-based CELP Speech Coder for Server-based Speech Recognition in Network Environments)

  • 이길호;윤재삼;오유리;김홍국
    • 대한음성학회지:말소리
    • /
    • 제54호
    • /
    • pp.27-43
    • /
    • 2005
  • Existing standard speech coders can provide speech communication of high quality while they degrade the performance of speech recognition systems that use the reconstructed speech by the coders. The main cause of the degradation is that the spectral envelope parameters in speech coding are optimized to speech quality rather than to the performance of speech recognition. For example, mel-frequency cepstral coefficient (MFCC) is generally known to provide better speech recognition performance than linear prediction coefficient (LPC) that is a typical parameter set in speech coding. In this paper, we propose a speech coder using MFCC instead of LPC to improve the performance of a server-based speech recognition system in network environments. However, the main drawback of using MFCC is to develop the efficient MFCC quantization with a low-bit rate. First, we explore the interframe correlation of MFCCs, which results in the predictive quantization of MFCC. Second, a safety-net scheme is proposed to make the MFCC-based speech coder robust to channel error. As a result, we propose a 8.7 kbps MFCC-based CELP coder. It is shown from a PESQ test that the proposed speech coder has a comparable speech quality to 8 kbps G.729 while it is shown that the performance of speech recognition using the proposed speech coder is better than that using G.729.

  • PDF

On Inflated Achievable Sum Rate of 3-User Low-Correlated SC NOMA

  • Chung, Kyuhyuk
    • International journal of advanced smart convergence
    • /
    • 제10권3호
    • /
    • pp.1-9
    • /
    • 2021
  • In the Internet of Thing (IoT) framework, massive machine-type communications (MMTC) have required large spectral efficiency. For this, non-orthogonal multiple access (NOMA) has emerged as an efficient solution. Recently, a non-successive interference cancellation (SIC) NOMA scheme has been implemented without loss. This lossless NOMA without SIC is achieved via correlated superposition coding (SC), in contrast to conventional independent SC. However, conventional minimum high-correlated SC for only 2-user NOMA schemes was investigated in the lossless 2-user non-SIC NOMA implementation. Thus, this paper investigates a 3-user low-correlated SC scheme, especially for an inflated achievable sum rate, with a design of 3-user low-correlated SC. First, we design the 3-user low-correlated SC scheme by taking the minimum sum rate between 3-user SIC NOMA and 3-user non-SIC NOMA, both with correlated SC. Then, simulations demonstrate that the low correlation in the direction of the first user's power allocation inflates the sum rate in the same direction, compared to that of conventional minimum high-correlated SC NOMA, and such inflation due to low correlation is also observed similarly, in the direction of the second user's power allocation. Moreover, we also show that the two low correlations of the first and second users inflates doubly in the both directions of the first and second users' power allocations. As a result, the proposed 3-user low-correlated SC could be considered as a promising scheme, with the inflated sum rate in the future fifth-generation (5G) NOMA networks.

Improvement of Photoheterotrophic Hydrogen Production of Rhodobacter sphaeroides by Removal of B800-850 Light-Harvesting Complex

  • KIM EUI-JIN;YOO SANG-BAE;KIM MI-SUN;LEE JEONG K.
    • Journal of Microbiology and Biotechnology
    • /
    • 제15권5호
    • /
    • pp.1115-1119
    • /
    • 2005
  • The photoheterotrophic $H_2$ production of Rhodobacter sphaeroides was significantly increased through disruption of the genes coding for uptake hydrogenase and poly-${\beta}$-hydroxybutyrate (PHB) synthase (Lee et al., Appl. Microbiol. Biotechnol. 60: 147-153, 2002). In this work, we further removed the B800-850 light-harvesting (LH) complex from the strain and found an increase in $H_2$ production at the light-saturating cell growth (${\ge}10$ Watts $[W]/m^2$). Neither the mutant nor the wild-type produced more $H_2$ at the brighter light. Accordingly, light does not appear to be limited for the $H_2$ production by the presence of B800-850. However, increase in the level of the spectral complexes resulted in decrease of $H_2$ production. Thus, although the B875 is essential for light harvesting, the consumption of cellular energy for the synthesis of B800-850 and the surplus LH complexes may reduce the energy flow into the $H_2$ production of R. sphaeroides.

Multi-band Approach to Deep Learning-Based Artificial Stereo Extension

  • Jeon, Kwang Myung;Park, Su Yeon;Chun, Chan Jun;Park, Nam In;Kim, Hong Kook
    • ETRI Journal
    • /
    • 제39권3호
    • /
    • pp.398-405
    • /
    • 2017
  • In this paper, an artificial stereo extension method that creates stereophonic sound from a mono sound source is proposed. The proposed method first trains deep neural networks (DNNs) that model the nonlinear relationship between the dominant and residual signals of the stereo channel. In the training stage, the band-wise log spectral magnitude and unwrapped phase of both the dominant and residual signals are utilized to model the nonlinearities of each sub-band through deep architecture. From that point, stereo extension is conducted by estimating the residual signal that corresponds to the input mono channel signal with the trained DNN model in a sub-band domain. The performance of the proposed method was evaluated using a log spectral distortion (LSD) measure and multiple stimuli with a hidden reference and anchor (MUSHRA) test. The results showed that the proposed method provided a lower LSD and higher MUSHRA score than conventional methods that use hidden Markov models and DNN with full-band processing.

SBR을 이용한 주파수 밴드선택 여기 선형예측 광대역 음성/오디오 부호화 (Frequency Band Selection Exited Linear Prediction Wideband Speech/Audio Coding Using SBR)

  • 장성훈;이인성
    • 한국음향학회지
    • /
    • 제32권6호
    • /
    • pp.556-562
    • /
    • 2013
  • 본 논문은 컴포트 노이즈(comfort noise)를 이용하는 주파수 밴드선택 음성/오디오 코덱에서 컴포트 노이즈 대신 SBR(Spectral Band Replication) 기술을 이용하여 여기 신호를 대체 함으로서 밴드 선택 광대역 음성/오디오 부호화기의 성능 향상을 목표로 한다. 비 전송 밴드에 SBR 기술로 합성된 신호를 삽입하기 위하여 부밴드 별로 전송된 신호를 활용하며, 각각의 부밴드 별로 에너지 가중치를 설정한다. 백색잡음 성분의 컴포트 노이즈 대신 전송신호에 의존하는 신호를 합성 함으로서 보다 높은 음질의 밴드 선택 부호화기를 제안하였다.