• Title/Summary/Keyword: 음성 부호화

Search Result 280, Processing Time 0.022 seconds

Tandemless Transcoding for AMR and EVRC Speech Coders (AMR과 EVRC 음성 부호화기간의 비탠덤 방식을 이용한 상호 부호화)

  • 이선일;유창동
    • The Journal of the Acoustical Society of Korea
    • /
    • v.21 no.6
    • /
    • pp.531-542
    • /
    • 2002
  • Novel tandemless transcoding method for AMR and EVRC speech coders is proposed in this paper. In contrast to conventional tandem method, the parameters which is used commonly in speech coder where CELP algorithm is adapted are directly transcoded. The proposed algorithm is composed of LSP transcoding, pitch delay transcoding, gains transcoding and fixed codebook vector transcoding Evaluation results show that the novel algorithm achieves better speech quality than tandem method and reduce computational complexity and delay.

Performance of ITU-T 8kbit/s Speech Coding Standard (CS-ACELP) (ITU-T 8kbit/s 음성부호화표준 CS-ACELP의 성능)

  • Kim, J.H
    • Electronics and Telecommunications Trends
    • /
    • v.13 no.2 s.50
    • /
    • pp.53-66
    • /
    • 1998
  • 본 고에서는 ITU가 수행해 온 음성 부호화 표준의 역사 그리고 1996년 ITU-T에서 승인된 8kbit/s 음성 부호화 표준인 CS-ACELP의 구성에 대해서 분석하였다. 또한, 미래 유, 무선 통신 시스템에 있어서 핵심 음성 부호화 기술로 자리잡게 될 CS-ACELP의 품질평가와 주요 애플리케이션을 살펴보았다.

PCS용 음성 부호화 기술

  • 이인성;강상원
    • 전기의세계
    • /
    • v.45 no.6
    • /
    • pp.4-8
    • /
    • 1996
  • 본 논문에서는 개인통신 시스템을 위한 음성 부호화기의 요구사항을 언급하고, 현재 PCS용 음성 부호화 기술로 제안 혹은 개발된 몇몇 주요한 음성 부호화 기술들을 소개하며, 각 주요 성능별 비교를 수행한다.

  • PDF

Development of Wideband GSM-EFR Speech Coding Algorithm with Application of Wavelet Transform to High-Band Signal (High-Band 신호에 웨이브렛 변환을 적용한 광대역 GSM-EFR 음성부호화 알고리즘 개발)

  • 이승원;배건성
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.783-786
    • /
    • 2000
  • 본 논문에서는 웨이브렛 변환을 적용한 광대역 음성부호화 알고리즘을 제안하였다. 제안한 음성부호화 알고리즘은 split-band 구조를 가지며, 16 kHz로 sampling된 입력신호를 QMF를 이용해서 동일한 대역폭을 갖는 두 개의 subband 신호로 나누고 이를 8kHz의 sampling율을 갖도록 downsampling 한다. 그리고 저대역 신호는 GSM-EFR 음성부호화 알고리즘을 이용하여 부호화하고, 고대역 신호는 DWT(Discrete Wavelet Transform)을 적용하여 subband로 나누어 부호화하였다. 각 subband에서 양자화 된 파라미터는 IDWT(Inverse DWT)과정을 거쳐서 upsampling되고 합성 QMF를 통과시켜 최종 합성음을 구하였다. 제안한 음성부호화기는 저대역 신호의 GSM-EFR 부호화에 12.2 kbps, 웨이브렛 변환을 이용한 고대역 신호의 부호화에 7.8 kbps로 전체 20 kbps의 전송율을 가지면서 G.722 표준안의 56 kbps에서의 합성음과 비슷한 음질을 나타내었다.

  • PDF

디지틀 이동 통신을 위한 음성 부호화 기술

  • Jeong, Jong-Tae;Kim, Yeong-Il
    • Electronics and Telecommunications Trends
    • /
    • v.4 no.3
    • /
    • pp.3-12
    • /
    • 1989
  • 디지틀 이동통신 시스팀 개발에 있어서 가용주파수 대역폭의 제한성 때문에 저 전송 속도 음성 부호화기에 관한 연구는 중요하다. 따라서, 음질도 좋고 주파수 효율을 극대화할 수 있는 디지틀 음성 부호화 방식에 대한 연구는 국내 고유모델의 디지틀 이동 통신 시스팀 개발에 초석이 된다고 할 수 있다. 본고에서는 현재 사용되거나 연구가 진행중인 디지틀 음성 부호화 방식들에 대하여 살펴보았고, 세계 각국에서 디지틀 이동통신을 위하여 제안한 디지틀 음성 부호화 방식들을 비교 및 검토 하였다.

A Low Rate VQ Speech Coding Algorithm with Variable Transmission Frame Length (가변 전송 Frame 길이를 갖는 저 전송속도 VQ 음성부호화 알고리즘에 대한 연구)

  • 좌정우;이성로;이황수
    • The Journal of the Acoustical Society of Korea
    • /
    • v.12 no.1E
    • /
    • pp.32-38
    • /
    • 1993
  • 본 논문에서는 저 전송속도의 음성 부호화기를 제안하였고 컴퓨터 시뮬레이션을 통하여 성능분석과 유연성을 입증하였다. 제안된 부호화 방식은 입력 음성신호의 Stationarity에 따라 전송 프레임의 길이를 가변하고, 전송 프레임의 대표적인 특징 벡터를 Vector Quatization으로 부호화하였다. 제안된 부호화 방식에서 특징 벡터열은 입력 음성신호를 샘플단위로 Prewindowed RLS Lattice 알고리즘을 통해 구한 PARCOR 계수로 구성된다. 입력 음성신호는 Subsegment로 분할되고, 각 Subsegment에서 대표적인 PARCOR 계수를 구한다. Likelihood Ratio Distortion Measure를 사용하여 유사도에 따라 Subsegment를 병합함으로써 전송프레임을 결정한다. 컴퓨터 시뮬레이션 결과로부터 제안된 VTEL 음성 부호화 방식은 좋은 음질을 유지하면서 전체 전송속도를 크게 줄일 수 있다.

  • PDF

Multi Rate Wideband Speech Coder with the AMR Speech Coder and MLT-VQ (AMR부호화기와 MLT-VQ방법을 이용한 다전송률 광대역 음성부호화기)

  • 김은주;이인성
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.809-812
    • /
    • 2001
  • 본 논문에서는 AMR(Adaptive Multi-Rate)과 MLT (Modulated Lapped Transform) 벡터 양자화 방법을 이용하여 광대역 음성부호화기를 설계하였다. 제안한 음성부호화 알고리즘은 split-band 구조를 가지고 있으며 16kHz로 샘플링 된 신호를 입력받아 QMF 필터에 의해 두 개의 대역으로 나누어, 각각 8kHz 샘플링 신호로 변환시킨 후 저대역(0Hz-3400Hz)의 신호와 고대역(3400Hz -7000Hz)의 신호로 나누어 각각 부호화한다. 나누어진 두 개의 협대역 음성신호는 AMR(Adaptive Multi-Rate)부호화기와 MLT (Modulated Lapped Transform)벡터 양자화 방법을 사용하여 각각 부호화되어 전송된다. 수신단에서는 각 대역을 AMR과 IMLT(Inverse MLT) 벡터 양자화 방법으로 역부호화하여 음성신호를 합성한다. 제안한 음성부호화기는 20.2kbps에서 12.15kbps까지의 다전송률로 동작된다. 설계된 광대역 음성부호화기는 MOS시험 결과로부터 G.722의 56 kbps 음성이 설계된 코더의 20.2 kbps와 비슷한 음질을 갖음을 확인할 수 있었다.

  • PDF

Coding History Detection of Speech Signal using Deep Neural Network (심층 신경망을 이용한 음성 신호의 부호화 이력 검출)

  • Cho, Hyo-Jin;Jang, Won;Shin, Seong-Hyeon;Park, Hochong
    • Journal of Broadcast Engineering
    • /
    • v.23 no.1
    • /
    • pp.86-92
    • /
    • 2018
  • In this paper, we propose a method for coding history detection of digital speech signal. In digital speech communication and storage, the signal is encoded to reduce the number of bits. Therefore, when a speech signal waveform is given, we need to detect its coding history so that we can determine whether the signal is an original or an coded one, and if coded, determine the number of times of coding. In this paper, we propose a coding history detection method for 12.2kbps AMR codec in terms of original, single coding, and double coding. The proposed method extracts a speech-specific feature vector from the given speech, and models the feature vector using a deep neural network. We confirm that the proposed feature vector provides better performance in coding history detection than the feature vector computed from the general spectrogram.

Low Bit-Rate Speech Coder (낮은 전송률 음성 부호화 방법)

  • 윤대희
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.267-270
    • /
    • 1994
  • 정보 및 통신의 필요성이 증대되면서 음성 부호화 방법에 관한 연구는 꾸준히 진행되어왔다. 특히, 이동통신에 대한 수요가 증가함에 따라 선진국에서는 기본 표준안을 완성하고, 채널 용량을 확대하기 위한 half-rate 표준화 작업이 한창 진행되고 있다. 본 논문에서는 표준화되거나 표준안으로의 가능성이 높은 음성 부호화 알고리즘들에 대해 서술한다. 또한 이로부터 향후 진행방향에 대해 언급하고자 한다.

  • PDF

Wideband Speech Coding Algorithm with Application of Wavelet Transform (웨이브렛 변환을 적용한 광대역 음성부호화 알고리즘)

  • 이승원;배건성
    • The Journal of the Acoustical Society of Korea
    • /
    • v.21 no.5
    • /
    • pp.462-470
    • /
    • 2002
  • Wideband speech, characterized by a bandwidth of 50∼7000 ㎐, sounds more natural and intelligible, and is less tiring to listen to when compared to narrowband speech characterized by a bandwidth of 300∼3400 ㎐. Wideband speech coders, however, have not been as successful as the narrowband speech coders because of their higher bit rate. In this paper, we propose a new wideband speech coder which combines the European standard of a narrowband speech coder, i.e., GSM-EFR, and a transform coder using the discrete wavelet transform. The proposed wideband speech coder operates as follows input speech is first split into two subbands with equal bandwidth and the two subband signals are coded and decoded by each subband coder. A GSM-EFR is adopted as a lower subband coder and a subband coder with wavelet transformed speech is designed for a upper subband coder. The total bit rate of the proposed coder is 18.9kbps (12.2 kbps for lower band coder and 6.7 kbps for upper band coder), and informal listening test results have shown that the proposed coder has comparable speech quality to that of G.722 with 56 kbps.