• 제목/요약/키워드: speech codec

검색결과 128건 처리시간 0.029초

SMV코덱의 음성/음악 분류 성능 향상을 위한 Support Vector Machine의 적용 (Analysis and Implementation of Speech/Music Classification for 3GPP2 SMV Codec Based on Support Vector Machine)

  • 김상균;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.142-147
    • /
    • 2008
  • 본 논문에서는 support vector machine (SVM)을 이용하여 기존의 3GPP2 selectable mode vocoder (SMV)코덱의 음성/음악 분류 성능을 향상시키는 방법을 제시한다. SVM은 통계적 학습 이론으로 훈련 데이터 사이의 최적 분류 초평면을 찾아내 최적화된 이진 분류를 보여준다. SMV의 음성/음악 실시간 분류 알고리즘에서 사용된 특징벡터와 분류방법을 분석하고, 이를 기반으로 분류성능향상을 위해 통계적 학습 이론인 SVM을 도입한다. 구체적으로, SMV의 음성/음악 분류알고리즘에서 사용되어진 특징벡터만을 선택적으로 사용하여 효과적으로 SVM을 구성한 분류기법을 제시한다. SMV의 음성/음악 분류에 적용한 SVM의 성능 평가를 위해 SMV 원래의 분류알고리즘과 비교하였으며, 다양한 음악장르에 대해 시스템의 성능을 평가한 결과 SVM을 이용하였을 때 기존의 SMV의 방법보다 우수한 음성/음악 분류 성능을 보였다.

변별적 가중치 학습을 이용한 3GPP2 SVM의 실시간 음성/음악 분류 성능 향상 (Enhancement of Speech/Music Classification for 3GPP2 SMV Codec Employing Discriminative Weight Training)

  • 강상익;장준혁;이성로
    • 한국음향학회지
    • /
    • 제27권6호
    • /
    • pp.319-324
    • /
    • 2008
  • 본 논문에서는 변별적 가중치 학습 (discriminative weight training) 기반의 3GPP2 Selectable Mode Vocoder (SMV) 실시간 음성/음악 분류 성능을 향상 시키는 방법을 제안한다. SMV의 음성/음악 실시간 분류 알고리즘에서 사용된 특징벡터와 분류방법을 분석하고, 이를 기반으로 분류성능향상을 위해 MCE (minimum classification error)방법을 도입하여, 각 특징 백터별로 다른 가중치를 적용하는 음성/음악 결정법 (decision rule)을 제시한다. 구체적으로 SMV의 음성/음악 분류알고리즘에서 사용되어진 특징벡터만을 선택적으로 사용하여 가중치를 적용한 값을 기하 평균한 값을 문턱값과 비교하는 실시간 분류기법이 제시되었다. SMV의 음성/음악 분류에 제안한 방법의 성능 평가를 위해 SMV 원래의 분류알고리즘과 비교하였으며, 다양한 음악장르에 대해 시스템의 성능을 평가한 결과 가중치를 적용하였을 때 기존의 SMV의 방법보다 우수한 음성/음악 분류 성능을 보였다.

EVRC와 G.729A 간의 상호부호화 (A Transcoding Algorithm between EVRC and G.729A)

  • 권구락;고성제
    • 대한전자공학회논문지SP
    • /
    • 제43권3호
    • /
    • pp.54-60
    • /
    • 2006
  • 본 논문에서는 EVRC와 G.729A 음성부호화기를 위한 상호부호화 알고리듬을 제안한다. 다른 음성 표준을 사용하는 통신망간에 음성신호를 연동시키는 가장 간단한 방법은 이중 부/복호화 (tandem coding) 방법이다. 이 방법은 두 번의 부/복호화 과정을 거치기 때문에 많은 계산량이 요구되며 아울러 음성 지연이 발생하게 된다. 이러한 문제점들을 개선하기 위하여 상호부호화를 사용한다. 상호부호화는 LSP (Line Spectral Pair) 변환과 피치 지연 변환 그리고 지연 시간 단축 알고리듬을 통하여 수행한다. 제안된 알고리듬은 $18{\sim}22%$의 적은 계산량과 $5{\sim}10ms$의 짧은 지연으로 상호 부/복호화에 상응하는 음성 품질을 제공함을 실험을 통해 확인할 수 있다.

디지털 이동통신을 위한 음성 부호기의 성능 분석 (A Performance Analysis of the Speech Coders for Digital Mobile Radio)

  • 정영모;이상욱
    • 대한전자공학회논문지
    • /
    • 제27권4호
    • /
    • pp.491-501
    • /
    • 1990
  • Recently, four speech coding techniques, namely, SBC-APCM(sub-band coding adaptive PCM), RPE-LPC(regualr pulse excitation linear predictive codec), MPE-LTP(multi-pulse excited long-term prediction) and CELP (code-excited linear prediction) are proposed for digital mobile radio applications. However, a performance comparison of these coders in the Rayleigh fading environment has not been made yet. In this paper, the performances of the four spech coders in the random bit error and burst error environment are investigated. For the channel coding of SBC-APCM, RPE-LPC and MPE-LTP, the sensitivity of output bit stream is measured and a bit selective forward error correction is provided acording to the measured bit sensitivity. And for an attempt to improve the performance of CELP, an optimum quantizer is applied for transmitting scalar quantities in CELP. However, an improvement over the conventional approach is found to be negligible. For the channel coding of CELP, Reed-Solomon code, Golay code, convolutional code of rate 1/2 shows the best performance. Finally, from the simulation results, it is concluded that CELP is the best candidate for digital mobile radio and is followed by MPE-LTP, SBC-APCM and RPE-LPC.

  • PDF

효율적인 LSF 양자화기를 이용한 QCELP 성능개선 (Performance Improvement of the QCELP using an Efficient LSF Coding)

  • 김해진;강상원
    • 한국음향학회지
    • /
    • 제16권1호
    • /
    • pp.10-15
    • /
    • 1997
  • 본 논문에서는 LSF계수의 효율적인 양자화기인 improved PSVQ(IPSVQ) 방식을 제안하고, 이를 CDMA 디지틀 이동통신용 음성부호화기인 8 kbps QCELP에 도입하여 QCELP의 성능을 개선하였다. 프레임당 40 비트의 DPCM 양자화방식 대신 27 비트에서 transparent한 성능을 제공하는 IPSVQ 방식을 이용하여 13 비트를 절약하고, 이렇게 절약된 비트들을 음질에 중요한 영향을 끼치는 계수들에 해당하는 코드북 및 피치이득 계수의 양자화에 추가로 할당하여 QCELP의 전체적인 성능을 개선하였다. 객관적인 평가 방법인 SNR 및 SEGSNR이 각각 0.9 dB와 0.4 dB 정도 개선되었으며, 주관적인 음질시험을 통해서 성능향상을 확인할 수 있었다.

  • PDF

RSA - QoS: A Resource Loss Aware Scheduling Algorithm for Enhancing the Quality of Service in Mobile Networks

  • Ramkumar, Krishnamoorthy;Newton, Pitchai Calduwel
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권12호
    • /
    • pp.5917-5935
    • /
    • 2018
  • Adaptive Multi-Rate Codec is one of the codecs which is used for making voice calls. It helps to connect people who are scattered in various geographical areas. It adjusts its bit-rate according to the user's channel conditions. It plays a vital role in providing an improved speech quality of voice connection in Long Term Evolution (LTE). There are some constraints which need to be addressed in providing this service profitably. Quality of Service (QoS) is the dominant mechanism which determines the quality of the speech in communication. On several occasions, number of users are trying to access the same channel simultaneously by standing in a particular region for a longer period of time. It refers to Multi-user channel sharing problem which leads to resource loss very often. The main aim of this paper is to develop a novel RSA - QoS scheduling algorithm for reducing the Resource Loss Ratio. Eventually, it increases the throughput.The simulation result shows that the RSA - QoS increases the number of users for accessing the resources better than the existing algorithms in terms of resource loss and throughput. Ultimately, it enhances the QoS in Mobile Networks.

FEC기능을 추가한 AMR-WB 음성 부호화기를 이용한 음성 패킷 전송 (Speech Packet Transmission Using the AMR-WB Coder with FEC)

  • 황정준;이인성
    • 대한전자공학회논문지TC
    • /
    • 제40권11호
    • /
    • pp.63-71
    • /
    • 2003
  • 본 논문에서는 인터넷 환경에서 실시간 음성 통신을 가능하게 하기 위해 부가 정보를 이용한 손실 패킷 복구 방법이 첨가된 전송 방법을 제시한다. 3GPP에서 기본적으로 이동 통신 환경에서의 사용을 위해 표준화되었고, 인터넷 환경에서의 사용을 위해 최근에 ITU-T에서 개선된 AMR-WB 음성 부호화기를 사용하였다. 인터넷과 같은 패킷 교환망 서비스에서의 패킷손실은 음질 저하를 유발하고 실시간 통신이 불가능하도록 한다. 따라서 본 논문에서는 단일 손실 발생시에 FEC(Foward Error Correction) 방법을 적용하였고 연속 손실의 경우에는 오류 은닉을 하였다. 또한 손실율에 따라 AMR-WR(Adaptive Multi-Rate Wideband) 부호화기의 특성을 이용하여 여러 모드로 동작하는 방법을 제시한다. 인터넷 환경의 실험을 위해 길버트 모델을 이용하였다. 손실율을 변화시키며 AMR-WB 23.05 kbit/s 모드로 전송하는 방법과 SNR(Signal to Noise Rate)과 MOS(Mean Opinion Score) 측정을 통해 비교하였다. 실험한 결과 손실율이 30% 에서도 SNR은 9.8㏈ MOS 값은 3.0정도의 통신 가능한 높은 음질을 보였다.

MPEG-D USAC: 통합 음성 오디오 부호화 기술 (MPEG-D USAC: Unified Speech and Audio Coding Technology)

  • 이태진;강경옥;김환우
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.589-598
    • /
    • 2009
  • 다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. 이와 같은 새로운 부호화 기술에 대한 요구사항에 따라, MPEG에서는 2007년 10월 82차 회의에서 CfP를 시작으로 USAC 표준화를 시작하였고, 2009년 4월 88차 회의에서 WD3까지 완성되었다. MPEG-D USAC 기술은 최신 음성 부호화기인 AMR-WB+와 최신 오디오 부호화기인 HE-AAC V2를 융합한 기술로 입력 신호의 특성에 따라 코어 대역 부호화로 AAC, ACELP, TCX 등 다양한 방법 중 하나를 선택하여 부호화를 수행하고, 고대역 부호화 기술로는 SBR, 스테레오 부호화 기술로는 MPEG-Surround를 이용한다. USAC 기술은 음성과 음악 신호 모두에 대해 모두 우수한 음질을 제공할 수 있으며, 모바일 기기로의 멀티미디어 콘텐츠 다운로드, 디지털 라디오, 모바일 TV 및 오디오 북등에서 응용이 가능하다.

G.723.1 음성 부호화기의 LSE 계수 양자화를 위한 고속화 알고리즘 연구 (A study on a fast algorithm for the LSP coefficient quantization of G. 723.1 speech codec)

  • 송창용;성호상;강상원;성유나
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.153-156
    • /
    • 2000
  • 본 논문에서는 멀티미디어 서비스들 중에서 음성 또는 오디오 신호를 저속으로 압축할 때 사용되는 G.723.1 부호화기의 line spectral frequency(LSF) 계수 양자화 방식을 고속으로 처리하는 알고리즘을 제안하였다. 제안된 고속탐색 방법은 LSF 계수의 순서성질을 이용하여 코드북의 탐색 범위를 줄임으로써 계산량을 크게 감소시킨다. 제안된 고속탐색 방법을 predictive split VQ(PSVQ) 구조를 갖는 G.723.1 에 적용한 결과 spectral distortion(SD) 성능 감쇄 및 추가적인 메모리 증가 없이 최적 코드벡터를 찾기 위한 코드북 탐색 과정에서 코드북의 평균 탐색 범위가 $20.1\%$ 감소했으며, 이는 additions, subtractions, multiplies 및 comparisons 수가 각각 $19.1\%$, $20.1\%$, $19.4\%$$12.2\% 감소하는 결과를 얻었다.

  • PDF

Vincent6 DSP코어를 이용한 G.728 음성 부호화기의 실시간 구현 (Real-time implementation of the G.728 speech codec using the Vincent6 DSP core)

  • 성호상
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.131-135
    • /
    • 2000
  • 본 논문에서는 고성능 고정 소수점 DSP (Digital Signal Processor) 코어인 Vincent6 코어 [1]를 이용하여 ITU-T C.728 음성 부호화기를 실시간으로 구현하였다 G.728 은 16 kb/s전송률의 ITU-T표준 음성 부호화기이며, 입력신호는 8 kHz로 샘플링되며 샘플 당 16 bit 로 양자화된 PCM 신호이다. G.728 은 LD-CELP(Low Delay Code Excited Linear Prediction)라고도 하며, 알고리 듬 delay는 0.625ms 이다. Vincent6 DSP core 는 VLIW (Very-Long Instruction Word) 특성을 가지므로 다중 명령 (multiple instruction)을 수행할 수 있다 이를 위해서 G.728 annex G를 이용하여 고정 소숫점 연산으로 코드를 작성한 후, 이를 vincent6 어셈블리 코드로 구현하였다. 최종적으로 구현된 코드는 ITU-T 의 test vector 에 대 해 bit exact 한 결과를 보이며 34 MCPS (Million Cycles Per Second)의 계산량을 가지며 사용 메모리크기는 데이터 메모리가 약 9KByte, 프로그램 메모리가 약 57 KByte 이다.

  • PDF