• 제목/요약/키워드: Speech coder

검색결과 166건 처리시간 0.021초

Radial Basis Function Networks를 이용한 이중 임계값 방식의 음성구간 검출기 (Voice Activity Detection Algorithm base on Radial Basis Function Networks with Dual Threshold)

  • 김홍익;박승권
    • 한국통신학회논문지
    • /
    • 제29권12C호
    • /
    • pp.1660-1668
    • /
    • 2004
  • 본 논문에서는 간단한 구조, 적은 계산량과 안정된 빠른 수렴속도를 가진 RBF (Radial Basis Function) 신경회로망을 이용한 이중 임계값 방식의 음성구간 검출기 알고리즘을 제안하고 시뮬레이션을 통해 유용성을 확인하였다. 음성압축기에 사용되는 CELP (Code-Excited Linear Prediction) 파라미터들을 신경회로망 입력으로 하여 잡음에 강하게 반응하게 하였고, 음성구간 검출기의 성능향상을 위해 음성구간과 침묵구간에서 다른 임계값을 사용하는 이중 임계값 방식을 적용하였다. 실험 결과 이중 임계값을 이용한 RBF 신경망 음성구간 검출기는 G.729 Annex B 음성구간 검출기 보다 우수한 성능을 보였고, 기존의 MLP (Multi Layer Perceptron) 신경회로망을 이용한 음성구간 검출기와 비교하여 음성구간에서는 비슷한 성능을 보였으나 침묵구간에서 25% 정도의 성능향상을 보였다.

웨이블릿 변환을 이용한 잡음제거기 설계 (Design of the Noise Suppressor Using Wavelet Transform)

  • 원호진;김종학;이인성
    • 한국음향학회지
    • /
    • 제20권7호
    • /
    • pp.37-46
    • /
    • 2001
  • 본 논문에서는 웨이블릿 변환을 이용한 주변 잡음제거기를 제안하였다. 기존의 고정된 시간-주파수 해상도를 가지는 단구간 푸리에 분석법 대신 다양한 시간-주파수 해상도를 제공하는 웨이블릿 분석법을 사용함으로써 시간 특성이 변하는 베이블 (Babble) 잡음에 좀더 효율적인 잡음제거 방법을 설계하였다. 본 논문에 제안된 웨이블릿 변환 잡음제거기는 스펙트럴 차감법에 기반하여 구성하였으며, 고주파 영역에서 높은 시간 해상도를 갖는 웨이블릿 마스크 패턴을 사용함으로써 시간 특성이 빠르게 변화하는 고주파 잡음에 더욱 효율적인 동작을 하도록 설계하였다. 성능평가를 위해 차량 잡음, 길거리 잡음, 베이블 잡음과 같은 이동통신에서 많이 사용하는 주변잡음에서 시험하였으며, 그 주관적 음질 평가 결과 베이블 잡음의 경우 기존의 EVRC(Enhanced Variable Rate Coder) 잡음 제거기보다 Mos (Mean Opinion Score) 0.2의 성능 개선을 이룰 수 있었다. 출력 음성의 스펙트로그램에서도 성능 개선을 확인할 수 있었다.

  • PDF

G.729A와 SMV 음성부호화기를 위한 파라미터 직접 변환 방식의 상호부호화 알고리듬 (Transcoding Algorithm for SMV and G.729A Vocoders via Direct Parameter Transformation)

  • 장달원;서성호;이선일;유창동
    • 대한전자공학회논문지SP
    • /
    • 제40권6호
    • /
    • pp.71-83
    • /
    • 2003
  • 본 논문에서는 G.729A와 SMV 음성부호화기를 위한 새로운 파라미터 직접 변환 방식의 상호부호화 알고리듬을 제안한다. 상호부호화를 위하여 부가적인 복호화, 부호화 과정을 거쳐야하는 기존의 Tandem 방식과 달리 제안된 파라미터 직접 변환 방식에서는 양 음성부호화기가 음성을 부호화하기 위하여 공통적으로 사용하는 파라미터들이 직접 변환된다. SMV 에서 G.729A로의 트랜스코딩에서는 LSP 변환, 피치 지연 변환, 낮은 전송률에서의 트랜스코딩 등의 알고리듬을 제안하고, G.729A에서 SMV로의 트랜스코더에서는 LSP 변환, 피치 지연 변환, 전송률 결정 등의 알고리듬을 제안한다 제안된 알고리듬을 다양한 방법으로 평가해본 결과 기존의 Tandem 방식과 비교하여 계산량과 지연 시간을 줄이면서도 동등한 음질 또는 향상된 음질을 구현함을 확인할 수 있었다.

이동통신용 음성부호화기에서의 LSP 계산시간 감소에 관한 연구 (A Study on the Reduction of LSP(Line Spectrum Pair) Transformation Time in Speech Coder for CDMA Digital Cellular System)

  • 민소연
    • 한국산학기술학회논문지
    • /
    • 제8권3호
    • /
    • pp.563-568
    • /
    • 2007
  • 본 논문에서는 EVRC 시스템에 사용되어지는 실근 방식의 계산량 감소 알고리즘을 치안한다. 실근 방법에서는 다항식에서의 근을 구하여 LSP로 변환하는 과정이 필요하다. 그러나, 근을 구하는 과정에서 주파수 대역을 순차적으로 검색하므로 계산시간이 많이 소요된다. LSP 파라미터의 중요한 특징은 대부분의 계수가 특정 주파수 대역에 주로 분포한다는 것이다. 그러므로, 본 논문에서는 실근 방식에서의 계산시간을 줄이기 위하여 1KHz 대역까지는 선형적이고 1KHz 대역 이상에서는 로그 스케일인 멜 스케일을 사용하였다. 실근 방식과 제안한 방법을 비교하기 위하여 두 가지를 측정하였다. 첫째, 제안한 방법에서의 LSP 파라미터의 값과 실근방식에서의 LSP 파라미터 값을 비교하였다. 둘째, 계산 시간 감소율을 측정하였다. 실험결과, LSP 파라미터의 값은 변화하지 않았으며 계산량은 약 48% 정도 감소하였다.

  • PDF

고성능 DSP를 이용한 G.723.1 Annex A 구현 (Implementation of a G,723.1 Annex A Using a High Performance DSP)

  • 최용수;강태익
    • 한국음향학회지
    • /
    • 제21권7호
    • /
    • pp.648-655
    • /
    • 2002
  • 본 논문에서는 고성능 범용 DSP (Digital Signal Processor)를 이용하여 멀티미디어 통신 등에 널리 사용되고 있는 G.723.1 Annex A (G.723.1A)의 다채널 구현에 관해 기술한다. 다채널 구현을 위해서 G.723.1의 알고리듬과 ITU-T(International Telecommunication Union-Telecommunication)에서 제공된 정수 연산 C 코드의 모듈별 계산량을 분석한 후, 이를 기준으로 C코드를 최적화한다. 각 모듈의 최적화 과정은 ITU-T에서 제공되는 시험벡터를 이용한 검증과 병행한다. 최적화 된 코드의 성능을 측정한 결과, 200㎒ TMS320C62x에서 내부 메모리만을 사용하여 5.3/6.3 kbps 두 가지 전송률에 대해서 부호화기와 복화화기를 동시에 17 채널을 수용하였다. 또한 비트-호환 버전의 경우에는 고속 코드북 검색 알고리듬을 도입하여 음질을 유지하면서 22 채널을 수용하였다.

대역 분할 장구간 예측을 이용한 CELP 부호화기 (A CELP Coder using the Band-Divided Long Term Prediction)

  • 최용수;강홍구;임명섭;안동순;윤대희
    • 한국음향학회지
    • /
    • 제14권4호
    • /
    • pp.38-45
    • /
    • 1995
  • 본 논문에서는 CELP (Code Excited Linear Prediction) 부호화기의 장구간 예측단에 MBE(Multi-Band Excitation) 방법을 도입하여 4.8kbps 이하의 낮은 전송률에서 성능을 향상시키는 방법을 제안한다. 제안한 방법에서는 기존의 CELP 방법으로 장구간 예측을 한 후에도 여전히 남아 있는 주기적 성분들을 다시 한번 다중대역(multiband)으로 장구간 예측을 한다. 이때 전 스펙트럼을 기본 주파수의 하모닉 간격으로 대역 분할하고, 주기적 다중대역 여기 신호는 각 대역 내의 하모닉들에서 여기 신호 스펙트럼과 근사한 크기를 갖는 정현파 (sine wave)의 합으로 표현함으로써 실제 여기 신호의 특성을 잘 반영하도록 한다. 제안된 방법의 성능 평가를 위해서 4.8 kbps의 전송률에서 컴퓨터 모의 실험을 하였다. 음질 평가의 비교 기준 대상으로 4.8 kbps DoD CELP와 4.4 kbps IMBE를 선정하여 주관적인 음질 평가를 실시한 결과 4.8 kbps DoD CELP보다 우수하였고, 4.4 kbps IMBE와는 비슷하였다.

  • PDF