• 제목/요약/키워드: CELP Vocoder

검색결과 52건 처리시간 0.023초

CELP Type Vocoder에서 RTP 확장 헤더 데이터를 이용한 연속적인 프레임 손실에 대한 PLC 성능개선 (The Performance Improvement of PLC by Using RTP Extension Header Data for Consecutive Frame Loss Condition in CELP Type Vocoder)

  • 홍성훈;배명진
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.48-55
    • /
    • 2010
  • 패킷네트워크에서 사용하는 음성부호화기는 자체적으로 PLC (Packet Loss Concealment) 알고리즘을 사용하고 있지만 서비스에 적합할 만큼 좋지 않다. 더욱이 연속적인 패킷 손실에 대해서는 많이 취약하다. PLC 알고리즘은 크게 송신단 기반의 알고리즘과 수신단 기반의 알고리즘으로 나뉜다. 송신단 기반의 알고리즘은 추가정보를 전송하기 때문에 음질개선에 큰 성능을 갖는 반면 데이터 전송율이 높아지고 추가 지연이 발생하며 상호간의 호환이 불가능하다. 수신단 기반의 알고리즘은 수신된 데이터에 기반하기 때문에 추가지연이나 정보가 필요 없으나 음질개선에 한계가 있다. 본 논문에서는 RTP 헤더 정보 중 사용하지 않는 확장 헤더 데이터 (Extension Header Data: 32 bit)부분에 PLC를 위한 추가정보를 전송하는 방법을 제안한다. 이렇게 함으로써 송신단 기반의 알고리즘이 갖는 호환성 문제를 해결하고 음질 개선 성능을 향상 시킬 수 있다. 추가적으로 발생하는 지연 (delay)는 이미 수신단에서 네트워크상의 지연을 조정하기 위해 지터 버퍼 (jitter buffer)를 갖고 있기 때문에 제안하는 알고리즘으로 인해 발생하는 추가 지연은 없다. G.729 PLC를 위한 추가 정보는 LP 파라미터 합성용 MA필터 인덱스, 여기신호, 여기신호 이득 및 잔여신호 이득 파라미터로 프레임당 16 bit를 할당한다. 이는 RTP payload 전송 시 음성 데이터를 두 프레임인 20 ms 단위로 전송하기 때문이다. 성능 평가 결과 기존 대비 13.5%의 성능 향상을 보였다.

개선된 델타검색기법을 이용한 피치검색시간의 단축 (AN ALGORITHM TO REDUCE THE PITCH SEARCHING TIME USING MODIFIED DELTA SEARCH IN CELP VOCODER)

  • 이주헌
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.214-217
    • /
    • 1994
  • The major drawback in the Code Excited Linear Prediction type vocoders is their large computational requirements. In this paper, a simple method is proposed to reduce the pitch searching time in the pitch filter almost without degradation of quality. On the basis of the observational regularity of the correlation function of speech, only the limited numbers of pitch lags are considered to be an optimum pitch. This is done by skipping the negative envelope side of the correlation function and limiting the maximum number of lags to be considered preliminarily. By doing so, we can reduce the computational time of pitch searching more than 51% with negligible quality degradation. In addition to that, by combining that method with the conventional delta search technique, we can reduce the computational time requirements more than 60% without serious lowering the speech quality in segmental SNR measure compared to the conventional full search method.

  • PDF

DSP16210을 이용한 8kbps CS-ACELP 의 실시간 구현 (Real-Time Implementation of the 8 kbps CS-ACELP)

  • 박지현;박성일정원국임병근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.1211-1214
    • /
    • 1998
  • Real-time implementation of Conjugate-Structure Algebraic CELP(CS-ACELP) is presented. ITU-T Study Group(SG) 15 has standardized the CS-ACELP speech coding algorithm as G.729. A real-time implementation of the CS-ACELP is achieved using 16 bit fixed point DSP16210 Digital Signal Processor (DSP) of Lucent Technologies. The speech coder has been implemented in the bit-exact manner using the fixed point CS-ACELP C source which is the part of the G.729 standard. To provide a multi-channel vocoder solution to digital communication system, we try to minimize the complexity(e.g., MIPS, ROM, RAM) of CS-ACELP. Our speech coder shows 15.5 MIPS in performance which enables 4 channel CS-ACELP to be processed with one DSP16210.

  • PDF

LSP 분포 특성을 이용한 G.723.1 보코더의 계산량 감소 (The Reduction of the Computation Speed using LSP Distribution in G.723-1 Vocoder)

  • 이희원;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.127-130
    • /
    • 2000
  • 현재까지 발표된 음성 부호화기 중에서 저전송률에서 양호한 음질을 제공하는 CELP 계열 보코더에 대한연구가 가장 많이 이루어지고 있다. 그 중에서 G.723.1부호화기는 인터넷 폰이나 화상회의 등 상용서비스로 개발되었다. G.723.1 부호화기에서는 음성신호의 선형예측 방법 중 LSP 파라미터를 이용하는 방법이 많이 사용된다. 이것은 LSP 파라미터의 전송형 특징 중 낮은 전송률에서도 왜곡이 적고 선형보간 특성이 뛰어나기 때문이다. 하지만 LPC 계수를 LSP 파라미터로 변환하기 위해서는 많은 계산시간이 소요된다[1]. 본 논문에서는 G.723.1 보코더에서 LSP 변환 시 다항식의 근을 찾는 순서를 음성신호의 LSP 분포 특성에 맞게 조정함으로써 전체 계산시간을 평균 2% 단축하였다.

  • PDF

개선된 혼성영역 교차상관법에 의한 G.723.1의 피치검색시간 단축에 관한 연구 (A Study on the Pitch Search Time Reduction of G.723.1 Vocoder by Improved Hybrid Domain Cross-correlation)

  • 조왕래;최성영;배명진
    • 전기학회논문지
    • /
    • 제59권12호
    • /
    • pp.2324-2328
    • /
    • 2010
  • In this paper we proposed a new algorithm that can reduce the open-loop pitch estimation time of G.723.1. The time domain cross-correlation method is simple but has long processing time by recursive multiplication. For reduction of processing time, we use the method that compute the cross-correlation by multiplying the Fourier value of speech by it's complex conjugate. Also, we can reduce the processing time by omitting the bit-reversing of FFT and IFFT for time-frequency domain transform. As a result, the processing time of improved hybrid domain cross-correlation algorithm is reduced by 67.37% of conventional time domain cross-correlation.

Duration Control 의한 G.723.1 보코더 전송률 개선에 관한 연구 (A Study on Improvement of Bit Rate using Duration Control of Speech in G.723.1 Vocoder)

  • 장경아;유영민;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2475-2478
    • /
    • 2003
  • CELP계열의 부호화기인 G.723.1 5.3kbps ACELP를 기반으로 하여 음질을 유지하면서 전송률을 낮출 수 있는 새로운 부호화 방법을 제안한다. 본 논문에서 적용한 부호화 방법은 음성 합성시 파라미터로 사용되는 지속시간 변경에 의해 CELP형 보코더의 전송률을 감소하고자 한다. 먼저 음성을 보코더 입력단에 입력하기 전 지속시간을 FFT 변환 특성을 이용해 음색의 변경 없이 지속시간을 줄임으써 계산시간을 줄이고 진폭과 위상 각각 1/2ⁿ배의 interpolation과 Decimation을 수행하여 부호화한다. 이렇게 부호화된 데이터는 G.723.1 복호화를 거치고, 다시 FFT point의 1/2ⁿ배 point로 IFFT과정을 수행함으로써 스팩트럼의 변경 없이 지속시간을 변경하여 원 음성을 합성하게 된다. G.723.1 보코더를 통과한 후 파형을 복원 실험한 결과 기존의 5.3kbps ACELP보다 46%정도 감소하였다.

  • PDF

음성부호화기에서 가변 윈도우 사용에 의한 스펙트럼 성능에 관한 연구 (A Study on Performance of Spectrum Analysis by using Variable Window in Vocoder)

  • 민소연;이광형;김정재
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 춘계학술발표논문집
    • /
    • pp.483-486
    • /
    • 2009
  • 인터넷폰과 화상회의를 위해 개발되어진 G.723.1 음성부호화기는 5.3kbps ACELP와 6.3kbps MP-MLQ 이중 전송률로 구성된다. 본 논문에서는 CELP 계열 음성부호화기의 음질 개선을 위해 스펙트럼 누설을 최소화할 수 있는 가변 윈도우를 이용한 새로운 스펙트럼 분석 알고리즘을 제안한다. 제안한 알고리즘을 ACELP에 적용한 실험결과에서 스펙트럼 왜곡은 약 0.1dB 정도 감소하였고, 잔차 에너지는 7% 정도 감소하였으며 주관적 음질평가 결과는 0.3 정도 개선되었다.

  • PDF

음성압축기의 음성패킷을 이용한 채널에러 정보 전달 (Transmission of Channel Information Using Voice Packet in the Vocoder)

  • 차성호;박호종
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.7-10
    • /
    • 2000
  • 본 논문은 이동통신상에서 송신측의 송신 채널 에러정보를 수신측에서 송신측으로 전달하는 음성패킷을 이용하여 송신측에 알려주어 압축과정에 이용하게 할 수 있는 방법을 제안한다. ACELP(Algebraic CELP)구조 방식을 가지고 있는 음성압축기들 중 G.729을 사용하며 음성 패킷정보 중 Pitch Delay와 Fixed Codebook를 이용하여 전송음성 패킷안에 상대방의 송신 채널정보를 싣는다. 수신측에서 받은 패킷이 Erasure로 판단되었을 때 패킷정보들 중 Fixed Codebook Index를 만들게 되는 4개의 Optimal 펄스 중 2개의 펄스만 사용하며 나머지 2개의 펄스는 약속된 임의의 위치에 위치시킨 후 송신측에 전송시킨다. 상대방에서 약속에 맞는 위치의 펄스를 보내왔을 때를 체크함으로써 자신의 송신채널 상태를 알 수 있게 된다 송신채널에$5\%$ Erasure 채널 에러가 발생했을 때 채널정보를 가진 패킷의 음질은 약 0.1dB 정도 떨어지게 된다. 하지만 음성압축 전송 시 송신채널의 정보를 이용하여 무선채널에러에 강하게 할 수 있다.

  • PDF

5MHz 대역폭을 갖는 ETRI Wideband CDMA 시스템의 물리계층 (Phisical layer of ETRI wideband CDMA with 5 MHz bandwidth)

  • 방승찬;박형래;한영남;임명섭;이헌;한기철;박항구
    • 정보와 통신
    • /
    • 제13권4호
    • /
    • pp.56-63
    • /
    • 1996
  • 본 논문에서는 한국전자통신연구소가 개인통신서비스 시스템 규격으로 제안한 4.3008Mcps 광대역 CDMA의 물리계층을 소개한다. 제안된 물리계층은 $28{\times}2^n$ 길이의 Hadamard 코드를 사용하여 5MHz 대역에 적합하게 설계되었다. 여기서는 13kbps CELP를 주 보코더로 채택했고 32kbps ADPCM도 채택할 수 있다. 역방향 링크에 버스트 파일럿 방법이 제안되었고, 이것은 연속 파일럿 방식에 비해 용량 증가를 가져온다. 또 시그널링이 많아질 경우에도 서비스의 품질을 유지하기 위하여 정보 데이터와 시그널링 데이터를 시간다중화하였고, 시그널링 활성도를 이용하는 것이 제안되어 용량을 증가시켰다. QPSK 데이터와 QPSK 확산, 가변 프레임크기, 코드쌍 할당 방법을 이용하여 정보데이타를 64kbps가지 전송한다. 제안된 여러 가지 방법들은 향후 FPLMTS의 요소 기술로도 이용될 수 있다.

  • PDF

인터넷 환경에서 FEC 기능이 추가된 AMR음성 부호화기를 이용한 오디오 스트림 전송 (Audio Stream Delivery Using AMR(Adaptive Multi-Rate) Coder with Forward Error Correction in the Internet)

  • 김은중;이인성
    • 한국통신학회논문지
    • /
    • 제26권12A호
    • /
    • pp.2027-2035
    • /
    • 2001
  • 본 논문에서는 ETSI와 3GPP에서 차세대 이동통신 IMT-2000 서비스의 음성부호화기의 표준으로 채택한 AMR을 인터넷을 통한 멀티미디어 서비스에서 사용하기 위해 부가 정보를 이용한 손실 패킷 복구 방법이 첨가된 전송방법을 제시한다. 인터넷과 같은 패킷 교환 망에서의 음성 통신에서 과도한 패킷 손실은 급격한 음질 저하를 유발한다. 본 논문에서는 음성 패킷 데이터를 순방향 오류정정(FEC)의 부가 정보로 사용하고 연속 패킷 손실이 발생하였을 경우 오류 은닉방법을 사용하여 패킷 손실에 의한 음질 저하를 개선하는 방법을 제안한다. 순방향 오류정정방법 중 부가 음성 정보를 원래의 음성정보와 함께 보냄으로써 손실된 음성은 부가 음성 정보를 이용해 복구할 수 있다. 본 연구에서 사용한 AMR 음성 부호화기는 CELP기반의 음성 부호화기 이므로 음성 부호화기의 특징을 이용해 2개 이상의 군집오류가 발생했을 경우 패킷 손실이 일어나기 전후의 데이터를 이용해서 손실된 패킷으로 인한 영향을 최소로 하는 오류은닉 방법을 사용하였다. 제안된 방법의 성능을 평가하기 위해 AMR 부호화기의 고음질 압축 방법인 12.2 kbit/s 모드로 전송하는 방법과 ITU-T 표준안인 CS-ACELP로 전송하는 방법을 SNR과 MOS 측정을 통해 비교하였다. 제안된 방법이 10%의 평균 패킷 손실률에서 부호화기 자체의 오류은닉 기술을 적용한 AMR - 12.2 kbit/s 모드보다 MOS값에서는 1.1, SNR값은 5.61 dB 높았으며, 제안된 방법은 20%의 손실률에서도 통신 가능한 음질을 유지하였다.

  • PDF