• Title/Summary/Keyword: 음성 신호 압축

Search Result 91, Processing Time 0.026 seconds

TMS320C6701 DSP를 이용한 MPEG-4 오디오 HVXC 코덱의 실시간 구현 (Real-time Implementation of HVXC codec conforming to MPEG-4 audio using TMS320C6701 DSP)

  • 강경옥;홍진우;김진웅;나훈;정대권
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.261-266
    • /
    • 1999
  • 본 논문에서는 인터넷 폰이나 디지털 이동통신에서와 같이 낮은 비트율이 요구되는 응용분야에서 사용될 수 있는 HVXC 부호화 및 복호화 알고리즘을 TMS320C6701 160MHz DSP를 사용하여 실시간 동작을 구현한 내용을 기술한다. 사용한 최적화 방법으로는 기본적으로 연산 시간이 많이 소요되는 함수 루틴에 대한 C 언어레벨의 최적화 및 어셈블리어 레벨의 최적화를 수행하였고, TMS320C6701 DSP 내부 프로그램 메모리를 프로그램 캐쉬로 사용하였다. 또한, 계산량이 많은 부분과 테이블 참조가 필요한 연산을DSP의 내부 데이터 메모리 영역에서 수행하여 소요시간을 단축하였으며, 음성신호 및 비트스트림의 입출력에는 background DMA(direct memory access) 방식을 이용하였다. 이와 같은 최적화결과 2kbps 및 4kbps의 비트율에서 압축 및 복원을 실시간으로 수행할 수 있다.

  • PDF

SAW 필터를 이용한 KLT 기반 Entropy-Constrained Quantizer 성능 향상 (Perceptual Quality Improvement of KLT based Entropy-Constrained Quantizer using a SAW Filter)

  • 임동석;김무영
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.1-2
    • /
    • 2013
  • KLT-AECQ 는 지각적인 성능 향상을 위하여 formant weighting 필터를 사용한다.Code Excited Linear Prediction(CELP) 코더는 사람의 음성신호를 압축하는 대표적인 방식이다. CELP 의 Rate-Distortion 성능을 향상 시키기 위해서 Karhunen-Loeve-Transform (KLT) 기반의 Classified Vector Quantization (KLT-CVQ) 방식이 제안되었으며, 이는 KLT 기반의 Adaptive Entropy-Constrained Quantization (KLT-AECQ) 방식으로 확장되었다. 기존의 KLT-AECQ 에서는 지각적인 성능 향상을 위하여 formant weighting 필터를 사용한다. 본 논문에서는 이 필터 대신에 Spectral Amplitude Warping (SAW) 필터를 적용함으로써, KLT-AECQ 코더의 지각적인 성능을 향상하였다.

  • PDF

방송통신융합과 멀티미디어방송서비스 기술

  • 김진웅
    • 정보와 통신
    • /
    • 제19권4호
    • /
    • pp.53-61
    • /
    • 2002
  • 세계는 현재 디지털 혁명에 의한 새로운 정보통신(IT) 서비스의 홍수에 직면해있다. '언제, 어디서나, 사용자의 요구에 맞추어'라는 말은 이미 모든 서비스 기술개발 분야에서 캐치프레이즈로 자리잡은지 오래 되었다. 통신은 기존 전화를 통한 음성 서비스 위주에서 점차 데이터 통신으로 무게 중심이 이동되고 있고, 방송도 단순한 영상물 중심의 프로그램 전달이 아닌 개인별 정보 전달 및 양방향 통신에 의한 부가서비스로 그 영역을 확장해가지고 있다. 이런 변화의 중심에는 역시 '디지털' 기술에 의해 가능한 '융합(Convergence)' 화를 위한 기술개발이 그 동력을 제공하고 있으며, 프로세서 , 메모리, 디스플레이, 모뎀 등 하드웨어의 발전과 함께 오디오비쥬얼 신호 압축 및 전송, 웹 문서처리 등 소프트웨어적인 기술 개발 및 표준화 결과를 상호 유기적이고 통합적으로 각 응용 서비스 시스템에 적용함으로써 가능해지고 있다. 본 고에서 데이터 방송, 지능형 방송 및 MPEG-21 멀티미디어 프레임워크 표준을 중심으로 방송의 입장에서 본 방송통신융합의 기술개발 현황과 전망에 대해 개괄해보기로 한다.

복합잡음 제거를 위한 비선형필터에 관한 연구 (A Study on Nonlinear Filter for Removal of Complex Noise)

  • 이경효;류지구;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.455-458
    • /
    • 2008
  • 이전의 정보화는 글이나 혹은 음성에 의존했다면, 현대사회의 정보전송은 다양한 영상 매체를 이용하여 전송하고 있다. 휴대폰과 TV, 컴퓨터는 대표적인 영상신호를 이용하는 매개체로서 현대사회를 이루는 큰 축이라고 할 수 있다. 이러한 이유로 중요성이 부각되어지는 영상 신호의 개발은 크게 압축 및 인식 그리고 복원 등 많은 부분에서 연구가 되어지고 있다. 노이즈는 이러한 신호를 이용함에 따라 필연적으로 발생되며, 발생되는 노이즈로서는 임펄스 노이즈(Impulse Noise)와 AWGN(Additive White Gaussian Noise)가 대표적이다. 이러한 노이즈를 줄이기 위하여 다양한 필터가 개발되고 있으며, 각기 그 잡음의 성향에 따라 다른 필터가 사용되어진다. 그러나 잡음은 신호에서 독립적으로 발생되어지는 것이 아니라 중첩되어 발생되어진다. 본 논문은 이러한 중첩된 잡음을 제거하고자 영상필터를 제안하였으며, 이를 기존의 다른 필터와 비교하였다.

  • PDF

음성신호의 실시간 피치변경에 관한 연구 (A Study on Real Time Pitch Alteration of Speech Signal)

  • 김종국;박형빈;배명진
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.82-89
    • /
    • 2004
  • 고음질 합성을 하면서도 다양한 음색을 갖도록 하기 위해서는 파형부호화를 이용한 합성법에 적용할 수 있는 피치 변경법이 필요하다. 따라서 본 논문에서는 스펙트럼 왜곡률을 최소화하는 영교차 단위의 시간축 조절에 의한 피치 변경법과 피치 동기분석이 용이하고 다른 영역으로의 변환과정이 불필요한 피치시점 검출법을 제안함으로써 고음질을 유지하면서 시간영역에서만 처리됨으로써 계산량을 줄이고 스펙트럼 왜곡률을 최소화하고 위상을 그대로 보존할 수 있는 시간영역에서의 피치 변경법을 제안하였다. 결과적으로 전체 피치 변경율에 대해서는 기존의 방법에 비해서 제안한 방법의 스펙트럼 왜곡률이 0.73%개선되었고 피치 압축시에는 제안한 방법의 스펙트럼 왜곡율이 2.18%개선되었다.

MPEG-4 CELP를 이용한 실시간 다자간 통신시스템의 구현 (Implementation of Real Time Multi-User Communication System with MPEG-4 CELP)

  • 김헌중;우광희;차형태
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.57-62
    • /
    • 2000
  • 본 논문은 6∼24kbit/s의 저비트율의 전송율을 지원하는 MPEG-4 CELP CODEC과 실시간 처리를 위한 효율적인 알고리즘의 최적화를 통한 인터넷 환경에서의 PC-to-PC 실시간 양방향 다자간 동시 통화 시스템을 구현하였다. 현재 구현된 시스템은 MPEG-4 CELP Mode-I을 사용하여 음성신호 압축 비트 열을 생성하고 있으며, Mode-I서 지원하는 비트율 중 18200bps 모드를 사용하고 있다. 이 경우 1프레임 당 처리하는 샘플 데이터 수는 160 샘플이고 현재 데이터 전송을 위한 데이터 package는 5 프레임이 1 package(117 byte)로 구성되어져 있으며, 동시에 4명의 용자가 접속하여 실시간으로 다자간 양방향 통신이 가능하도록 구현되었다. 개발 환경은 Windows 운영체제 하에서 Microsoft Visual C++ 6.0을 사용하였다.

  • PDF

고정 소수점 연산시 오차의 전파를 줄이는 고속 이산 여현 변환 알고리즘 (A fast DCT algorithm with reduced propagation error in the fixed-point compuitation)

  • 정연식;이임건;최영호;박규태
    • 한국통신학회논문지
    • /
    • 제23권9A호
    • /
    • pp.2365-2371
    • /
    • 1998
  • 이산 여현 변환(Discrete Cosine Transform: DCT)은 음성 및 영상 신호의 압축에 광범위하게 응용되고 있다. 본 논문에서는 $2^{m}$-포인트의 일반적인 경우로 확장이 가능한 새로운 고속 DCT 알고리즘과 구조를 제안한다. 제안한 알고리즘은 커널의 대칭성을 이용하여 N-포인트의 DCT를 N/2-포인트의 DCT로 나누어 처리하며 이를 재귀적으로 적용해 나간다. 제안한 알고리즘은 적은 덧셈 및 곱셈 연산을 통해 변환을 수행하며, 변환을 위해 통과해야 하는 곱셈 연산단의 수가 적고 대부분의 곱셈 연산이 흐름도상의 후반부에서 일괄적으로 수행되므로 고정 소수점 연산시에 발생할 수 있는 오차의 전파를 줄일 수 있다.

  • PDF

다중비 신호처리에 적용한 선형 주기적 시변 시스템의 입출력 이득 (Input-Output Gains of Linear Periodic Time-Varying Systems with Applications to Multirate Signal Processing)

  • 이상철;박계원
    • 한국정보통신학회논문지
    • /
    • 제4권5호
    • /
    • pp.963-969
    • /
    • 2000
  • 본 논문에서는, 선형 주기적 시변 시스템에 대해서, 두 개의 입출력 이득을 정의한다. 그 하나는 단위 크기의 ι$_2$노름을 갖는 모든 입력에 대한 최악의 $\iota_2$ 노름의 출력의 비로서, G($\iota_2,\iota_2$ 로 표기한다. 또 다른 하나는 단위 크기의 RMS 값을 갖는 모든 입력에 대한 최악의 RMS 값의 출력의 비로서, G(RMS, RMS)로 표기한다. 선형 시불변 시스템에 대해서는 이 두 개의 이득은 등가라는 사실이 잘 알려져 있다. 본 논문에서는 선형 주기적 시변 시스템에 대해서도 이 두 개의 이득이 등가라는 것을 증명한다. 또한, 선형 주기적 시변 시스템에 대한 주파수 응답을 얻는 두 가지 방법 사이의 관계를 유도한다. 이렇게 정의된 입출력 이득은 M-채널 필터 뱅크에 적용한다. 필터 뱅크는 음성 압축 등에 사용되는 대표적인 다중비 신호처리 시스템이다. 이러한 필터뱅크에는 일반적으로 에일리어징 왜곡, 진폭 왜곡 및 위상 왜곡이 존재한다. 본 논문에서는 오차 시스템의 G($\iota_2,\iota_2$ 이득을 최적화 하는 방법에 의해 필터 뱅크를 설계함으로써, 필터 뱅크에서 일반적으로 존재하는 왜곡을 작게할 수 있음을 보인다.

  • PDF

동영상에서 모드 선택을 위한 코스트 평가 방법 (Coast Evaluation Techniques for Mode Selection in Video Coding)

  • 송대건
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권6호
    • /
    • pp.275-280
    • /
    • 2013
  • 최근 액서스망의 브로드밴드화와 영상기기의 고성능화에 따라 인터넷을 통한 음성, 영상 등의 미디어 정보를 다루는 멀티미디어 서비스가 주목받고 있으며 점차 보급되어 가고 있다. 앞으로 더욱더 영상 기기나 네트워크 환경에 발맞추어 고품질의 영상을 다루고 이용하는 형태가 점점 다양화되고 활용화 되리라 예측된다. 그 중에서도 동영상 부호화 기술 즉, 영상 정보의 압축 부호화 기술은 중심적인 역할을 하는 기술 중의 하나이다. 동영상 부호화 기술은 방대한 정보량을 필요로 하는 영상 신호 중에 포함되어 있는 용장성을 배제하고 적절한 정보량을 디지털 부호로서 효율인 영상 신호를 표현하는 기술로서 발전되어 가고 있다. 따라서 본 연구는 동영상 부호화에서의 모드 선택에 적용하는 코스트 평가 방법을 검토하고 부호화 효율을 최대화하기 위해 방법을 제안 하고자하며 이를 기존 방법과 비교해 우수성을 확인하였다.

Embedded Linux 시스템 설계 및 구현에 관한 연구 (A Development and Design of Embedded Linux System)

  • 유임종;고성찬
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.129-132
    • /
    • 2003
  • 본 논문에서는 실시간 운영체제하에 가전제품 및 간단한 통신모듈로 최근 많이 응용되고 있는 StrongArm SA110을 메인 CPU로 하여 정보통신 분야에 적용될 수 있는 VoIP분야 중 RTP를 통한 음성데이터의 통신 Embedded Linux 시스템의 설계 및 구현에 관한 내용을 언급한다. 본 논문에서는 하드웨어 측면으로 임베디드 리눅스 CPU 개발 Toolkit인 타이눅스 박스II를 이용하여 VoIP 시스템을 구성하였으며, VoIP 소프트웨어 처리부분으로는 실시간 전송 프로토콜인 RTP를 이용해 설계 구현하였다. 본 논문의 개발환경은 타겟보드와 개발용 리눅스 PC간 연결 인터페이스를 위한 RS-232C의 직렬 접속, USB 접속, Ethernet LAN 접속 연결로 구성하였다. RS-232C는 직렬 접속으로 개발용 리눅스 PC의 터미널 에뮬레이션을 위한 콘솔로 사용하였다. VoIP 통신을 위한 환경은 ADC/DAC 변환부를 통해 아날로그 신호를 디지털로 변화시키고 PCM 압축하도록 구성되어야 하나 wave 파일로 대체하여 사용하였고, 양측간의 통신을 위한 연결 설정부는 VoIP를 위한 H.323이나 SIP에서 필요한 Gatekeeper나 Network Server를 단말 양측간 소켓통신으로 본 과정을 대체 하였다. 본 논문에서는 VoIP 시스템의 운용 중 일반적 기술에 관한 것을 언급하였고 임베디드 리눅스 개발보드를 이용하여 RTP 프로토콜의 동작하는 메커니즘을 중점적으로 기술하였다.

  • PDF