• Title/Summary/Keyword: 음성 신호 압축

Search Result 91, Processing Time 0.024 seconds

Compensation Method for Improvement of Speech Recognition in Wireless Communication Network (무선 통신망에서 음성인식률 개선을 위한 보상기법 연구)

  • Seo Jin-Ho;Park Ho-Chong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.65-68
    • /
    • 2004
  • 이동통신 기술의 발전으로 이동통신 사용이 폭발적으로 증가하였고 그에 따라 이동통신망을 이용한 많은 서비스가 제공되고 있다. 이동통신망에서의 음성 인식 서비스에서 음성 인식기에 입력되는 음성신호는 통신망을 통해 음성 압축기를 거치게 되고 이에 음성신호가 왜곡되어 인식기의 인식성능이 저하된다. 본 논문에서는 무선통신 환경에서 음성인식기의 성능을 개선하기 위한 보상 방법을 제안한다. 기존의 제안된 방법은 음성 데이터에 의존하는 방법을 사용하나 본 논문에서는 음성 데이터와는 독립적 방법인 음성 압축기에 의해 손상된 입력 신호의 스펙트럼 보상방법과 Cepstrum 보정방법을 통해 인식률을 향상시키는 방법을 제안한다. 즉, 음성 압축기에 의하여 왜곡된 스펙트럼을 단계적 방법으로 보상하고 그를 토대로 왜곡된 신호에서 만들어진 Cepstrum을 보정하여 음성 인식기의 성능을 향상시키는 방법을 연구하였으며, 그 견과 손상된 음성신호의 인식률 $64.88\%$에 대하여, 본 논문에서 제안하는 보상 방법을 적용한 음성신호의 인식률은 $79.73\%$로서 $14.85\%$가 향상된 결과를 얻을 수 있었다.

  • PDF

A Multi-Channel Speech Surveillance System (다채널 음성 감시 시스템 개발)

  • 김성수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.442-445
    • /
    • 1998
  • TMS320C31 DSP를 사용하여 다채널 음성신호를 실시간으로 압축/저장 및 재생 시스템을 구현하였다. 각각의 전화선으로부터 입력되는 DAM성신호는 실시간으로 VSELP 음성 부호화 알고리즘을 이용하여 8Kbps 의 전송률로 압축된다 압축 음성 데이터는 host computer 로 전송되어 각각의 채널별로 HDD 나 MOD 같은 저장 장치에 저장되어진다. PC microsoft windows95 환경에서 동작하는 호스트프로그램은 압축 음성 데이터를 하드 디스크나 광자기 디스크에 저장하고, 저장된 압축 음성 데이터는쉽게 검색하여 재생이 가능하다.

  • PDF

16kbps Windeband Sideband Speech Codec (16kbps 광대역 음성 압축기 개발)

  • 박호종;송재종
    • The Journal of the Acoustical Society of Korea
    • /
    • v.21 no.1
    • /
    • pp.5-10
    • /
    • 2002
  • This paper proposes new 16 kbps wideband speech codec with bandwidth of 7 kHz. The proposed codec decomposes the input speech signal into low-band and high-band signals using QMF (Quadrature Mirror Filter), then AMR (Adaptive Multi Rate) speech codec processes the low-band signal and new transform-domain codec based on G.722.1 wideband cosec compresses the high-band signal. The proposed codec allocates different number of bits to each band in an adaptive way according to the property of input signal, which provides better performance than the codec with the fixed bit allocation scheme. In addition, the proposed cosec processes high-band signal using wavelet transform for better performance. The performance of proposed codec is measured in a subjective method. and the simulations with various speech data show that the proposed coders has better performance than G.722 48 kbps SB-ADPCM.

Unified coding scheme of speech and music (음악 및 음성 신호의 융합 압축 기술)

  • O, Eun-Mi
    • Broadcasting and Media Magazine
    • /
    • v.16 no.4
    • /
    • pp.59-71
    • /
    • 2011
  • 오디오와 음성 압축 기술적 근간은 서로 다르지만, 최근의 모바일 멀티미디어 기기 시장의 컨버전스 현상에 따라 압축하고자 하는 신호가 혼용되고 있으며, 비슷한 목표 전송률과 음질로 수렴하고 있다. 현재는 동일 기기에서 서로 다른 압축 기술을 적용하고 있으나, 음성과 음악이 동시에 서비스 되는 멀티미디어 기기에서는 단일 압축 방식으로 처리하고자 하는 이슈가 부각되고 있다. 특히, 스마트 폰 및 음악 콘텐츠 포탈 서비스의 대중화를 고려할 때, 음성 및 음악 신호 모두를 효율적으로 압축하는 음악 및 음성 신호의 융합 압축 기술이 더욱 필요해 보인다. 본 고에서는 MPEG 오디오 그룹에서 가장 최근 진행한 Unified Speech and Audio Coding(USAC)의 탄생 배경 및 표준화 현황을 소개한다. USAC는 64kbps 이하에서 기술적으로 최고 성능을 지닌 AMR-WB+ 및 HE-AAC v2보다도 우월한 음질을 보이며, 높은 비트율에서도 동등한 음질을 보장한다. 이런 우수한 음질에 기여한 USAC의 스위칭 구조와 더불어 기술적으로 향상된 주요 모듈인 파라미터 기반 스테레오 및 고주파 압축, 그리고 엔트로피 코딩 방식에 대해서 살펴 본다. 향후, 다양한 오디오 신호를 효율적으로 압축하는 USAC는 디지털 라디오, 모바일 TV, 그리고 오디오 북과 같은 사용자 시나리오에서 사용될 확률이 높아 보인다. 또한, USAC는 배경 잡음이나 배경 음악이 있는 경우에도 성능이 우수하기 때문에 YouTube 및 podcast 등과 같이 사용자가 콘텐츠를 생성할 때도 유용하게 사용 될 수 있다.

A Design of Noise Reduction Circuit for A radio Telephonic System (무선전화 시스템용 잡음억제회로의 설계)

  • Moon, Jong-Kyu;Kim, Duk-Gyoo
    • Journal of the Institute of Electronics Engineers of Korea TE
    • /
    • v.39 no.2
    • /
    • pp.84-89
    • /
    • 2002
  • In this paper, we present the design method of noise reduction circuit in telephonic system. The circuit consists of compressor, expander and a filter. The basic idea of a proposed method compresses the audible signal in order to mask the channel noise during transmission and then expand at the reverse rate the transmitted signal to naturally recover the original signal. Of course, there should be no distortion or other degradation of the audio itself in passing through companding(compress/expand) cycle. In the compressing process, the gain of compressor is automatically controlled by the envelope level of input signal in order to increase the effective dynamic range of input signal and to improve the signal to noise ratio. The compressed rate is the root time of a audible signal. The compressed signal should be expanded at the square time of the signal to recover a original signal. Simulation shows the proposed method improves the performance of the noise reduction of a channel noise as well as stability. 

A Study on the Reconstruction of a Frame Based Speech Signal through Dictionary Learning and Adaptive Compressed Sensing (Adaptive Compressed Sensing과 Dictionary Learning을 이용한 프레임 기반 음성신호의 복원에 대한 연구)

  • Jeong, Seongmoon;Lim, Dongmin
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.37A no.12
    • /
    • pp.1122-1132
    • /
    • 2012
  • Compressed sensing has been applied to many fields such as images, speech signals, radars, etc. It has been mainly applied to stationary signals, and reconstruction error could grow as compression ratios are increased by decreasing measurements. To resolve the problem, speech signals are divided into frames and processed in parallel. The frames are made sparse by dictionary learning, and adaptive compressed sensing is applied which designs the compressed sensing reconstruction matrix adaptively by using the difference between the sparse coefficient vector and its reconstruction. Through the proposed method, we could see that fast and accurate reconstruction of non-stationary signals is possible with compressed sensing.

ATSC Set-Top Box System (ATSC 수신기 시스템)

  • 도영수;김상욱
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1999.06b
    • /
    • pp.3-8
    • /
    • 1999
  • DTV(Digital Television)라 일컬어지는 방송 방식은 미국의 경우 지상파를 이용하여 압축된 영상신호와 음성신호를 방송 및 수신을 하기 위한 것으로 ATSC(Advanced Television System Committees)가 규격을 제안하고 FCC(Federal Communications Commission)가 수용하여 현실화 되어졌다. ATSC 산하의 다양한 Working Group에서는 방송국, 방송장비업체, 가전업체 등이 제안함으로써 규격화하여 전송부는 VSB(Vestigial Side-band), 영상압축은 MPEG2, 음성압축은 AC3로 결정하였다. 본 고에서는 ATSC의 규격에 따라 송신되어지는 방송을 수신할 수 있도록 채널복조와 영상 및 음성신호를 복호화 할 수 있는 수신 시스템의 구성과 테스트 결과를 살펴보고자 한다.

  • PDF

Speech Codec Standardization for Super-wideband Communication (초광대역 음성통화 서비스를 위한 압축 기술 및 표준화)

  • O, Eun-Mi
    • Broadcasting and Media Magazine
    • /
    • v.19 no.1
    • /
    • pp.48-55
    • /
    • 2014
  • One of the recent noticeable evolutions in mobile communication systems is that wideband-codec is deployed rapidly in VoLTE (Voice over Long Term Evolution) service or HD voice. This paper is concerned with next generation HD voice or VoLTE service that is coined to describe high quality communication with super-wideband voice codec. 3GPP EVS (Enhanced Voice Service) Codec is being standardized to develop the super-wideband voice codec. This paper deals with the codec design constraints, performance requirements, the status of standardization, and finally perspective on VoLTE service in future.

Voice Packet Conversion from 13kbps QCELP to 8kbps QCELP Speech Codecs (13kbps QCELP에서 8kbps QCELP로의 음성 패킷 변환 기술)

  • 박호종;권상철
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.6
    • /
    • pp.71-76
    • /
    • 1999
  • In digital cellular communication systems, tandem coding occurs in communications between mobile phones with different speech codecs, resulting in poor voice quality, high computational load, and long transmission delay. In this paper, voice packet conversion technique is proposed to solve the tandem coding problems, and packet conversion algorithm from 13kbps QCELP to 8kbps QCELP is developed. Simulations using various speech data show that the proposed packet conversion method produces voice quality which is equivalent to that by the conventional tandem coding method with shorter transmission delay using about 33% computational load.

  • PDF

DSP를 이용한 음성 및 오디오 시스템 설계

  • 김성수;조성호
    • 전기의세계
    • /
    • v.46 no.5
    • /
    • pp.39-44
    • /
    • 1997
  • 현재 DSP는 음성 및 오디오 신호처리 시스템, 디지털 통신 시스템, 제어 시스템, 영상처리 시스템 등 많은 영역에 걸쳐 성공적으로 사용되고 있다. 몇가지 대표적인 활용분야를 살펴보면, 음성신호 압축 분야 [1-4], MPEG (moving picture expert group)과 같은 오디오신호 압축분야[5,6], 그리고 디지털 통신 시스템에서의 적응 반향제거기, 적응 동화기, 채널간섭 제거, 변복조기, 채널 코딩, 암호화기[7-14] 등에서도 DSP가 사용되고 있다. 그리고 수중 음향 신호처리[15], 디지털 필터 디자인, 전력 스펙트럼 추정, 수중 음향 신호처리 같은 디지털 신호처리 분야[16-23]와 적응 신호처리[24-26], 이외에도 능동 소음 제어기 및 적응 제어기와 같은 제어 시스템 [27]에도 유용하게 이용되고 있다. 또한 영상 압축, 디지털 방송, 의료기기 등과 같은 영상처리 분야[28-32] 및 그 밖의 많은 분야에서 DSP의 활용은 점점 커져가고 있는 추세이다.

  • PDF