• 제목/요약/키워드: Voice signal

검색결과 431건 처리시간 0.024초

Signal Enhancement of a Variable Rate Vocoder with a Hybrid domain SNR Estimator

  • Park, Hyung Woo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.962-977
    • /
    • 2019
  • The human voice is a convenient method of information transfer between different objects such as between men, men and machine, between machines. The development of information and communication technology, the voice has been able to transfer farther than before. The way to communicate, it is to convert the voice to another form, transmit it, and then reconvert it back to sound. In such a communication process, a vocoder is a method of converting and re-converting a voice and sound. The CELP (Code-Excited Linear Prediction) type vocoder, one of the voice codecs, is adapted as a standard codec since it provides high quality sound even though its transmission speed is relatively low. The EVRC (Enhanced Variable Rate CODEC) and QCELP (Qualcomm Code-Excited Linear Prediction), variable bit rate vocoders, are used for mobile phones in 3G environment. For the real-time implementation of a vocoder, the reduction of sound quality is a typical problem. To improve the sound quality, that is important to know the size and shape of noise. In the existing sound quality improvement method, the voice activated is detected or used, or statistical methods are used by the large mount of data. However, there is a disadvantage in that no noise can be detected, when there is a continuous signal or when a change in noise is large.This paper focused on finding a better way to decrease the reduction of sound quality in lower bit transmission environments. Based on simulation results, this study proposed a preprocessor application that estimates the SNR (Signal to Noise Ratio) using the spectral SNR estimation method. The SNR estimation method adopted the IMBE (Improved Multi-Band Excitation) instead of using the SNR, which is a continuous speech signal. Finally, this application improves the quality of the vocoder by enhancing sound quality adaptively.

장애음성의 주기성분과 잡음성분의 분리 방법에 관하여 (Separation of Periodic and Aperiodic Components of Pathological Speech Signal)

  • 조철우;리타오
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 10월 학술대회지
    • /
    • pp.25-28
    • /
    • 2003
  • The aim of this paper is to analyze the pathological voice by separating signal into periodic and aperiodic part. Separation was peformed recursively from the residual signal of voice signal. Based on initial estimation of aperiodic part of spectrum, aperiodic part is decided from the extrapolation method. Periodic part is decided by subtracting aperiodic part from the original spectrum. A parameter HNR is derived based on the separation. Parameter value statistics are compared with those of Jitter and Shimmer for normal, benign and malignant cases.

  • PDF

무전기 음성통신에서 최적음성채널 선택을 위한 개선방안에 관한 연구 (Study on Improvement for selecting the optimum voice channels in the radio voice communication)

  • 류창국;이배호
    • 한국전자통신학회논문지
    • /
    • 제11권2호
    • /
    • pp.171-178
    • /
    • 2016
  • 지상 관제소에 근무하는 항공관제사와 비행중인 항공기는 무전기를 이용하여 음성통신을 한다. 항공기에서 송신하는 음성신호는 전국에 있는 다수의 지상사이트에 동시에 수신된다. 이때 항공관제사는 항공기와의 거리, 속도, 기상상태, 안테나와 무전기 조정상태 등에 따라 다양한 품질의 음성신호를 수신하게 된다. 항공관제사는 매 순간 최적의 음성신호를 찾아 항공기와 최적의 상황에서 음성통신을 수행한다. 그러나, 현재는 입력된 음성의 음량(Gain)을 기준으로 CD(: Carrier Dectect)값이 우수하다고 판단되는 신호를 최적채널로 선택하지만, 이는 잡음이 통화품질에 미치는 영향을 고려하지 않기에 최적채널을 선택한다고 볼 수 없다. 본 논문을 통해 수신된 음성신호에서 잡음을 제거한 후 사용자가 최적채널을 선택할 수 있도록 수치화된 정보 및 개선된 음질의 음성신호를 제공할 수 있었다. 이를 이용하여 항공기 관제 또는 훈련감청시스템 운용 시 향상된 품질의 채널을 선택하여 안전사고 예방, 훈련 능력향상 등을 기대할 수 있다.

VoIP 스팸 콜 탐지를 위한 음성신호의 DEVS 모델링 및 시뮬레이션 (DEVS Simulation of Spam Voice Signal Detection in VoIP Service)

  • 김지연;김형종;조영덕;김환국;원유재;김명주
    • 한국시뮬레이션학회논문지
    • /
    • 제16권3호
    • /
    • pp.75-87
    • /
    • 2007
  • VoIP 서비스 품질이 개선되고 많은 문제점들이 극복되면서 이에 대한 사용자들의 관심이 높아지고 있다. VoIP는 인스턴트 메시징 서비스 등 사용자들의 편익을 위한 서비스를 제공하고 있지만 비용 및 보안 문제는 사용자들의 이러한 서비스 사용을 주저하게 만들고 있다. 본 논문은 이와 같은 문제 중 하나인 VoIP 스팸 문제를 다루고자 한다. 스팸 콜에서의 음성 메시지 신호 패턴을 고려하여 정상 콜과 Noise가 포함된 정상 콜, 스팸 콜 이 세 가지 음성 모델을 설계하고, 논문에서 제시하는 음성 신호 정보량 기반의 스팸 탐지 알고리즘에 적용해 보았다. 각 모델의 모델링 및 시뮬레이션은 DEVS-$Java^{TM}$를 이용하였다. 본 연구는 스팸 콜 음성 신호를 탐지하기 위한 방법을 제시하고 이를 모델링 및 시뮬레이션 방법론을 통해 검증하는 것에 기여점을 둘 수 있다.

  • PDF

Design of Intelligent Emotion Recognition Model

  • Kim, Yi-gon
    • 한국지능시스템학회논문지
    • /
    • 제11권7호
    • /
    • pp.611-614
    • /
    • 2001
  • Voice is one of the most efficient communication media and it includes several kinds of factors about speaker, context emotion and so on. Human emotion is expressed is expressed in the speech, the gesture, the physiological phenomena(the breath, the beating of the pulse, etc). In this paper, the emotion recognition method model using neuro-fuzzy in order to have cognizance of emotion from voice signal is presented and simulated.

  • PDF

신호 준공간 모델에 기반한 통계적 음성 검출기 (Statistical Voice Activity Defector Based on Signal Subspace Model)

  • 류광춘;김동국
    • 한국음향학회지
    • /
    • 제27권7호
    • /
    • pp.372-378
    • /
    • 2008
  • 음성 검출기 (VAD, Voice Activity Detector)는 이동 통신이나 음성신호처리 등에 매우 중요한 기법으로 사용된다. 일반적인 음성 검출방식은 이산 푸리에 변환 (DFT, Discrete Fourier Transform)영역에서 통계적인 모델을 기반으로 하여 우도비검정 (LRT, Likelihood Ratio Test)을 하게 된다. 그리고 이 값을 임계값과 비교하며 음성인지 아닌지 판단하게 된다. 본 논문에서는 신호 준공간 (Signal Subspace)에 기반한 새로운 통계적 음성 검출 기법을 제안하다. 확률적인 주성분 분석 (PPCA, Probabilistic Principal Component Analysis)은 신호 준공간 방법에서 잡음신호에 대한 확률적인 모델을 얻기 위해 사용된다. 제안된 기법은 신호 준공간 영역에서 우도비검정에 기반을 두는 결정규칙을 적용하였다. 음성 검출 실험 결과는 신호 준공간 모델에 근거한 음성 검출기 기법이 주파수 영역에 기반한 가우시안 (Gaussian) 음성 검출기 보다 향상된 검출 결과를 보여준다.

Adaptive Post Processing of Nonlinear Amplified Sound Signal

  • Lee, Jae-Kyu;Choi, Jong-Suk;Seok, Cheong-Gyu;Kim, Mun-Sang
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.872-876
    • /
    • 2005
  • We propose a real-time post processing of nonlinear amplified signal to improve voice recognition in remote talk. In the previous research, we have found the nonlinear amplification has unique advantage for both the voice activity detection and the sound localization in remote talk. However, the original signal becomes distorted due to its nonlinear amplification and, as a result, the rest of sequence such as speech recognition show less satisfactorily results. To remedy this problem, we implement a linearization algorithm to recover the voice signal's linear characteristics after the localization has been done.

  • PDF

Sample selection approach using moving window for acoustic analysis of pathological sustained vowels according to signal typing

  • 이지연
    • 말소리와 음성과학
    • /
    • 제3권3호
    • /
    • pp.99-108
    • /
    • 2011
  • The perturbation parameters like jitter, shimmer, and signal-to-noise ratio (SNR) are largely estimated in the particular segment from the subjective or whole portion of the given pathological voice signal although there are many possible regions to be able to analyze the voice signals. In this paper, the pathological voice signals were classified as type 1, 2, 3, or 4 according to narrow band spectrogram and the value differences of the perturbation parameters extracted in the subjective and entire portion tended to be getting bigger as from type 1 to type 4 signals. Therefore, sample selection method based on moving window to analyze type 2 and 3 signals as well as type 1 signals is proposed. Although type 3 signals cannot be analyzed using the perturbation analysis, the type 3 signals by selecting out the samples in which error count is less than 10 through moving window were analyzed. At present, there is no method to be able to analyze the type 4 signals. Future research will endeavor to determine the best way to evaluate such voices.

  • PDF

일반화된 가우시안 분포를 이용한 신호 준공간 기반의 음성검출기법 (Signal Subspace-based Voice Activity Detection Using Generalized Gaussian Distribution)

  • 엄용섭;장준혁;김동국
    • 한국음향학회지
    • /
    • 제32권2호
    • /
    • pp.131-137
    • /
    • 2013
  • 본 논문에서는 신호준공간(signal subspace) 영역에서 통계적 모델을 이용한 향상된 음성검출기법을 제안한다. 이를 위해 EP(Embedded Prewhitening) 기법에 의해 비상관적인 (uncorrelated) 신호준공간을 생성하고, 이 영역에서 잡음음성과 잡음에 대한 통계적 특성을 파악하였다. 이러한 통계적 특성에 근거하여 GGD (Generalized Gaussian Distribution)을 사용하여 보다 효율적인 음성검출 알고리즘을 제안한다. 실험을 통해 제안된 기법이 0-15dB SNR의 시뮬레이션 환경에서 기존 Gaussian을 사용한 신호준공간 기법보다 향상된 음성검출 결과를 보여준다.

FPGA를 이용한 음성 신호 감지 시스템 개발 (Development of Voice Signal Detection System using FPGA)

  • 김장원
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.141-146
    • /
    • 2015
  • 다양하게 복합된 소리 및 음성신호를 FPGA의 마이크로 입력받아서 신호를 분류하고 분석하여 이상 신호를 감지할 수 있는 많은 시스템이 있으나, 효율적이며 효과적으로 이상 신호를 감지하는 시스템을 구현하는데 있어서는 많은 문제점들을 가지고 있다. 따라서 이 문제를 해결하고 감지율을 높이기 위하여 본 연구에서 제안된 방법에서는 소리 신호가 입력되는 마이크 센서를 사용하여 FIFO(First-in First-out) 구조에 적용하고, 통계학적으로 분산과 변동계수를 적용한 알고리즘을 기반으로 이상 신호를 효과적으로 분류하고, 효율적으로 감지 여부를 출력하는 시스템을 제안하고 구현하였다. 제안된 알고리즘을 적용한 시스템을 통하여 100회 이상의 실험을 반복한 결과 96.3%의 감지율을 보였다.