• 제목/요약/키워드: Speech signals

검색결과 497건 처리시간 0.031초

음성신호의 상위 포만트에 대한 ZCR-파라미터 검출에 관한 연구 (On a Detection of the ZCR-Parameter for Higher Formants of Speech Signals)

  • 유건수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1992년도 학술논문발표회 논문집 제11권 1호
    • /
    • pp.49-53
    • /
    • 1992
  • In many applications such as speech analysis, speech coding, speech recognition, etc., the voiced-unvoiced decision should be performed correctly for efficient processing. One of the parameters which are used for voice-unvoiced decision is zero-crossing. But the information of higher formants have not represented as the zero-crossing rate for higher formants of speech signals.

  • PDF

대역 스크램블을 이용한 음성 보호방식 (Speech Encryption Scheme Using Frequency Band Scrambling)

  • 지형근;이동욱
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 추계학술대회 논문집 학회본부 B
    • /
    • pp.700-702
    • /
    • 1999
  • The protection of data which we want to keep secret from invalid users has become a main topic nowadays. This paper introduces a encryption scheme for protecting speech signals from eavesdropping. The proposed encryption scheme adopts a secure voice cryptographic algorithm based on the scrambling in frequency band. In order to improve the conventional speech signal encryption scheme, we have randomly permuted DCT coefficients of speech signal. Simulation results are included to show the performance of the proposed algorithm for secure transmission of speech signals.

  • PDF

음성신호의 AM-FM 성분 분리를 위한 가변대역폭 필터 구현 (Realization of Variable Bandwidth Filter for Decomposition of Speech Signals into AM-FM Components)

  • 이희영;김용태
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2208-2211
    • /
    • 2003
  • In this paper, a variable bandwidth filter(VBF) is realized with the purpose of the decomposition of speech signals with time-varying instantaneous of frequencies. The proposed VBF can extract AM-FM components of a speech signal whose time-frequency representations(TFRs) are not overlapped in time-frequency domain

  • PDF

선스펙트럼 쌍의 복원에 의한 잡음억제 기법 (Noise Suppression Method for Restoring Line Spectrum Pair)

  • 최재승
    • 대한전자공학회논문지SP
    • /
    • 제47권4호
    • /
    • pp.112-118
    • /
    • 2010
  • 본 논문에서는 시간지연신경회로망과 주파수영역의 파라미터를 가지는 선스펙트럼 쌍을 사용하여 정규화 방법에 기초한 잡음억제 시스템을 제안한다. 먼저, 시간지연신경회로망은 선형예측분석하여 구해진 잡음이 부가된 음성신호의 선스펙트럼 쌍을 학습시킨다. 그리고 제안한 시스템은 시간지연신경회로망을 학습시킴으로써 배경잡음에 의하여 열화된 잡음이 부가된 음성신호를 강조한다. 따라서 제안한 시간지연신경회로망은 학습에 의하여 잡음이 부가된 선스펙트럼 쌍의 값을 잡음이 부가되기 전의 값으로 복원하여 잡음을 억제한다. 제안한 시스템은 스펙트럼 왜곡율의 평가법을 사용하여 배경잡음에 의하여 열화된 음성 신호에 대하여 효과적인 것을 확인한다.

ICA와 DNN을 이용한 방송 드라마 콘텐츠에서 음악구간 검출 성능 (Performance of music section detection in broadcast drama contents using independent component analysis and deep neural networks)

  • 허운행;장병용;조현호;김정현;권오욱
    • 말소리와 음성과학
    • /
    • 제10권3호
    • /
    • pp.19-29
    • /
    • 2018
  • We propose to use independent component analysis (ICA) and deep neural network (DNN) to detect music sections in broadcast drama contents. Drama contents mainly comprise silence, noise, speech, music, and mixed (speech+music) sections. The silence section is detected by signal activity detection. To detect the music section, we train noise, speech, music, and mixed models with DNN. In computer experiments, we used the MUSAN corpus for training the acoustic model, and conducted an experiment using 3 hours' worth of Korean drama contents. As the mixed section includes music signals, it was regarded as a music section. The segmentation error rate (SER) of music section detection was observed to be 19.0%. In addition, when stereo mixed signals were separated into music signals using ICA, the SER was reduced to 11.8%.

고해상 피치검출을 이용한 한국어 음성신호의 음소분리 (Segmentation of the Korean speech signals into phonetic units using the super resolution pitch determination)

  • 이응구;이두수
    • 한국통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.270-278
    • /
    • 1993
  • 본 논문에서는 고해상 피치검출을 이용해서 정확한 피치를 찾고 각 피치 주기에서의 상관함수와 문턱값을 비교하여 한국어 음성신호를 음소단위로 분리하는 알로리듬을 제안한다. 제안된 알고리듬의 특성은 정확하고 고신뢰도를 갖으며, 변이구간이나 무음구간도 구분할 수 있다. 이 알고리듬은 음소단위로 분리하여 코드북을 설계하는 백터양자화와 음성인식 분야에 적용된다. 본 논문에서 제안한 알고리듬은 PC386/DX 상에서 386/MATLAB으로 실행한 결과 피치주기를 정확히 찾고 음소별로 분리가 가능함을 알 수 있다.

  • PDF

잡음 섞인 한국어 인식을 위한 ICA 비교 연구 (Comparison of ICA Methods for the Recognition of Corrupted Korean Speech)

  • 김선일
    • 전자공학회논문지 IE
    • /
    • 제45권3호
    • /
    • pp.20-26
    • /
    • 2008
  • 두 가지 Independent Component Analysis(ICA) 알고리즘을 적용하여 자동차 엔진 소음과 섞인 음성 신호의 인식을 시도하였다. 이를 이용하여 추정한 신호를 HMM을 이용하여 인식하였고 이 신호의 인식률을 소음이 섞이기 전의 음성 신호의 인식률과 비교하였다. 음성 신호를 추정하는데 두 가지 서로 다른 ICA를 사용하였으며 그 중의 하나는 negentropy를 최대화하는 FastICA 알고리즘이며 다른 하나는 출력 신호 사이의 독립성을 최대화하여서 입력과 출력 사이의 mutual information을 최대화하는 information-maximization approach 이다. 남성 앵커가 진행한 한국어 뉴스 문장에 대한 단어 인식률은 87.85%이며 다양한 신호 대 잡음비를 갖도록 소음을 섞어서 추정을 한 후 인식을 시도한 결과 FastICA를 이용해 추정한 음성 신호에 대한 인식률은 1.65%, information-maximization을 이용해 추정한 음성 신호에 대한 인식률은 2.02% 인식률 저하가 나타났다. 따라서 어느 방법을 적용하든지 의미 있는 차이가 없음을 확인하였다.

Variable LPF에 의한 피치검출 (The Pitch Detection Using Variable LPF)

  • 백금란
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.88-92
    • /
    • 1993
  • In speech signal processing, it is necessary to detect exactly the pitch. The algorithms of pitch extraction which have been proposed until now are difficult to detect pitches over wide range speech signals. Thus we propose a new algorithm which uses the G-peak extraction to do it. It is the method that finds the most MZI(maximum zero-crossing interval) at each frame and convolve it with speech signal ; this is the same with passing speech signals to variable LPF. Finally we obtained the pitch, improve the accuracy of pitch detection and extract it with the high speed.

  • PDF

Evaluation for speech signal based on human sense and signal quality

  • Mekada, Yoshito;Hasegawa, Hiroshi;Kumagai, Takeshi;Kasuga, Masao
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1997년도 Proceedings International Workshop on New Video Media Technology
    • /
    • pp.13-18
    • /
    • 1997
  • Each reproducing speech signal has each particular signal property, because of the processing of encoding and decoding for communications through various media. In this paper, we examine the correlation between speech signal quality and sensory pleasure for the sensory improvement of that signal. In experiments, we evaluate the quality of speech signals through various media by psychological auditory test and physical features of these signals.

  • PDF

주파수 영역 자기 공분산 기울기를 이용한 음성과 자동차 소음 신호의 구분 (Classification of Speech and Car Noise Signals using the Slope of Autocovariances in Frequency Domain)

  • 김선일
    • 한국정보통신학회논문지
    • /
    • 제15권10호
    • /
    • pp.2093-2099
    • /
    • 2011
  • 음성 신호와 자동차 엔진 배기음 등의 소음이 섞인 신호에서 통계적 방법을 이용하여 음성 신호와 자동차 소음 신호를 분리하였다. 분리된 신호에서 음성신호를 구분해 내기 위해 128개의 원소를 갖는 신호 조각의 연속으로 신호를 재구성하고 각 신호 조각에 대해 FFT를 구하였다. 각 신호 조각의 FFT 계수 중에서 저주파 영역의 일부 계수 중 계수 각각에 대해 각 신호 조각 사이의 자기 공분산을 구하고 이들을 평균하였다. 그리고 linear regression을 이용 하여 평균 자기 공분산 값들을 연결하는 직선의 방정식을 구한 후 이 직선의 기울기를 비교하여 음성 신호와 자동차 소음 신호를 구분하는 방법을 제안하고 유용성을 확인하였다.