• Title/Summary/Keyword: 신호 전처리

Search Result 357, Processing Time 0.025 seconds

Comparison of Recognition Performance for Preprocessing Method of USE STSA with Approximated Modified Bessel Function (Modified Bessel 함수 근사화를 적용한 MMSE STSA 전처리 기법의 음성인식 성능 비교)

  • Son Jong Mok;Kim Min Sung;Bae Keun Sung
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.125-128
    • /
    • 2001
  • 본 연구에서는 음성신호의 왜곡에 대해 음성 부재 확률을 고려한 MMSE(Minimum Mean Square Error) STSA(Short-Time Spectral Amplitude Estimator)를 전처리기로 도입하여 HMM(Hidden Markov Model)에 기반 한 음성인식시스템의 인식성능을 평가하였다. 음성인식 시스템의 실시간 구현을 고려하여, MMSE STSA 기법을 음성개선을 위한 전처리기로 사용할 때 MMSE STSA의 이득계산 과정에서 많은 계산량이 요구되는 modified Bessel 함수를 근사 화하여 사용하였다.

  • PDF

The Effect of the Telephone Channel to the Performance of the Speaker Verification System (전화선 채널이 화자확인 시스템의 성능에 미치는 영향)

  • 조태현;김유진;이재영;정재호
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.5
    • /
    • pp.12-20
    • /
    • 1999
  • In this paper, we compared speaker verification performance of the speech data collected in clean environment and in channel environment. For the improvement of the performance of speaker verification gathered in channel, we have studied on the efficient feature parameters in channel environment and on the preprocessing. Speech DB for experiment is consisted of Korean doublet of numbers, considering the text-prompted system. Speech features including LPCC(Linear Predictive Cepstral Coefficient), MFCC(Mel Frequency Cepstral Coefficient), PLP(Perceptually Linear Prediction), LSP(Line Spectrum Pair) are analyzed. Also, the preprocessing of filtering to remove channel noise is studied. To remove or compensate for the channel effect from the extracted features, cepstral weighting, CMS(Cepstral Mean Subtraction), RASTA(RelAtive SpecTrAl) are applied. Also by presenting the speech recognition performance on each features and the processing, we compared speech recognition performance and speaker verification performance. For the evaluation of the applied speech features and processing methods, HTK(HMM Tool Kit) 2.0 is used. Giving different threshold according to male or female speaker, we compare EER(Equal Error Rate) on the clean speech data and channel data. Our simulation results show that, removing low band and high band channel noise by applying band pass filter(150~3800Hz) in preprocessing procedure, and extracting MFCC from the filtered speech, the best speaker verification performance was achieved from the view point of EER measurement.

  • PDF

Improving Non-Profiled Side-Channel Analysis Using Auto-Encoder Based Noise Reduction Preprocessing (비프로파일링 기반 전력 분석의 성능 향상을 위한 오토인코더 기반 잡음 제거 기술)

  • Kwon, Donggeun;Jin, Sunghyun;Kim, HeeSeok;Hong, Seokhie
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.29 no.3
    • /
    • pp.491-501
    • /
    • 2019
  • In side-channel analysis, which exploit physical leakage from a cryptographic device, deep learning based attack has been significantly interested in recent years. However, most of the state-of-the-art methods have been focused on classifying side-channel information in a profiled scenario where attackers can obtain label of training data. In this paper, we propose a new method based on deep learning to improve non-profiling side-channel attack such as Differential Power Analysis and Correlation Power Analysis. The proposed method is a signal preprocessing technique that reduces the noise in a trace by modifying Auto-Encoder framework to the context of side-channel analysis. Previous work on Denoising Auto-Encoder was trained through randomly added noise by an attacker. In this paper, the proposed model trains Auto-Encoder through the noise from real data using the noise-reduced-label. Also, the proposed method permits to perform non-profiled attack by training only a single neural network. We validate the performance of the noise reduction of the proposed method on real traces collected from ChipWhisperer board. We demonstrate that the proposed method outperforms classic preprocessing methods such as Principal Component Analysis and Linear Discriminant Analysis.

The Damage Classification by Periodicity Detection of Ultrasonic Wave Signal to Occur at the Tire (타이어에서 발생하는 초음파 신호의 주기성 검출에 의한 손상 분별)

  • Oh, Young-Dal;Kang, Dae-Soo
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.10 no.6
    • /
    • pp.107-111
    • /
    • 2010
  • The damage of tire by damage material classification method is researched as used ultrasonic wave signal to occur at a tire during vehicle driving. Auto-correlation function after having passed through an envelope detecting preprocess is used for detecting periodicity because of occurring periodic ultrasonic waves signal with tire revolution. One revolution cycle time of a damaged tire and period that calculated auto-correlation function appeared equally in experiment. The result that can classification whether or not there was a tire damage is established.

Objective measurement of spatial auditory quality for multi channel audio codecs (멀티채널 오디오 압축 코덱 음질의 객관적인 측정방법)

  • Choi, In-Yong;Chon, Sang-Bae;Sung, Koeng-Mo
    • Proceedings of the IEEK Conference
    • /
    • 2005.11a
    • /
    • pp.431-434
    • /
    • 2005
  • 본 논문은 멀티채널 오디오 압축 코덱의 음질을 객관적으로 평가할 수 있는 시스템 및 파라메터에 관한 것으로, 멀티채널 오디오 신호로부터 양이입력신호(ear input signals)를 만들어내는 전처리 과정과 이 과정을 통해 출력되는 양이입력신호로부터 양이레벨차이왜곡(inter-aural level difference distortion)을 구하는 과정 및 양이레벨차이왜곡이 청취평가 결과와 일관적인 상관관계를 보임을 서술한다. 본 연구에 의하면 멀티채널 오디오 압축 코덱의 음질을 선별된 청취자에 의한 주관적인 평가와 통계처리 없이 객관적인 측정만을 통해 평가하는 것이 가능하며, 이를 사용하면 멀티채널 오디오 압축 코덱 개발자들이 시간, 경제적 부담 없이 자신이 개발한 압축 코덱의 음질을 간단하게 평가해볼 수 있다.

  • PDF

Automated Layout of PLA using CIF (GIF를 이용한 PLA의 Layout 자동화)

  • Jeong, Seung-Jeong;Yang, Yeong-Il;Gyeong, Jong-Min
    • Journal of the Korean Institute of Telematics and Electronics
    • /
    • v.22 no.1
    • /
    • pp.14-21
    • /
    • 1985
  • In this paper, a new pitch extraction method, the area comparison method, is proposed. By the speech production model, the area of the first peak on a pitch interval of speech signals is emphasized. By using the above characteristics, this method have more advantages than the others for pitch extraction. The defective decision caused by an impulsive noise is minimized and the pre-filtering is not necessary for this rr ethos, because the integration of signals takes place in the process.

  • PDF

The Comparison of features for Speech/Music Discrimination (음성/음악 분류를 위한 특징 비교)

  • Lee Kyong Rok;Seo Bong Su;Kim Jin Young
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.157-160
    • /
    • 2000
  • 본 논문에서는 멀티미디어 정보에서 원하는 정보를 추출하는 멀티미디어 인덱싱 중 오디오 인덱싱의 전처리 부격인 음성/음악 분류실험을 하였다. 오디오 인덱싱에 있어서 음성/음악 분류기는 원 오디오 신호에서 정보를 가진 음성 부분을 분리하는 역할을 한다. 실험에서는 음성/음악 분류에서 널리 쓰이는 멜캡스트럼(Mel Cepstrum), 정규화 로그 에너지(normalized log energy), 영교차(Zero-Crossings)를 특징 파라미터로 사용하였다[l, 2, 3]. 특징공간은 GMM(Gaussian Mixture Model)에 의해 모델링 되었고, 오디오 신호의 분류는 각각 3가지 분류항목(음성, 음악, 음성+음악)과 2가지 분류항목(음성, 음악)을 적용하였다. 실험결과 3가지 분류항목 적용시와 2가지 분류항목 적용시 모두 멜캡스트럼을 사용하였을 때 가장 좋은 결과를 보였다.

  • PDF

A Baseline Elimination Method for ECG using Wavelet Transform (웨이브렛 변환을 이용한 심전도의 기저선 제거)

  • 최형민;김원식;정광일;황재호
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2003.05a
    • /
    • pp.128-133
    • /
    • 2003
  • 본 연구에서는 심전도 신호의 전처리 과정에서 원신호의 왜곡을 최소화하여 기저선을 제거 할 수 있는 웨이브렛 모함수를 결정하기 위하여, European S-T T database의 심전도 신호에 다양한 웨이브렛 모함수를 적용하여 기저선을 제거하였으며 제거효율을 평가하기 위하여 SNR과 RSE를 계산하였다. 실험결과 가장 우수했던 웨이브렛 모함수는 db8(diff: 27.12), coif5(diff: 25.32), sym7(diff: 25.13)이었으며, diff(meanSNR-meanRSE)의 값이 23미만으로는 심전도의 진단 파라미터까지 왜곡시키므로 사용할 수 없다는 것을 알 수 있었다.

  • PDF

Localization of Multiple Speakers Using Microphone Array System (마이크로폰 어레이 시스템을 이용한 다화자 방향검지)

  • Hung, Vu Viet;Lee, Chang-Hoon
    • The Journal of Engineering Research
    • /
    • v.8 no.1
    • /
    • pp.59-65
    • /
    • 2006
  • 본 논문에서는 마이크로폰 어레이 시스템을 이용하여 여러 화자의 음성 정보로부터 각 화자가 위치한 방향을 추정하는 기술 개발 내용을 다룬다. 성능 향상을 위한 전처리 과정으로 비선형 증폭기를 사용하여 거리에 따른 영향을 최소화하는 과정과 잡음에 대한 강인성을 얻기 위해 음성활성 영역을 검출하는 과정을 포함한다. 등간격으로 배치된 마이크로폰 어레이 시스템의 기하학적 특성에 따른 음원의 위치와 신호의 지연시간차이와의 상관관계로부터 화자의 위치를 역으로 추정하는 알고리즘을 기본으로 하여 가능성 척도를 계산하고 이를 활용하여 가능성이 높은 것들을 클러스터링하여 가능성이 있는 후보를 선정하여 화자의 방향을 검지한다. 이 과정에서 오인식을 최소화하기 위하여 가능성이 희박한 영역에 대한 추정 억제 방법으로 부정식 추론법을 적용하였다. 2 화자의 음성 신호를 입력으로 한 실험을 통하여 제안한 방법에 의한 다화자 방향검지의 가능성을 알아보았다.

  • PDF

The High Speed Pitch Extraction of Speech Signals Using the Area Comparison Method (면적 비교법에 의한 고속 PITCH 추출)

  • 배명진;안수결
    • Journal of the Korean Institute of Telematics and Electronics
    • /
    • v.22 no.2
    • /
    • pp.13-17
    • /
    • 1985
  • In this paper, a new pitch extraction method, the area comparison method, is proposed. By the speech production model, the area of the first peak on a pitch interval of speech signals is emphasized. By using the above characteristics, this method have more advantages than the others for pitch extraction. The defective decision caused by an impulsive noise is minimized and the pre-filtering is not necessary for this method, because the intergration of signals takes place in the process.

  • PDF