• Title/Summary/Keyword: 신호후처리

Search Result 959, Processing Time 0.026 seconds

Post-Processing of Speech Recognition Using User Utterance Sequential Pattern (사용자 발화 순차패턴을 이용한 음성인식 후처리)

  • Song, Won-Moon;Kim, Eun-Ju;Kim, Myung-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.709-711
    • /
    • 2005
  • 최근 음성인식 분야에서는 발화된 음성의 단순한 신호 처리위주의 인식 결과로부터 좀 더 신뢰할 수 있는 결과를 얻기 위하여 여러 가지 후처리 기법들이 연구되고 있다. 본 논문에서는 개인 사용자를 위한 음성 명령어 인식 환경에서 사용자의 발화 정보를 후처리에 적용함으로써 사용자 정보를 고려한 음성인식 후처리 기법을 제안한다. 먼저 이전에 사용했던 음성 명령어들로부터 명령어 발화 순차 패턴 규칙을 추출 한 후 사용자가 사전에 발화한 명령어를 바탕으로 구성된 순차 패턴을 비교하여 순차 규칙상 얻어 질 수 있는 단어를 결정한다. 이렇게 얻어진 단어를 고려하여 음성인식기 인식단어 후보들의 확률값을 적절히 보정한 후 최종 인식 단어를 재결정한다. 이러한 과정에서 적절한 보정을 위하여 발화 순차 패턴의 신뢰도와 인식기의 결과단어를 고려한 보정 방법을 제안한다. 실험을 통하여 제안한 후처리를 이용한 음성인식이 HMM을 이용한 기본 음성인식에 비해 오류율을 $15\%$이상 낮추어 인식률에 상당한 기여를 하였음을 확인할 수 있다.

  • PDF

Robust Blind Source Separation to Noisy Environment For Speech Recognition in Car (차량용 음성인식을 위한 주변잡음에 강건한 브라인드 음원분리)

  • Kim, Hyun-Tae;Park, Jang-Sik
    • The Journal of the Korea Contents Association
    • /
    • v.6 no.12
    • /
    • pp.89-95
    • /
    • 2006
  • The performance of blind source separation(BSS) using independent component analysis (ICA) declines significantly in a reverberant environment. A post-processing method proposed in this paper was designed to remove the residual component precisely. The proposed method used modified NLMS(normalized least mean square) filter in frequency domain, to estimate cross-talk path that causes residual cross-talk components. Residual cross-talk components in one channel is correspond to direct components in another channel. Therefore, we can estimate cross-talk path using another channel input signals from adaptive filter. Step size is normalized by input signal power in conventional NLMS filter, but it is normalized by sum of input signal power and error signal power in modified NLMS filter. By using this method, we can prevent misadjustment of filter weights. The estimated residual cross-talk components are subtracted by non-stationary spectral subtraction. The computer simulation results using speech signals show that the proposed method improves the noise reduction ratio(NRR) by approximately 3dB on conventional FDICA.

  • PDF

A Measurement Algorithm using Gray-level Thresholding in Automatic Refracto-Keratometer (그레이 수준 한계 기법을 이용한 자동 굴절력 측정 알고리즘)

  • Seong, Won;Park, Jong-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.695-698
    • /
    • 2002
  • 최근 시각 관련 측정기 개발에 대한 관심이 높아지고 있다. 이에 본 연구는 자동 시각 굴절력 곡률계의 전자 부문에 연동될 굴절력 측정 알고리즘을 개발하였다. 만약 자동화된 시스템이 광학계로부터 나오는 영상을 이용하여 내부 처리를 거친 후 정확한 시각 측정치를 검사자에게 알려줄 수 있다면 잘못 측정되는 측정 횟수를 크게 줄일 수 있을 것이다. 본 연구는 형태학적 필터링(morphological filtering)과 그레이-레벨의 신호 강조(signal enhance) 기술들을 이용하여 자동 시각 굴절력 측정 시스템에 연동될 측정 알고리즘을 개발하였다. 알고리즘에서는 광학계로부터, 도출된 영상으로부터 첫째로 형태학적 필터링 처리를 행하여 처리가 어려운 원 영상을 좀 더 다루기 쉬운 상태로 바꿔준 후 영상에 가해주는 그레이 수준 한계 기법을 통해 신호를 강조함으로써 영상의 그레이 값 분포가 다양함으로 인해서 발생되는 오차를 줄이게 된다. 그리하여 본 전자 부문 소프트웨어는 정확한 측정값 도출이 어려운 시각 영상에 적용되어 효과적으로 오차를 줄임으로써 보다 효율적인 시각 측정을 가능하게 하였다.

  • PDF

Robust Noise Detection for Digital Audio Restoration in Old Films (고전 영화의 디지털 음원 복원을 위한 강인한 노이즈 검출 기법)

  • You, Su-Jeong;Cho, Nam-Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.11a
    • /
    • pp.53-54
    • /
    • 2010
  • 본 논문에서는 단일 채널 디지털 오디오 신호에서 스펙트로그램과 영상 처리 기법을 이용하여 크래클 잡음을 검출하는 알고리즘을 제안한다. 오디오 신호의 주파수 특성을 효율적으로 분석하기 위해 스펙트로그램을 특정 컬러맵을 이용하여 컬러 영상으로 변환한 후 영상 처리 기법을 적용하여 크래클 잡음이 존재하는 구간을 검출하여 디지털 오디오 복원에 이용한다. 특히 고전영화에 나타나는 크래클 잡음은 에너지와 신호 길이가 음성이나 음악 신호와 유사하여 기존의 스펙트럴 음성 검출 기법으로는 검출에 어려움이 있다. 이에 비해 스펙트로그램 영상에서는 크래클 잡음이 다른 신호들과 구분되는 특성을 나타내므로 영상 처리 기법을 적용하여 경계 검출과 Hough 변환에 의한 선 검출을 이용하여 크래클 잡음을 검출한다. 제안된 알고리즘은 고전 영화 디지털 오디오 복원에 적용하였으며 크래클 잡음 검출에 우수한 성능을 보여준다.

  • PDF

Multiband Enhancement for DEMON Processing Algorithms (대역 분할 처리를 통한 데몬 처리 성능 향상 기법)

  • Cheong, Myoung Jun;Hwang, Soo Bok;Lee, Seung Woo;Kim, Jin Seok
    • The Journal of the Acoustical Society of Korea
    • /
    • v.32 no.2
    • /
    • pp.138-146
    • /
    • 2013
  • Passive sonars employ DEMON (Detection of Envelope Modulation on Noise) processing to extract propeller information from the radiated noise of underwater targets. Conventional DEMON processing improves SNR(Signal to Noise Ratio) characteristic by Welch method. The conventional Welch method overlaps several different time domain DEMON outputs to reduce the variance. However, the conventional methods have high computational complexity to get high SNR with correlated acoustic signals. In this paper, we propose new DEMON processing method that divides acoustic signal into several frequency bands before DEMON processing and averages each DEMON outputs. Therefore, the proposed method gathers independent acoustic signal faster than conventional method with low computational complexity. We prove the performance of the proposed method with mathematical analysis and computer simulations.

특이치 분해를 이용한 신호 향상 과정 중 유색잡음 하에서 주기신호의 주파수 및 갯수추정

  • 백성준
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1991.06a
    • /
    • pp.32-37
    • /
    • 1991
  • 고해상도 신호처리의 기본적인 문제는, 관찰 데이터의 개수가 작고 신호 대 잡음비(SNR)가 낮아서, 푸리에 분석기법에 의해 주기신호가 분해되지 않는 경우에, 신호의 파라미터를 추정하는 것이라 할 수 있다. 주기신호의 주파수 추정 문제에서는 일반적으로 주기신호의 개수를 알고 있다고 가정하는데, 주기신호의 개수가 사전에 알려져 있지 않은 경우, 주파수 추정은 결국 주기신호의 개수결정문제가 되어, EVD나 SVD를 이용한 개수 결정방법이 활발히 연구되어 왔다. 고해상도 신호처리에서는 EVD나 SVD의 비선형 특성 상임게치 신호 대 잡음비가 존재하며 이 SNR보다 낮은 경우 심각한 왜곡현상을 보이게 되어, 주파수 추정 또는 주기신호의 개수결정에 큰 오차를 보이게 된다. 주기신호의 개수를 사전에 알고 있는 경우, 임게치 SNR를 낮추려는 노력으로는 overdetermined over-ranked structured correlation matrix의 rank reduction과 averaging을 이용한 신호 향상방법(signal enhancement)이 연구되어 왔다. 그러나 사전에 주기신호의 개수를 알아야만 하는 결점이 있고, 잡음이 백색이여야 하는 제약이 있었다. 일반적으로 환경 잡음은 유색이고, 주기신호의 개수를 사전에 모르는 경우이므로, 낮은 SNR에서의 주파수 추정문제는 유색잡음을 고려한 신호향상으로 임게치 SNR을 낮추고 주기신호의 개수를 결정한 후 주파수 추정이 이루어져야 한다. 본 논문에서는 이를 위해 광대협 유색잡음에서의 신호향상과 그 과정 중 중 주기신호의 개수를 결정하는 알고리즘ㅇ르 제시하고자 한다.

  • PDF

MRAL Post Processing based on LS for Performance Improvement of Active Sonar Localization (소나 위치 추정 성능 향상을 위한 LS기반 MRAL 후처리 기법)

  • Jang, Eun-Jeong;Han, Dong Seog
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.49 no.9
    • /
    • pp.172-180
    • /
    • 2012
  • In multi-static sonar for detecting an underwater target, received signals contain the target echo, reverberation and clutter. Clutter and reverberation are main causes of increasing the false alarm rate. MRAL classifies received signals according to the spatial similarity, and it regards classified signal as reflected signals from a reflector. MRAL reduces the false alarm rate this way. However, the results of MRAL can have localization errors. In this paper, an MRAL post processing algorithm is proposed to reduce the localization errors with the least square (LS) method.

Post-processing for the elimination of residual echo in double-talk environment (동시통화 환경에서 잔여반향 제거를 위한 후처리 기법)

  • Son, Jae-Hyeak;Shin, Jae-Ho
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.44 no.2 s.314
    • /
    • pp.137-143
    • /
    • 2007
  • The P-ECLMS algorithm adapted the existing Post-Processing method occurs the distortion of the near-end signal at the double-talk situation. To solve this problem, we propose the SP-ECLMS algorithm which makes the Post-Processing coefficient differently at the case of the single-talk and the double-talk. When the correlation level is not output less than 30%, the proposed algorithm output the original signal to prevent the signal's distortion.

Calculating Traffic Congestion of each Intersection Direction (교차로상의 방향별 교통혼잡량 산출)

  • 진현수
    • Proceedings of the KOR-KST Conference
    • /
    • 1998.10a
    • /
    • pp.206-215
    • /
    • 1998
  • 교차로 교통신호제어의 입려정보로 단순히 차량의 대수만으로는 정확한 신호제어를 할 수가 없다. 여기에는 대기차량수, 도로의 길이, 차량의 형태 등을 고려한 도로의 혼잡량이라는 상징적 정보량이 적합하다고 할 수 있다. 그러나 상징적인 정보량은 입력정보인 실제적인 물리량사이에 서로 관련성이 없거나 상충적일 경우, 각 정보간의 선형성과 관련식을 도출하여 상징적인 정보를 얻는다는 것이 어렵다. 본 논문에서는 교통 신호처리에서 사용하는 상징적 정보량의 의미와 필요성을 고찰하여 본 후, 퍼지 이론을 통해 물리적인 교통 정보량을 이용 교통신호제어 상징적인 출력 정량인 교통 혼잡량을 산출하여 교통신호제어에 적용하여 기존의 교통신호제어와 비교하였다.

  • PDF

A Study on Selection of the Optimal Region of Interest for Smart Scale Photoplethysmography (스마트 체중계의 PPG 신호를 위한 최적의 측정 위치 선택에 대한 연구)

  • Jung, SeungGi;Han, TaeTang;Kim, ChanYoung;Moon, Chanki;Nam, Yunyoung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.555-558
    • /
    • 2015
  • 본 논문에서는 체중계에 올라선 상태에서 발바닥 다섯 부위의 PPG 신호를 측정하고 분석하여 가장 강한 신호가 측정되는 최적의 위치를 찾기 위해 비교 실험하였다. PPG 신호는 스마트폰 카메라 측정하였고, 신호의 정확률을 비교하기 위해 발바닥과 손가락에서 동시에 PPG신호를 측정하였다. 발바닥과 손가락 끝에서 얻은 PPG 신호로부터 RRI를 산출한 후 Bland-Altman을 이용하여 유의성을 비교 분석하였다. 실험은 5명의 젊은 남녀를 대상으로 수행되었으며 실험결과 부위 1과 부위 2에서 높은 유의성을 보였다.