• 제목/요약/키워드: 음성검출

검색결과 725건 처리시간 0.03초

응급구조에서의 음향데이터 분석을 위한 음성 부재구간 검출 기술 (Voice inactivity detection for Analysis of Acoustic data of Emergency Rescue)

  • 황승현;장준혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1348-1349
    • /
    • 2015
  • 본 논문에서는 응급구조의 신고 상황에서의 수보자의 보다 정확하고 신속한 대응를 위하여 수화자의 음향환경을 분석하여 주변상황에 대한 정보를 알고자 심화 신경망 기반의 음성 부재구간 검출 기법을 제안한다. 제안한 알고리즘은 음성 신호에서의 23차의 Mel-filter bank를 추출하고 이를 심화 신경망 기법을 이용하여 음성 부재구간을 검출한다. 객관적인 성능 평가를 위해 제안된 기법은 실제 응급구조 상황에서 평가되었으며, 기존의 음성검출기를 이용한 음성 부재구간 검출 성능에 비하여 향상된 성능을 보였다.

자동차 잡음 환경에서 웨이브렛 밴드 엔트로피 앙상블 분석을 이용한 음성구간 검출 알고리즘 (Voice Activity Detection Algorithm using Wavelet Band Entropy Ensemble Analysis in Car Noisy Environments)

  • 이기현;이윤정;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제16권9호
    • /
    • pp.1005-1017
    • /
    • 2013
  • 음성구간 검출은 음성과 잡음이 섞인 신호에서 음성구간과 비음성구간을 구분하는 과정으로 음성 향상을 위한 신호처리에서 매우 중요한 과정이다. 지금까지 음성구간 검출에 관한 많은 연구가 있었지만, 낮은 신호 대 잡음비 환경이나 자동차 잡음과 같은 시간에 따른 변화가 심한 잡음환경에서는 좋은 성능을 보이지 못하였다. 본 논문에서는 웨이브렛 밴드 엔트로피 기반의 앙상블 분산과 소프트 문턱치 기법을 이용한 새로운 음성구간 검출 알고리듬을 제안하였다. 제안한 알고리듬의 성능을 비교 평가하기 위하여 자동차 잡음이 있는 다양한 신호 대 잡음비 환경에서 실험을 수행하였으며 실험결과, 제안한 방법의 우수한 성능을 확인할 수 있었다.

일반화된 가우시안 분포를 이용한 신호 준공간 기반의 음성검출기법 (Signal Subspace-based Voice Activity Detection Using Generalized Gaussian Distribution)

  • 엄용섭;장준혁;김동국
    • 한국음향학회지
    • /
    • 제32권2호
    • /
    • pp.131-137
    • /
    • 2013
  • 본 논문에서는 신호준공간(signal subspace) 영역에서 통계적 모델을 이용한 향상된 음성검출기법을 제안한다. 이를 위해 EP(Embedded Prewhitening) 기법에 의해 비상관적인 (uncorrelated) 신호준공간을 생성하고, 이 영역에서 잡음음성과 잡음에 대한 통계적 특성을 파악하였다. 이러한 통계적 특성에 근거하여 GGD (Generalized Gaussian Distribution)을 사용하여 보다 효율적인 음성검출 알고리즘을 제안한다. 실험을 통해 제안된 기법이 0-15dB SNR의 시뮬레이션 환경에서 기존 Gaussian을 사용한 신호준공간 기법보다 향상된 음성검출 결과를 보여준다.

한국어 음성신호의 음절과 운율구 경계에 관한 연구 (A Study on Syllable's and Prosodic Phrase's Boundaries in Korean Speech Signal)

  • 이기영;송민석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.361-364
    • /
    • 1999
  • 한국어의 연속 음성 인식을 위하여 운율구 단위로 경계를 검출하는 연구가 진행되고 있다. 그 과정의 일부로서 본 연구에서는 여러 음향 특징들을 조합하여 연속음성에서 음절 경계의 검출하는 방법을 제시하였으며, 연속 음성으로부터 한국어 운율구인 강세구의 경계를 운율 특징만을 이용한 패턴 비교 방법을 이용하여 검출한 것과 비교 검토하였다. 그 결과, 패턴 비교 방법으로 검출한 강세구의 경계를 음절의 경계와 일치되도록 정렬해줄 필요가 있음을 알 수 있었다.

  • PDF

음성인식을 위한 자동차 소음환경에서의 끝점 검출 (Endpoint Detection in the Car Noise Environment for Speech Recognition)

  • 서동권;신원호;양태영;김원구;윤대희
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.76-79
    • /
    • 1998
  • 소음이 존재하지 않는 환경에서는 에너지 파라메터만으로도 정확한 끝점 검출을 수 행할 수 있으나 신호대 잡음비가 0dB에 가까운 자동차 환경에서는 끝점 검출이 거의 불가 능하다. 본 논문에서는 자동차 소음 환경에서 음성 구간 검출을 위하여 단구간 영교차율과 2∼4kHz의 주파수 영역 에너지를 사용한 끝점 검출 방법을 제안하였다. 제안된 방법과 기 존의 방법의 성능을 DTW를 이용한 단독음 인식 시스템에 적용하여 인식률로 비교하였으 며 제안된 음성 구간 검출 방법을 적용한 경우가 보다 좋은 인식률을 나타내었다.

  • PDF

잡음 환경에서 심리음향모델 기반 음성 에너지 최대화를 이용한 음성 검출 방법 (Voice Activity Detection Method Using Psycho-Acoustic Model Based on Speech Energy Maximization in Noisy Environments)

  • 최갑근;김순협
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.447-453
    • /
    • 2009
  • 이 논문은 음성 에너지를 최대화 하여 낮은 SNR환경에서 음성 존재 여부를 판단하고 정확한 끝점을 검출하는 방법에 대한 것이다. 전통적인 VAD (Voice Activity Detection) 알고리듬은 잡음의 추정치를 이용해 음성과 비음성 구간을 선택하여 낮은 SNR환경이나 비안정 잡음환경에서는 정확하지 못한 문턱값으로 인해 부정확한 끝점검출을 하였다. 또한 잡음의 시간적 변화를 반영하기 위해 비교적 큰 분석 구간을 두어 계산량이 증가함에 따라 실제 응용에 적합하지 않은 단점이 있다. 이 논문은 잡음환경에서 정확한 음성 구간의 검출을 위해 심리음향 모델에 기반 한 바크 스케일 필터 뱅크를 이용하여 주어진 프레임에서 음성 에너지를 최대화 시키고 잡음을 억제하는 SEM-VAD (Speech Energy Maximization-Voice Activity Detection) 방법을 제안하였다. 다양한 잡음환경, SNR 15 dB, 10 dB 5 dB 0 dB 상황에서 실험한 결과 SNR의 변화에 안정적인 문턱값을 얻었고, 음성 검출을 위한 실험에서 자동차 잡음 환경에 대한 PHR (Pause Hit Rate)은 모든 잡음 환경에서 100%의 정확도를 보였고, FAR (False Alarm Rate)는 SNR 15 dB와 10 dB에서는 0%, SNR 5 dB에서 5.6% SNR 0 dB에서 9.5%의 성능을 보였다.

실시간 변별적 가중치 학습에 기반한 음성 검출기 (Voice Activity Detection Based on Real-Time Discriminative Weight Training)

  • 강상익;조규행;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제45권4호
    • /
    • pp.100-106
    • /
    • 2008
  • 본 논문에서는 다양한 잡음 환경에서 음성의 통계적 모델에 기반한 음성 검출기의 성능향상을 위해 PSFM (Power Spectral Flatness Measure)을 이용하여 실시간으로 변별적 가중치 학습 (Discriminative Weight Training) 기반의 최적화된 우도비 테스트 (Likelihood Ratio Test, LRT)를 제안한다. 먼저, 기존의 통계모델기반의 음성 검출기를 분석하고, 이를 기반으로 MCE (Minimum Classification Error)방법을 도입하여 도출한 각 주파수 채널별 가중치를 PSFM 값에 기반하여 실시간 매 프레임마다 다른 가중치를 적용한 우도비 기반의 음성 검출 결정법을 제시한다. 제안된 알고리즘은 다양한 잡음 환경에서 기존에 제시된 음성 검출기와 비교하였으며, 우수한 성능을 보인다.

2-채널 (음성 및 EGG) 신호 분석에 의한 피치검출 (Pitch Detection by the Analysis of Speech and EGG Signals)

  • 신무용;김정철;배건성
    • 한국음향학회지
    • /
    • 제15권5호
    • /
    • pp.5-12
    • /
    • 1996
  • 본 연구에서는 음성 및 EGG 신호를 2-채널 피치검출 알고리즘을 제안하였다. 성대의 떨림에 관한 정확한 정보를 얻을 수 있는 EGG 신호를 이용함으로써 음성신호로부터 피치를 검출하고자 할 때 수반되는 문제점들을 최소화 할 수 있으며, EGG 신호의 왜곡 및 불규칙한 변화는 음성신호의 분석을 통해 보완해 줌으로써 시간영역에서 음성신호에 동기된 정확한 피치 marker를 검출하였다. 2-채널 피치검출 알고리즘은 음성신호만을 이용한 일반적인 피치검출 알고리즘에 비해 보다 정확하고 개선된 피치궤적을 얻을 수 있음을 실험을 통해 보였으며, 따라서 새로이 개발되는 피치검출 알고리즘의 객관적인 비교 및 평가에 이용될 수 있다.

  • PDF

시간-주파수영역에서의 새로운 피치검출 방법 (A New Pitch Detection Method in time-Frequency Domain)

  • 김종국;최호진;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.805-808
    • /
    • 2001
  • 음성인식, 합성 및 분석과 같은 음성신호처리 분야에 있어서 기본주파수 즉, 피치를 정확히 검출하는 것은 중요하나 만일 음성신호의 기존주파수를 정확히 검출할 수 있다면 음성인식에 있어서 화자에 따른 영향을 줄일 수 있기 때문에 인식의 정확도를 높일 수 있고, 음성합성 시에 자연성과 개성을 쉽게 변경하거나 유지할 수 있다. 또한 분석시 피치에 동기 시켜 분석하면 성문의 영향이 제거된 정확한 성도 파라미터를 얻을 수 있다. 따라서 제안한 논문에서는 시간영역처리에서 시간영역파형에서 먼저 성도성분이 제거된 성문특성 즉 피치주기 성분을 강조하기 위해 음성신호의 기울기를 이용한 Positive 센터 클리핑를 수행하고 주파수 영역에서는 원신호의 스펙트럼과 센터클립된 신호의 스펙트럼과의 Peak-Fiting을 수행하고 선형 인터폴래이션(스무딩)을 통해 평탄화된 스펙트럼을 얻었다. 결과적으로 유성음 구간과 음성이 변하는 전이구간에서 G-peak가 강조된 더욱 정확한 Pitch를 검출할 수 있었다.

  • PDF

웨이브렛 변환을 이용한 피치검출 (Pitch Detection Using Wavelet Transform)

  • 손영호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1997년도 영남지회 학술발표회 논문집 Acoustic Society of Korean Youngnam Chapter Symposium Proceedings
    • /
    • pp.5-8
    • /
    • 1997
  • 음성신호는 성대를 통과한 공기 흐름의 성질에 따라 유성음과 무성음으로 구분될 수 있다. 그 중 유성음에서는 성대의 규칙적인 지동이 존재하게 된는 데 이때 성대가 닫히는 순간을 GCI(Glotal Closure Instant)라 하며 성대 진동의 기본주기를 피치라고 한다. 이러한 피치는 음성합성, 음성인식, 피치동기 음성신호의 분석등에 중요한 파라미터 중의 하나이다. 본 논문에서는 가우시안 함수의 일차미분형태를 갖는 웨이브렛 함수를 사용할 경우 신호의 급격한 변화부분을 검출할 수 있다는 성질을 이용하여 음성 신호의 GCI를 찾아내고 이를 이용하여 피치를 검출하였다.

  • PDF