• Title/Summary/Keyword: 음향적 특징

Search Result 435, Processing Time 0.028 seconds

음성질환별 MDVP, Phonetogram의 특징 연구

  • 안철민;김성태
    • Proceedings of the KSLP Conference
    • /
    • 2003.11a
    • /
    • pp.143-143
    • /
    • 2003
  • 음성에 대한 청각적 판단으로는 차이점과 공통점을 느낄 수 있으나, 개별적인 음향 분석에서는 차이점이나 공통점을 밝혀 내지 못한 경우가 많았다 따라서 음성에 대한 청각적 판단처럼 음향 분석 변수를 종합적으로 분석할 수 있는 MDVP와 Phonetogram을 이용하여 음성질환별로 나타나는 소견을 관찰하여 청각적 판단과 종합적인 음향학적 분석간에 연관성이 있는지 알아보고자 하였다. 음성변화를 주소로 본원에 내원하였던 환자 중 화상회선경술 검사상 양성성대질환이 관찰되었던 102명을 대상으로 하였고, 성대질환이 없었던 정상군과 비교하였다. 각 대상들은 화상회선경술 검사에서 질환의 종류를 확인하였고, 질환별 청각적 분석을 GRBAS로 확인하였다. 또한 MDVP를 시행하여 질환별로 변수들의 특징적인 변화를 종합적으로 도식화하여 확인하였고, Phonetogram을 시행하여 질환별로 감소된 부분이 있는지 확인하였다. (중략)

  • PDF

Speech Recognition in the Noisy Environment Using Multi-Band-Based Likelihood Measure (다중 대역기반 우도 측정을 이용한 잡음 환경에서의 음성 인식)

  • 신원호
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.315-318
    • /
    • 1998
  • 본 논문에서는 서브밴드 및 전 대역(full band)으로부터 얻은 특징 벡터를 함께 사용하여 잡음 환경에서 음성인식 시스템의 성능을 향상시키는 방법을 제안하였다. 이는 인식시 잡음에 오염된 대역에서 얻은 특징 벡터를 제거하는데 따른 정보 손실을 막기 위해 전 대역으로부터 얻은 특징 벡터를 함께 이용하며 신호 대 잡음비가 높은 대역을 강조하여 각 모델에 대한 확률 값을 계산한다. 전화망에서 수집된 데이터베이스를 이용하여 인식 실험을 수행한 결과 비교적 넓은 주파수 대역에 걸쳐 분포된 잡음의 경우에도 인식 성능을 향상시킬 수 있었다.

  • PDF

A PZrosodic Characteristics of Korean Read Sentences in Discourse Context (한국어 낭독체 담화문의 운율적 특징)

  • 성철재
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.209-213
    • /
    • 1998
  • 50개의 담화단독 문장과 연속발성 문장을 대상으로 무장의 첫 어절과 마지막 어절에서의 첫 음절과 마지막 음절의 운율특징을 조사하였다. 이를 체계적으로 살펴 보기 위하여 각 어절에서의 마지막 음절의 음향변수에 대한 첫 음절의 음향변수의 비율을 얻은 뒤 이를 대상으로 하여 평균값과 분포를 구하였다. 지속시간의 경우 두 스타일 간에 주목할 만한 큰 차이점은 없었으나 담화 연속 문장의 문두에서 화자의 조음시간 프로그래밍이 약간 조화롭지 못함을 알 수 있었다. Fo는 마지막 어절 부분의 비율값이 두 스타일간 통계적으로 유의한 차이를 보였으며 운율자질로 기능할 수 있는 가능성을 보였다. 에너지는 Fo와 유사한 분포경향을 보인다. 문미 어절의 마지막 음절이 첫 음절의 약 85% 정도의 힘으로 발성됨을 알 수 있고, 담화 연속 발화의 마지막 어절에서 단독 발화문보다 상대적으로 강하게 조음되었음을 알 수 있었다.

  • PDF

Robust estimation of HMM parameters Based on the State-Dependent Source-Quantization for Speech Recognition (상태의존 소스 양자화에 기반한 음성인식을 위한 은닉 마르코프 모델 파라미터의 견고한 추정)

  • 최환진;박재득
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.1
    • /
    • pp.66-75
    • /
    • 1998
  • 최근 음성인식을 위한 대표적인 방법으로써 은닉 마르코프 모델이 사용되고 있으며, 이러한 방법은 음성의 특성을 잘 표현하도록 하는 음향적인 모델링 방법에 따라서 성능이 좌우된다. 본 논문에서는 상태에서의 출력확률은 견고히 추정하기 위한 방법으로 상태에서 의 출력활률을 소스들의 분포와 그들의 빈도로 가중한 출력분포로 표시하는 상태 의존 소스 양자화 모델링 방법을 제안한다. 이 방법은 한 상태 내에서 특징 파라미터들이 유사한 특성 을 가지며, 그들의 변이가 다른 상태에 있는 특징 파라미터들에 비해서 작다는 사실에 기반 한다. 실험결과에 의하면, 제안된 방법이 기존의 baseline시스템보다 단어 인식율의 경우는 2.7%, 문장 인식율의 경우 3.6%의 향상을 보였다. 이러한 결과로부터 제안된 SDSQ-DHMM이 인식율 향상면에서 유효하며, HMM에 있어서 상태별 출력확률의 견고한 추정을 위한 대안으로 사용될 수 있을 것으로 판단된다.

  • PDF

A Speech Recognition Using Instantaneous SNR Estimation and RASTA Processing (순시적인 신호대 잡음비 예측과 RASTA 기법을 이용한 음성인식)

  • 배현권;오문식;이행세
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.1
    • /
    • pp.55-59
    • /
    • 1998
  • 본 논문에서는 잡음에 강한 음성 인식기를 위한 음성의 특징 추출에 관해서 살펴 보았다. 지금까지의 음성 인식기는 조용한 실험실 환경하에서 학습이 이루어지나 실제 테스 트는 여러 가지 환경에서 이루어지므로, 이러한 환경 변화에 따라 음성인식 시스템의 성능 이 감소함을 보여왔다. 이를 보완하기 위해 여러 가지 연구가 진행되고 있으나 본 연구에서 는 음성의 특징 추출 부분에서 순시적인 신호대 잡음비 예측과 잡음에 강한(RASTA)처리를 하므로써 인식율을 향상시켰다.

  • PDF

A Study on Unspecified Speaker Recognition by Selective Pattern-Block Neural Network (선택적 패턴블럭 신경회로망을 이용한 불특정 화자 인식)

  • 강명광
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.96-99
    • /
    • 1995
  • 본 연구는 특징 파라메터의 특성을 고려한 신경회로망에 관한 연구로서 패턴블럭 선택적 신경회로망을 제안하고, 제안한 신경회로망의 성능을 평가하기 위하여 한국어 단모음에 대한 불특정 화자 인식 실험을 하였다. 각 패턴에 따른 특징 파라메터의 변화를 고려하지 않은 기존의 패턴매칭 알고리즘에 비하여 제안된 신경회로망은 인가된 패턴을 파라메터의 특성에 맞게 몇 개의 부패턴으로 분할한 후 가장 최적의 부패턴을 선택하여 학습하고 인지하는 것이 그 특성이다.

  • PDF

Performance Improvement of Word Spotting Using State Weighting of HMM (HMM의 상태별 가중치를 이용한 핵심어 검출의 성능 향상)

  • 최동진
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.305-308
    • /
    • 1998
  • 본 논문에서는 핵심어 검출의 성능을 향상시키기 위한 새로운 후처리 방법을 제안한다. 일반적으로 핵심어 검출 시스템에 의해 검출된 상위 n개의 후보 단어들의 우도(likelihood)는 비슷한 경우가 많다. 따라서, 한 음성구간에 대해 음향학적으로 유사한 핵심어들간의 오인식 가능성이 높아진다. 그러나 기존의 핵심어 검출에 사용된 후처리 방법은 음성의 모든 구간에 같은 비중을 두고 우도를 평가하므로 비슷한 음향학적 특징을 가지는 유사한 핵심어들의 비교에 적합하지 못하다. 이를 해결하기 위하여, 본 논문에서는 후보단어들의 부분적인 음향학적 특징 차이에 기반한 가중치를 우도 계산 시에 반영함으로써 보다 변별력을 높이는 알고리즘을 제안한다. 실험 결과, 제안된 방법을 이용하여 유사한 후보단어들간의 변별력을 높일 수 있었고, 인식율이 93%일 때, 우도비검사 방법에 비해 19.6%의 false alarm rate을 감소시킬 수 있었다.

  • PDF

Reduction of Number of Free Parameters in Segmental-feature HMM (분절 특징 HMM의 매개 변수 수의 감소에 관한 연구)

  • 윤영선;오영환
    • The Journal of the Acoustical Society of Korea
    • /
    • v.19 no.7
    • /
    • pp.48-52
    • /
    • 2000
  • 음성 인식에 많이 사용되는 HMM (hidden Markov model)을 개선하기 위하여 분절 특징을 사용한 분절 특징 HMM은 성능이 우수하다고 발표되었다. 그러나, 분절 길이가 증가하고 회귀 차수가 놓아질수록 분절 특징 HMM을 표현하는 매개 변수의 수도 같이 증가된다. 따라서, 본 연구에서는 상태에서 관측 가능한 분절의 분산을 분절 내의 모든 프레임에 대하여 공통적으로 표현하는 고정 분산 방법을 통하여 성능의 저하 없이 매개 변수의 수를 줄이도록 시도하였다. 실험 결과, 두 혼합 밀도인 경우 고정 분산을 이용한 분절 특징 HMM의 성능과 시변 분산을 이용한 성능의 차이가 거의 없어, 제안된 방법의 유효성을 입증하였다.

  • PDF

Frequency Dependent Underwater Acoustic Mode Penetration Depth in Sediment (주파수에 따른 해저 퇴적층에서의 수중 음파 투과 심도)

  • 양철수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1984.12a
    • /
    • pp.52-56
    • /
    • 1984
  • 파동 이론에 의한 수중에서의 저주파 음파전달은 음향학적 경계 조건에 의해 결정되는 Normal Mode로 특징지어 진다. Normal Mode는 수층(Water Layer)뿐만 아니라 수직적으로 층상 구조인 해저 퇴적층(Subatrate)의 음향 특성을 포함하여 결정되는 파동 방정식의 해로서 이에 의해 수층 및 해저 퇴적층에서의 음압 분포와 감쇠를 계산할 수 있다. 본 논문은 저주파 음파 전달에 관한 Normal Mode 이론에 의하여 음원의 주파수와 해저 퇴적층에서의 음속 분포등에 따른 각 Mode의 음압 분포, 감쇠등에 관한 음향학적 해석으로 원거리까지 진행하는 수중 음파의 해저 퇴적층 투과 심도를 추출하였다.

  • PDF

Acoustic Facies in the Western South Sea, Korea (한국남서해역의 음향학적 퇴적상)

  • BAHNG, HYO KY;OH, JAE KYUNG
    • 한국해양학회지
    • /
    • v.28 no.4
    • /
    • pp.313-322
    • /
    • 1993
  • The Western south Sea of Korea can be divided into 4 acoustic facies (AF I-AF IV) according to the variations of acoustic characters. Typical acoustic characters revealed in high-resolution seismic profiles (3.5kHz) are prolonged, internal reflected, non-penetrated, and transparent types. These acoustic types probably controlled by bottom condition and sediment properties such as composition and compaction of sediments. Acoustic facies I is characterized by prolonged type which is produced by absorbing of acoustic signals on the coarse sediments including gravels and shell fragments and irregular bedforms. Acoustic facies II is characterized by internal reflected type which is probably produced by differential sediments compaction. Acoustic facies III is characterized by non-penetrated type caused by scattering of acoustic signals on the well sorted fine ad very fine sand sediments. Acoustic facies IV is characterized by transparent type with non-internal reflector in limited thickness. Acoustic types in high-resolution profiles provide important information not only about the stratigraphy of sub bottom but also abut the sedimentary processes in shallow sea.

  • PDF