• 제목/요약/키워드: PBW

검색결과 49건 처리시간 0.026초

연주식 발파공법 개발에 대한 기초적 연구 - 리듬감 부여에 관하여 - (A Basic Study on Development of Orchestra Blasting Method - About the Application of Rhythm -)

  • 윤지선;최성현;배상훈
    • 화약ㆍ발파
    • /
    • 제26권1호
    • /
    • pp.39-48
    • /
    • 2008
  • 그 동안 우리나라와 같이 터널 및 노천 발파 현장 근거리에 보안물건이 위치해 있어 진동제어가 절실히 필요한 상황에서 진동제어에 효과가 있는 것으로 알려진 전자뇌관을 이용하여 불쾌감을 주던 발파음을 쾌적한 발파음으로 전환하고자 연주식발파공법(Orchestra blasting method, OBM)개발에 대한 연구가 진행되어왔으며, 본 연구에서는 리듬감구현에 중점을 두고 실험을 실시하였다. 우선 단발발파를 실시하여 독립파형을 획득, 누적 파형합성프로그램(Program blasting wave, PBW)을 이용하여 분석한 결과 실험 현장의 최적지연초시는 34ms를 나타내었고, 50ms이상에서는 수렴하는 경향을 보였다. 또 리듬감 구현에 필요한 지연시차를 선택한 음악의 실제 연주 시간을 분석하여 결정하였고, 그 결과 실제 연주 시간에 맞춰 기폭된 발파음은 큰 북으로 연주하는 듯한 느낌을 주는 쾌적한 발파음으로 전환시킬 수 있었다.

음성 개선 기반의 모델 보상 기법을 이용한 강인한 잡음 음성 인식 (A Noise Robust Speech Recognition Method Using Model Compensation Based on Speech Enhancement)

  • 신광호;정호열;정현열
    • 한국음향학회지
    • /
    • 제27권4호
    • /
    • pp.191-199
    • /
    • 2008
  • 본 논문에서는 잡음 환경하의 음성 인식을 위해 전처리 단계에서 Mel-warped Wiener Filtering (MWF) 기법을 이용하여 입력 음성을 개선하고 후처리 단계에서 PMC (Parallel Model Combination) 기법을 이용하여 인식 모델을 보상하는 MWF-PMC잡음 처리 기법을 제안한다. PMC 기법은 전처리 단계에서 개선된 음성의 묵음 구간으로부터 잔류 잡음을 취하여 깨끗한 음성을 이용하여 작성한 인식 모델을 보상함으로써 잡음 환경하의 음성 인식 성능을 향상시킬 수 있다. 인식 실험을 위한 음성 데이터는 국어공학연구소 (KLE)에서 작성한 PBW (Phoneme Balanced Words) 452 단어 음성 데이터를 8 kHz로 다운 샘플링한 후 Subway, Car 및 Exhibition 잡음을 5단계의 신호 대 잡음비 (SNR)를 0, 5, 10, 15, 2003로 부가하여 구성하였다. 인식 실험 결과, 본 논문에서 제안한 MWF-PMC 기법이 기존의 결합된 기법보다 전반적으로 향상된 인식 성능을 얻어 그 유효성을 확인할 수 있었다.

문맥종속 반음소단위에 의한 음운 자동 레이블링 시스템의 성능 개선 (Improvement of automatic phoneme labeling system using context-dependent demiphone unit)

  • 박순철;김봉완;이용주
    • 대한음성학회지:말소리
    • /
    • 제37호
    • /
    • pp.23-48
    • /
    • 1999
  • To improve the performance of automatic labelling system, the context-dependent demiphone unit was proposed. A phone is divided into two parts: a left demiphone that accounts for the left side coarticulation and a right demiphone that copes with the right side context. Demiphone unit provides a better training of the transition between phones. In this paper, If the length of the phone is less than 120 msec, it is split into two demiphones. If the length of the phone is greater than 120 msec, it is divided into three parts. In order to evaluate the performance of the system, we use 452 phonetically balanced words(PBW) database for training and testing phoneme models. According to the experiment, the system using proposed demiphone unit compared with that using old demiphone unit gains 3.83% improved result(71.63%) within 10ms of the duo boundary, and 2.20% improved result(86.41%) within 20ms of the true boundary.

  • PDF

Noise Robust Automatic Speech Recognition Scheme with Histogram of Oriented Gradient Features

  • Park, Taejin;Beack, SeungKwan;Lee, Taejin
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제3권5호
    • /
    • pp.259-266
    • /
    • 2014
  • In this paper, we propose a novel technique for noise robust automatic speech recognition (ASR). The development of ASR techniques has made it possible to recognize isolated words with a near perfect word recognition rate. However, in a highly noisy environment, a distinct mismatch between the trained speech and the test data results in a significantly degraded word recognition rate (WRA). Unlike conventional ASR systems employing Mel-frequency cepstral coefficients (MFCCs) and a hidden Markov model (HMM), this study employ histogram of oriented gradient (HOG) features and a Support Vector Machine (SVM) to ASR tasks to overcome this problem. Our proposed ASR system is less vulnerable to external interference noise, and achieves a higher WRA compared to a conventional ASR system equipped with MFCCs and an HMM. The performance of our proposed ASR system was evaluated using a phonetically balanced word (PBW) set mixed with artificially added noise.

다이폰 기반의 Generic Word Model을 이용한 거절 알고리즘 (A Study on the Rejection Algorithm Using Generic Word Model Based on Diphone Subword Unit)

  • 정익주;정훈
    • 음성과학
    • /
    • 제10권2호
    • /
    • pp.15-25
    • /
    • 2003
  • In this paper, we propose an algorithm on OOV(Out-of-Vocabulary) rejection based on two-stage method. In the first stage, the algorithm rejects OOVs using generic word model, and then in the second stage, for further reduction of false acceptance, it rejects words which have low similarity to the candidate by measuring the distance between HMM models. For the experiment, we choose 20 in-vocabulary words out of PBW445 DB distributed by ETRI. In case that the first stage is processed only, the false acceptance is 3% with 100% correct acceptance, and in case both stages are processed, the false acceptance is reduced to 1% with 100% correct acceptance.

  • PDF

MLLR을 이용한 한국어 음성의 화자 적응 (A Speaker Adaptation of Korean Speech Using MLLR)

  • 김태형;이건웅;이상호;홍재근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.251-254
    • /
    • 2000
  • 화자 독립 인식은 훈련 화자와 시험 화자의 차이로 인해 화자 종속의 경우보다 인식률이 떨어진다. 따라서, 인식률을 향상시키기 위해 화자 독립 모델을 화자에 적응시킬 필요가 있다. 본 논문에서는 효과적인 적응 방법인 MLLR(Maximum Likelihood Linear Regression) 적응 방법을 한국어 음성에 적용하여 적응 성능을 향상시켰고, 온라인 상에서 적용 가능하도록 증가 적응 방법을 이용하였다. PBW 445 음성 데이타베이스에 대한 실험 결과, 400개의 적응 데이터를 사용하였을 때, 제안한 방법이 기존의 화자 독립 시스템보다 7.02% 향상된 성능을 보였다.

  • PDF

음운 자동 레이블링 시스템의 처리단위에 의한 성능비교 (Performance compare by the processing unit of the automatic phoneme labelling system)

  • 박순철;김태환;김봉완;이용주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.173-177
    • /
    • 1999
  • 본 논문에서는 레이블링 시스템에서 기본단위로 새롭게 제안된바 있는 demiphone의[1] 성능을 평가하기 위하여 monophone과 triphone, demiphone을 단위로 하는 레이블링 시스템을 구축하여 demiphone의 성능을 평가하였다. 음성 데이터 베이스는 PBW 452단어를 대상으로 남자 30명분의 데이터를 훈련에 사용하였으며, 훈련에 사용하지 않는 남자 4명분의 데이터를 시스템의 평가에 사용하였다. 평가결과 demiphone을 사용한 경우 경계오차가 20ms 이하의 경우에는 monophone에 비하여 6.31%, triphone에 비해 6.21%로 성능이 우수하다. 그리고, 40ms 이하의 경우에는 각각 4.33% 와 3.68%의 성능 향상을 가져왔다.

  • PDF

음소 음향학적 변화 패턴을 이용한 한국어 음성신호의 연속 모음 분할 (Consecutive Vowel Segmentation of Korean Speech Signal using Phonetic-Acoustic Transition Pattern)

  • 박창목;왕지남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.801-804
    • /
    • 2001
  • This article is concerned with automatic segmentation of two adjacent vowels for speech signals. All kinds of transition case of adjacent vowels can be characterized by spectrogram. Firstly the voiced-speech is extracted by the histogram analysis of vowel indicator which consists of wavelet low pass components. Secondly given phonetic transcription and transition pattern spectrogram, the voiced-speech portion which has consecutive vowels automatically segmented by the template matching. The cross-correlation function is adapted as a template matching method and the modified correlation coefficient is calculated for all frames. The largest value on the modified correlation coefficient series indicates the boundary of two consecutive vowel sounds. The experiment is performed for 154 vowel transition sets. The 154 spectrogram templates are gathered from 154 words(PRW Speech DB) and the 161 test words(PBW Speech DB) which are uttered by 5 speakers were tested. The experimental result shows the validity of the method.

  • PDF

공동이용을 위한 음성DB의 구축 및 음성 자료 수집을 위한 Workbench의 구현 (Construction of Korean Speech DB for Common Use and Implementation of Workbench for Spoken Language Data Acquisition)

  • 김봉완;이용주
    • 대한음성학회지:말소리
    • /
    • 제35_36호
    • /
    • pp.189-209
    • /
    • 1998
  • This study discusses Korean speech database that has been designed and constructed for common use, especially focusing on designing a list of words or sentences that covers various phonological environments. As the results, PBW(Phonetically Balanced words) and PBS(Phonetically Balanced Sentences) was selected from balanced text corpus using maximum entropy method. And, implemented workbench for spoken language data acquisition is presented in this paper. The workbench consists of grapheme to phoneme converter, utterance list selection module, speech data editing module, multi-layer labelling module, and phoneme context search module.

  • PDF

COMBINATORIAL AUSLANDER-REITEN QUIVERS AND REDUCED EXPRESSIONS

  • Oh, Se-jin;Suh, Uhi Rinn
    • 대한수학회지
    • /
    • 제56권2호
    • /
    • pp.353-385
    • /
    • 2019
  • In this paper, we introduce the notion of combinatorial Auslander-Reiten (AR) quivers for commutation classes [${\tilde{w}}]$ of w in a finite Weyl group. This combinatorial object is the Hasse diagram of the convex partial order ${\prec}_{[{\tilde{w}}]}$ on the subset ${\Phi}(w)$ of positive roots. By analyzing properties of the combinatorial AR-quivers with labelings and reflection functors, we can apply their properties to the representation theory of KLR algebras and dual PBW-basis associated to any commutation class [${\tilde{w}}_0$] of the longest element $w_0$ of any finite type.