통합 검색 | Korea Science

숫자음 인식을 위한 K-L 동적 특징파라미터의 확장 (Extension of K-L Dynamic Parameter for Connected Digit Recognition)

김주곤
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
- /
- pp.257-261
- /
- 1998
일반적으로 인식률이 저조한 연속 숫자음의 인식 정도 향상을 위해서 K-L 동적특징의 확장에 대해서 검토한다. 이 검토결과를 4연속 숫자음을 대상으로 하는 인식 실험을 수행하여 숫자음 인식에 있어서 확장된 K-L 동적특징의 유효성을 확인하고자 한다. 이를 위하여 음성자료는 국어공학센터에서 채록한 4연속 숫자음을 사용하며, 확장한 K-L 동적특징의 유효성을 확인하기 위해서는 단일 특징 파라미터로서 멜-켑스트럼과 회귀계수, K-L 동적계수 등과 이들 특징 파라미터를 결합한 경우에 대해서 특징파라미터를 확장하여 K-L 동적 특징을 추출하고, 4연속 숫자음인식 실험을 수행하였다. 이때 인식의 기본 단위로는 48개의 유사음소단위를 음소모델로 사용하였으며, 인식실험에 있어서는 유한 상태 오토마타에 의한 구문제어를 통한 OPDP 법을 이용하였다. 인식 실험 결과, 단일 특징파라미터로서 멜-켑스트럼을 사용한 경우 67.5%, 이를 확장한 K-L 동적계수를 사용한 경우 78.2%를 보였다. 또한 결합한 특징파라미터에 있어서는 멜-켑스트럼과 희귀계수를 사용한 경우 78.4%의 인식률을 보였으며, 이를 K-L 동적계수로 확장한 경우 82.3%의 인식률을 얻어 확장한 K-L 동적특징파라미터의 유효성을 확인하였다.
PDF

음성인식에 있어서 특징 파라미터의 기여도에 기반한 상태별 특징 파라미터 가중 (State-Dependent Feature-Parameter Weighting By the Contribition of the feature parameter to the performance of the Speech Recongition)

최환진
- 한국음향학회지
- /
- 제17권1호
- /
- pp.39-48
- /
- 1998
본 논문에서는 은닉 마르코프 모델에 기반한 음성인식에 있어서 특징 파라미터의 인식 성능에 미치는 영향의 차이를 인식 시스템에 반영하여 인식성능을 향상시키기 위한 방 법을 제안하였다. 특징 파라미터별 가중치를 유도하기 위해서 우선 상태별 특징 파라미터의 인식율에 대한 기여도를 가중치로 변환하고, 이를 특징 파라미터 각각의 상태에서의 출력확 률에 곱하여 상태별 출력확률을 재 추정하게 된다. 실험결과, "가변가중"방법이 "고정가중" 방법에 비해서 단어 인식의 경우 3.3%, 그리고 문장 인식율의 경우 5.3%의 성능향상을 보 임으로써 상태별 특징 파라미터의 가중이 인식 성능 향상에 유효함을 알 수 있었다.
PDF

HMM 인식기에서 상태별 다중 특징 파라미터 가중 (State-Dependent Weighting of Multiple Feature Parameters in HMM Recognizer)

손종목;배건성
- 한국음향학회지
- /
- 제18권4호
- /
- pp.47-52
- /
- 1999
본 논문에서는 특징 파라미터의 분산과 인식성능에 대한 기여도를 고려하여 각 특징 파라미터를 가중시키는 방법을 제안하였다. 각 특징 파라미터의 인식률에 비례하게 전체 기여도를 설정하고, 각 특징 파라미터의 분산에 따라 가중요인을 설정하였다. 전체 기여도와 분산에 따른 가중요인을 사용하여 각 특징 파라미터의 상태별 가중치를 설정하였다. 제안한 방법의 유효성을 살펴보기 위해 유사음소 단위의 HMM 음성인식시스템을 사용하여 인식실험을 하였다. 인식실험에서 제안한 방법으로 가중치를 설정하였을 경우에 인식률이 7.7% 향상됨을 볼 수 있었다.
PDF

LSTM-RNN 기반 음성합성을 위한 파라미터 생성 알고리즘 (Parameter Generation Algorithm for LSTM-RNN-based Speech Synthesis)

박상준;한민수
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2017년도 하계학술대회
- /
- pp.105-106
- /
- 2017
본 논문에서는 최대 우도 기반 파라미터 생성 알고리즘을 적용하여 인공 신경망의 출력인 음향 파라미터 열의 정확성 및 자연성을 향상시키는 방법을 제안하였다. 인공 신경망의 출력으로 정적 특징벡터 뿐 만 아니라 동적 특징벡터도 함께 사용하였고, 미리 계산된 파라미터 분산을 파라미터 생성에 사용하였다. 추정된 정적, 동적 특징벡터의 평균, 분산을 EM 알고리즘에 적용하여 최대 우도 기준 파라미터를 추정할 수 있다. 제안된 알고리즘은 파라미터 생성 시 동적 특징벡터 및 분산을 함께 적용하여 시간축에서의 자연성을 향상시켰다. 제안된 알고리즘의 객관적 평가로 MCD, F0 의 RMSE 를 측정하였고, 주관적평가로 선호도 평가를 실시하였다. 그 결과 기존 알고리즘 대비 객관적, 주관적 성능이 향상되는 것을 검증하였다.
PDF

음성 인식률 향상을 위한 음성의 특징 파라미터 추출 알고리즘

최재승
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2017년도 춘계학술대회
- /
- pp.686-687
- /
- 2017
본 논문에서는 잡음에 강인하고 음성인식 성능이 효과적인 멜 주파수 켑스트럼 계수의 파라미터의 추출 알고리즘을 제안한다. 본 논문에서 제안한 알고리즘은 배경잡음이 혼합된 깨끗한 연속음성 중에서 위너필터를 이용하여 음성에 포함된 배경잡음을 감소시키며, 이후에 멜 주파수 켑스트럼 계수의 특징추출 방법을 사용하여 음성의 특징 파라미터를 추출한다.
PDF

단어인식을 위한 음소의 동적 특징에 관한 검토 (A Study on the Dynamic Feature of Phoneme for Word Recognition)

김주곤
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1997년도 영남지회 학술발표회 논문집 Acoustic Society of Korean Youngnam Chapter Symposium Proceedings
- /
- pp.35-39
- /
- 1997
본 연구에서는 음소를 인식의 기본단위로 하는 한국어 단어인식 시스템의 인식정도를 개선하기 이해 각 음소의 시간방향의 정보를 포함하고 있는 동적특징인 회귀계수와 K-L(Karhunen-Loeve)변환으로 얻은 특징파라미터(이하 K-L계수라 함)를 이용하여 음소인식과 단어인식 실험을 수행한 결과 그 유효성을 확인하였다. 이를 위해 먼저 파열음을 대상으로 정적 특징과 파라미터인 멜-켑스트럼(Mel-Cepstrum)과 동적 특징 파라미터인 회귀계수(Regressive Coefficient) 와 K-L 계수(Karhunen-Loeve Coefficient)를 추출하여 음소 인식실험을 수행하였다. 그 결과 멜-켑스트럼을 사용한 경우 39.84%, 회귀계수를 사용한 경우 48.52%, K-L계수를 사용한 경우 52.40%의 인식률을 얻었다. 이를 참고로 각각의 특징 파라미터를 결합하여 인식실험한 결과 멜-켑스트럼과 K-L계수를 사용한 경우 47.17%,멜 -켑스트럼과 회귀계수의 경우 60.11%,K-L계수와 회귀계수의 경우 60.35%, 멜-켑스트럼과 K-L계수 , 회귀계수를 사용한 경우 58.13%를 인식률을 얻어 동적특징인 K-L 계수와 회귀계수를 사용한 경우와 멜-켑스트럼과 회귀계수를 사용한 경우가 높은 인식률을 보였으며 이를 단어로 확장하여 인식실험을 수행한 결과 기존의 특징 파라미터를 이용한 경우보다 높은 인식률을 얻어 동적 파라미터의 유효성을 확인하였다
PDF

위너필터법이 적용된 MFCC의 파라미터 추출에 기초한 화자독립 인식알고리즘 (Speaker Independent Recognition Algorithm based on Parameter Extraction by MFCC applied Wiener Filter Method)

최재승
- 한국정보통신학회논문지
- /
- 제21권6호
- /
- pp.1149-1154
- /
- 2017
배경잡음 하에서 음성인식 시스템의 우수한 인식성능을 얻기 위해서 적절한 음성의 특징 파라미터를 선택하는 것이 매우 중요하다. 본 논문에서 사용한 특징 파라미터는 위너필터 방법이 적용된 인간의 청각 특성을 이용한 멜 주파수 켑스트럼 계수(Mel frequency cepstral coefficient, MFCC)를 사용한다. 즉, 본 논문에서 제안하는 특징 파라미터는 배경잡음을 제거한 후에 깨끗한 음성신호의 파라미터를 추출하는 새로운 방법이다. 제안한 수정된 MFCC 특징 파라미터를 다층 퍼셉트론 네트워크에 입력하여 학습시킴으로써 화자인식을 구현한다. 본 실험에서는 14차의 MFCC 특징 파라미터를 사용하여 화자독립 인식실험을 실시하였으며, 백색잡음이 혼합된 경우의 음성의 화자독립인식률은 평균 94.48%로 효과적인 결과를 구할 수 있었다. 본 논문에서 제안한 방법과 기존의 방법들을 비교하였을 때 본 논문에서 제안한 화자인식 성능이 수정된 MFCC 특징 파라미터를 사용함으로써 향상되었다.
https://doi.org/10.6109/jkiice.2017.21.6.1149 인용 PDF KSCI

Wavelet변환과 신경회로망에 의한 위장 영상의 질환 부위 패턴 인식 알고리즘 (Disease Region Pattern Recognition Algorithm of Gastrointestinal Image using Wavelet Transform and Neural Network)

이상복;이주신
- 전자공학회논문지S
- /
- 제36S권5호
- /
- pp.70-77
- /
- 1999
본 논문에서는 Wavelet을 이용한 위장 영상의 질환 부위 특징을 추출하여 질환 부위 패턴을 인식할 수 있는 알고리즘을 제안하였다. 전처리 과정으로서 위장 영상이 형태정보는 입력 영상을 DWT(Discrete wavelet transform)에 의해 4레벨 DWT 계수 행렬을 구하고 계수 행렬의 특징에 따라 저주파 계수 행렬로부터 저주파 특징 파라미터 32개, 수평 고주파 계수 행렬로부터 수평 고주파 특징 파라미터 16개, 수직 고주파 계수 행렬로부터 수직 고주파 특징 파라미터 16개, 그리고, 대각 고주파 계수 행렬로부터 대각 고주파 특징 파라미터 32개 등 모두 96개의 특징 파라미터를 추출한 후 각각의 특징 파라미터를 최대 값+0.5로 최소 값을 -0.5로 정규화 하여 신경회로망의 입력 벡터로 사용하였다. 위장 영상 패턴 인식을 위한 신경회로망은 교사 학습을 요구하는 다층 구조의 오차 역전파(Error back propagation)알고리즘으로 하였고 구조적 특성을 이용하여 입력층, 중간층, 출력층의 계층 구조로 설계하였다. 설계된 신경회로망의 학습은 학습계수를 0.2로 모우멘텀을 0.6으로 설정하여 출력층 최대오차가 0.01보다 작을 때까지 수행하였으며 약 8000회 정도 학습한 결과 설정값 보다 작은 결과를 얻었고 질환의 종류나 위치, 크기에 관계없이 100%의 인식률을 얻었다.
PDF

Lyapunov 차원을 이용한 화자식별 파라미터 추정 (Estimation of Speeker Recognition Parameter using Lyapunov Dimension)

유병욱;김창석
- 한국음향학회지
- /
- 제16권4호
- /
- pp.42-48
- /
- 1997
본 논문에서는 음성을 비선형 결정론적 발생메카니즘에서 발생되는 불규칙한 신호인 카오스로 보고 상관차원과 Lyapunov 차원을 구함으로써 음성화자식별 파라미터와 음성인식파라미터에 대한 성능을 평가하였다. Taken의 매립정리를 이용하여 스트레인지 어트렉터를 구성할 때 AR모델의 파워스펙트럼으로부터 주요주기를 구함으로써 정확한 상관차원과 Lyapunov 차원을 추정하였다. 이트렉터 궤도의 특징을 잘 나타내는 상관차원과 Lyapunov 차원을 가지고 음성인식과 화자인식의 특징파라미터로의 효용성을 고찰하였다. 그 결과, 음성인식보다는 화자식별의 특징파라미터로타당하였으며 화자식별 특징파라미터로서는 상관차원보다는 Lyapunov 차원이 높은 화자식별 인식율을 얻을 수 있음을 알았다.
PDF

Wavelet에 의한 의용영상의 병소부위 특징추출 (Disease Region Feature Extraction of Medical Image using Wavelet)

이상복;이주신
- 한국컴퓨터정보학회논문지
- /
- 제3권3호
- /
- pp.73-81
- /
- 1998
본 논문에서는 의용영상의 병소부위 특징을 추출하여 판별 자동화할 수 있는 방안을 제안하였다. 전처리 과정으로서 의용영상의 형태정보는 입력영상을 DWT(Discrete wavelet transform)에 의해 4레벨 DWT 계수 행렬을 구하고 계수 행렬의 특징에 따라 저주파 계수 행렬로부터 저주파 특징 파라미터 32개, 수평 고주파 계수 행렬로부터 수평 고주파특징 파라미터 16개, 수직 고주파 계수 행렬로부터 수직 고주파 특징 파라미터 16개, 그리고, 대각 고주파 계수 행렬로부터 대각 고주파 특징 파라미터 32개 등 모두 96개의 특징 파라미터를 추출하였다. 본 논문에서 제안된 알고리즘을 이용하면 자동 판별 시스템을 구축할수 있고, PACS의 성능 향상에 크게 기여할 것이다.
PDF

Search Result 569, Processing Time 0.022 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)