• 제목/요약/키워드: Spectrum DB

검색결과 46건 처리시간 0.039초

전화선 채널이 화자확인 시스템의 성능에 미치는 영향 (The Effect of the Telephone Channel to the Performance of the Speaker Verification System)

  • 조태현;김유진;이재영;정재호
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.12-20
    • /
    • 1999
  • 본 논문에서는 깨끗한 환경에서 녹음된 음성데이터와 채널환경에서 수집된 음성데이터의 화자확인 성능을 비교하였다. 채널데이터의 화자확인 성능을 향상시키기 위하여 채널환경에 강인한 특징 파라메타 및 전처리에 대해 연구하였다. 실험을 위한 음성 DB는 어구지시(text-prompted) 시스템을 고려하여 두 자리의 한국어 숫자음으로 구성하였다. 적용한 음성 특징은 LPCC(Linear Predictive Cepstral Coefficient), MFCC(Mel Frequency Cepstral Coefficient), PLP(Perceptually Linear Prediction), LSP(Line Spectrum Pair)이며, 채널 잡음을 제거하기 위한 전처리 과정으로는 음성신호에 대한 필터링을 적용하였다. 추출된 특징으로부터 채널의 영향을 제거 또는 보상하기 위해 cepstral weighting, CMS(Cepstral Mean Subtraction), RASTA(RelAtive SpecTrAl)를 적용하였다. 또한 각각의 특징 및 처리 방법에 대한 음성인식 성능을 제시함으로써 화자확인에서의 성능과 음성인식에서의 성능을 비교하였다. 적용한 음성 특징 및 처리 방법들에 대한 성능 평가를 위해 HTK(HMM Tool Kit) 2.0을 이용하였다. 남자, 여자 화자별로 임계값을 다르게 주는 방법으로 깨끗한 음성데이터와 채널 데이터에 대한 EER(Equal Error Rate)을 구하여 비교하였다. 실험결과 전처리 과정에서 대역통과 필터(150~3800Hz)를 적용하여 저대역 및 고대역의 채널 잡음을 제거하고, 이 신호로부터 MFCC를 추출하였을 때 EER 측면에서의 화자확인 성능이 가장 좋게 나타났다.

  • PDF

HRTF를 이용한 헤드폰 기반의 다채널 입체음향 생성 (Headphone-based multi-channel 3D sound generation using HRTF)

  • 김시호;김경훈;배건성;최송인;박만호
    • 대한전자공학회논문지SP
    • /
    • 제42권1호
    • /
    • pp.71-77
    • /
    • 2005
  • 본 논문에서는 5.1채널 입체음향 오디오 신호를 2채널의 헤드폰으로 재생하기 위한 HRTF (Head Related Transfer Function) 기반의 입체음향 생성 시스템에 대하여 다룬다. 각 채널의 모노 입력신호는 HRTF를 이용한 바이노럴(binaural) 필터링을 통해 가상적으로 음상정위되며, 입체감과 공간감을 증가시키기 위해 잔향효과가 추가된다. 연산량 감소를 위해 음상정위 성능을 저하시키지 않는 범위에서 HRTF의 임펄스 응답 탭 수를 줄였으며, 잔향효과를 위한 음장제어부에서는 초기반사열중 주요한 성분만을 지연기로 모델링하였다. 또한 비개인화된 HRTF DB에 의란 앞/뒤 혼돈 문제를 줄이기 위하여 앞/뒤 스펙트럼의 차를 가중치로 하여 HRTF 스펙트럼을 강조하는 방법을 적용하였다. 구현한 시스템의 성능 평가 결과, 단순한 스테레오 방법이나 2채널 Down Mixing 방식에 비해 현실감 있고 방향성 있는 입체음향을 느낄 수가 있었다.

새로운 스펙트럼 완만화에 의한 합성 음질 개선 (Improvement of Synthetic Speech Quality using a New Spectral Smoothing Technique)

  • 장효종;최형일
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1037-1043
    • /
    • 2003
  • 본 논문에서는 단위음소로 다이폰을 사용하여 음성을 합성하는 방법에 관하여 기술한다. 음성 합성은 기본적으로 단위음소들의 연결을 통하여 이루어지는데, 이때 발생하는 가장 큰 문제점은 두 단위음소 사이의 연결부분에서 불연속이 발생하는 것이다. 이 문제를 해결하기 위하여 본 논문에서는 포만트 궤적뿐 아니라 스펙트럼의 분포특성과 인간의 청각적인 특성을 반영하여 스펙트럼을 완만화하는 방법을 제안한다. 즉, 제안하는 방법은 단위음소의 연결 구간에서 인간의 청각신경 특성을 고려하여 완만화의 양과 범위를 결정한 다음, 두 다이폰 경계의 스펙트럼 분포를 시간에 따라 가중치를 다르게 주어 스펙트럼 완만화를 수행한다. 이 방법은 불연속을 제거하며 완만화로 인하여 발생할 수 있는 음성의 왜곡을 최소화한다. 제안하는 방법의 성능을 평가하기 위하여 ETRI 음성 DB 샘플과 개인별로 자체 녹음한 총 20여개의 문장에서 추출한 약 500여 개의 다이폰에 대하여 실험을 수행하였다.

전단벽식 구조물의 내진설계 시 합리적인 바닥판의 휨강성비 적용에 대한 연구 (A Parametric Study of Flexural Stiffness Ratio on Floor Slabs for Seismic Design of Shear Wall Structures)

  • 오순택;이동준;음영훈
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제13권6호통권58호
    • /
    • pp.148-155
    • /
    • 2009
  • 전단벽식 구조물의 내진설계 시 강막가정을 적용한 모델의 횡변위 응답은 실제 거동과 무시할 수 없는 차이를 발생함으로 휨강성을 포함한 바닥판의 모형화 여부가 구조물의 거동에 어떠한 영향을 미치는가에 대한 연구가 요구된다. 전형적인 15층 판상형 전단벽식 아파트를 예제구조물로 선정하여 MIDAS-ADS2008 프로그램을 이용하여 강막가정을 적용한 RD모델, 바닥판을 모형화하여 면외 강성을 고려한 DB모델 그리고 면내외 강성을 고려한 SRC모델을 대상으로 해석하였다. KBC2005 기준을 이용하여 등가정적해석과 응답스팩트럼 해석에 의한 지진하중에 대한 3개의 모델의 응답을 비교분석하였다. 바닥판의 강성비를 10%, 30% 및 50% 삼단계로 적용하여 각 단계별 비교 값으로 각 모델의 횡적거동의 차이를 분석하였다.

수동 소나 표적의 식별을 위한 지능형 특징정보 추출 및 스코어링 알고리즘 (Intelligent Feature Extraction and Scoring Algorithm for Classification of Passive Sonar Target)

  • 김현식
    • 한국지능시스템학회논문지
    • /
    • 제19권5호
    • /
    • pp.629-634
    • /
    • 2009
  • 실시간 시스템 적용에 있어서, 수동 소나 표적의 식별을 위한 특징정보 추출 및 스코어링 알고리즘은 다음과 같은 문제점들을 가지고 있다. 즉, 주파수 스펙트럼으로부터 PSR(Propeller Shaft Rate) 및 BR(Blade rate) 등의 특징정보를 실시간으로 구별하는 것은 매우 어렵기 때문에 정확하고 효율적인 특징정보 추출(extraction)법을 요구한다. 또한, 추출된 특징정보들로 구성된 식별 DB(DataBase)는 잡음 및 불완전한 구성을 갖기 때문에 강인하고 효과적인 특징정보 스코어링(scoring)법을 요구한다. 나아가, 구조와 파라메터에 있어서 용이한 설계 절차를 요구한다. 이러한 문제들을 해결하기 위해서 진화 전략(ES : Evolution Strategy) 및 퍼지(fuzzy) 이론을 이용하는 지능형 특징정보 추출 및 스코어링 알고리즘이 제안되었다. 제안된 알고리즘의 성능을 검증하기 위해서는 수동 소나 표적의 실시간 식별이 수행되었다. 시뮬레이션 결과는 제안된 알고리즘이 실시간 시스템 적용에서 존재하는 문제점들을 효과적으로 해결할 수 있음을 보여준다.

PCA-optimized 필터뱅크 기반의 MFCC 특징파라미터 추출 및 한국어 4연숫자 전화음성에 대한 인식실험 (Extraction of MFCC feature parameters based on the PCA-optimized filter bank and Korean connected 4-digit telephone speech recognition)

  • 정성윤;김민성;손종목;배건성
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.279-283
    • /
    • 2004
  • 음성신호의 스펙트럼으로부터 MFCC를 추출할 때, 일반적으로 필터뱅크의 처리과정에서 삼각형 형태의 필터를 사용한다. 그러나 더 나은 인식성능을 위해, 훈련 음성데이터의 스펙트럼에 PCA를 적용하여 필터뱅크의 필터형태를 최적화하는 PCA-optimized 필터뱅크 방법이 Lee et al. 에 의해 제안되었다. 본 논문에서는 대용량의 4연숫자 전화음성 DB를 사용하여PCA-optimized 필터뱅크 기반의 MFCC 특징파라미터를 추출하고 인식실험을 수행한 후, 기존의 삼각형 형태의 필터를 사용하는 MFCC와 각 대역별 로그에너지로 가중시켜서 얻어지는 MFCC와의 인식성능을 비교하였다. 실험결과, PCA-optimized 필터뱅크 기반의 MFCC 특징파라미터가 기존의 삼각형 형태의 필터뱅크 기반 MFCC에 비해 조금 향상된 인식률을 나타내었지만, 각 대역별 로그에너지로 가중치를 주어 얻어지는 MFCC보다는 인식률이 떨어졌다.

디지털콘텐츠 제작을 위한 전통문화원형의 캐릭터 분류 : 관음보살(觀音菩薩) 및 동자(童子)를 중심으로 (Classification of Characters out of their Original Cultural Forms to Create Digital Contents : Focusing on Avalokitesvara (觀音菩薩) and Buddhist child (童子))

  • 이영숙;신승윤
    • 만화애니메이션 연구
    • /
    • 통권27호
    • /
    • pp.153-176
    • /
    • 2012
  • 디지털 콘텐츠 산업이 융합하고 있는 시점에서 다양한 전통문화 소재의 발굴이 필요하다. 우리나라의 전통문화는 오랜 역사 속에서 전통 신앙과 맞물려 풍부한 소재를 보유하게 되었다. 전통문화의 큰 축으로써 우리나라의 역사와 함께 자리 해 온 불교미술에 접근하여 새로운 문화 콘텐츠의 소재를 발굴하고 DB 분류하고자 한다. 이는 불교문화콘텐츠를 통해 향후 전통 문화에 근거한 미래 브랜드를 구현하고자 하는데 그 목적이 있다. 본 연구는 전통 문화적 관점에서 문화원형을 활용하였다. 불교 미술에 등장한 관음보살과 동자의 상징을 통한 의미를 연구하여 캐릭터로 제작하기 위한 기반이 되고자 한다. 따라서 문화재청에 등록된 국보 및 보물로 등재되어진 불교 존상 중 관음보살과 동자로 범위로 정하고, 관음보살과 동자가 지닌 상징체계를 통해 전통캐릭터를 고찰하였다. 그 과정에서 불교문화 캐릭터는 역할에 의한 분류, 지물에 의한 분류가 가능함을 발견하고 DB 분류 하였다. 본 연구의 결과는 상징성을 가진 복잡한 불교문화를 문화원형으로 활용하기 위한 참고자료가 될 것이다. 그리고 불교존상이 가지는 의미를 통해 한국적 전통캐릭터의 디지털콘텐츠 활용에 도움이 되고자 한다.

머리전달함수의 심리음향적 특성을 이용한 전/후 음상정위 특성 개선 (Improvement of front/back Sound Localization Characteristics using Psychoacoustics of Head Related Transfer Function)

  • 구교식;차형태
    • 방송공학회논문지
    • /
    • 제11권4호
    • /
    • pp.448-457
    • /
    • 2006
  • 일반적으로 3D 입체음향을 생성하기 위해서는 소리가 음원으로부터 청자의 두 귀에 이르는 정보를 포함하고 있는 머리전달함수를 사용한다. 그러나 HRTF의 비개인화적인 특성 때문에 양쪽 귀까지의 거리가 같아지는 혼돈원추상에서는 앞/뒤 방향지각에 대한 혼돈을 주게 됨으로써 입체감을 저하시키게 된다. 이에 본 논문에서는 인간의 청각특성에 따른 여기에너지를 이용하여 앞/뒤 음상정위의 특성을 개선하는 방법을 제안하고자 한다. 서로 대칭되는 각 HRTF의 여기 에너지를 계산하고 각 bark 대역에 따른 에너지의 비율을 추출하는 방식으로써 각 HRTF의 스펙트럼 특성을 부각시키는 방법을 제안하였으며 청감테스트를 통해서 제안한 방식이 기존 방법보다 방향감을 개선시킴을 확인할 수 있었다.

Direct displacement-based design accuracy prediction for single-column RC bridge bents

  • Tecchio, Giovanni;Dona, Marco;Modena, Claudio
    • Earthquakes and Structures
    • /
    • 제9권3호
    • /
    • pp.455-480
    • /
    • 2015
  • In the last decade, displacement-based (DB) methods have become established design procedures for reinforced concrete (RC) structures. They use strain and displacement measures as seismic performance control parameters. As for other simplified seismic design methods, it is of great interest to prove if they are usually conservative in respect to more refined, nonlinear, time history analyses, and can estimate design parameters with acceptable accuracy. In this paper, the current Direct Displacement-Based Design (DDBD) procedure is evaluated for designing simple single degree of freedom (SDOF) systems with specific reference to simply supported RC bridge piers. Using different formulations proposed in literature for the equivalent viscous damping and spectrum reduction factor, a parametric study is carried out on a comprehensive set of SDOF systems, and an average error chart of the method is derived allowing prediction of the expected error for an ample range of design cases. Following the chart, it can be observed that, for the design of actual RC bridge piers, underestimation errors of the DDBD method are very low, while the overestimation range of the simplified displacement-based procedure is strongly dependent on design ductility.

부밴드 스펙트럼의 무게중심을 이용한 강인한 오디오 인식기 (Robust Audio Identification Using Spectro-Temporal Subband Centroids)

  • 서진수;이승재
    • 한국음향학회지
    • /
    • 제27권5호
    • /
    • pp.239-243
    • /
    • 2008
  • 본 논문에서는 스펙트럼의 주파수 및 시간 방향의 특성을 결합한 오디오 인식 방법을 제안하였다. 특히 스펙트럼의 형태를 모사하기 위해 부밴드로 나누고 주파수와 시간 방향의 무게중심을 구하고 정규화하여 인식기에 사용하였다. 무게중심 값은 스펙트럼의 형태적 특징을 잘 나타내면서도 간결하여 인식기에 사용되는 특징 DB의 크기를 줄여줄 수 있는 장점이 있다. 수 천곡 규모의 오디오에 대해서, 부밴드 스펙트럼의 주파수와 시간 방향 무게중심의 인식 성능을 비교하였다. 실험 결과 주파수와 시간 방향 특징을 결합하면 상보적으로 인식 성능을 높일 수 있음을 발견하고, 선형 변환을 이용하여 주파수와 시간 방향 특징을 하나로 결합하는 방법을 제안하였다.