• 제목/요약/키워드: FFT coefficients

검색결과 58건 처리시간 0.033초

남녀 성별인식을 위한 음성 특징벡터의 비교 (Comparison of Characteristic Vector of Speech for Gender Recognition of Male and Female)

  • 정병구;최재승
    • 한국정보통신학회논문지
    • /
    • 제16권7호
    • /
    • pp.1370-1376
    • /
    • 2012
  • 본 논문에서는 남성화자 혹은 여성화자인지를 구분하는 성별인식 알고리즘을 제안한다. 본 논문에서는 남성화자와 여성화자의 특징벡터를 분석하며, 이러한 남녀의 특징벡터를 이용하여 신경회로망에 의한 제안한 성별인식에 대한 인식실험을 수행한다. 신경회로망의 입력신호로 사용한 특징벡터로는 10차의 LPC 켑스트럼 계수, 12차의 LPC 켑스트럼 계수, 12차의 FFT 켑스트럼 및 1차의 RMS, 12차의 LPC 켑스트럼 및 8차의 FFT 스펙트럼들이다. 본 실험에서는 특히 12차의 LPC 켑스트럼 및 8차의 저역 FFT 스펙트럼의 특징벡터를 사용하여 20-20-2의 네트워크에 의하여 신경회로망이 학습되었다. 실험결과, 남성화자에 대하여 학습 시에는 평균 99.8%, 여성화자에 대해서는 평균 96.5%의 성별인식률이 구해졌다.

FFT 켑스트럼의 처리시간 단축에 관한 연구 (On a Reduction of Computation Time of FFT Cepstrum)

  • 조왕래;김종국;배명진
    • 음성과학
    • /
    • 제10권2호
    • /
    • pp.57-64
    • /
    • 2003
  • The cepstrum coefficients are the most popular feature for speech recognition or speaker recognition. The cepstrum coefficients are also used for speech synthesis and speech coding but has major drawback of long processing time. In this paper, we proposed a new method that can reduce the processing time of FFT cepstrum analysis. We use the normal ordered inputs for FFT function and the bit-reversed inputs for IFFT function. Therefore we can omit the bit-reversing process and reduce the processing time of FFT ceptrum analysis.

  • PDF

FFT를 이용한 주파수 영역의 RVDT 센서 오차 보상 (Frequency Domain Error Compensation of RVDT Sensor using FFT)

  • 이창수
    • 전기전자학회논문지
    • /
    • 제16권3호
    • /
    • pp.189-196
    • /
    • 2012
  • 본 논문에서는 FFT 영역을 이용한 새로운 RVDT 인코더의 위상 오차 보상 방법을 제시하였다. 최소 개수의 보상 저항의 조합으로 오차를 측정하고 FFT 변환 후 1차 하모닉 성분의 저항에 따른 계수의 변화를 구하였다. 또한 삽입 저항과 계수의 크기가 반비례 관계에 있음을 알아냈다. 이 방법은 기존의 시간 영역에서의 보상에 비해 테이블을 구하는데 드는 시간이 단축되고 테이블의 크기를 획기적으로 줄일 수 있었다. 또한 축변환을 통해 보상 저항의 위치도 정확히 찾을 수 있었으며 첨두간 위상 오차값을 0.57도 정도로 2배 가까이 개선하였다.

$Radix-4^2$알고리즘을 사용한 저면적 FFT 프로세서 구조 (Low-area FFT Processor Structure using $Radix-4^2$ Algorithm)

  • 김한진;장영범
    • 대한전자공학회논문지SD
    • /
    • 제49권3호
    • /
    • pp.8-14
    • /
    • 2012
  • 이 논문에서는 $Radix-4^2$알고리즘을 사용한 저면적 FFT 구조를 제안한다. 큰 point의 FFT는 여러 개의 직렬연결 스테이지로 구성되는데, $Radix-4^2$알고리즘을 사용하면 매 2 스테이지마다 곱셈 종류의 수가 3인 스테이지가 생긴다. 이 사실을 이용하여 곱셈 연산 종류의 수가 3인 스테이지의 구현 면적을 줄이는 구조를 제안하였다. 예를 들면 4096-point FFT는 6개의 스테이지로 구성되는데 $Radix-4^2$ 알고리즘을 사용하면 3개의 스테이지가 곱셈연산 종류의 수가 3이다. 이 3개의 스테이지의 곱셈 연산 하드웨어는 CSD(Canonic Signed Digit) 계수 방식과 CSS(Common Sub-expression Sharing) 기술을 사용하여 구현면적 감소시킬 수 있었다. 제안된 방식을 사용하여 256-point FFT 구조를 설계하여 Verilog-HDL 코딩하였다. 또한 tsmc $0.18{\mu}m$ CMOS 라이브러리를 사용하여 합성하여 구현한 결과 $1.971mm^2$의 cell area를 얻었다. 이와 같은 합성 결과는 기존 구조와 비교하여 약 23%의 cell area 감소 효과를 보였다.

주파수 영역 자기 공분산 기울기를 이용한 음성과 자동차 소음 신호의 구분 (Classification of Speech and Car Noise Signals using the Slope of Autocovariances in Frequency Domain)

  • 김선일
    • 한국정보통신학회논문지
    • /
    • 제15권10호
    • /
    • pp.2093-2099
    • /
    • 2011
  • 음성 신호와 자동차 엔진 배기음 등의 소음이 섞인 신호에서 통계적 방법을 이용하여 음성 신호와 자동차 소음 신호를 분리하였다. 분리된 신호에서 음성신호를 구분해 내기 위해 128개의 원소를 갖는 신호 조각의 연속으로 신호를 재구성하고 각 신호 조각에 대해 FFT를 구하였다. 각 신호 조각의 FFT 계수 중에서 저주파 영역의 일부 계수 중 계수 각각에 대해 각 신호 조각 사이의 자기 공분산을 구하고 이들을 평균하였다. 그리고 linear regression을 이용 하여 평균 자기 공분산 값들을 연결하는 직선의 방정식을 구한 후 이 직선의 기울기를 비교하여 음성 신호와 자동차 소음 신호를 구분하는 방법을 제안하고 유용성을 확인하였다.

Common sub-expression sharing과 CORDIC을 이용한 OFDM 시스템의 저면적 파이프라인 FFT 구조 (Low-area Pipeline FFT Structure in OFDM System Using Common Sub-expression Sharing and CORDIC)

  • 최동규;장영범
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.157-164
    • /
    • 2009
  • 이 논문에서는 OFDM시스템에서 가장 큰 칩 면적을 차지하고 높은 전력을 요구하는 핵심 연산 블록인 FFT에 대하여 파이프라인 Radix-4 MDC 방식의 저면적 구조를 제안하였다. 나비연산기에서 Twiddle factor 복소 곱셈연산을 수행할 때, 기존의 곱셈기를 사용하지 않고 CSD형 계수의 공통패턴을 공유하여 덧셈의 수를 줄일 수 있는 Common sub-expression sharing 방식과 CORDIC 알고리즘을 사용하여 구현 면적을 감소시켰다. 제안구조는 Verilog-HDL을 통해 모델링하고 Synopsys로 논리합성한 결과 기존구조와 비교하여 복소곱셈부는 48.2%감소효과, 전체 FFT구조는 22.1%의 면적 감소효과를 달성하였다. 따라서 제안된 FFT구조는 다양한 크기의 FFT를 사용하는 OFDM용 시스템에 효율적으로 사용될 수 있는 구조임을 보였다.

4채널 뇌파 신호를 이용한 감정 분류에 관한 연구 (A Study on Emotion Classification using 4-Channel EEG Signals)

  • 김동준;이현민
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권2호
    • /
    • pp.23-28
    • /
    • 2009
  • 본 연구에서는 뇌파를 AR모델로 모델링하여 선형예측계수를 특징 파라미터로 이용할 때와 뇌파의 주파수 대역별 상호상관계수를 이용할 때의 감정상태 분류 성능을 비교해 보고자 하였다. 이를 위하여 분노, 슬픔, 기쁨, 안정의 4가지 감정상태에 따른 뇌파를 4개 채널로부터 수집하여 선형예측계수와 ${\theta}$, ${\alpha}$, ${\beta}$ 대역의 주파수 영역에서의 상호상관계수를 추출하여 이들을 특징 파라미터로 한 감정상태 분류 실험을 수행함으로써 두 방법의 감정상태 분류 성능을 비교하였고, 패턴 분류기로는 신경회로망을 이용하였다. 감정 분류 실험 결과 뇌파의 특징 파라미터로서 선형예측계수를 이용한 결과가 상호상관계수를 이용할 때보다 성능이 월등히 좋은 것을 알 수 있었다.

  • PDF

뇌파를 이용한 감정의 패턴 분류 기술 (Pattern Classification of Four Emotions using EEG)

  • 김동준;김영수
    • 한국정보전자통신기술학회논문지
    • /
    • 제3권4호
    • /
    • pp.23-27
    • /
    • 2010
  • 본 연구에서는 감성 평가 시스템 가장 적합한 파라미터를 찾기 위하여 3가지 뇌파 파라미터를 이용하여 감정 분류 실험을 하였다. 뇌파 파라미터는 선형예측기계수(linear predictor coefficients)와 FFT 스펙트럼 및 AR 스펙트럼의 밴드별 상호상관계수(cross-correlation coefficients)를 이용하였으며, 감정은 relaxation, joy, sadness, irritation으로 설정하였다. 뇌파 데이터는 대학의 연극동아리 학생 4명을 대상으로 수집하였으며, 전극 위치는 Fp1, Fp2, F3, F4, T3, T4, P3, P4, O1, O2를 사용하였다. 수집된 뇌파 데이터는 전처리를 거친 후 특징 파라미터를 추출하고 패턴 분류기로 사용된 신경회로망(neural network)에 입력하여 감정 분류를 하였다. 감정 분류실험 결과 선형예측기계수를 이용하는 것이 다른 2가지 보다 좋은 성능을 나타내었다.

  • PDF

Speaker Identification Using Incremental Learning

  • Kim, Jinsu;Son, Sung-Han;Cho, Byungsun;Park, Kang-Bak;Tsuji, Teruo;Hanamoto, Tsuyoshi
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2002년도 ICCAS
    • /
    • pp.75.5-75
    • /
    • 2002
  • $\textbullet$ FFT $\textbullet$ Autocorrelation $\textbullet$ Levinson_Durbin resolution $\textbullet$ LP coefficients $\textbullet$ LP cepstral Coefficients $\textbullet$ Incremental Learning

  • PDF

확률분포 특성을 이용한 OFDM용 IFFT∪FFT프로세서 설계 (Design of an IFFT∪FFT processor with manipulated coefficients based on the statistics distribution for OFDM)

  • 최원철;이현;조경록
    • 대한전자공학회논문지SD
    • /
    • 제40권12호
    • /
    • pp.87-94
    • /
    • 2003
  • 본 논문에서는 통계적 분석 방법으로 IEEE 802.11a WLAN의 OFDM 모뎀용 IFFT 및 FFT의 양자화 에러를 최소화하는 설계방법을 제안한다. 제안된 방법은 IFFT 및 FFT의 회전계수(twiddle coefficient)에 통계적으로 계산된 계수를 적용하여 회전계수를 수정하는 새로운 알고리즘을 사용한다. 본 논문에서는 알고리즘을 radix-2² SDF(single-path delay feedback) 구조에 적용하여 설계하였고 IFFT와 FFT의 대칭적 성질을 이용하여 회로블록을 공유하도록 하였다. 회로 레벨에서 설계된 입출력 10비트인 송신단의 IFFT와 수신단의 FFT가 자기루프 구조 가졌을 때 최대 양자화 오차는 0.0021이다. 기존의 선형확장 회전계수의 최대 양자화 오차가 0.0087로 측정되었기 때문에 제안된 프로세서가 3비트 효율이 좋다.