• 제목/요약/키워드: 복소 켑스트럼

검색결과 2건 처리시간 0.017초

로그 전력 스펙트럼을 이용한 초음파 영상에서의 장기인식 (Organ Recognition in Ultrasound images Using Log Power Spectrum)

  • 박수진;손재곤;김남철
    • 한국통신학회논문지
    • /
    • 제28권9C호
    • /
    • pp.876-883
    • /
    • 2003
  • 본 논문에서는 초음파 영상에서 로그 전력 스펙트럼(log power spectrum)을 이용한 장기 인식 알고리듬을 제시한다. 제안한 알고리듬은 크게 특징추출과 특징분류의 두 단계로 구성된다. 특징추출에서는 이동불변의 성질을 가지는 로그 전력 스펙트럼을 이용하여 전처리를 수행한 입력 영상으로부터 장기 조직의 반향(echo of the tissue) 성분을 추출한다. 특징 분류에서는 마하라노비스(Mahalanobis) 거리를 사용하여 입력영상으로부터 추출한 특징벡터와 각 영상 부류의 평균벡터 사이의 유사도를 측정한다. 실제 초음파 영상에 대한 실험결과는 제안된 알고리듬이 전력 스펙트럼(power spectrum)과 유클리드(Euclid) 거리를 이용한 인식 알고리듬보다 최대 30% 향상된 인식률을, 또 가중 큐프런시(weighted quefrency) 복소 켑스트럼(complex cepstrum)을 이용한 알고리듬보다 10∼40% 향상된 인식률을 보여준다.

음성 인식에서 위상 정보의 활용 (Utilization of Phase Information for Speech Recognition)

  • 이창영
    • 한국전자통신학회논문지
    • /
    • 제10권9호
    • /
    • pp.993-1000
    • /
    • 2015
  • MFCC는 음성 신호 처리에서 귀중한 특징 벡터들 중 하나이다. MFCC에서 명백한 결점은 푸리에 변환의 크기를 취함에 의해 위상 정보가 손실된다는 것이다. 이 논문에서 우리는 푸리에 변환의 실수부와 허수부 크기를 따로 취급함으로써 위상 정보를 활용하는 방법을 생각한다. 퍼지 벡터 양자화와 은닉 마코브 모델을 이용한 음성인식에 이 방법을 적용함으로써, 종전 방법에 비해 음성 인식 오류율을 줄일 수 있음을 보인다. 우리는 또한 수치해석을 통하여, FFT의 실수부와 허수부 각각에서 6개의 성분을 취하여 모두 12개의 MFCC 성분을 사용하는 것이 음성인식에 최적임을 보인다.