• 제목/요약/키워드: Cepstral distances

검색결과 6건 처리시간 0.026초

켑스트럼 거리 기반의 음성/음악 판별 성능 향상 (Performance Improvement of Speech/Music Discrimination Based on Cepstral Distance)

  • 박슬한;최무열;김형순
    • 대한음성학회지:말소리
    • /
    • 제56호
    • /
    • pp.195-206
    • /
    • 2005
  • Discrimination between speech and music is important in many multimedia applications. In this paper, focusing on the spectral change characteristics of speech and music, we propose a new method of speech/music discrimination based on cepstral distance. Instead of using cepstral distance between the frames with fixed interval, the minimum of cepstral distances among neighbor frames is employed to increase discriminability between fast changing music and speech. And, to prevent misclassification of speech segments including short pause into music, short pause segments are excluded from computing cepstral distance. The experimental results show that proposed method yields the error rate reduction of$68\%$, in comparison with the conventional approach using cepstral distance.

  • PDF

다차원 MMCD를 이용한 음성/음악 판별 (Speech/Music Discrimination Using Multi-dimensional MMCD)

  • 최무열;송화전;박슬한;김형순
    • 대한음성학회지:말소리
    • /
    • 제60호
    • /
    • pp.191-201
    • /
    • 2006
  • Discrimination between speech and music is important in many multimedia applications. Previously we proposed a new parameter for speech/music discrimination, the mean of minimum cepstral distances (MMCD), and it outperformed the conventional parameters. One weakness of MMCD is that its performance depends on range of candidate frames to compute the minimum cepstral distance, which requires the optimal selection of the range experimentally. In this paper, to alleviate the problem, we propose a multi-dimensional MMCD parameter which consists of multiple MMCDS with combination of different candidate frame ranges. Experimental results show that the multi-dimensional MMCD parameter yields an error rate reduction of 22.5% compared with the optimally chosen one-dimensional MMCD parameter.

  • PDF

MFCC의 단구간 시간 평균을 이용한 음성/음악 판별 파라미터 성능 향상 (Improving Speech/Music Discrimination Parameter Using Time-Averaged MFCC)

  • 최무열;김형순
    • 대한음성학회지:말소리
    • /
    • 제64호
    • /
    • pp.155-169
    • /
    • 2007
  • Discrimination between speech and music is important in many multimedia applications. In our previous work, focusing on the spectral change characteristics of speech and music, we presented a method using the mean of minimum cepstral distances (MMCD), and it showed a very high discrimination performance. In this paper, to further improve the performance, we propose to employ time-averaged MFCC in computing the MMCD. Our experimental results show that the proposed method enhances the discrimination between speech and music. Moreover, the proposed method overcomes the weakness of the conventional MMCD method whose performance is relatively sensitive to the choice of the frame interval to compute the MMCD.

  • PDF

다차원 MMCD를 이용한 음성/음악 판별 (Speech/Music Discrimination Using Multi-dimensional MMCD)

  • 최무열;송화전;박슬한;김형순
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 추계학술대회 발표논문집
    • /
    • pp.142-145
    • /
    • 2006
  • Discrimination between speech and music is important in many multimedia applications. Previously we proposed a new parameter for speech/music discrimination, the mean of minimum cepstral distances (MMCD), and it outperformed the conventional parameters. One weakness of it is that its performance depends on range of candidate frames to compute the minimum cepstral distance, which requires the optimal selection of the range experimentally. In this paper, to alleviate the problem, we propose a multi-dimensional MMCD parameter which consists of multiple MMCDs with different ranges of candidate frames. Experimental results show that the multi-dimensional MMCD parameter yields an error rate reduction of 22.5% compared with the optimally chosen one-dimensional MMCD parameter.

  • PDF

유도전동기의 고장 진단을 위한 효과적인 특징 추출 방법 (An Effective Feature Extraction Method for Fault Diagnosis of Induction Motors)

  • 흥 뉘엔;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권7호
    • /
    • pp.23-35
    • /
    • 2013
  • 본 논문은 고장 분류 시스템을 위해 진동 신호로부터 특징 벡터를 자동적으로 추출하는 효과적인 기법을 제안한다. 기존의 멜-주파수 캡스트럼 계수는 진동신호의 노이즈에 민감하여 분류 정확도를 감소시키는 단점이 있다. 이러한 문제를 해결하기 위해 본 논문은 4단계 필터 뱅크로 구성된 스펙트럴 엔벨로프 캡스트럼 계수 분석을 제안하며, 4단계는 (1) 모든 진동 신호의 스펙트럴 엔벨로프를 기술하기 위한 선형 예측 코딩 알고리즘 사용 단계, (2) 일반적인 스펙트럴 모양을 얻기 위해 모든 엔벨로프의 평균화 단계, (3) 평균 엔벨로프와 그 주파수의 최대값을 찾기 위한 기울기 하강 방법 사용 단계, (4) 엔벨로프의 주파수 사이의 거리로부터 계산된 중앙값을 얻는데 사용되는 비 중첩 필터 뱅크 단계로 구성된다. 이4-단계필터뱅크는 특징벡터를 추출하기위해 캡스트럼 계수 계산에 사용된다. 마지막으로 유도전동기의 결함 형태를 구분하기 위해 이러한 특수 파라미터를 사용하는 다중 계층 서포트 벡터 머신을 사용한다. 모의실험 결과, 제안하는 방법은 약 99.65%의 분류 성능을 보이며, 동시에 기존 방법들보다 우수한 성능을 보인다.

MFCC 특징 벡터를 이용한 수중 천이 신호 식별 (Classification of Underwater Transient Signals Using MFCC Feature Vector)

  • 임태균;황찬식;이형욱;배건성
    • 한국통신학회논문지
    • /
    • 제32권8C호
    • /
    • pp.675-680
    • /
    • 2007
  • 일반적으로 천이 신호의 식별은 지진학이나 상태 모니터링 분야, 특히 수중 음향 신호 처리 분야에서 활발한 연구가 이루어지고 있다. 수중 환경에서 발생하는 천이 신호로는 돌고래와 같은 해양 생물이 내는 천이 신호와 선박, 잠수함 등에서 발생하는 인위적인 천이 신호 등이 있으며, 수중 감시 체계에서 이러한 수중 천이 신호를 식별하는 문제는 매우 중요한 연구 주제이다. 본 논문에서는 음성 인식 분야에서 우수한 인식 성능을 보이는 MFCC(Mel Frequency Cepstral Coefficient)를 기반으로, 천이 신호로 탐지된 입력 신호에 대하여 분석 프레임 단위로 MFCC 특징 벡터를 추출하고, 식별하고자 하는 데이터베이스에 있는 모든 참조 신호들의 MFCC 특징 벡터와의 유클리디언 거리(euclidean distance)를 계산한 후, 가장 작은 값을 갖는 참조 신호로 입력 프레임들을 사상(mapping)시킴으로써 사상이 가장 많이 된 참조 신호로 탐지된 수중 천이신호를 식별하는 프레임 기반의 식별 알고리즘을 제안한다.