• 제목/요약/키워드: Feature-based classification

검색결과 1,317건 처리시간 0.026초

베이즈 분류기를 이용한 수중 배경소음하의 과도신호 분류 (Classification of Transient Signals in Ocean Background Noise Using Bayesian Classifier)

  • 김주호;복태훈;팽동국;배진호;이종현;김성일
    • 한국해양공학회지
    • /
    • 제26권4호
    • /
    • pp.57-63
    • /
    • 2012
  • In this paper, a Bayesian classifier based on PCA (principle component analysis) is proposed to classify underwater transient signals using $16^{th}$ order LPC (linear predictive coding) coefficients as feature vector. The proposed classifier is composed of two steps. The mechanical signals were separated from biological signals in the first step, and then each type of the mechanical signal was recognized in the second step. Three biological transient signals and two mechanical signals were used to conduct experiments. The classification ratios for the feature vectors of biological signals and mechanical signals were 94.75% and 97.23%, respectively, when all 16 order LPC vector were used. In order to determine the effect of underwater noise on the classification performance, underwater ambient noise was added to the test signals and the classification ratio according to SNR (signal-to-noise ratio) was compared by changing dimension of feature vector using PCA. The classification ratios of the biological and mechanical signals under ocean ambient noise at 10dB SNR, were 0.51% and 100% respectively. However, the ratios were changed to 53.07% and 83.14% when the dimension of feature vector was converted to three by applying PCA. For correct, classification, it is required SNR over 10 dB for three dimension feature vector and over 30dB SNR for seven dimension feature vector under ocean ambient noise environment.

PCMM 기반 특징 보상 기법에서 변별력 향상을 위한 Minimum Classification Error 훈련의 적용 (Minimum Classification Error Training to Improve Discriminability of PCMM-Based Feature Compensation)

  • 김우일;고한석
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.58-68
    • /
    • 2005
  • 본 논문에서는 잡음 환경에서 강인한 음성 인식을 위하여 특징 보상 기법의 성능을 향상시킬 수 있는 방법을 제안한다. 기존의 음성 모델 기반의 특징 보상 기법에서 이용되는 오염 음성 모델 추정 방식은 입력 음성에 대한 변별력 있는 사후 확률 예측을 보장하지 못하며, 부정확하게 계산된 사후 확률은 복구된 음성에서 명료도 하락의 문제를 일으킨다. 제안하는 기법에서는 오염 음성 모델 추정 과정에 분별적 훈련 방식의 하나인 최소 분류 오류 (MCE) 훈련 기법을 도입한다. MCE 훈련 기법을 적용하기 위해 변별력 하락의 가능성을 가지는 '경쟁 요소' 를 결정하는 기법을 제안한다. 병렬결합된 혼합 모델 (PCMM) 기반의 특징 보상에 MCE 훈련 기법을 적용하는 과정을 제안하고 변별력 향상의 영향을 관찰한다. Aurora 2.0 데이터베이스와 실제 자동차 주행 환경에서 수집된 음성 데이터베이스에 대한 성능 평가를 실시한다. 실험 결과는 제안한 기법이 음성 인식 성능 향상에 도움이 되는 것을 입증한다.

The extension of the largest generalized-eigenvalue based distance metric Dij1) in arbitrary feature spaces to classify composite data points

  • Daoud, Mosaab
    • Genomics & Informatics
    • /
    • 제17권4호
    • /
    • pp.39.1-39.20
    • /
    • 2019
  • Analyzing patterns in data points embedded in linear and non-linear feature spaces is considered as one of the common research problems among different research areas, for example: data mining, machine learning, pattern recognition, and multivariate analysis. In this paper, data points are heterogeneous sets of biosequences (composite data points). A composite data point is a set of ordinary data points (e.g., set of feature vectors). We theoretically extend the derivation of the largest generalized eigenvalue-based distance metric Dij1) in any linear and non-linear feature spaces. We prove that Dij1) is a metric under any linear and non-linear feature transformation function. We show the sufficiency and efficiency of using the decision rule $\bar{{\delta}}_{{\Xi}i}$(i.e., mean of Dij1)) in classification of heterogeneous sets of biosequences compared with the decision rules min𝚵iand median𝚵i. We analyze the impact of linear and non-linear transformation functions on classifying/clustering collections of heterogeneous sets of biosequences. The impact of the length of a sequence in a heterogeneous sequence-set generated by simulation on the classification and clustering results in linear and non-linear feature spaces is empirically shown in this paper. We propose a new concept: the limiting dispersion map of the existing clusters in heterogeneous sets of biosequences embedded in linear and nonlinear feature spaces, which is based on the limiting distribution of nucleotide compositions estimated from real data sets. Finally, the empirical conclusions and the scientific evidences are deduced from the experiments to support the theoretical side stated in this paper.

단위 신경망과 특징벡터 차원 축소 기반의 음악 분위기 자동판별 (Music Mood Classification based on a New Feature Reduction Method and Modular Neural Network)

  • 송민균;김현수;문창배;김병만;오득환
    • 한국산업정보학회논문지
    • /
    • 제18권4호
    • /
    • pp.25-35
    • /
    • 2013
  • 본 논문에서는 개인화된 분위기 분류 모델 대신에 대중의 분위기 분류 모델을 제안한다. 분위기 판별 성능을 개선하기 위해 두 가지 접근 방법을 선택하였는데, 그 첫 번째가 표준편차에 기초한 특징축소이다. 이는 음악의 특징을 추출하기 위해 사용하는 MIRtoolbox에서 추출되는 391개의 특징들을 모두 사용할 경우의 성능 저하 문제를 해결하기 위한 방법이다. 실험결과, 본 논문에서 제안한 특징축소 방법이 기존의 차원 축소 방법인 R-Square와 PCA보다 성능이 좋음을 확인할 수 있었다. 그리고 특징축소 방법만으로는 성능 개선에 한계가 있어 두 번째 개선방법으로 단위 신경망을 사용하여 추가의 성능 개선을 시도하였다. 실험결과 이 역시 유효한 성능 개선이 이루어짐을 확인할 수 있었다.

RPA분류기의 성능 향상을 위한 OHC알고리즘 (OHC Algorithm for RPA Memory Based Reasoning)

  • 이형일
    • 한국멀티미디어학회논문지
    • /
    • 제6권5호
    • /
    • pp.824-830
    • /
    • 2003
  • 메모리 기반 추론에서 기억공간의 효율적인 사용과 분류성능의 향상을 위하여 제안되었던 RPA(Recursive Partition Averaging)알고리즘은 대상 패턴 공간을 분할 한 후 대표 패턴을 추출하여 분류 기준 패턴으로 사용한다. 이 기법은 구성된 초월 평면상에서 단순히 대표패턴을 추출하여 분류 성능 저하의 원인이 되는 단점을 가지고 있었다. 여기에서는 기존 RPA의 단점을 보완하기 위해 FPD (Feature-based Population Densimeter)를 이용한 OHC (Optimized Hyperrectangle Calving) 알고리즘을 제안한다. 제안된 알고리즘은 RPA분할 종료 후 OHC를 이용하여 초월 평면을 최적화한 후 패턴 평균 기법을 적용하여 학습 결과를 산출한다. 제안된 알고리즘은 k-NN분류기에서 필요로 하는 메모리 공간의 40%정도를 사용하며 분류에 있어서도 RPA보다 우수한 인식 성능을 보이고 있다. 또한 저장된 패턴의 감소로 인하여, 실제 분류에 소요되는 시간비교에 있어서도 k-NN보다 월등히 우수한 성능을 보이고 있다.

  • PDF

텍스트 분류를 위한 자질 순위화 기법에 관한 연구 (An Experimental Study on Feature Ranking Schemes for Text Classification)

  • 김판준
    • 정보관리학회지
    • /
    • 제40권1호
    • /
    • pp.1-21
    • /
    • 2023
  • 본 연구는 텍스트 분류를 위한 효율적인 자질선정 방법으로 자질 순위화 기법의 성능을 구체적으로 검토하였다. 지금까지 자질 순위화 기법은 주로 문헌빈도에 기초한 경우가 대부분이며, 상대적으로 용어빈도를 사용한 경우는 많지 않았다. 따라서 텍스트 분류를 위한 자질선정 방법으로 용어빈도와 문헌빈도를 개별적으로 적용한 단일 순위화 기법들의 성능을 살펴본 다음, 양자를 함께 사용하는 조합 순위화 기법의 성능을 검토하였다. 구체적으로 두 개의 실험 문헌집단(Reuters-21578, 20NG)과 5개 분류기(SVM, NB, ROC, TRA, RNN)를 사용하는 환경에서 분류 실험을 진행하였고, 결과의 신뢰성 확보를 위해 5-fold cross validation과 t-test를 적용하였다. 결과적으로, 단일 순위화 기법으로는 문헌빈도 기반의 단일 순위화 기법(chi)이 전반적으로 좋은 성능을 보였다. 또한, 최고 성능의 단일 순위화 기법과 조합 순위화 기법 간에는 유의한 성능 차이가 없는 것으로 나타났다. 따라서 충분한 학습문헌을 확보할 수 있는 환경에서는 텍스트 분류의 자질선정 방법으로 문헌빈도 기반의 단일 순위화 기법(chi)을 사용하는 것이 보다 효율적이라 할 수 있다.

Improved Algorithm for Fully-automated Neural Spike Sorting based on Projection Pursuit and Gaussian Mixture Model

  • Kim, Kyung-Hwan
    • International Journal of Control, Automation, and Systems
    • /
    • 제4권6호
    • /
    • pp.705-713
    • /
    • 2006
  • For the analysis of multiunit extracellular neural signals as multiple spike trains, neural spike sorting is essential. Existing algorithms for the spike sorting have been unsatisfactory when the signal-to-noise ratio(SNR) is low, especially for implementation of fully-automated systems. We present a novel method that shows satisfactory performance even under low SNR, and compare its performance with a recent method based on principal component analysis(PCA) and fuzzy c-means(FCM) clustering algorithm. Our system consists of a spike detector that shows high performance under low SNR, a feature extractor that utilizes projection pursuit based on negentropy maximization, and an unsupervised classifier based on Gaussian mixture model. It is shown that the proposed feature extractor gives better performance compared to the PCA, and the proposed combination of spike detector, feature extraction, and unsupervised classification yields much better performance than the PCA-FCM, in that the realization of fully-automated unsupervised spike sorting becomes more feasible.

Automatic Emotion Classification of Music Signals Using MDCT-Driven Timbre and Tempo Features

  • Kim, Hyoung-Gook;Eom, Ki-Wan
    • The Journal of the Acoustical Society of Korea
    • /
    • 제25권2E호
    • /
    • pp.74-78
    • /
    • 2006
  • This paper proposes an effective method for classifying emotions of the music from its acoustical signals. Two feature sets, timbre and tempo, are directly extracted from the modified discrete cosine transform coefficients (MDCT), which are the output of partial MP3 (MPEG 1 Layer 3) decoder. Our tempo feature extraction method is based on the long-term modulation spectrum analysis. In order to effectively combine these two feature sets with different time resolution in an integrated system, a classifier with two layers based on AdaBoost algorithm is used. In the first layer the MDCT-driven timbre features are employed. By adding the MDCT-driven tempo feature in the second layer, the classification precision is improved dramatically.

3차원 웨이블렛 변환을 이용한 다중시기 SAR 영상의 특징 추출 및 분류 (Feature Extraction and Classification of Multi-temporal SAR Data Using 3D Wavelet Transform)

  • 유희영;박노욱;홍석영;이경도;김이현
    • 대한원격탐사학회지
    • /
    • 제29권5호
    • /
    • pp.569-579
    • /
    • 2013
  • 이 연구에서는 다중시기 SAR 영상으로부터 3D 웨이블렛 변환을 통해 추출된 특징 정보를 이용하여 토지피복 분류를 수행하였고 그 적용가능성을 평가하였다. 분류를 하기 전 단계로 3차원 웨이블렛 변환기반 특징을 추출하였고, 이후 토지 피복 분류에 사용하였다. 비교를 목적으로 특징추출 단계가 들어가지 않는 원본 영상과 주성분분석 기반 특징들의 분류를 함께 수행하였다. 성능 검증을 위해 당진에서 촬영된 다중시기 Radarsat-1호 영상을 사용하였고 토지피복은 논, 밭, 산림, 수계, 도심지가 포함된 5개의 클래스로 구분하였다. 토지피복 식별 능력 분석에 따르면 밭과 산림은 매우 유사한 특성을 보이기 때문에 두 클래스를 구분하는 것은 매우 어렵다. 3차원 웨이블렛 기반 특징을 사용하는 경우, 도심지를 제외하고 모든 클래스의 분류 정확도가 향상되었다. 특히 밭과 산림의 정확도가 향상된 것을 확인할 수 있었다. 이러한 향상은 다중시기자료를 시간과 공간적으로 동시에 분석하는 3차원 웨이블렛 변환 과정에 기인한 것으로 판단된다. 이 결과로부터 3차원 웨이블렛 변환이 영상으로부터 특징을 추출하는데 이용 가능하다는 것을 확인할 수 있었고, 추후에 다른 센서나 다른 연구지역으로 추가 실험을 수행할 예정이다.

퍼지 매핑을 이용한 퍼지 패턴 분류기의 Feature Selection (Feature Selection of Fuzzy Pattern Classifier by using Fuzzy Mapping)

  • 노석범;김용수;안태천
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.646-650
    • /
    • 2014
  • 본 논문에서는 다차원 문제로 인하여 발생하는 패턴 분류 성능의 저하를 방지 하여 퍼지 패턴 분류기의 성능을 개선하기 위하여 다수의 Feature들 중에서 패턴 분류 성능 향상에 기여하는 Feature를 선택하기 위한 새로운 Feature Selection 방법을 제안 한다. 새로운 Feature Selection 방법은 각각의 Feature 들을 퍼지 클러스터링 기법을 이용하여 클러스터링 한 후 각 클러스터가 임의의 class에 속하는 정도를 계산하고 얻어진 값을 이용하여 해당 feature 가 fuzzy pattern classifier에 적용될 경우 패턴 분류 성능 개선 가능성을 평가한다. 평가된 성능 개선 가능성을 기반으로 이미 정해진 개수만큼의 Feature를 선택하는 Feature Selection을 수행한다. 본 논문에서는 제안된 방법의 성능을 평가, 비교하기 위하여 다수의 머신 러닝 데이터 집합에 적용한다.