• 제목/요약/키워드: Feature-based classification

검색결과 1,317건 처리시간 0.027초

Time-Frequency Analysis of Electrohysterogram for Classification of Term and Preterm Birth

  • Ryu, Jiwoo;Park, Cheolsoo
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제4권2호
    • /
    • pp.103-109
    • /
    • 2015
  • In this paper, a novel method for the classification of term and preterm birth is proposed based on time-frequency analysis of electrohysterogram (EHG) using multivariate empirical mode decomposition (MEMD). EHG is a promising study for preterm birth prediction, because it is low-cost and accurate compared to other preterm birth prediction methods, such as tocodynamometry (TOCO). Previous studies on preterm birth prediction applied prefilterings based on Fourier analysis of an EHG, followed by feature extraction and classification, even though Fourier analysis is suboptimal to biomedical signals, such as EHG, because of its nonlinearity and nonstationarity. Therefore, the proposed method applies prefiltering based on MEMD instead of Fourier-based prefilters before extracting the sample entropy feature and classifying the term and preterm birth groups. For the evaluation, the Physionet term-preterm EHG database was used where the proposed method and Fourier prefiltering-based method were adopted for comparative study. The result showed that the area under curve (AUC) of the receiver operating characteristic (ROC) was increased by 0.0351 when MEMD was used instead of the Fourier-based prefilter.

Bhattacharyya distance 기반 특징 추출 기법 (Feature Extraction Method Using the Bhattacharyya Distance)

  • 최의선;이철희
    • 대한전자공학회논문지SP
    • /
    • 제37권6호
    • /
    • pp.38-47
    • /
    • 2000
  • Bhattacharyya distance는 패턴 분류 문제에 있어서 클래스간 분리도 측정의 수단으로 사용되어 왔으며 특징 추출 시 유용한 정보를 제공한다. 본 논문에서는 최근 발표된 Bhattacharyya distance를 이용한 에러 예측 기법을 이용하여 예측된 분류 에러가 최소가 되는 특정 벡터를 추출하는 방법에 대하여 제안한다. 제안한 특징 추출 기법은 최적화 알고리즘인 전체탐색 및 순차탐색 방법의 적용 시 분류 에러를 직접 구하지 않고 Bhattacharyya distance를 이용하여 분류 에러를 예측하므로 고차원 데이터의 경우 고속의 특징 추출이 가능하며, 에러 예측 성질을 이용하여 패턴 분류 시 필요한 최소 특징 벡터의 수를 예측할 수 있는 장점이 있다.

  • PDF

Use of Word Clustering to Improve Emotion Recognition from Short Text

  • Yuan, Shuai;Huang, Huan;Wu, Linjing
    • Journal of Computing Science and Engineering
    • /
    • 제10권4호
    • /
    • pp.103-110
    • /
    • 2016
  • Emotion recognition is an important component of affective computing, and is significant in the implementation of natural and friendly human-computer interaction. An effective approach to recognizing emotion from text is based on a machine learning technique, which deals with emotion recognition as a classification problem. However, in emotion recognition, the texts involved are usually very short, leaving a very large, sparse feature space, which decreases the performance of emotion classification. This paper proposes to resolve the problem of feature sparseness, and largely improve the emotion recognition performance from short texts by doing the following: representing short texts with word cluster features, offering a novel word clustering algorithm, and using a new feature weighting scheme. Emotion classification experiments were performed with different features and weighting schemes on a publicly available dataset. The experimental results suggest that the word cluster features and the proposed weighting scheme can partly resolve problems with feature sparseness and emotion recognition performance.

구문론과 의미론적 방법을 이용한 지문분류 (A Syntactic and Semantic Approach to Fingerprints Classification)

  • 최영식;신태민;임인식;박규태
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1157-1159
    • /
    • 1987
  • A syntactic and semantic approach is used to make type classification based on feature points(whorl, delta, core) and the shape of flow line around feature points. The image is divided into 30 by 30 subregions which are represented in the average direction and 4-tuple direction component. Next the relaxation process with singularity detection and convergency checking is performed. A set of semantic languages is used to describe the major flow line around the extracted feature points. LR(1) parser and feature transfer function are used to recognize the coded flow patterns. The 72 fingerprint impressions is used to test the proposed approach and the rate of the classification is about 93 percentages.

  • PDF

Stacked Autoencoder를 이용한 특징 추출 기반 Fuzzy k-Nearest Neighbors 패턴 분류기 설계 (Design of Fuzzy k-Nearest Neighbors Classifiers based on Feature Extraction by using Stacked Autoencoder)

  • 노석범;오성권
    • 전기학회논문지
    • /
    • 제64권1호
    • /
    • pp.113-120
    • /
    • 2015
  • In this paper, we propose a feature extraction method using the stacked autoencoders which consist of restricted Boltzmann machines. The stacked autoencoders is a sort of deep networks. Restricted Boltzmann machines (RBMs) are probabilistic graphical models that can be interpreted as stochastic neural networks. In terms of pattern classification problem, the feature extraction is a key issue. We use the stacked autoencoders networks to extract new features which have a good influence on the improvement of the classification performance. After feature extraction, fuzzy k-nearest neighbors algorithm is used for a classifier which classifies the new extracted data set. To evaluate the classification ability of the proposed pattern classifier, we make some experiments with several machine learning data sets.

Optimization of Domain-Independent Classification Framework for Mood Classification

  • Choi, Sung-Pil;Jung, Yu-Chul;Myaeng, Sung-Hyon
    • Journal of Information Processing Systems
    • /
    • 제3권2호
    • /
    • pp.73-81
    • /
    • 2007
  • In this paper, we introduce a domain-independent classification framework based on both k-nearest neighbor and Naive Bayesian classification algorithms. The architecture of our system is simple and modularized in that each sub-module of the system could be changed or improved efficiently. Moreover, it provides various feature selection mechanisms to be applied to optimize the general-purpose classifiers for a specific domain. As for the enhanced classification performance, our system provides conditional probability boosting (CPB) mechanism which could be used in various domains. In the mood classification domain, our optimized framework using the CPB algorithm showed 1% of improvement in precision and 2% in recall compared with the baseline.

Classifying Social Media Users' Stance: Exploring Diverse Feature Sets Using Machine Learning Algorithms

  • Kashif Ayyub;Muhammad Wasif Nisar;Ehsan Ullah Munir;Muhammad Ramzan
    • International Journal of Computer Science & Network Security
    • /
    • 제24권2호
    • /
    • pp.79-88
    • /
    • 2024
  • The use of the social media has become part of our daily life activities. The social web channels provide the content generation facility to its users who can share their views, opinions and experiences towards certain topics. The researchers are using the social media content for various research areas. Sentiment analysis, one of the most active research areas in last decade, is the process to extract reviews, opinions and sentiments of people. Sentiment analysis is applied in diverse sub-areas such as subjectivity analysis, polarity detection, and emotion detection. Stance classification has emerged as a new and interesting research area as it aims to determine whether the content writer is in favor, against or neutral towards the target topic or issue. Stance classification is significant as it has many research applications like rumor stance classifications, stance classification towards public forums, claim stance classification, neural attention stance classification, online debate stance classification, dialogic properties stance classification etc. This research study explores different feature sets such as lexical, sentiment-specific, dialog-based which have been extracted using the standard datasets in the relevant area. Supervised learning approaches of generative algorithms such as Naïve Bayes and discriminative machine learning algorithms such as Support Vector Machine, Naïve Bayes, Decision Tree and k-Nearest Neighbor have been applied and then ensemble-based algorithms like Random Forest and AdaBoost have been applied. The empirical based results have been evaluated using the standard performance measures of Accuracy, Precision, Recall, and F-measures.

주급수 유량의 형상 분류 및 추정 모델에 대한 연구 (A Study of the Feature Classification and the Predictive Model of Main Feed-Water Flow for Turbine Cycle)

  • 양학진;김성근;최광희
    • 에너지공학
    • /
    • 제23권4호
    • /
    • pp.263-271
    • /
    • 2014
  • 터빈 사이클의 성능 상태량을 결정하기 위한 보정 열 성능 분석은 발전소의 향상된 경제성 운전을 위해 요구된다. 본 연구에서는 유용하고 정확한 성능 분석을 위해서 산업 표준인 ASME PTC를 기분으로 하여 성능 데이터를 사용하여 주급수 유량의 영역별 판정 알고리듬을 개발하고 각 영역별 추정 알고리즘을 개발하였다. 추정 알고리즘은 측정 상태량의 상관관계를 기반으로 형상 분류를 제시하고, 이를 기반으로 서포트 벡터 머신 모델링을 이용하여 추정 모델을 구성하였으며, 서포트 벡터 머신 모델링의 우수성을 검증하기 위하여 신경 회로망 모델, 커널 회귀 모델과 비교하였다. 주급수 유량의 형상 분류 및 추정 모델은 터빈 사이클에서 정확한 보정 열 성능 분석을 제공함으로써 향상된 성능 분석에 기여할 것이다.

영상 분류를 위한 분류기 통합모델 (Classifier Integration Model for Image Classification)

  • 박동철
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.96-102
    • /
    • 2012
  • 영상 분류를 위한 다단계 특성벡터 기반의 분류기 모델(Partitioned Feature-based Classification Model with Expertise Table: PFC-ET)의 성능을 더욱 향상시킨 진보된 형태의 분류기 통합모델 (Classifier Integration Model: CIM)이 본 논문에서 제안되었다. CIM은 PFC-ET과 같이 주어진 데이터에서 추출된 전체의 특징벡터를 연결하여 이용하지 않고, 같은 성질의 특징 벡터들끼리 모아서, 각각의 국지적 학습기를 통하여 분류에 이용한다. PFC-ET에서 분류판단 확률행렬에 의한 오류를 최소화하기위해 국지적 분류기로 사용되는 군집화 알고리즘의 멤버 비율을 사용하여 최종적인 분류의 정확도를 높이는 방안을 제안한다. 제안된 CIM의 성능을 검증하기 위하여, Caltech 데이터에 대한 일반적인 영상 분류와 6 클래스 위성 영상 분류 문제에 대한 실험을 진행하였다. 제안된 CIM은 기존의 PFC 와 PFC-ET 모델과 비교한 실험에서 분류 정확도와 후처리 문제의 복잡성 면에서 향상된 성능을 보여주었다.

사례기반 추론을 위한 동적 속성 가중치 부여 방법 (A Dynamic feature Weighting Method for Case-based Reasoning)

  • 이재식;전용준
    • 지능정보연구
    • /
    • 제7권1호
    • /
    • pp.47-61
    • /
    • 2001
  • 사례기반 추론과 같은 사후학습 기법은 인공신경망이나 의사결정나무와 같은 사전학습 기법에 비해서 여러 장점을 가지고 있다. 하지만, 사후학습 기법은 사례 표현에 관련성이 적은 속성이 포함된 경우에는 성능이 저하되는 단점을 가지고 있다. 이러한 단점을 극복하기 위해서, 속성 가중치 부여 방법들이 연구되었다. 기존의 속성 가중치 부여 방법들은 대부분 전역적으로 속성 가중치를 부여하는 것이었다. 본 연구에서는 새로운 지역적 속성 가중치 부여 방법인 CBDFW를 제안한다. CBDFW 기법은 무작위로 생성된 속성 가중치들의 분류 성공 여부를 저장하고 있다가, 새로운 사례가 주어졌을 때에 성공적인 분류 결과를 보인 가중치들을 검색하여 동적으로 새로운 가중치들을 생성해낸다. 신용평가 데이터로 CBDFW의 성능을 실험한 결과, 기존의 연구들에서 제시된 분류 적중률보다 우수한 성능을 보였다.

  • PDF