• 제목/요약/키워드: classifiers

검색결과 743건 처리시간 0.032초

An Ensemble Classifier using Two Dimensional LDA

  • Park, Cheong-Hee
    • 한국멀티미디어학회논문지
    • /
    • 제13권6호
    • /
    • pp.817-824
    • /
    • 2010
  • Linear Discriminant Analysis (LDA) has been successfully applied for dimension reduction in face recognition. However, LDA requires the transformation of a face image to a one-dimensional vector and this process can cause the correlation information among neighboring pixels to be disregarded. On the other hand, 2D-LDA uses 2D images directly without a transformation process and it has been shown to be superior to the traditional LDA. Nevertheless, there are some problems in 2D-LDA. First, it is difficult to determine the optimal number of feature vectors in a reduced dimensional space. Second, the size of rectangular windows used in 2D-LDA makes strong impacts on classification accuracies but there is no reliable way to determine an optimal window size. In this paper, we propose a new algorithm to overcome those problems in 2D-LDA. We adopt an ensemble approach which combines several classifiers obtained by utilizing various window sizes. And a practical method to determine the number of feature vectors is also presented. Experimental results demonstrate that the proposed method can overcome the difficulties with choosing an optimal window size and the number of feature vectors.

Personalized Anti-spam Filter Considering Users' Different Preferences

  • Kim, Jong-Wan
    • 한국멀티미디어학회논문지
    • /
    • 제13권6호
    • /
    • pp.841-848
    • /
    • 2010
  • Conventional filters using email header and body information equally judge whether an incoming email is spam or not. However this is unrealistic in everyday life because each person has different criteria to judge what is spam or not. To resolve this problem, we consider user preference information as well as email category information derived from the email content. In this paper, we have developed a personalized anti-spam system using ontologies constructed from rules derived in a data mining process. The reason why traditional content-based filters are not applicable to the proposed experimental situation is described. In also, several experiments constructing classifiers to decide email category and comparing classification rule learners are performed. Especially, an ID3 decision tree algorithm improved the overall accuracy around 17% compared to a conventional SVM text miner on the decision of email category. Some discussions about the axioms generated from the experimental dataset are given too.

Network Anomaly Detection using Hybrid Feature Selection

  • 김은혜;김세현
    • 한국정보보호학회:학술대회논문집
    • /
    • 한국정보보호학회 2006년도 하계학술대회
    • /
    • pp.649-653
    • /
    • 2006
  • In this paper, we propose a hybrid feature extraction method in which Principal Components Analysis is combined with optimized k-Means clustering technique. Our approach hierarchically reduces the redundancy of features with high explanation in principal components analysis for choosing a good subset of features critical to improve the performance of classifiers. Based on this result, we evaluate the performance of intrusion detection by using Support Vector Machine and a nonparametric approach based on k-Nearest Neighbor over data sets with reduced features. The Experiment results with KDD Cup 1999 dataset show several advantages in terms of computational complexity and our method achieves significant detection rate which shows possibility of detecting successfully attacks.

  • PDF

PCA & LDA 융합 알고리즘을 이용한 pRBFNNs 패턴 분류기 설계 (Design of pRBFNNs Pattern Classifiers Model Using a Synthesis of PCA & LDA Algorithm)

  • 김나현;유성훈;오성권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2011년도 제42회 하계학술대회
    • /
    • pp.1960-1961
    • /
    • 2011
  • 얼굴 인식에서 가장 많이 사용되고 있는 PCA(Principal Component Analysis)는 고차원의 얼굴 데이터를 낮은 차원으로 표현할 수 있다는 장점이 있다. LDA(Linear Discriminant Analysis)는 서로 다른 데이터를 잘 분리할 수 있으며, 얼굴 인식에서 우수한 성능을 보인다. 본 연구에서는 서로의 장점을 결합하여 PCA와 LDA를 혼합, 적용하였다. 고차원의 얼굴데이터를 PCA로 차원 축소한 후 LDA를 이용해 더욱 효과적인 분류가 되어 얼굴 인식률을 향상시킨다. 인식 모듈로는 pRBFNN(Polynomial Based Radial Basis Function Neural Networks) 모델을 구축하여 고차원 패턴인식 문제에 대한 해결책을 제시하고자 한다. 그리고 제안된 패턴분류기는 얼굴 데이터를 사용하여 성능을 확인한다.

  • PDF

Asymmetric Semi-Supervised Boosting Scheme for Interactive Image Retrieval

  • Wu, Jun;Lu, Ming-Yu
    • ETRI Journal
    • /
    • 제32권5호
    • /
    • pp.766-773
    • /
    • 2010
  • Support vector machine (SVM) active learning plays a key role in the interactive content-based image retrieval (CBIR) community. However, the regular SVM active learning is challenged by what we call "the small example problem" and "the asymmetric distribution problem." This paper attempts to integrate the merits of semi-supervised learning, ensemble learning, and active learning into the interactive CBIR. Concretely, unlabeled images are exploited to facilitate boosting by helping augment the diversity among base SVM classifiers, and then the learned ensemble model is used to identify the most informative images for active learning. In particular, a bias-weighting mechanism is developed to guide the ensemble model to pay more attention on positive images than negative images. Experiments on 5000 Corel images show that the proposed method yields better retrieval performance by an amount of 0.16 in mean average precision compared to regular SVM active learning, which is more effective than some existing improved variants of SVM active learning.

Impact of Instance Selection on kNN-Based Text Categorization

  • Barigou, Fatiha
    • Journal of Information Processing Systems
    • /
    • 제14권2호
    • /
    • pp.418-434
    • /
    • 2018
  • With the increasing use of the Internet and electronic documents, automatic text categorization becomes imperative. Several machine learning algorithms have been proposed for text categorization. The k-nearest neighbor algorithm (kNN) is known to be one of the best state of the art classifiers when used for text categorization. However, kNN suffers from limitations such as high computation when classifying new instances. Instance selection techniques have emerged as highly competitive methods to improve kNN through data reduction. However previous works have evaluated those approaches only on structured datasets. In addition, their performance has not been examined over the text categorization domain where the dimensionality and size of the dataset is very high. Motivated by these observations, this paper investigates and analyzes the impact of instance selection on kNN-based text categorization in terms of various aspects such as classification accuracy, classification efficiency, and data reduction.

A Multi-Objective TRIBES/OC-SVM Approach for the Extraction of Areas of Interest from Satellite Images

  • Benhabib, Wafaa;Fizazi, Hadria
    • Journal of Information Processing Systems
    • /
    • 제13권2호
    • /
    • pp.321-339
    • /
    • 2017
  • In this work, we are interested in the extraction of areas of interest from satellite images by introducing a MO-TRIBES/OC-SVM approach. The One-Class Support Vector Machine (OC-SVM) is based on the estimation of a support that includes training data. It identifies areas of interest without including other classes from the scene. We propose generating optimal training data using the Multi-Objective TRIBES (MO-TRIBES) to improve the performances of the OC-SVM. The MO-TRIBES is a parameter-free optimization technique that manages the search space in tribes composed of agents. It makes different behavioral and structural adaptations to minimize the false positive and false negative rates of the OC-SVM. We have applied our proposed approach for the extraction of earthquakes and urban areas. The experimental results and comparisons with different state-of-the-art classifiers confirm the efficiency and the robustness of the proposed approach.

다층 퍼셉트론 신경망을 이용한 숫자 분류기 설계 방식 분석 및 비교 (Analysis and Comparison of Numeral Classifiers Based on the Multilayer Perceptron)

  • 김세송;김동욱;정승원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.951-952
    • /
    • 2017
  • 숫자 인식 분야는 인식 분야에서도 오래된 분야이며 다양한 방법이 제시되어 있는데, 그 중 다중 퍼셉트로 신경망을 이용한 숫자 분류기에 대한 비교 분석을 수행한다. 특히 복잡한 문제를 여러 개의 단순한 문제로 나누는 방식의, 각 숫자에 대한 독립적인 분류기를 설계하는 방식에 대하여 분석을 수행한다. 일반적인 하나의 분류기로 전체 숫자를 분류하는 방식과의 비교를 통하여 숫자 분류에는 각 숫자에 대한 독립적인 분류기를 이용하는 것이 적합하다는 사실을 실험적으로 확인하였다.

SVM과 온톨로지를 이용한 이미지 의미 관계 자동 추출 기법 (Automatic Extraction of Semantic Relationships from Images Using Ontologies and SVM Classifiers)

  • 정진우;주영도;이동호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.13-18
    • /
    • 2007
  • 효과적인 이미지 검색을 위하여, 이미지의 저수준 시각 정보로부터 고수준 의미 정보를 추출하는 기술에 관한 많은 연구가 이루어지고 있다. 특히 최근에는 Support Vector Machine과 같은 기계 학습 기법을 이용한 이미지 어노테이션 시스템의 개발이 활발히 진행중이이다. 그러나 기존의 연구들은 단편적인 이미지 정보만을 추출함에도 불구하고, 그 성능이 여전히 만족스럽지 못하다. 본 논문에서는 Support Vector Machine과 온톨로지를 이용하여 이미지의 다양한 정보를 효과적으로 추출 및 기술할 수 있는 시스템을 제안한다. 특히 온톨로지는 특정 도메인의 상세한 지식 표현과 추론을 위한 지식베이스로서, 본 논문에서는 Support Vector Machine을 이용하여 이미지 안에 존재하는 객체들의 컨셉을 판별하고 이미지 어노테이션 온톨로지와 생태계 온톨로지를 이용하여 공간 관계, 천적 관계와 같은 객체간 의미 관계를 자동적 자동적으로 추출하는 방법을 제안한다.

  • PDF

지역 기반 분류기의 앙상블 학습 (Ensemble Learning of Region Based Classifiers)

  • 최성하;이병우;양지훈;김선호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.267-270
    • /
    • 2007
  • 기계학습에서 분류기들의 집합으로 구성된 앙상블 분류기는 단일 분류기에 비해 정확도가 높다는 것이 입증되었다. 본 논문에서는 새로운 앙상블 학습으로서 데이터의 지역 기반 분류기들의 앙상블 학습을 제시하여 기존의 앙상블 학습과의 비교를 통해 성능을 검증하고자 한다. 지역 기반 분류기의 앙상블 학습은 데이터의 분포가 지역에 따라 다르다는 점에 착안하여 학습 데이터를 분할하고 해당하는 지역에 기반을 둔 분류기들을 만들어 나간다. 이렇게 만들어진 분류기들로부터 지역에 따라 가중치를 둔 투표를 하여 앙상블 방법을 이끌어낸다. 본 논문에서 제시한 앙상블 분류기의 성능평가를 위해 UCI Machine Learning Repository에 있는 11개의 데이터 셋을 이용하여 단일 분류기와 기존의 앙상블 분류기인 배깅과 부스팅등의 정확도를 비교하였다. 그 결과 기본 분류기로 나이브 베이즈와 SVM을 사용했을 때 새로운 앙상블 방법이 다른 방법보다 좋은 성능을 보이는 것을 알 수 있었다.

  • PDF