• 제목/요약/키워드: 분류기 알고리즘

검색결과 596건 처리시간 0.026초

기계학습 알고리즘에 기반한 뇌파 데이터의 감정분류 및 정확도 향상에 관한 연구 (A research on the emotion classification and precision improvement of EEG(Electroencephalogram) data using machine learning algorithm)

  • 이현주;신동일;신동규
    • 인터넷정보학회논문지
    • /
    • 제20권5호
    • /
    • pp.27-36
    • /
    • 2019
  • 본 연구에서는 공개된 뇌파 데이터인 DEAP(A Database for Emotion Analysis using Physiological Signals) 데이터 세트를 활용한 감정분류 분석 및 정확도 향상에 대한 실험을 진행하였다. 실험에는 32명에 대한 32개의 뇌파측정 채널 데이터가 모두 사용되었다. 전처리과정에서는 뇌파 데이터에 대한 256Hz 샘플링작업을 진행하였고, 유한 임펄스 응답 필터를 사용하여 주파수 대역별로 쎄타(4-8Hz), 슬로 알파(8-10Hz), 알파(8-12Hz), 베타(12-30Hz), 감마(31-45Hz) 파형에 대한 데이터를 추출하였다. 추출한 데이터는 시간-주파수 변형을 통하여 데이터의 상태를 구분한 후에, 독립성분분석방법을 통해 잡음(Artifact)을 제거하여 데이터를 정제했다. 도출된 데이터는 분류기 기계학습 알고리즘 실험을 시행할 수 있도록 CSV 파일로 변형 하였으며, 감정분류에는 Arousal-Valence 평면을 사용하였다. 감정은 "긍정적(Positive)", "부정적(Negative)" 이외에 평온한 상태로 존재하는 "중립적(Neutral)"의 3가지 상태로 분류하였다. 정확도를 개선하기 위해서 랜덤 포레스트(Random Forest) 알고리즘에 속성 선택적 분류기(Attribute Selected Classifier: ASC) 방식에 의해 선택된 속성을 적용하여 실험하였다. 정확도는 "각성(Arousal)" 부분에서 Koelstra의 결과보다 "32.48%" 높은 결과가 도출되었고, Liu의 실험의 "정서가(Valence)"와 비교해보면 ASC(Random Forest) 결과가 "8.13%" 더 높은 결과를 도출하였다. 정확도를 개선하기 위해 ASC 방식을 적용한 랜덤 포레스트 분류기 실험결과에서는 전체평균을 기준으로 기존 연구 결과와 대비하여 "2.68%" 높은 정확도가 도출되었다.

비선형 반복 패턴과 스펙트럼 분석을 이용한 집중-비집중 분류기의 성능 평가 (Performance Evaluation of Attention-inattetion Classifiers using Non-linear Recurrence Pattern and Spectrum Analysis)

  • 이지은;유선국;이병채
    • 감성과학
    • /
    • 제16권3호
    • /
    • pp.409-416
    • /
    • 2013
  • 집중은 관련된 사건을 선택적으로 주의하고, 관련 없는 사건을 무시하는 인간의 중요한 인지 기능중의 하나이다. 인간의 집중 능력을 관리 이용하는 컴퓨터 기반 장치에 있어서 집중과 비집중 상태를 구분하는 것은 필수적으로 요구되는 조건이다. 본 논문에서는, 뇌파신호로부터 분류기의 입력으로 사용되는 특징을 효율적으로 추출하기 위하여 비선형 반복 패턴 분석기법과 스펙트럼 분석 기법을 새로이 결합하였고(13개 특징 추출), 서포트벡터머신, 역전파 알고리즘, 선형분리, 로지스틱 회귀 분류 기반 분류기들을 포함하는 집중-비집중 분류기들의 성능을 분석하였다. 그중에서 81 %의 정확도를 보이는 서포트벡터머신 분류기가 가장 좋은 성능을 보였다. 또한 스펙트럼 분석으로 추출한 특징만을 사용하였을 경우(76 % 정확도)가 비선형 분석 방법으로 추출한 특징만을 사용했을 경우(67 % 정확도)보다 좀 더 우수한 성능을 보였다. 비선형-스펙트럼 분석법을 복합 적용한 서포트벡터머신 분류기가 추후 집중 관련 장비 설계에 있어서 효율적으로 적용될 수 있을 것이다.

  • PDF

오류 데이타에 강한 자질 투영법 기반의 문서 범주화 기법 (Text Classification based on a Feature Projection Technique with Robustness from Noisy Data)

  • 고영중;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.498-504
    • /
    • 2004
  • 본 논문은 자질 투영법을 사용한 새로운 문서 분류기를 제안한다. 제안된 문서 분류기는 학습 문서를 각 자질로의 투영으로써 표현한다. 문서를 위한 분류 작업은 투영된 각 자질로부터의 투표(voting)에 기인한다. 실험을 통해서 본 제안된 문서 분류기는 단순한 구조에도 불구하고 높은 성능을 보이고 있으며, 특히 기존의 문서 범주화 기법에서 높은 성능을 보여왔던 최근린법(k-NN)과 지지백터기계(SVM)와 비교했을 때 빠른 수행 속도와 오류 데이타가 많을 환경에서 높은 성능을 보인다는 장점이 있다. 또한 제안된 문서 분류기의 알고리즘이 매우 단순하기 때문에 분류기의 구현과 학습 과정이 쉽게 수행될 수 있다. 이러한 이유로 제안된 문서 분류기는 빠른 수행 속도와 견고성(robustness), 그리고 높은 성능을 요구하는 은서 범주화 응용 영역에 유용하게 사용될 수 있을 것이다.

문서분류에서 SVD(Singular Value Decompotion)기법에 기초한 효율적인 특징 선택방법 연구 (An Efficient Selection Method for Document Classification Based On Singular Value Decompostion)

  • 리청화;변동률;박순철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.321-322
    • /
    • 2009
  • 본 논문에서는 문서분류를 위하여 SVD(Singular Value Decomposition)을 이용한 효율적인 특징 선택 방법을 제안한다. 분류기 알고리즘은 문서를 효과적으로 분류할 수 있지만 분류기에 입력되는 특징공간이 너무 크다는 단점이 있다. SVD를 이용하면 입력 데이터의 차원을 줄여줄 수 있으며 문서와 문서 사이의 관계성을 내포하는 벡터공간을 만들 수 있다. 따라서 SVD를 이용하면 문서분류의 시간과 효율을 동시에 증가시킬 수 있다. 본 논문에서는 실험을 통하여 SVD을 이용한 문서분류 시스템이 입력데이터에 대한 차원을 감소시키면서 훌륭한 분류 결과를 얻을 수 있음을 보여준다.

미분진화 기반의 초단기 호우예측을 위한 특징 선택 (Feature Selection to Predict Very Short-term Heavy Rainfall Based on Differential Evolution)

  • 서재현;이용희;김용혁
    • 한국지능시스템학회논문지
    • /
    • 제22권6호
    • /
    • pp.706-714
    • /
    • 2012
  • 본 논문에서는 대한민국의 국립기상연구소에서 제공한 최근 4년간의 데이터를 훈련 데이터, 검증 데이터 및 테스트 데이터로 나누어 초단기 호우 예측을 하고자 한다. 우리는 데이터 셋을 훈련 데이터, 검증 데이터와 테스트 데이터 세 부분으로 나눴다. 데이터의 차원이 커짐에 따라 해 공간의 크기가 지수적으로 증가하여 실험의 속도가 현저히 떨어지는 문제를 피하기 위하여 72개의 특징들 중에서 주요한 특징들만을 선택하게 되었다. 예측의 정확도를 높이기 위해 미분진화 알고리즘을 사용하였고, 진화연산의 적합도 함수로 두 개의 분류기를 선택하였는데, 일반적으로 우수한 성능을 보이는 서포트 벡터 머신(SVM)과 분류 속도가 빠른 최근린법(k-NN)을 사용하였다. 또한, 실험에 사용할 데이터 가공을 위해 언더샘플링과 정규화를 하였다. 진화연산의 적합도 함수로 SVM 분류기를 사용하였을 때 실험 결과가 대체로 우수하였는데, 미분진화 알고리즘 실험은 모든 특징을 선택한 실험보다 약 5 배 정도 우수한 성능을 보였고, 유전 알고리즘을 사용한 실험보다 약 1.36 배 정도 더 우수한 성능을 보였다. 실험 속도 면에서는 미분진화 알고리즘을 사용한 실험이 유전 알고리즘을 사용한 실험보다 약 20배 이상 실험 시간이 단축되었다.

의미 기반 유전 알고리즘을 사용한 특징 선택 (Semantic-based Genetic Algorithm for Feature Selection)

  • 김정호;인주호;채수환
    • 인터넷정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.1-10
    • /
    • 2012
  • 본 논문은 문서 분류의 전처리 단계인 특징 선택을 위해 의미를 고려한 최적의 특징 선택 방법을 제안한다. 특징 선택은 불필요한 특징을 제거하고 분류에 필요한 특징을 추출하는 작업으로 분류 작업에서 매우 중요한 역할을 한다. 특징 선택 기법으로 특징의 의미를 파악하여 특징을 선택하는 LSA(Latent Semantic Analysis) 기법을 사용하지만 기본 LSA는 분류 작업에 특성화 된 기법이 아니므로 지도적 학습을 통해 분류에 적합하도록 개선된 지도적 LSA를 사용한다. 지도적 LSA를 통해 선택된 특징들로부터 최적화 기법인 유전 알고리즘을 사용하여 더 최적의 특징들을 추출한다. 마지막으로, 추출한 특징들로 분류할 문서를 표현하고 SVM (Support Vector Machine)을 이용한 특정 분류기를 사용하여 분류를 수행하였다. 지도적 LSA를 통해 의미를 고려하고 유전 알고리즘을 통해 최적의 특징 집합을 찾음으로써 높은 분류 성능과 효율성을 보일 것이라 가정하였다. 인터넷 뉴스 기사를 대상으로 분류 실험을 수행한 결과 적은 수의 특징들로 높은 분류 성능을 확인할 수 있었다.

홍수 예.경보시스템 개선을 위한 인공신경망 이론의 적용 (Application of Artificial Neural Networks Technique for the Improvement of Flood Forecasting and Warning System)

  • 박성천;김용구;정천리;진영훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1265-1271
    • /
    • 2009
  • 본 연구에서는 강우의 시 공간적 분포의 불규칙한 변동성을 고려한 강우-유출예측모형을 위해 인공신경망(Artificial Neural Networks: ANNs)의 기법의 일종인 자기조직화(Self Organizing Map: SOM) 이론과 역전파 학습 알고리즘(Back Propagation Algorithm: BPA) 이론을 복합적으로 이용하였다. 기존의 인공신경망 연구에서 야기된 저 갈수기의 유출량에 대한 과대평가, 홍수기의 유출량에 대한 과소평가, 예측값이 연속적으로 선행 유출량을 나타내는 Persistence 현상을 해결하기 위하여 패턴분류 성능을 지닌 SOM 이론을 예측모형의 전처리 과정으로 이용하였다. 먼저, 본 연구에서 제안한 방법은 SOM에 의해 강우-유출 관계를 분류하고, SOM에 의한 분류에 따라 각각의 모형을 구성한다. 개별적으로 구축된 모형은 유출량의 예측을 위해 각각의 양상에 따라 분류된 자료를 이용한다. 결과적으로 본 연구에서 제안한 방법은 과거의 인공신경망의 일반적인 적용에 의한 결과보다 더 나은 예측능력을 보여주었으며, 더불어 유출량의 과소 및 과대추정과 Persistence 현상과 같은 문제점이 나타나지 않았다. 또한 강우량 및 유출량의 범위에 제한을 받지 않는 강우-유출예측 모형의 개발 및 홍수기로부터 갈수기까지의 보다 넓은 범위의 유출량의 예측에 기여할 것으로 기대된다.

  • PDF

Expectation Maximization (EM)과 Least Mean Square(LMS) algorithm을 이용하여 초음파 비파괴검사 신호의 분류를 하기 위한 새로운 접근법 (A novel approach to the classification of ultrasonic NDE signals using the Expectation Maximization(EM) and Least Mean Square(LMS) algorithms)

  • Daewon Kim
    • 융합신호처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.15-26
    • /
    • 2003
  • 초음파 검사 방법은 여러 가지 물질들의 흠집이나 틈새, 그리고 티끌 등을 감지해내는데 널리 쓰이고 있다. 그 중 초음파 신호를 분석하는 절차는 전체의 신호처리 과정에서 아주 중요한 역할을 담당하고 있다. 많은 초음파 신호처리와 신호분류의 방법들이 제기 되었는데 그 중 가장 널리 쓰이는 방법은 신호들의 특징 공간상에서 그 특정의 성분들을 추출해내고 그 후 신경망 네트웍을 통한 분류 방법을 이용하여 초음파 신호들을 구별해 내는 방법이다. 이 논문은 기존의 신호 분류 체계와는 다른 대체 신호 분류법을 제시하고 있는데 이것은 최소 평균 제곱 (LMS) 알고리즘을 이용하여 핵 전력 발전소에서 쓰이는 증기 발생기 튜브로부터 감지되어진 초음파 비파괴 검사 신호 (ultrasonic nondestructive evaluation signal) 을 분류해내는데 쓰일 수가 있다 이 초음파 비파괴 검사 신호는 튜브내의 흠집이나 틈새로부터 감지되어진 신호일수도 있고 또는 튜브내의 침전물에 의해서 발생된 신호일 수도 있는데 이 두가지 신호는 매우 유사하기 때문에 반드시 분류를 해내어 침전물에 의한 신호일 경우는 무방하지만 흠집이나 갈라진 틈새에서 나오는 신호일 경우는 더 이상의 오염이나 사고 등을 방지하기 위해 수리 또는 교체 등의 후속 조치로 이어져야 한다. 이러한 절차를 밟기 위하여 증기 발생기 튜브의 내부에서의 초음파 센서로부터 증기 발생기 튜브 사이의 거리를 측정하는데 모델링 기법에 기반한 deconvolution 방법이 제시되었고 여기서 나온 결과가 정리, 분석되었다 이 방법은 space alternating generalized expectation maximization (SAGE) 알고리즘을 이차원 미분 파라미터인 Hessian의 사용으로 인하여 수렴 속도가 빠른 Newton-Raphson 알고리즘과 함께 병행 사용하여 초음파 신호의 초점 도달 시간과 그 크기를 측정하여 초점 도달 거리에 따라 두 종류의 신호를 분류, 차별화 하는 기법이다. 이 알고리즘을 이용한 접근법으로 얻어진 결과가 흠집이나 틈새로부터 나온 신호일 경우와 퇴적물에 의해 나온 신호일 경우로 정리, 분류되었고 적절한 분류 효과를 보인 결과가 이 논문에 제시되었다.

  • PDF

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

차분진화 알고리즘을 이용한 Nearest Prototype Classifier 설계 (Design of Nearest Prototype Classifier by using Differential Evolutionary Algorithm)

  • 노석범;안태천
    • 한국지능시스템학회논문지
    • /
    • 제21권4호
    • /
    • pp.487-492
    • /
    • 2011
  • 본 논문에서는 가장 단순한 구조를 가진 Nearest Prototype Classifier의 성능 개선을 위해 차분 진화 알고리즘을 적용하여 prototype의 위치를 결정하는 방법을 제안하였다. 차분 진화 알고리즘을 이용하여 prototype의 위치 벡터가 결정이 되며, 차분 진화 알고리즘에 의해 결정된 prototype의 class label을 결정하기 위한 class label 결정 알고리즘도 제안하였다. 제안된 알고리즘의 성능 평가를 위해 기존의 패턴 분류기와 비교 결과를 보인다.