• 제목/요약/키워드: 분류기 선택

검색결과 341건 처리시간 0.025초

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

전진선택법에 의해 선택된 부분 상관관계의 유전자들을 이용한 암 분류 (Classifying Cancer Using Partially Correlated Genes Selected by Forward Selection Method)

  • 유시호;조성배
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.83-92
    • /
    • 2004
  • 유전 발현 데이터는 생명체의 특정 조직에서 채취한 샘플을 마이크로어레이상에서 측정한 것으로, 유전자들의 발현 정도가 수치로 나타난 데이터이다. 일반적으로 정상조직과 이상조직에서 관련 유전자들의 발현 정도는 차이를 보이기 때문에 유전 발현 데이터를 통하여 암을 분류할 수 있다. 그러나 분류에 모든 유전자가 관여하지는 않으므로 효율적인 암의 분류를 위해서는 관련성 있는 소수의 유전자만을 선별해내는 작업인 특징선택 방법이 필요하다. 본 논문에서는 회귀분석의 변수선택방법중 하나인 전진 선택법(forward selection method)을 사용하여 유전자들을 선하고 분류하는 방법을 제안한다. 이 방법은 선택되는 유전자들의 중복된 정보를 최소화시켜 암의 분류에 있어 보다 효과적인 유전자 선택을 한다. 실험데이터는 대장암 데이터(Colon cancer dataset)를 사용하였고, 분류기는 k-최근접 이웃(KNN)을 사용하였다. 이 방법과 상관계수를 이용한 특징 선택방법인 피어슨 상관계수와 스피어맨 상관계수방법과 비교해본 결과 전진 선택법에 의한 특징선택 방법이 암의 분류에 있어서 더 효과적인 유전자 선택을 한다는 사실을 확인하였다. 실험결과 90.3%의 높은 인식률을 보였다. 추가적으로 림프종 데이터에 대한 실험을 하였고, 그 결과 전진 선택법의 유용성을 확인할 수 있었다.

SVM 분류기를 통한 심실세동 검출 (SVM Classifier for the Detection of Ventricular Fibrillation)

  • 송미혜;이전;조성필;이경중
    • 전자공학회논문지SC
    • /
    • 제42권5호
    • /
    • pp.27-34
    • /
    • 2005
  • 심실세동은 심장의 무질서한 전기적 활동으로 인해 심근 수축이 동시에 이뤄지지 않게 되어 급성심장사에 이르게 하는 부정맥이다. 본 연구에서는 이러한 심실세동 검출을 위해 적은 양의 학습 데이터만으로 좋은 분류 성능을 보이는 SVM(Support Vector Machine) 분류기 기반의 심실세동 검출 알고리즘을 제안하였다. 심전도 신호로부터 SVM 분류기에 입력할 입력 특징을 추출하기 위하여 웨이브렛 변환기반의 대역통과 필터링, R점 검출, 입력 특징 추출구간 설정의 전처리 과정을 수행하였으며 입력 특징으로는 리듬 기반의 정보 및 웨이브렛 변환 계수를 선택하였다. SVM 다원분류기는 정상리듬(NSR) 분류기, 심실 세동과 유사한 심실빈맥(VT) 분류기, 심실세동(VF) 분류기 그리고 그 외 부정맥 분류기로 구성하였다. SVM 분류기의 파라미터 C값과 ${\alpha}$값은 실험을 통하여 최고 성능을 나타내는 C=10, ${\alpha}=1$을 선택하였다. SVM 다원 분류기를 통한 정상리듬, 심실빈맥 심실세동의 검출 평균값은 98.39%, 96.92%, 99.88%의 우수한 검출 성능을 나타냈다. 본 연구에서 제안된 동일 입력특징을 사용하여 SVM 분류기의 심실세동 검출 결과와 다층퍼셉트론 신경망 및 퍼지추론 방법에 의한 결과를 비교하였으며 SVM 분류기가 비슷하거나 우수한 결과를 보였다. 또한 기존 다른 알고리즘에 비하여도 우수한 결과를 보임으로써 제안된 입력 특징을 통한 SVM 분류기 기반의 심실세동 검출이 유용함을 확인할 수 있었다.

의미 기반 유전 알고리즘을 사용한 특징 선택 (Semantic-based Genetic Algorithm for Feature Selection)

  • 김정호;인주호;채수환
    • 인터넷정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.1-10
    • /
    • 2012
  • 본 논문은 문서 분류의 전처리 단계인 특징 선택을 위해 의미를 고려한 최적의 특징 선택 방법을 제안한다. 특징 선택은 불필요한 특징을 제거하고 분류에 필요한 특징을 추출하는 작업으로 분류 작업에서 매우 중요한 역할을 한다. 특징 선택 기법으로 특징의 의미를 파악하여 특징을 선택하는 LSA(Latent Semantic Analysis) 기법을 사용하지만 기본 LSA는 분류 작업에 특성화 된 기법이 아니므로 지도적 학습을 통해 분류에 적합하도록 개선된 지도적 LSA를 사용한다. 지도적 LSA를 통해 선택된 특징들로부터 최적화 기법인 유전 알고리즘을 사용하여 더 최적의 특징들을 추출한다. 마지막으로, 추출한 특징들로 분류할 문서를 표현하고 SVM (Support Vector Machine)을 이용한 특정 분류기를 사용하여 분류를 수행하였다. 지도적 LSA를 통해 의미를 고려하고 유전 알고리즘을 통해 최적의 특징 집합을 찾음으로써 높은 분류 성능과 효율성을 보일 것이라 가정하였다. 인터넷 뉴스 기사를 대상으로 분류 실험을 수행한 결과 적은 수의 특징들로 높은 분류 성능을 확인할 수 있었다.

합성곱 신경망을 이용한 주가방향 예측: 상관관계 속성선택 방법을 중심으로 (Stock Price Direction Prediction Using Convolutional Neural Network: Emphasis on Correlation Feature Selection)

  • 어균선;이건창
    • 경영정보학연구
    • /
    • 제22권4호
    • /
    • pp.21-39
    • /
    • 2020
  • 딥러닝(Deep learning) 기법은 패턴분석, 이미지분류 등 다양한 분야에서 높은 성과를 나타내고 있다. 특히, 주식시장 분석문제는 머신러닝 연구분야에서도 어려운 분야이므로 딥러닝이 많이 활용되는 영역이다. 본 연구에서는 패턴분석과 분류능력이 높은 딥러닝의 일종인 합성곱신경망(Convolutional Neural Network) 모델을 활용하여 주가방향 예측방법을 제안한다. 추가적으로 합성곱신경망 모델을 효율적으로 학습시키기 위한 속성선택(Feature Selection, FS)방법이 적용된다. 합성곱신경망 모델의 성과는 머신러닝 단일 분류기와 앙상블 분류기를 벤치마킹하여 객관적으로 검증된다. 본 연구에서 벤치마킹한 분류기는 로지스틱 회귀분석(Logistic Regression), 의사결정나무(Decision Tree), 인공신경망(Neural Network), 서포트 벡터머신(Support Vector Machine), 아다부스트(Adaboost), 배깅(Bagging), 랜덤포레스트(Random Forest)이다. 실증분석 결과, 속성선택을 적용한 합성곱신경망이 다른 벤치마킹 분류기보다 분류 성능이 상대적으로 높게 나타났다. 이러한 결과는 합성곱신경망 모델과 속성선택방법을 적용한 예측방법이 기업의 재무자료에 내포된 가치를 보다 정교하게 분석할 수 있는 가능성이 있음을 실증적으로 확인할 수 있었다.

베이지안 분류기를 이용한 신문기사 필터링 (A Study On Filtering of Newspaper Article by Using Bayesian Classifier)

  • 손기준;노태길;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.490-492
    • /
    • 2002
  • 본 논문에서는 필터링 문제를 이진 문서 분류 문제로 보고 신문기사 필터링에 베이지안 분류자를 사용한다. 신문 기사 필터링 문제에서 베이지안 분류자를 사용할 경우 학습 문서가 고정되어 있지 않기 때문에 여러 가지 파라미터를 사용하여 실험을 하였다. 실험 결과 베이지안 이진 분류기는 제한된 학습 문서에서 더 나은 성능을 보였고 해당 문서 집합에서 10%이상 비율의 문서를 사용자가 선택해야 함을 알 수 있었다.

  • PDF

저속 구름 베어링의 다중 결함 조기 검출 (Early Multiple Fault Identification of Low-Speed Rolling Element Bearings)

  • 강현준;정인규;강명수;김종면
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.749-752
    • /
    • 2014
  • 본 논문에서는 저속으로 동작하는 구름 베어링의 다중 결함 조기 검출을 위해 결함 특징 추출, 효과적인 특징 선택, 선택된 특징을 이용한 결함 분류의 세 단계로 구성된 결함 진단 기법을 제안한다. 1단계에서 이산 웨이블릿 변환을 이용하여 미세성분으로부터 통계적 결함 특징을 추출하고, DET(distance evaluation technique)를 이용하여 추출한 결함 특징 가운데 베어링 다중 결함 검출에 효과적인 특징을 선택한다. 마지막으로 선택된 특징을 k-NN(k-Nearest Neighbors) 분류기 입력으로 사용함으로써 결함을 진단한다. 본 논문에서는 제안한 결함 진단 기법의 성능을 분류 정확도 측면에서 평가한 결과 95.14%의 높은 분류 정확도를 보였다.

UT 신호형상 인식을 위한 Intelligence Package 개발과 Austenitic Stainless Steel Welding부 결함 분류에 관한 적용 연구 (Intelligence Package Development for UT Signal Pattern Recognition and Application to Classification of Defects in Austenitic Stainless Steel Weld)

  • 이강용;김준섭
    • 비파괴검사학회지
    • /
    • 제15권4호
    • /
    • pp.531-539
    • /
    • 1996
  • 본 연구에서는 초음파 신호형상인식법을 이용하여 용접부의 인공 결함을 분류하기 위한 연구를 실시하였다. 이를 위해 신호처리 및 특징 변수를 추출할 때에 많은 사용자 정의 변수를 가지는 신호 형상 인식 패키지를 개발하였으며 디지탈 신호처리, 특징 변수 추출, 특징 변수의 선택, 분류기 선정 등의 과정을 일괄적으로 처리하였다. 특히, 선형 분류기, 경험적 Bayesian 분류기 등의 통계적 분류기와 신경회로망 분류기를 함께 사용하여 비교, 검토하였다. 이에 관한 적용 연구로 노치와 구멍으로 이루어진 인공 결함을 분류하였다. 그 결과 인공결함 분류에서 높은 인식률을 얻었으며, 특히 적절히 학습 시켰을 경우 신경회로망 분류기가 통계적 분류기에 비하여 인식률 면에서 유리하였다.

  • PDF

적응형 신호 형상 인식 프로그램 개발과 AE법에 의한 용접부 결함 분류에 관한 적용 연구 (Development of Adaptive Signal Pattern Recognition Program and Application to Classification of Defects in Weld Zone by AE Method)

  • 이강용;임장묵;김준섭
    • 비파괴검사학회지
    • /
    • 제16권1호
    • /
    • pp.34-45
    • /
    • 1996
  • 음향 방출 신호의 수집 및 처리, 특징값 추출 및 선택, 분류기 설계 및 검증 과정 등을 수행할 수 있는 신호 형상 인식 프로그램을 개발하고, 이를 오스테나이트계 STS304 용접부의 인공 결함 분류 연구에 적용하였다. 특히 분류기로는 선형 함수 분류기, 경험적 Bayesian 분류기, 신경 회로망 분류기를 사용하였고, 센서는 광대역 센서와 공진형 센서를 사용하여 분류기간의 비교와 센서간의 차이점을 검토하였다. 그 결과 신경 회로망 분류기가 다른 분류기에 비해 높은 인식률을 주었고, 공진형 센서보다는 광대역 센서를 통해 받은 신호가 더 높은 인식률을 주었다.

  • PDF

영상인식을 위한 화질의 데이터 분류성 (Data Classification of Visual Quality for Image Recognition)

  • 조재현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.279-280
    • /
    • 2021
  • 패턴 또는 영상을 인식하기 위하여 먼저 기계 학습 모델을 선택하고, 선택된 모델은 여러 단계의 처리 단계 과정으로써, 학습 데이터 구성과 특징 추출 그리고 분류기 등으로 크게 나눌 수 있다. 기존의 학습 모델의 처리 단계 중 학습 데이터 구성은 첫 번째 중요한 단계이다. 본 논문에서는 학습 데이터들의 특징을 분석하여 데이터 분류성의 척도로 사용될 수 있는지를 검토하여 차후 기계 학습 및 딥 러닝의 인식을 높이고자 한다.

  • PDF