• 제목/요약/키워드: 다항판별지수

검색결과 3건 처리시간 0.016초

다항판별지수와 검정통계량 제안 (Proposition of polytomous discrimination index and test statistics)

  • 최진수;홍종선
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권2호
    • /
    • pp.337-351
    • /
    • 2016
  • 현실세계의 예측 문제에서 세 범주 이상의 결과로 예측되는 경우가 많다. 이러한 경우에 대한 기존의 문헌연구에서는 부합성을 짝 접근방법으로 활용한 통계량은 범주의 뚜렷한 구분 없이 표현되었다. 최근 새롭게 표현한 평가자료와 이를 바탕으로 부합성을 재표현하여 통계량들을 새롭게 정의함으로써 직관적으로 의미 파악이 가능해졌지만 통계량들의 판단기준이 구체적이지 않은 문제점을 갖고 있다. 또한 이 통계량들은 가능한 부합성의 짝으로 구성되었지만 실제범주들간에서 예측범주들의 부합성을 추가적으로 고려할 수 있기에 이를 포함한 두 가지 통계량을 제안하였다. 제안한 통계량은 선택된 두 범주로부터 모든 가능한 경우들 사이를 판별하는 장점이 있다. 본 연구에서 제안한 두 가지 통계량은 지시함수로 표현되므로 비모수적 통계량으로 변환할 수 있다. 그러므로 부합성 통계량을 가설검정 방법으로 사용할 수 있음을 제안한다.

부합성을 이용한 표준화된 다항판별지수 (Standardized polytomous discrimination index using concordance)

  • 최진수;홍종선
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권1호
    • /
    • pp.33-44
    • /
    • 2016
  • 의학진단과 신용평가 등에서 삼항 이상 다항 범주의 결과로 예측되는 경우가 많다. 다항 범주의 문제에 대하여 부합성 (concordance)을 이용한 다섯 종류의 통계량이 제안되고 사용되었다. 그러나 이러한 통계량들은 범주의 뚜렷한 구분없이 표현되어 짝 (pairwise) 접근방법과 집단 (set) 접근방법을 사용하기 어렵고, 이 통계량들의 의미를 명확하게 파악할 수 없다. 따라서 통계량들의 비교분석이 가능하지 않았다. 본 연구에서는 평가자료를 새롭게 표현하고, 이를 바탕으로 부합성을 재표현한다. 이 부합성을 이용하여 기존의 통계량들을 새롭게 정의한다. 본 연구에서 제안한 방법으로 다섯 가지 통계량들의 의미를 설명할 수 있으며 비교 분석이 가능하다. 다양한 자료를 생성하여 분석하여 이 통계량들의 특징을 탐색할 수 있으며 설명할 수 있다.

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.