Rough Set Analysis for Stock Market Timing

러프집합분석을 이용한 매매시점 결정

  • 허진영 ((주)네오아이즈) ;
  • 김경재 (동국대학교_서울 경영정보학과) ;
  • 한인구 (한국과학기술원 경영대학)
  • Received : 2010.06.15
  • Accepted : 2010.07.21
  • Published : 2010.09.30

Abstract

Market timing is an investment strategy which is used for obtaining excessive return from financial market. In general, detection of market timing means determining when to buy and sell to get excess return from trading. In many market timing systems, trading rules have been used as an engine to generate signals for trade. On the other hand, some researchers proposed the rough set analysis as a proper tool for market timing because it does not generate a signal for trade when the pattern of the market is uncertain by using the control function. The data for the rough set analysis should be discretized of numeric value because the rough set only accepts categorical data for analysis. Discretization searches for proper "cuts" for numeric data that determine intervals. All values that lie within each interval are transformed into same value. In general, there are four methods for data discretization in rough set analysis including equal frequency scaling, expert's knowledge-based discretization, minimum entropy scaling, and na$\ddot{i}$ve and Boolean reasoning-based discretization. Equal frequency scaling fixes a number of intervals and examines the histogram of each variable, then determines cuts so that approximately the same number of samples fall into each of the intervals. Expert's knowledge-based discretization determines cuts according to knowledge of domain experts through literature review or interview with experts. Minimum entropy scaling implements the algorithm based on recursively partitioning the value set of each variable so that a local measure of entropy is optimized. Na$\ddot{i}$ve and Booleanreasoning-based discretization searches categorical values by using Na$\ddot{i}$ve scaling the data, then finds the optimized dicretization thresholds through Boolean reasoning. Although the rough set analysis is promising for market timing, there is little research on the impact of the various data discretization methods on performance from trading using the rough set analysis. In this study, we compare stock market timing models using rough set analysis with various data discretization methods. The research data used in this study are the KOSPI 200 from May 1996 to October 1998. KOSPI 200 is the underlying index of the KOSPI 200 futures which is the first derivative instrument in the Korean stock market. The KOSPI 200 is a market value weighted index which consists of 200 stocks selected by criteria on liquidity and their status in corresponding industry including manufacturing, construction, communication, electricity and gas, distribution and services, and financing. The total number of samples is 660 trading days. In addition, this study uses popular technical indicators as independent variables. The experimental results show that the most profitable method for the training sample is the na$\ddot{i}$ve and Boolean reasoning but the expert's knowledge-based discretization is the most profitable method for the validation sample. In addition, the expert's knowledge-based discretization produced robust performance for both of training and validation sample. We also compared rough set analysis and decision tree. This study experimented C4.5 for the comparison purpose. The results show that rough set analysis with expert's knowledge-based discretization produced more profitable rules than C4.5.

매매시점결정은 금융시장에서 초과수익을 얻기 위해 사용되는 투자전략이다. 일반적으로, 매매시점 결정은 거래를 통한 초과수익을 얻기 위해 언제 매매할 것인지를 결정하는 것을 의미한다. 몇몇 연구자들은 러프집합분석이 매매시점결정에 적합한 도구라고 주장하였는데, 그 이유는 이 분석방법이 통제함수를 이용하여 시장의 패턴이 불확실할 때에는 거래를 위한 신호를 생성하지 않는다는 점 때문이었다. 러프집합은 분석을 위해 범주형 데이터만을 이용하므로, 분석에 사용되는 데이터는 연속형의 수치값을 이산화하여야 한다. 이산화란 연속형 수치값의 범주화 구간을 결정하기 위한 적절한 "경계값"을 찾는 것이다. 각각의 구간 내에서의 모든 값은 같은 값으로 변환된다. 일반적으로, 러프집합 분석에서의 데이터 이산화 방법은 등분위 이산화, 전문가 지식에 의한 이산화, 최소 엔트로피 기준 이산화, Na$\ddot{i}$ve and Boolean reasoning 이산화 등의 네 가지로 구분된다. 등분위 이산화는 구간의 수를 고정하고 각 변수의 히스토그램을 확인한 후, 각각의 구간에 같은 숫자의 표본이 배정되도록 경계값을 결정한다. 전문가 지식에 의한 이산화는 전문가와의 인터뷰 또는 선행연구 조사를 통해 얻어진 해당 분야 전문가의 지식에 따라 경계값을 정한다. 최소 엔트로피 기준 이산화는 각 범주의 엔트로피 측정값이 최적화 되도록 각 변수의 값을 재귀분할 하는 방식으로 알고리즘을 진행한다. Na$\ddot{i}$ve and Boolean reasoning 이산화는 Na$\ddot{i}$ve scaling 후에 그로 인해 분할된 범주값을 Boolean reasoning 방법으로 종속변수 값에 대해 최적화된 이산화 경계값을 구하는 방법이다. 비록 러프집합분석이 매매시점결정에 유망할 것으로 판단되지만, 러프집합분석을 이용한 거래를 통한 성과에 미치는 여러 이산화 방법의 효과에 대한 연구는 거의 이루어지지 않았다. 본 연구에서는 러프집합분석을 이용한 주식시장 매매시점결정 모형을 구성함에 있어서 다양한 이산화 방법론을 비교할 것이다. 연구에 사용된 데이터는 1996년 5월부터 1998년 10월까지의 KOSPI 200데이터이다. KOSPI 200은 한국 주식시장에서 최초의 파생상품인 KOSPI 200 선물의 기저 지수이다. KOSPI 200은 제조업, 건설업, 통신업, 전기와 가스업, 유통과 서비스업, 금융업 등에서 유동성과 해당 산업 내의 위상 등을 기준으로 선택된 200개 주식으로 구성된 시장가치 가중지수이다. 표본의 총 개수는 660거래일이다. 또한, 본 연구에서는 유명한 기술적 지표를 독립변수로 사용한다. 실험 결과, 학습용 표본에서는 Na$\ddot{i}$ve and Boolean reasoning 이산화 방법이 가장 수익성이 높았으나, 검증용 표본에서는 전문가 지식에 의한 이산화가 가장 수익성이 높은 방법이었다. 또한, 전문가 지식에 의한 이산화가 학습용과 검증용 데이터 모두에서 안정적인 성과를 나타내었다. 본 연구에서는 러프집합분석과 의사결정 나무분석의 비교도 수행하였으며, 의사결정나무분석은 C4.5를 이용하였다. 실험결과, 전문가 지식에 의한 이산화를 이용한 러프집합분석이 C4.5보다 수익성이 높은 매매규칙을 생성하는 것으로 나타났다.

Keywords

References

  1. 김창연, 안병석, 조성식, 김성희, 도산예측을 위한 러프집합 이론과 인공신경망 통합방법론, 경영정보학연구, 9권 4호(1999), 23-40.
  2. 박기남, 이훈영, 박상국, 러프집합을 이용한 통합형 채권등급 평가모형 구축에 관한 연구, 한국경영과학회지, 20권 3호(2000), 125-135.
  3. 장재건, 정용만, 연광제, 전준우, 신동현, 김현태, 기술적 분석지표를 이용한 선물투자기법, 도서출판 진리탐구, 1996.
  4. 정석훈, 서용무, Rough Set 기법을 이용한 신용카드 연체자 분류, Entrue Journal of Information Systems, 7권 1호(2008), 141-150.
  5. Achelis, S. B., Technical analysis from A to Z. Chicago : Probus Publishing, (1995).
  6. Ahn, B. S., Cho. S. S. and Kim. C. Y., The integrated methodology of rough set theory and artificial neural network for business failure prediction., Expert Systems with Applications, Vol.18, No.2(2000), 65-74. https://doi.org/10.1016/S0957-4174(99)00053-6
  7. Dimitras, A. I., Slowinski. R., Susmaga. R. and Zopounidis. C., Business failure prediction using rough sets, European Journal of Operational Research, Vol.114, No.2(1999), 263-280. https://doi.org/10.1016/S0377-2217(98)00255-0
  8. Edwards, R. D. and Magee. J., Technical analysis of stock trends, Chicago, Illinois : John Magee (1997).
  9. Grzymala-Busse, J. W., LERS-s system for learning from examples based on rough sets. In R. Slowinski (Ed.), Intelligent Decision Support. Handbook of Applications and Advances of the Rough Sets Theory(3-18), Kluwer Academic Publisher(1992).
  10. Hashemi, R. R., Le Blanc., L. A., Rucks. C. T. and Rajaratnam. A., A hybrid intelligent system for predicting bank holding structures. European Journal of Operational Research, Vol.109, No.2(1998), 390-402. https://doi.org/10.1016/S0377-2217(98)00065-4
  11. Henriksson, R. D. and Merton. R. C. On market timing and investment performance II : Statistical procedures for evaluating forecasting skill, Journal of Business, Vol.54(1981), 513-533. https://doi.org/10.1086/296144
  12. Kim, K. and Han. I. The extraction of trading rules from stock market data using rough sets, Expert Systems, Vol.18, No.4(2001), 194-202. https://doi.org/10.1111/1468-0394.00174
  13. Merton, R. C. On market timing and investment performance I : An equilibrium theory of value for market forecasts. Journal of Business, Vol.54(1981), 363-406. https://doi.org/10.1086/296137
  14. Murphy, J. J., Technical analysis of the futures markets : A comprehensive guide to trading methods and applications, New York : Prentice- Hall(1986).
  15. Nguyen, H. S. and Skowron. A. Quantization of real-valued attributes, In Proc. Second International Joint Conference on Information Sciences, Wrightsville Beach, NC, (1995), 34-37.
  16. Pawlak, Z., Rough sets, International Journal of Information and Computer Sciences, Vol.11 (1982), 341-356. https://doi.org/10.1007/BF01001956
  17. Pawlak, Z., Rough set approach to knowledge-based decision support. European Journal of Operational Research, Vol.99(1997), 48-57. https://doi.org/10.1016/S0377-2217(96)00382-7
  18. Quinlan, J. R., C4.5 : Programs for Machine Learning, Morgan Kaufmann Publishers, (1993).
  19. Ruggiero, M. A., Cybernetics trading strategies : Developing profitable trading systems with state-of-the-art technologies, New York : John Wiley and Sons, (1997).
  20. Skowron, A., Boolean reasoning for decision rules generation. In J. Komorowski. and Z. W. Ras. (Eds.), Methodologies for Intelligent Systems, Lecture Notes in Artificial Intelligence(1993), 295-305.
  21. Slowinski, R. and Stefanowski. J., Rough classification with valued closeness relation. In E. Diaday et al. (Eds.), New Approaches in Classification and Data Analysis(1994), 482-488.
  22. Slowinski, R. and Zopounidis. C., Application of the rough set approach to evaluation of bankruptcy risk, International Journal of Intelligent Systems in Accounting, Finance and Management, Vol.4, No.1(1995), 27-41.
  23. Slowinski, R., Zopounidis. C. and Dimitras. A. I., Prediction of company acquisition in Greeceby means of the rough set approach. European Journal of Operational Research, Vol.100, No.1(1997), 1-15. https://doi.org/10.1016/S0377-2217(96)00110-5
  24. Tay, F. E. H. and Shen. L., Economic and financial prediction using rough sets model, European Journal of Operational Research, Vol.141, No.3(2002). 641-659. https://doi.org/10.1016/S0377-2217(01)00259-4
  25. Waksman, G., Sandler. M., Ward. M. and Firer. C., Market timing on the Johannesburg stock exchange using derivative instruments, Omega, Vol.25, No.1(1997), 81-91. https://doi.org/10.1016/S0305-0483(96)00044-8
  26. Yeh, C. C., Chi. D. J. and Hsu. M. F., A hybrid approach of DEA, rough set and support vector machines for business failure prediction, Expert Systems with Applications, Vol. 37(2010), 1535-1541. https://doi.org/10.1016/j.eswa.2009.06.088