• 제목/요약/키워드: Stock Index Prediction

검색결과 96건 처리시간 0.023초

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.

절대 유사 임계값 기반 사례기반추론과 유전자 알고리즘을 활용한 시스템 트레이딩 (System Trading using Case-based Reasoning based on Absolute Similarity Threshold and Genetic Algorithm)

  • 한현웅;안현철
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제26권3호
    • /
    • pp.63-90
    • /
    • 2017
  • Purpose This study proposes a novel system trading model using case-based reasoning (CBR) based on absolute similarity threshold. The proposed model is designed to optimize the absolute similarity threshold, feature selection, and instance selection of CBR by using genetic algorithm (GA). With these mechanisms, it enables us to yield higher returns from stock market trading. Design/Methodology/Approach The proposed CBR model uses the absolute similarity threshold varying from 0 to 1, which serves as a criterion for selecting appropriate neighbors in the nearest neighbor (NN) algorithm. Since it determines the nearest neighbors on an absolute basis, it fails to select the appropriate neighbors from time to time. In system trading, it is interpreted as the signal of 'hold'. That is, the system trading model proposed in this study makes trading decisions such as 'buy' or 'sell' only if the model produces a clear signal for stock market prediction. Also, in order to improve the prediction accuracy and the rate of return, the proposed model adopts optimal feature selection and instance selection, which are known to be very effective in enhancing the performance of CBR. To validate the usefulness of the proposed model, we applied it to the index trading of KOSPI200 from 2009 to 2016. Findings Experimental results showed that the proposed model with optimal feature or instance selection could yield higher returns compared to the benchmark as well as the various comparison models (including logistic regression, multiple discriminant analysis, artificial neural network, support vector machine, and traditional CBR). In particular, the proposed model with optimal instance selection showed the best rate of return among all the models. This implies that the application of CBR with the absolute similarity threshold as well as the optimal instance selection may be effective in system trading from the perspective of returns.

변동성 돌파 전략을 사용한 S&P 500 지수의 자동 거래와 매수 및 보유 비교 연구 (Comparative Study of Automatic Trading and Buy-and-Hold in the S&P 500 Index Using a Volatility Breakout Strategy)

  • 홍성혁
    • 사물인터넷융복합논문지
    • /
    • 제9권6호
    • /
    • pp.57-62
    • /
    • 2023
  • 본 연구는 미국 S&P 500 지수를 변동성 돌파 전략을 활용하여 Buy and Hold 방식과 비교 분석한 연구이다. 변동성 돌파 전략은 시장의 상대적 안정 또는 집중된 시기 후의 가격 움직임을 활용하는 거래 전략이다. 특히, 낮은 변동성 기간 후에 큰 가격 움직임이 더 자주 발생한다는 것이 관찰된다. 주식이 한동안 좁은 가격 범위에서 움직이다가 가격이 갑작스레 상승 또는 하락하는 경우, 그 주식이 해당 방향으로 계속 움직일 것으로 예상된다. 이러한 움직임을 활용하기 위해 거래자들은 변동성 돌파 전략을 채택한다. 'k' 값은 최근 시장 변동성의 측정값에 곱하는 배수로서 활용된다. 변동성의 측정 방법 중 하나로는 최근 거래일의 최고가와 최저가 차이를 나타내는 평균 진정 범위(ATR)가 있다. 'k' 값은 거래자들이 거래 임계값을 설정하는 데 중요한 역할을 한다. 본 연구는 'k' 값을 일반적인 값으로 연산하여 Buy and Hold 전략과 수익률을 비교 하여, 변동성 돌파전략을 사용한 알고리즘 트레이딩이 약간은 높은 수익률을 이룩하였다. 추후에는 인공 지능 딥러닝 기법을 이용하여 S&P 500 지수의 자동 거래를 위한 최적의 K 값을 구하고, 이를 통해 수익률을 극대화하기 위한 시뮬레이션 결과를 제시할 예정이다.

시계열 자료 코스피200의 패턴분류를 위한 퍼지 서포트 벡타 기계 (Fuzzy Support Vector Machine for Pattern Classification of Time Series Data of KOSPI200 Index)

  • 이수용;손소영;김철응;이일병
    • 한국지능시스템학회논문지
    • /
    • 제14권1호
    • /
    • pp.52-56
    • /
    • 2004
  • 주식시장에서 KOSPI200지수의 상승 또는 하락으로 분류 및 예측하는 정보는 선물 및 옵션시장에서 포토폴리오를 설계할 때 의사결정을 위해 중요한 기준이 된다. 경제지표인 시계열 패턴들의 향후 추세는 가장 최근의 경제패턴에 매우 종속적이기 때문에 최근의 패턴들을 가장 우선적으로 학습해야 할 필요가 있다. 본 논문에서는 시계열분석, 신경회로망, 그리고 다양한 분야에서 각광을 받고 있는 SVM(Support Vector Machine)과 Fuzzy SVM 모형의 분류 및 예측성능을 비교하였다. 특히 학습 DB에 따라 시계열성 속성을 갖는 퍼지소속함수에 가장 적합한 차원을 제시함으로서 Fuzzy SVM이 우수함을 입증하였다.

지능형 변동성트레이딩시스템개발을 위한 GARCH 모형을 통한 VKOSPI 예측모형 개발에 관한 연구 (A Study on Developing a VKOSPI Forecasting Model via GARCH Class Models for Intelligent Volatility Trading Systems)

  • 김선웅
    • 지능정보연구
    • /
    • 제16권2호
    • /
    • pp.19-32
    • /
    • 2010
  • 학계와 금융파생상품 가격결정이나 변동성매매와 같은 실무영역 모두에서 주식시장의 변동성은 중요한 역할을 한다. 본 연구는 GARCH 모형에 기초하여 한국주식시장의 변동성을 정확히 예측함으로써 변동성매매시스템의 성과를 높일 수 있는 새로운 방법을 제시하였다. 특히, 여러 연구 자료에서 밝혀지고 있는 변동성 비대칭성개념을 도입하였다. 최근 새로 개발된 한국주식시장 변동성 지수인 VKOSPI를 변동성 대용값으로 사용한다. VKOSPI는 KOSPI 200 지수옵션의 가격을 이용하여 계산된 값으로서 옵션딜러들의 변동성 예측치를 반영하고 있다. KOSPI 200 옵션시장은 1997년 시작되었으며, 발전을 거듭하여 현재 하루 거래량이 1,000만 계약을 넘어서면서 세계 최고의 지수옵션시장으로 발전하였다. 이러한 옵션시장에 반영된 변동성을 분석하는 것은 투자자들에게 좋은 투자정보를 제공하게 될 것이다. 특히, 변동성 대용값으로 VKOSPI를 사용하면 다른 변동성 대용치를 사용할 때 발생하는 통계적 추정의 문제를 피해 갈 수 있다. 본 연구는 2003년부터 2006년의 KOSPI 200 지수 일별자료를 대상으로 최우도추정방법(MLE)을 이용하여 GARCH 모형을 추정한다. 비대칭 GARCH 모형으로는 Glosten, Jagannathan, Runke의 GJR-GARCH 모형, Nelson의 EGARCH 모형, 그리고 Ding, Granger, Engle의 PARCH모형을 포함하며 대칭 GARCH 모형은 (1, 1) GARCH 모형을 이용한다. 2007년부터 2009년까지의 KOSPI 200 지수 일별자료를 대상으로 반복적 계산과정을 통해 내일의 변동성 예측값과 오르고 내리는 변화방향을 예측하였다. 분석 결과 시장변동성과 예기치 않은 주가변동 사이에는 음의 상관관계가 존재하며, 음의 주가변동은 동일한 크기의 양의 주가변동보다 훨씬 더 큰 변동성의 증가를 가져옴을 알 수 있다. 즉, 한국 주식시장에도 변동성 비대칭성이 존재함을 보여주었다. GARCH 모형을 이용하여 내일의 VKOSPI의 등락방향을 예측하고 이를 이용하여 변동성 매매시스템을 개발하였다. 내일의 변동성이 상승할 것으로 예측되면 스트래들매수전략을 이용하고 반대로 변동성이 하락할 것으로 예측되면 스트래들 매도전략을 이용한다. 변동성의 변화방향성을 맞춘 경우에는 VKOSPI 변동분을 더하고 틀린 경우에는 변동분을 뺀 누적합을 이용하여 변동성매매전략의 총수익을 계산한다. 모형추정용 자료구간의 경우 통계적 기준인 MSPE 기준으로는 PARCH 모형의 적합도가 가장 높고, 예측방향의 적중도를 재는 MCP 기준으로는 EGARCH 모형이 가장 높은 값을 보여주었다. 테스트용 자료구간의 경우에는 PARCH 모형이 모형적합도와 내일의 변동성 등락방향 예측에서 가장 좋은 결과를 보여주었다. 모형추정용 자료구간의 경우 GARCH 모형 전체에서 매매이익을 기록하고 있고 테스트용 자료구간의 경우에는 EGARCH 모형을 제외한 GARCH 모형들이 매매이익을 보여주었다. 본 연구에서 나타난 변동성의 군집과 비대칭성 현상으로부터 변동성에 비선형성이 존재함을 알 수 있었으며, 비선형성에서 좋은 결과를 보이고 있는 인공지능시스템과 비대칭 GARCH 모형을 결합한다면 제안된 변동성매매시스템의 성과를 많이 개선할 수 있을 것으로 판단된다.

인공신경망을 이용한 경제 위기 예측 (The Prediction of Currency Crises through Artificial Neural Network)

  • 이형용;박정민
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.19-43
    • /
    • 2016
  • 이 연구에서 Asia 금융 위기의 원인을 고찰하여 보고, European Monetary Systems의 금융 위기와 비교하여 본다. Asian 신흥 국가들은 1997년도에 금융 위기를 경험하였고, European Monetary Systems의 국가들도 1992년도에 동일한 경험을 하였다. 또한, 중남미의 신흥 경제국가인 Mexico 역시 1994년에 금융위기를 겪었다. 이 연구의 목적은 이들 금융위기의 내면을 고찰하고 그 결과로부터 일반화된 법칙을 추출하는 것이다. 이 연구에서는 금융위기를 경험한 한국과 영국과 멕시코를 각각 세가지 다른 모형으로 연구하고 비교하였다. 이 접근 방법은 체계적인 조사를 통하여 세 국가의 차이점을 보여주고 또한 공통적인 내재 요인을 관찰한다. 이전의 많은 연구 방법들은 대부분 선형 회귀식을 통한 causal model에 초점을 맞추고 있지만, 이러한 선형 회귀 모형의 약점을 보완하여서 현실에 산재하며 존재하는 비 선형의 문제를 해결하기 위하여 또 다른 방법을 제안하여 본다. 이 연구에서 사용한 구조 방정식(Structural Equation Model) 모형은 현실로부터 원인을 추출하고 분석하는 연구에 적합하며, 신경망(Artificial Neural Network) 모형은 선형모형의 단점을 보완하여서 비 선형 요인을 설명해 준다. 구조방정식 모형에 적용하기 위하여서 LISREL(LInear Structural RELationship)을 사용하였다. LISREL은 확인적 요인분석과 계량경제학에서 개발된 연립방정식모델에 토대를 둔 다중회귀분석 및 경로분석 등이 결합된 성격을 갖는 방법론으로 다양한 연구에 적용된다. 또한 인공지능(Artificial Intelligence) 기법 중의 하나인 신경망 모형은 선형회귀 분석과 다른 형태의 결과를 도출한다. 세가지 방법론의 우수성을 비교하기 위하여 Hit ratio를 각 국가/ 각 방법론 별로 구분하여서 비교한 결과 다른 방법론 보다 신경망이 더 좋은 성과를 나타내고 있는 것을 확인할 수 있었다. 세가지 방법론에 각각 일반적인 환율 예측에 사용되는 변수를 사용하였다. 소비자 물가지수(Consumer Price Index), 국내총생산(Gross Domestic Product), 이자율(Interest rate), 주가지수(Stock Index), 경상수지(Current Account), 외환보유고(Foreign Reserves)의 6가지 변수를 이용하여서 환율을 예측하여서 급격한 환율 변화로 초래되는 경제위기를 예측하려고 하였다. 각각의 국가의 데이터는 대한민국은 1991년부터 1999년까지, 영국은 1986년부터 1995년까지, 멕시코는 1988년부터 1998년까지의 기간을 정하여서 시계열자료를 분기별로 사용하였다. 각각의 데이터는 Data Stream과 한국은행(Bank of Korea)의 데이터를 이용하여서 분석하였다. 선형회귀방정식을 이용한 분석과 구조방정식인 LISREL을 이용한 분석은 각각 Hit ratio가 국가별로 순위가 변동되기도 하였으나, 인공지능 방법론인 인공신경망의 경우는 모든 국가에서 가장 좋은 예측 결과를 나타내고 있었다. 이 논문은 환율의 변동에 대한 다양한 예측 모형을 비교하고 평가하여서 연구에서 제시하는 개념을 검토하였다는 점에서 의의를 갖는다.

The Hybrid Knowledge Integration Using the Fuzzy Genetic Algorithm

  • Kim, Myoung-Jong;Ingoo Han;Lee, Kun-Chang
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.145-154
    • /
    • 1999
  • An intelligent system embedded with multiple sources of knowledge may provide more robust intelligence with highly ill structured problems than the system with a single source of knowledge. This paper proposes the hybrid knowledge integration mechanism that yields the cooperated knowledge by integrating expert, user, and machine knowledge within the fuzzy logic-driven framework, and then refines it with a genetic algorithm (GA) to enhance the reasoning performance. The proposed knowledge integration mechanism is applied for the prediction of Korea stock price index (KOSPI). Empirical results show that the proposed mechanism can make an intelligent system with the more adaptable and robust intelligence.

  • PDF

The Hybrid Knowledge Integration Using the Fuzzy Genetic Algorithm

  • Kim, Myoung-Jong;Ingoo Han;Lee, Kun-Chang
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 춘계공동학술대회-지식경영과 지식공학
    • /
    • pp.145-154
    • /
    • 1999
  • An intelligent system embedded with multiple sources of knowledge may provide more robust intelligence with highly ill structured problems than the system with a single source of knowledge. This paper proposes th hybrid knowledge integration mechanism that yields the cooperated knowledge by integrating expert, user, and machine knowledge within the fuzzy logic-driven framework, and then refines it with a genetic algorithm (GA) to enhance the reasoning performance. The proposed knowledge integration mechanism is applied for the prediction of Korea stock price index (KOSPI). Empirical results show that the proposed mechanism can make an intelligent system with the more adaptable and robust intelligence.

  • PDF

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 (A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market)

  • 이모세;안현철
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.167-181
    • /
    • 2018
  • 지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.

금융시장 예측을 위한 시계열자료의 변환기법 융합을 이용한 패턴 모델 결정 (Determination of Pattern Models using a Convergence of Time-Series Data Conversion Technique for the Prediction of Financial Markets)

  • 전진호;김민수
    • 디지털융복합연구
    • /
    • 제13권5호
    • /
    • pp.237-244
    • /
    • 2015
  • 수출주도정책, FTA 체결 및 규제개선 등과 같은 다양한 시장지향적인 정책을 통해 경제시장의 규모가 지속적으로 커졌다. 이에 따라 올바른 의사결정을 위하여 경제시장을 정확하게 분석, 예측하는 문제가 중요한 이슈가 되었다. 경제시장을 표현하는 여러 지표 중 가장 대표적인 주식지표의 정확한 분석 및 의사결정을 위하여 시계열자료의 모델링에 적합한 은닉마아코프모델을 토대로 자료 내에 내재된 예외적인 특징과 잡음을 제거하기 위한 변환기법의 융합모델을 제안하여 모델 추정과 예측 문제에 적용하였으며 그 유효성을 확인하였다. 실험 결과를 통해, 본 연구에서 제안하는 변환조합을 적용하는 모델추정 기법이 유효한 모델 상태 추정 결과를 보여주었으며 실제 코스피지수와 예측의 문제에서도 매우 유사한 운동양태를 확인할 수 있었다.