• Title/Summary/Keyword: statistical forecast model

검색결과 254건 처리시간 0.029초

지능형 전망모형을 결합한 로보어드바이저 알고리즘 (Robo-Advisor Algorithm with Intelligent View Model)

  • 김선웅
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.39-55
    • /
    • 2019
  • 최근 은행과 증권회사를 중심으로 다양한 로보어드바이저 금융상품들이 출시되고 있다. 로보어드바이저는 사람 대신 컴퓨터가 포트폴리오 자산배분에 대한 투자 결정을 실행하기 때문에 다양한 자산배분 알고리즘이 활용되고 있다. 본 연구에서는 대표적 로보어드바이저 알고리즘인 블랙리터만모형의 강점을 살리면서 객관적 투자자 전망을 도출할 수 있는 지능형 전망모형을 제안하고 이를 내재균형수익률과 결합하여 최종 포트폴리오를 도출하는 로보어드바이저 자산배분 알고리즘을 새로이 제안하며, 실제 주가자료를 이용한 실증분석 결과를 통해 전문가의 주관적 전망을 대신할 수 있는 지능형 전망모형의 실무적 적용 가능성을 보여주고자 한다. 그동안 주가 예측에서 우수한 성과를 보여주었던 기계학습 방법 중 SVM 모형을 이용하여 각 자산별 기대수익률에 대한 예측과 예측 확률을 도출하고 이를 각각 기대수익률에 대한 투자자 전망과 전망에 대한 신뢰도 수준의 입력변수로 활용하는 지능형 전망모형을 제안하였다. 시장포트폴리오로부터 도출된 내재균형수익률과 지능형 전망모형의 기대수익률, 확률을 결합하여 최종적인 블랙리터만모형의 최적포트폴리오를 도출하였다. 주가자료는 2008년부터 2018년까지의 132개월 동안의 8개의 KOSPI 200 섹터지수 월별 자료를 분석하였다. 블랙리터만모형으로 도출된 최적포트폴리오의 결과가 기존의 평균분산모형이나 리스크패리티모형 등과 비교하여 우수한 성과를 보여주었다. 구체적으로 2008년부터 2015년까지의 In-Sample 자료에서 최적화된 블랙리터만모형을 2016년부터 2018년까지의 Out-Of-Sample 기간에 적용한 실증분석 결과에서 다른 알고리즘보다 수익과 위험 모두에서 좋은 성과를 기록하였다. 총수익률은 6.4%로 최고 수준이며, 위험지표인 MDD는 20.8%로 최저수준을 기록하였다. 수익과 위험을 동시에 고려하여 투자 성과를 측정하는 샤프비율 역시 0.17로 가장 좋은 결과를 보여주었다. 증권계의 애널리스트 전문가들이 발표하는 투자자 전망자료의 신뢰성이 낮은 상태에서, 본 연구에서 제안된 지능형 전망모형은 현재 빠른 속도로 확장되고 있는 로보어드바이저 관련 금융상품을 개발하고 운용하는 실무적 관점에서 본 연구는 의의가 있다고 판단된다.

Wavelet Thresholding Techniques to Support Multi-Scale Decomposition for Financial Forecasting Systems

  • Shin, Taeksoo;Han, Ingoo
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.175-186
    • /
    • 1999
  • Detecting the features of significant patterns from their own historical data is so much crucial to good performance specially in time-series forecasting. Recently, a new data filtering method (or multi-scale decomposition) such as wavelet analysis is considered more useful for handling the time-series that contain strong quasi-cyclical components than other methods. The reason is that wavelet analysis theoretically makes much better local information according to different time intervals from the filtered data. Wavelets can process information effectively at different scales. This implies inherent support fer multiresolution analysis, which correlates with time series that exhibit self-similar behavior across different time scales. The specific local properties of wavelets can for example be particularly useful to describe signals with sharp spiky, discontinuous or fractal structure in financial markets based on chaos theory and also allows the removal of noise-dependent high frequencies, while conserving the signal bearing high frequency terms of the signal. To date, the existing studies related to wavelet analysis are increasingly being applied to many different fields. In this study, we focus on several wavelet thresholding criteria or techniques to support multi-signal decomposition methods for financial time series forecasting and apply to forecast Korean Won / U.S. Dollar currency market as a case study. One of the most important problems that has to be solved with the application of the filtering is the correct choice of the filter types and the filter parameters. If the threshold is too small or too large then the wavelet shrinkage estimator will tend to overfit or underfit the data. It is often selected arbitrarily or by adopting a certain theoretical or statistical criteria. Recently, new and versatile techniques have been introduced related to that problem. Our study is to analyze thresholding or filtering methods based on wavelet analysis that use multi-signal decomposition algorithms within the neural network architectures specially in complex financial markets. Secondly, through the comparison with different filtering techniques' results we introduce the present different filtering criteria of wavelet analysis to support the neural network learning optimization and analyze the critical issues related to the optimal filter design problems in wavelet analysis. That is, those issues include finding the optimal filter parameter to extract significant input features for the forecasting model. Finally, from existing theory or experimental viewpoint concerning the criteria of wavelets thresholding parameters we propose the design of the optimal wavelet for representing a given signal useful in forecasting models, specially a well known neural network models.

  • PDF

Wavelet Thresholding Techniques to Support Multi-Scale Decomposition for Financial Forecasting Systems

  • Shin, Taek-Soo;Han, In-Goo
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 춘계공동학술대회-지식경영과 지식공학
    • /
    • pp.175-186
    • /
    • 1999
  • Detecting the features of significant patterns from their own historical data is so much crucial to good performance specially in time-series forecasting. Recently, a new data filtering method (or multi-scale decomposition) such as wavelet analysis is considered more useful for handling the time-series that contain strong quasi-cyclical components than other methods. The reason is that wavelet analysis theoretically makes much better local information according to different time intervals from the filtered data. Wavelets can process information effectively at different scales. This implies inherent support for multiresolution analysis, which correlates with time series that exhibit self-similar behavior across different time scales. The specific local properties of wavelets can for example be particularly useful to describe signals with sharp spiky, discontinuous or fractal structure in financial markets based on chaos theory and also allows the removal of noise-dependent high frequencies, while conserving the signal bearing high frequency terms of the signal. To data, the existing studies related to wavelet analysis are increasingly being applied to many different fields. In this study, we focus on several wavelet thresholding criteria or techniques to support multi-signal decomposition methods for financial time series forecasting and apply to forecast Korean Won / U.S. Dollar currency market as a case study. One of the most important problems that has to be solved with the application of the filtering is the correct choice of the filter types and the filter parameters. If the threshold is too small or too large then the wavelet shrinkage estimator will tend to overfit or underfit the data. It is often selected arbitrarily or by adopting a certain theoretical or statistical criteria. Recently, new and versatile techniques have been introduced related to that problem. Our study is to analyze thresholding or filtering methods based on wavelet analysis that use multi-signal decomposition algorithms within the neural network architectures specially in complex financial markets. Secondly, through the comparison with different filtering techniques results we introduce the present different filtering criteria of wavelet analysis to support the neural network learning optimization and analyze the critical issues related to the optimal filter design problems in wavelet analysis. That is, those issues include finding the optimal filter parameter to extract significant input features for the forecasting model. Finally, from existing theory or experimental viewpoint concerning the criteria of wavelets thresholding parameters we propose the design of the optimal wavelet for representing a given signal useful in forecasting models, specially a well known neural network models.

  • PDF

교통 접근성 변동에 따른 도시 토지이용 변화에 관한 연구 (A Study on the Change of Urban Land Use According to the Change of Transportation Accessibility)

  • 원석환;황철수
    • 지적과 국토정보
    • /
    • 제47권1호
    • /
    • pp.127-142
    • /
    • 2017
  • 수도권의 도시화는 서울로의 교통 접근성의 변화에 따라 급속하게 진행되었다. 도시화 과정 속에 교외화, 주택 수의 증가, 도심용지 토지이용 증대 등의 다양한 공간적 변화가 이루어지고 있다. 본 연구의 목적은 2001~2008년 간 경기도 남양주시의 도시화 경관현상을 살펴보고 교통(도로 및 철도) 접근성의 변화에 따른 주변 토지이용 변화의 상관성을 분석하는데 있다. 상관성 분석 결과를 토대로 멀티 에이전트 시스템(MAS)을 이용하여 교통접근성과 토지이용 에이전트 간 상호작용의 관점에서 시뮬레이션 하였다. 이런 과정을 통하여 교통접근성의 변화로 인한 주변 토지이용 변화를 시공간적으로 예측하고자 한다. 도시화 현황을 살펴보기 위해서 위성영상 자료와 지적도 자료를 이용하여 거시적 미시적 경관 분석을 실시한 후 교통접근성의 변화에 따른 주변 토지이용 변화의 상관성을 분석하기 위해 교통자료와 토지이용 자료를 활용하여 GIS분석 및 통계 분석, 시뮬레이션 분석을 하였다. 본 연구를 통해 신규 도로 및 철도가 생성됨에 따라 주변 500m 이내에서 도심 토지용지로 변경되는 패턴을 확인할 수 있었으며, 향후 도로 및 철도가 생성됨에 따라 발생하는 토지용지 변화 현상을 예측할 수 있는 시스템을 구축하였다. 이를 통해 교통시설 입지 대상지역 선정 시 기초자료로 활용할 수 있는 근거가 될 수 있을 것으로 기대된다.

온라인쇼핑몰의 CRM 전략에 관한 동태적 분석: System Dynamics 기법을 활용한 고객만족도 분석을 중심으로 (Dynamic Analysis of CRM Strategy for Online Shopping-mall)

  • 강재원;임재익;이상근
    • 경영정보학연구
    • /
    • 제9권3호
    • /
    • pp.99-132
    • /
    • 2007
  • 전자상거래에서 고객관리가 중요한 이슈로 떠오르면서 CRM에 대한 선행연구가 많이 진행되어왔다. 하지만 대부분 통계기반의 실증연구들이어서 시간의 흐름에 따른 CRM 결과의 동태적 변화를 보여주지 못하며, CRM 전략에 대한 타당성과 미래성과를 예측 할 수 없는 한계점을 가지고 있었다. 따라서 본 연구는 이러한 한계점을 보완하고자, 온라인쇼핑몰의 CRM 구성요소들을 도출하고 이들간의 동태적 변화를 분석하기 위해 시스템다이내믹스기법을 기반으로 한 동태적 모델을 설계하였다. 구체적으로, 온라인쇼핑몰에 초점을 맞추고 퍼미션마케팅 이론에 기반하여 고객을 세분화하였으며, 기대이론 등을 바탕으로 세분화된 고객들에게 서로 다른 수준의 CRM을 적용하여 그에 따른 고객만족도와 불편도의 변화에 대한 명제(Proposition)을 설정하였다. 시뮬레이션 실행 결과, 세분화된 고객별로 CRM의 긍정적 효과로 인한 고객만족 및 유입보다 부정적 효과로 인한 불만족 및 이탈이 더 많은 것으로 나타났으며, 이는 본 연구에서 설정한 명제의 타당성을 검증하고 있다. 위와 같이, 본 연구에서 설계한 동태적 모델은 기존의 기대이론을 바탕으로 한 고객만족도 및 불만족도가 고객유입과 이탈에 미치는 영향에 대한 근거를 제시하였으며, 향후 븐 연구를 기반으로 실제 쇼핑몰사례를 접목시킨 실증 연구가 이루어진다면 현업의 CRM 전략수립에 명확한 기준을 제시할 수 있을 것으로 기대된다.

BDS 통계와 DVS 알고리즘을 이용한 수문시계열의 비선형성 분석 (Detecting Nonlinearity of Hydrologic Time Series by BDS Statistic and DVS Algorithm)

  • 최강수;경민수;김수전;김형수
    • 대한토목학회논문집
    • /
    • 제29권2B호
    • /
    • pp.163-171
    • /
    • 2009
  • 수문시계열 분석과 예측을 위하여 통상적으로 기존의 선형적인 모형들을 이용하여 왔다. 그러나 최근 자연현상이나 수문시계열의 패턴 그리고 변동성에 비선형구조가 존재하고 있다는 것이 입증되고 있다. 따라서 기존의 선형적인 방법들에 의한 시계열분석이나 예측은 비선형 시스템에 대해서 적절하지 않을 것이다. 최근, 시계열의 비선형성 구조를 판단하기 위해 카오스 이론을 토대로 한 상관적분으로부터 BDS(Brock-Dechert-Scheinkman) 통계 기법이 유도되었다. BDS 통계는 시스템의 비선형구조와 무작위성 구조를 구별하는데 매우 효과적으로 이용되어 오고 있다. 또한 DVS(Deterministic Versus Stochastic) 알고리즘은 카오스와 추계학적 시스템을 구별하고 예측하는데 주로 이용되어 왔다. 그러나 본 연구에서는 DVS 알고리즘에 의해 시계열의 비선형성을 판별할 수 있음을 보이고자 한다. 따라서 본 연구에서는 추계학적 시계열과 수문학적 시계열들의 비선형성을 검사하고자 한다. ARMA 모형과 TAR(Threshold autoregressive) 모형으로부터로 발생시킨 추계학적 시계열, 미국 유타주 GSL 체적자료, 미국 플로리다 주 St. Johns 강 Cocoa 지점의 유출량 자료, 소양강 댐 일 유입량 자료 등의 수문시계열에 대해 비선형성 분석을 수행하고 그 결과를 비교하였다. 분석결과 BDS 통계가 선형 및 비선형 시계열을 구분하는데 매우 강력한 도구임을 보였고, DVS 알고리즘 또한 시계열의 비선형성을 구별하는데 효과적으로 이용될 수 있음을 보였다.

재무예측을 위한 Support Vector Machine의 최적화 (Optimization of Support Vector Machines for Financial Forecasting)

  • 김경재;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.241-254
    • /
    • 2011
  • Support vector machines(SVM)은 비교적 최근에 등장한 데이터마이닝 기법이지만, 재무, CRM 등의 경영학 분야에서 많이 연구되고 있다. SVM은 인공신경망과 필적할 만큼의 예측 정확도를 보이는 사례가 많았지만, 암상자로 불리는 인공신경망 모형에 비해 구축된 예측모형의 구조를 이해하기 쉽고, 인공신경망에 비해 과도적합의 가능성이 적어서 적은 수의 데이터에서도 적용 가능하다는 장점을 가지고 있다. 하지만, 일반적인 SVM을 이용하려면, 인공신경망과 마찬가지로 여러 가지 설계요소들을 설계자가 선택하여야 하기 때문에 임의성이 높고, 국부 최적해에 수렴할 가능성도 크다. 또한, 많은 수의 데이터가 존재하는 경우에는 데이터를 분석하고 이용하는데 시간이 소요되고, 종종 잡음이 심한 데이터가 포함된 경우에는 기대하는 수준의 예측성과를 얻지 못할 가능성이 있다. 본 연구에서는 일반적인 SVM의 장점을 그대로 유지하면서, 전술한 두 가지 단점을 보완한 새로운 SVM 모형을 제안한다. 본 연구에서 제안하는 모형은 사례선택기법을 일반적인 SVM에 융합한 것으로 대용량의 데이터에서 예측에 불필요한 데이터를 선별적으로 제거하여 예측의 정확도와 속도를 제고할 수 있는 방법이다. 본 연구에서는 잡음이 많고 예측이 어려운 것으로 알려진 재무 데이터를 활용하여 제안 모형의 유용성을 확인하였다.

다분류 SVM을 이용한 DEA기반 벤처기업 효율성등급 예측모형 (The Prediction of DEA based Efficiency Rating for Venture Business Using Multi-class SVM)

  • 박지영;홍태호
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.139-155
    • /
    • 2009
  • For the last few decades, many studies have tried to explore and unveil venture companies' success factors and unique features in order to identify the sources of such companies' competitive advantages over their rivals. Such venture companies have shown tendency to give high returns for investors generally making the best use of information technology. For this reason, many venture companies are keen on attracting avid investors' attention. Investors generally make their investment decisions by carefully examining the evaluation criteria of the alternatives. To them, credit rating information provided by international rating agencies, such as Standard and Poor's, Moody's and Fitch is crucial source as to such pivotal concerns as companies stability, growth, and risk status. But these types of information are generated only for the companies issuing corporate bonds, not venture companies. Therefore, this study proposes a method for evaluating venture businesses by presenting our recent empirical results using financial data of Korean venture companies listed on KOSDAQ in Korea exchange. In addition, this paper used multi-class SVM for the prediction of DEA-based efficiency rating for venture businesses, which was derived from our proposed method. Our approach sheds light on ways to locate efficient companies generating high level of profits. Above all, in determining effective ways to evaluate a venture firm's efficiency, it is important to understand the major contributing factors of such efficiency. Therefore, this paper is constructed on the basis of following two ideas to classify which companies are more efficient venture companies: i) making DEA based multi-class rating for sample companies and ii) developing multi-class SVM-based efficiency prediction model for classifying all companies. First, the Data Envelopment Analysis(DEA) is a non-parametric multiple input-output efficiency technique that measures the relative efficiency of decision making units(DMUs) using a linear programming based model. It is non-parametric because it requires no assumption on the shape or parameters of the underlying production function. DEA has been already widely applied for evaluating the relative efficiency of DMUs. Recently, a number of DEA based studies have evaluated the efficiency of various types of companies, such as internet companies and venture companies. It has been also applied to corporate credit ratings. In this study we utilized DEA for sorting venture companies by efficiency based ratings. The Support Vector Machine(SVM), on the other hand, is a popular technique for solving data classification problems. In this paper, we employed SVM to classify the efficiency ratings in IT venture companies according to the results of DEA. The SVM method was first developed by Vapnik (1995). As one of many machine learning techniques, SVM is based on a statistical theory. Thus far, the method has shown good performances especially in generalizing capacity in classification tasks, resulting in numerous applications in many areas of business, SVM is basically the algorithm that finds the maximum margin hyperplane, which is the maximum separation between classes. According to this method, support vectors are the closest to the maximum margin hyperplane. If it is impossible to classify, we can use the kernel function. In the case of nonlinear class boundaries, we can transform the inputs into a high-dimensional feature space, This is the original input space and is mapped into a high-dimensional dot-product space. Many studies applied SVM to the prediction of bankruptcy, the forecast a financial time series, and the problem of estimating credit rating, In this study we employed SVM for developing data mining-based efficiency prediction model. We used the Gaussian radial function as a kernel function of SVM. In multi-class SVM, we adopted one-against-one approach between binary classification method and two all-together methods, proposed by Weston and Watkins(1999) and Crammer and Singer(2000), respectively. In this research, we used corporate information of 154 companies listed on KOSDAQ market in Korea exchange. We obtained companies' financial information of 2005 from the KIS(Korea Information Service, Inc.). Using this data, we made multi-class rating with DEA efficiency and built multi-class prediction model based data mining. Among three manners of multi-classification, the hit ratio of the Weston and Watkins method is the best in the test data set. In multi classification problems as efficiency ratings of venture business, it is very useful for investors to know the class with errors, one class difference, when it is difficult to find out the accurate class in the actual market. So we presented accuracy results within 1-class errors, and the Weston and Watkins method showed 85.7% accuracy in our test samples. We conclude that the DEA based multi-class approach in venture business generates more information than the binary classification problem, notwithstanding its efficiency level. We believe this model can help investors in decision making as it provides a reliably tool to evaluate venture companies in the financial domain. For the future research, we perceive the need to enhance such areas as the variable selection process, the parameter selection of kernel function, the generalization, and the sample size of multi-class.

ARIMA모델에 의한 피용자(被傭者) 의료보험(醫療保險) 수진율(受診率), 건당진료비(件當診療費) 및 건당진료일수(件當診療日數)의 추이(推移)와 예측(豫測) (Trend and Forecast of the Medical Care Utilization Rate, the Medical Expense per Case and the Treatment Days per Cage in Medical Insurance Program for Employees by ARIMA Model)

  • 장규표;감신;박재용
    • Journal of Preventive Medicine and Public Health
    • /
    • 제24권3호
    • /
    • pp.441-458
    • /
    • 1991
  • 공무원 및 사립학교교직원 의료보험과 직장의료보험에서 입원, 외래별 수진을, 건당진료비 (1985년 기준 불변가격), 건당진료일수 등의 장래예측을 통해 의료보험 진료비 안정화 방안을 마련하는데 기초자료로 제시하기 위하여, 이들의 $1979{\sim}89$년간 월별 통계자료를 이용, Box-Jenkins model인 ARIMA 모델을 적용하여 1994년 까지의 수진을, 건당진료비 및 건당진료일수를 예측한 결과를 요약하면 다음과 같다. 수진을, 건당진료비 및 건당진료일수의 ARIMA 모형을 제시하면 다음 표와 같다. 상기의 ARIMA 모형을 기초로하여 향후 5년간의 수진율을 예측한 결과, 공교의료보험 입원의 경우, 1989년의 실측치는 0.068건 이었으며, 1990년과 1991년은 0.068건, 1992년과 1993년은 0.069건, 1994년은 0.070건으로 연평균 0.7%정도 증가될 것으로 예측되었으며, 외래의 경우, 1989년의 실측치는 3.487건이었으나 1990년은 3.530건, 1994년은 3.668건으로 연평균 1%정도 증가될 것으로 예측되었다. 직장의료보험 입원의 경우, 1989년의 실측치는 0.063건이었으며, 1990년부터 1994년까지 모두 0.063건으로 안정될 것으로 예측되었으며, 외래의 경우 1989년의 실측치는 2.984건이었으나, 1990년은 3.016건, 1994년은 3.154건으로 연평균 1.1% 정도 증가될 것으로 예측되었다. 건당진료비의 향후 예측치는 12월을 기준으로하여 1985년 불변가격으로 공교의료보험 입원의 경우, 1989년의 실측치는 332,751원이었으나, 1990년은 345,938원, 1994년은 354,511원으로 연평균 0.6%정도 증가될 것으로 예측되었으며, 외래의 경우, 1989년의 실측치는 11,925원이었으나, 1990년은 12,638원, 1994년은 12,904원으로 연평균 0.5%정도 증가될 것으로 예측되었다. 직장의료보험 입원의 경우, 1989년 실측치는 281,835원이었으나, 1990년은 282,524원, 1994년은 293,973원으로 연평균 1%정도 증가될 것으로 예측되었으며, 외래의 경우, 1989년 실측치는 11,599원이었으나, 1990년부터 1994년까지 11,585원으로 안정될 것으로 예측되었다. 건당진료일수의 향후 예측치는 12월을 기준으로 하여 공교의료보험 입원의 경우, 1989년의 실측치는 13.79일이었으며, 1990년은 13.82일, 1993년과 1994년은 13.85일로 거의 안정될 것으로 예측되었으며, 외래의 경우, 1994년까지 5일 정도로 안정될 것으로 예측되었다. 직장의료보험 입원의 경우, 1989년의 실측치는 12.23일이었으나, 1990년은 12.30일, 1994년은 12.85일로 연평균 1.1%정도 증가될 것으로 예측되었으며, 외래의 경우 1989년의 실측치는 4.61일이었으며 1990년부터 1994년까지 4.60일로 안정될 것으로 예측되었다.

  • PDF

산업군 내 동질성을 고려한 온라인 뉴스 기반 주가예측 (Online news-based stock price forecasting considering homogeneity in the industrial sector)

  • 성노윤;남기환
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.1-19
    • /
    • 2018
  • 주가 예측은 학문적으로나 실용적으로나 중요한 문제이기에, 주가 예측에 관련된 연구가 활발히 진행되었다. 빅 데이터 시대에 도입하면서, 빅 데이터를 결합한 주가 예측 연구도 활발히 진행되고 있다. 다수의 데이터를 기반으로 기계 학습을 이용한 연구가 주를 이룬다. 특히 언론의 효과를 접목한 연구 방법들이 주목을 받고 있는데, 그중 온라인 뉴스를 분석하여 주가 예측에 활용하는 연구가 주를 이루고 있다. 기존 연구들은 온라인 뉴스가 개별 회사에 대한 미치는 영향을 주로 살펴보았다. 또한, 관련성이 높은 기업끼리 서로 영향을 주는 것을 고려하는 방법도 최근에 연구되고 있다. 이는 동질성을 가지는 산업군에 대한 효과를 살펴본 것인데, 기존 연구에서 동질성을 가지는 산업군은 국제 산업 분류 표준에 따른다. 즉, 기존 연구들은 국제 산업 분류 표준으로 나뉜 산업군이 동질성을 가진다는 가정하에서 분석을 시행하였다. 하지만 기존 연구들은 영향력을 가지는 회사를 고려하지 못한 채 예측하였거나 산업군 내에서 이질성이 존재하는 점을 반영하지 못했다는 한계점을 가진다. 본 연구는 산업군 내에 이질성이 존재함을 밝히고, 이질성을 반영하지 못한 기존 연구의 한계점을 K-평균 군집 분석을 적용하여, 주가에 영향을 미치는 산업군의 동질적인 효과를 반영할 수 있는 방법론을 제안하였다. 방법론이 적합하다는 것을 증명하기 위해 3년간의 온라인 뉴스와 주가를 통해 실험한 결과, 다수의 경우에서 본 논문에서 제시한 방법이 좋은 결과를 나타냄을 확인할 수 있었으며, 국제 산업 분류 표준 산업군 내에서 이질성이 클수록 본 논문에서 제시한 방법이 좋은 효과를 보인다는 것을 확인할 수 있었다. 본 연구는 국제 산업 분류 표준으로 나누어진 기업들이 높은 동질성을 가지지 않는 다는것을 밝히고 이를 반영한 예측 모형의 효율성을 입증하였다는 점에서 의의를 가진다.