• 제목/요약/키워드: Predictive Power

검색결과 705건 처리시간 0.025초

분류 알고리즘 기반 주문 불균형 정보의 단기 주가 예측 성과 (Classification Algorithm-based Prediction Performance of Order Imbalance Information on Short-Term Stock Price)

  • 김선웅
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.157-177
    • /
    • 2022
  • 투자자들은 증권회사가 제공하는 시세표인 Limit Order Book 정보를 통해 국내외 투자자들이 제출하는 주문 정보를 실시간으로 파악하면서 거래에 참여하고 있다. Limit Order Book에 실시간으로 공개되고 있는 주문 정보가 주가 예측에서 유용성이 있을까? 본 연구는 장 중 투자자들의 매수와 매도 주문이 어느 한쪽으로 쏠리면서 주문 불균형이 나타나는 경우 미래 주가 등락의 예측 변수로서 유의성이 있는지를 분석하는 것이다. 분류 알고리즘을 이용하여 주문 불균형 정보의 당일 종가 등락에 대한 예측 정확도를 높이고, 예측 결과를 이용한 데이트레이딩 전략을 제안하며 실증분석을 통해 투자 성과를 분석한다. 자료는 2004년 1월 19일부터 2022년 6월 30일까지의 4,564일 동안의 코스피200 주가지수선물 5 분 봉 주가를 분석하였다. 실증분석 결과는 다음과 같다. 첫째, 총매수 주문량과 총매도 주문량의 불균형 정도로 측정하는 주문 불균형지수와 주가는 유의적 상관성을 보인다. 둘째, 주문 불균형 정보는 당일 종가까지의 미래 주가 등락에 대해서도 유의적인 영향력이 나타났다. 셋째, 주문 불균형 정보를 이용한 당일 종가 등락의 예측 정확도는 Support Vector Machines 알고리즘이 54.1%로 가장 높게 나타났다. 넷째, 하루 중 이른 시점에서 측정한 주문 불균형지수가 늦은 시점에서 측정한 주문 불균형지수보다 예측 정확성이 더 높았다. 다섯째, 종가 등락 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 비교모형의 투자 성과보다 높게 나타났다. 여섯째, 분류 알고리즘을 이용한 투자 성과는 K-Nearest Neighbor 알고리즘을 제외하면 모두 비교모형보다 총수익 평균이 높게 나타났다. 일곱째, Logistic Regression, Random Forest, Support Vector Machines, XGBoost 알고리즘의 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 수익성과 위험성을 동시에 평가하는 샤프비율에서도 비교모형보다 높은 결과를 보여주었다. 본 연구는 Limit Order Book 정보 중 총매수 주문량과 총매도 주문량 정보의 경제적 가치가 존재함을 밝혔다는 점에서 기존의 연구와 학술적 차별점을 갖는다. 본 연구의 실증분석 결과는 시장 참여자들에게 투자 전략적 측면에서 함의가 있다고 판단된다. 향후 연구에서는 최근 활발히 연구가 진행되고 있는 딥러닝 모형 등으로의 확장을 통해 주가 예측의 정확도를 높임으로써 데이트레이딩 투자전략의 성과를 개선할 필요가 있다.

PCL-5(DSM-5 기준 외상 후 스트레스 장애 체크리스트) 한국판 종단 타당화 연구 (A Longitudinal Validation Study of the Korean Version of PCL-5(Post-traumatic Stress Disorder Checklist for DSM-5))

  • 이동훈;이덕희;김성현;정다송
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제28권2호
    • /
    • pp.187-217
    • /
    • 2022
  • 본 연구는 한국판 외상 후 스트레스 장애 체크리스트-5(PCL-5)의 타당화 연구를 진행하였다. 이를 위해 성인을 대상으로 두 시점에서 온라인 설문을 1년 간격으로 실시하였고, 1시점에서는 1,077명, 2시점에서는 563명의 자료를 본 연구에서 사용하였다. 확인적 요인분석을 통해 1요인, 4요인, 6요인, 7요인의 모형 적합도를 확인한 결과, 4, 6, 7요인이 수용가능한 수준으로 나타났으며, 그 중 7, 6, 4요인 순으로 우수한 적합도를 보였다. 다음으로 내적일치도, 오메가 계수, 개념신뢰도, 분산추출지수, 검사-재검사 신뢰도를 확인한 결과 모두 양호한 것으로 나타났다. 타당도를 확인하기 위해 한국판 외상 후 스트레스 선별 평가지(K-PC-PTSD-5)와 단축형 간이정신진단 검사-18(BSI-18)와의 상관분석을 실시한 결과, 두 검사 모두와 정적상관이 나타났다. 한국판 PCL-5가 향후 PTSD, 우울, 불안, 신체화 증상을 예측할 수 있는지 확인하고자 위계적 다중회귀분석을 실시한 결과, 1시점에서 한국판 PCL-5로 측정한 PTSD 증상이 2시점의 PTSD, 우울, 불안, 신체화 증상을 예측하는 것으로 나타났다. 본 연구에서는 ROC 곡선 분석을 통해 PCL-5의 PTSD 증상집단 구분에 대한 변별력을 확인하고 최적 절단점을 제시하였다. PCL-5의 한국판 종단타당화 결과, 본 척도가 한국인에게 신뢰롭고 타당한 척도인 것으로 나타났다. 본 연구는 예측타당도 분석을 통해 한국판 PCL-5가 PTSD 증상뿐만 아니라 우울, 불안, 신체화와 같은 PTSD 관련 증상을 예측가능함을 제시하였으며, PTSD 증상집단에 대한 변별이 가능한 절단점을 제시하였다는 점에서 PTSD 증상을 측정하는 기존 타당화 연구와 차별점을 지닌다.

농지 공간격자 자료의 층화랜덤샘플링: 농업시스템 기후변화 영향 공간모델링을 위한 국내 농지 최적 층화 및 샘플 수 최적화 연구 (A stratified random sampling design for paddy fields: Optimized stratification and sample allocation for effective spatial modeling and mapping of the impact of climate changes on agricultural system in Korea)

  • 이민영;김용은;홍진솔;조기종
    • 환경생물
    • /
    • 제39권4호
    • /
    • pp.526-535
    • /
    • 2021
  • 공간 샘플링은 공간모델링 연구에 활용되어 샘플링 비용을 줄이면서 모델링의 효율성을 높이는 역할을 한다. 농업분야에서는 기후변화 영향을 예측하고 평가하기 위한 고해상도 공간자료 기반 모델링에 대한 연구 수요가 빠르게 증가하고 있으며, 이에 따라 공간 샘플링의 필요성과 중요성이 증가하고 있다. 본 연구는 국내 농지 공간샘플링 연구를 통해 농업분야 기후변화연구의 공간자료 활용의 효율성을 제고하고자 하였다. 본 연구는 층화랜덤샘플링을 기반으로 하였으며, 1 km 해상도의 농지 공간격자자료 모집단(11,386개 격자)에 대해서 RCP 시나리오별(RCP 4.5/8.5) 연대별(2030/2050/2080년대) 공간샘플링을 설계하였다. 국내 농지는 기상 및 토양 특성에 따라 계층화 되었으며, 샘플링 효율 극대화를 위해 최적 층화 및 샘플 배정 최적화를 수행하였다. 최적화는 작물수량, 온실가스 배출량, 해충 분포 확률을 포함하는 16개 목표 변수에 대해 주어진 정밀도 제한 내에서 샘플 수를 최소화하는 방향으로 진행되었다. 샘플링의 정밀도와 정확도 평가는 각각 변동계수(CV)와 상대적 편향을 기반으로 하였다. 국내 농지 공간격자 모집단 계층화 및 샘플 배정 및 샘플 수 최적화 결과, 전체 농지는 5~21개 계층, 46~69개 샘플 수 수준에서 최적화되었다. 본 연구결과물들은 국내 농업시스템 대표 공간격자로써 널리 활용될 수 있을 것으로 기대된다. 또한, 기후변화 영향예측 공간모델링 연구들에 활용되어 샘플링 비용 및 계산 시간을 줄이면서도 모델의 효율성을 높이는 데에 기여할 수 있다.

PL의 브랜드확장이 소비자태도에 미치는 영향에 관한 연구 : 모브랜드 적합도 인식 차이의 조절효과를 중심으로 (The Effect of Brand Extension of Private Label on Consumer Attitude - a focus on the moderating effect of the perceived fit difference between parent brands and an extended brand -)

  • 김종근;김향미;이종호
    • 한국유통학회지:유통연구
    • /
    • 제16권4호
    • /
    • pp.1-27
    • /
    • 2011
  • 브랜드확장은 다양한 마케팅 영역 중에서도 전통적으로 활발하게 연구가 진행되어 왔던 영역으로서, 본 연구는 최근 그 중요성이나 활용도가 급증하고 있는 PL(Private Label)제품에 대해 브랜드확장의 개념을 활용하여 차별적으로 접근하고자 하였다. 최근 PL제품에 관한 마케팅연구가 활발하게 진행되고 있으나, 대부분 기존 틀에서 크게 벗어나지 못한 채 단순한 적용에 그치고 있으며, 특히 브랜드확장에 관련된 연구들에서도 PL시장의 특성을 제대로 반영하고 있다고 볼 수 없다. 특히 PL제품의 확장에 있어서는 두 가지 모브랜드가 존재할 수 있는데, 이에 대한 연구는 부재한 상황이다. 이에 본 연구에서는 확장 PL제품의 태도에 영향을 미치는 변수로서 두 가지 모브랜드인 유통업체와 기존 PL제품에 대한 태도를 제시하였다. 또한 개별 모브랜드가 PL제품의 태도에 미치는 영향은 개별 모브랜드와 확장 PL제품간 유사성에 의해 상이할 것이라고 제안하였으며, 유통업체와 기존 PL제품에 대한 태도에 영향을 미치는 변수로서 신뢰와 만족을 제시하였다. 분석결과 유통업체와 기존 PL제품에 대한 태도 모두 확장 PL제품의 태도에 유의한 영향을 미쳤으며 동시에 적합도 정도에 따라 그 영향력이 상이함도 실제 데이터를 통해 검증하였다. 즉 확장 PL제품의 태도는 모브랜드의 적합도가 보다 강하게 형성된 모브랜드의 영향을 더 크게 받는 것을 확인할 수 있었다. 이를 토대로 향후 PL제품을 확장할 경우 소비자가 보다 긍정적인 태도를 갖고 있는 모브랜드에 기초하여 해당 모브랜드와의 연상이 강하게 나타날 수 마케팅 전략을 구사할 필요가 있을 것이다.

  • PDF

비정형 정보와 CNN 기법을 활용한 이진 분류 모델의 고객 행태 예측: 전자상거래 사례를 중심으로 (Customer Behavior Prediction of Binary Classification Model Using Unstructured Information and Convolution Neural Network: The Case of Online Storefront)

  • 김승수;김종우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.221-241
    • /
    • 2018
  • 최근 딥러닝 기술이 주목을 받고 있다. 대중들의 관심을 받았던 국제 이미지 인식 기술 대회(ILSVR)와 알파고(AlphaGo)에서 사용된 딥러닝 기술이 바로 합성곱 신경망(CNN; Convolution Neural Network)이다. 합성곱 신경망은 입력 이미지를 작은 구역으로 나누어 부분적인 특징을 인식하고 이것을 결합하여 전체를 인식하는 특징을 가진다. 이러한 딥러닝 기술이 우리의 생활에 있어 많은 변화를 야기할 것이라는 기대를 주고 있지만 현재까지는 이미지 인식과 자연어 처리 등에 그 성과가 국한되어 있다. 비즈니스 문제에 대한 딥러닝 활용은 아직까지 초기 연구 단계로 향후 마케팅 응답 예측이나 허위 거래 식별, 부도 예측과 같은 전통적 비즈니스 문제들에 대해 보다 깊게 활용되고 그 성능이 입증된다면 딥러닝 기술의 활용 가치가 보다 더 주목받게 될 것으로 기대된다. 이러한 때 비교적 고객 식별이 용이하고 활용 가치가 높은 빅데이터를 보유하고 있는 전자상거래 기업의 사례를 바탕으로 하여 딥러닝 기술의 비즈니스 문제 해결 가능성을 진단해보는 것은 학술적으로 매우 의미 있는 시도라 할 수 있겠다. 이에 본 연구에서는 전자상거래 기업의 고객 행태 예측력을 높이기 위한 방안으로 합성곱 신경망을 활용한 '이종 정보 결합(Heterogeneous Information Integration)의 CNN 모델'을 제시한다. 이는 정형과 비정형 정보를 결합하여 다층 퍼셉트론 구조의 합성곱 신경망에서 학습시키는 모델로서 최적의 성능을 발휘하도록 '이종 정보 결합'과 '비정형 정보의 벡터 전환', 그리고 '다층 퍼셉트론 설계'로 하는 3개의 내부 아키텍처를 정의하고 각 아키텍처 단위로 구성되는 방식에 따른 성능을 평가하여 그 결과를 바탕으로 제안 모델을 확정하고 그 성능을 평가해보고자 한다. 고객 행태 예측을 위한 목표 변수는 전자상거래 기업에서 중요하게 관리하고 있는 재구매 고객, 이탈 고객, 고빈도 구매 고객, 고빈도 반품 고객, 고단가 구매 고객, 고할인 구매 고객 등 모두 6개의 이진 분류 문제로 정의한다. 제안한 모델의 유용성을 검증하기 위해서 국내 특정 전자상거래 기업의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 정형과 비정형 정보를 결합하여 CNN을 활용한 제안 모델이 NBC(Naïve Bayes classification)과 SVM(Support vector machine), 그리고 ANN(Artificial neural network)에 비해서 예측 정확도와 F1 Measure가 높게 평가되었다. 또 NBC, SVM, ANN에서 정형 정보만을 사용할 때 보다 정형과 비정형 정보를 결합하여 입력 변수로 함께 활용한 경우에 예측 정확도가 향상되는 것으로 나타났다. 따라서 실험 결과로부터 비정형 정보의 활용이 고객 행태 예측의 정확도 향상에 기여한다는 점과 CNN 기법의 특징 추출 알고리즘이 VOC에 사용된 단어들의 분포와 위치 정보를 해석하여 문장의 의미를 파악하는데 효과적이라는 점을 실증적으로 확인하였다는데 그 의미가 있다고 할 수 있겠다. 이를 통해서 CNN 기법이 지금까지 소개된 이미지 인식이나 자연어 처리 분야 외에 비즈니스 문제 해결에도 활용 가치가 높다는 점을 확인하였다는데 이 연구의 의의가 있다 하겠다.