• 제목/요약/키워드: group-specific time series regression analysis

검색결과 4건 처리시간 0.009초

초등학교 교원 수 예측을 위한 시계열 회귀모형 (Time series regression model for forecasting the number of elementary school teachers)

  • 류수락;김종태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권2호
    • /
    • pp.321-332
    • /
    • 2013
  • 본 연구는 지속적인 저출산의 여파로 2020년에는 초등학생 수가 올해 대비 17%, 중고교생은 30%가 감소할 것이라는 예측을 가지고 초등학교 교원 수를 예측하기 위한 방법을 제시하는데 있다. 교육통계연보의 1970년부터 2010년까지의 초등교육 관련 주요 통계 자료를 이용하여 시계열 회귀모형과 시계열 그룹별 회귀모형, 지수평활법 모형을 제시하고, 제시된 모형을 이용하여 향후 10년간의 연도별 초등학교 교원 수를 예측하였다. 모형 예측 결과 시계열 그룹별 회귀 모형이 교원 수 시계열을 가장 잘 설명하는 것으로 나타났으며, 적합한 모형으로 판명되었다. 3가지 분석방법 모형에 따른 예측값에 대한 장단점과 한계를 제시한다.

딥러닝 시계열 알고리즘 적용한 기업부도예측모형 유용성 검증 (Corporate Default Prediction Model Using Deep Learning Time Series Algorithm, RNN and LSTM)

  • 차성재;강정석
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.1-32
    • /
    • 2018
  • 본 연구는 경제적으로 국내에 큰 영향을 주었던 글로벌 금융위기를 기반으로 총 10년의 연간 기업데이터를 이용한다. 먼저 시대 변화 흐름에 일관성있는 부도 모형을 구축하는 것을 목표로 금융위기 이전(2000~2006년)의 데이터를 학습한다. 이후 매개 변수 튜닝을 통해 금융위기 기간이 포함(2007~2008년)된 유효성 검증 데이터가 학습데이터의 결과와 비슷한 양상을 보이고, 우수한 예측력을 가지도록 조정한다. 이후 학습 및 유효성 검증 데이터를 통합(2000~2008년)하여 유효성 검증 때와 같은 매개변수를 적용하여 모형을 재구축하고, 결과적으로 최종 학습된 모형을 기반으로 시험 데이터(2009년) 결과를 바탕으로 딥러닝 시계열 알고리즘 기반의 기업부도예측 모형이 유용함을 검증한다. 부도에 대한 정의는 Lee(2015) 연구와 동일하게 기업의 상장폐지 사유들 중 실적이 부진했던 경우를 부도로 선정한다. 독립변수의 경우, 기존 선행연구에서 이용되었던 재무비율 변수를 비롯한 기타 재무정보를 포함한다. 이후 최적의 변수군을 선별하는 방식으로 다변량 판별분석, 로짓 모형, 그리고 Lasso 회귀분석 모형을 이용한다. 기업부도예측 모형 방법론으로는 Altman(1968)이 제시했던 다중판별분석 모형, Ohlson(1980)이 제시한 로짓모형, 그리고 비시계열 기계학습 기반 부도예측모형과 딥러닝 시계열 알고리즘을 이용한다. 기업 데이터의 경우, '비선형적인 변수들', 변수들의 '다중 공선성 문제', 그리고 '데이터 수 부족'이란 한계점이 존재한다. 이에 로짓 모형은 '비선형성'을, Lasso 회귀분석 모형은 '다중 공선성 문제'를 해결하고, 가변적인 데이터 생성 방식을 이용하는 딥러닝 시계열 알고리즘을 접목함으로서 데이터 수가 부족한 점을 보완하여 연구를 진행한다. 현 정부를 비롯한 해외 정부에서는 4차 산업혁명을 통해 국가 및 사회의 시스템, 일상생활 전반을 아우르기 위해 힘쓰고 있다. 즉, 현재는 다양한 산업에 이르러 빅데이터를 이용한 딥러닝 연구가 활발히 진행되고 있지만, 금융 산업을 위한 연구분야는 아직도 미비하다. 따라서 이 연구는 기업 부도에 관하여 딥러닝 시계열 알고리즘 분석을 진행한 초기 논문으로서, 금융 데이터와 딥러닝 시계열 알고리즘을 접목한 연구를 시작하는 비 전공자에게 비교분석 자료로 쓰이기를 바란다.

Liver Cancer Mortality Characteristics and Trends in China from 1991 to 2012

  • Fang, Jia-Ying;Wu, Ku-Sheng;Zeng, Yang;Tang, Wen-Rui;Du, Pei-Ling;Xu, Zhen-Xi;Xu, Xiao-Ling;Luo, Jia-Yi;Lin, Kun
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권5호
    • /
    • pp.1959-1964
    • /
    • 2015
  • Purpose: To investigate the distribution of liver cancer mortality as well as its developing trend from 1991 to 2012, forecast the future five-year trend, and provide a basis for the comprehensive prevention and management. Materials and Methods: Mortality data for liver cancer in China from 1991 to 2012 were used to describe characteristics and distribution of liver cancer mortality. Trend surface analysis was used to study the geographical distribution of liver cancer mortality. Curve estimation, time series modeling, gray modeling (GM) and joinpoint regression were used to predict and forecast future trends. Results: The mortality rate of liver cancer has constantly increased in China since 1991. Rates in rural areas are higher than in urban areas, and in males are higher than in females. In addition, our data predicted that the trend will continue to increase in the next 5 years. The age-specific mortality of liver cancer increases with age and peaks in the group of 80-84 years old. Geographical analysis showed the liver mortality rate was higher in the southeast provinces, such as Jiangsu, Zhejiang and Guangdong, and southwest regions like Guangxi Province. Conclusions: The standardized mortality rate of liver cancer in China has consistently increased from 1991 to 2012, and the upward trend is predicted to continue in the future. Much better prevention and management of liver cancer is needed in high mortality areas (the southwestern and southeastern parts of China) and high mortality age groups (80- to 84-year-olds), especially in rural areas.

시계열 자료의 데이터마이닝을 통한 한국산업표준의 제정과 활용 분석 (Analysis of Enactment and Utilization of Korean Industrial Standards(KS) by Time Series Data Mining)

  • 윤재권;김완;이희상
    • 기술혁신연구
    • /
    • 제23권3호
    • /
    • pp.225-253
    • /
    • 2015
  • 표준은 산업발전 및 무역 자유화의 기반이며 사회 경제적인 효율을 향상시키는 중요한 수단이다. 표준과 관련된 정책은 국가적인 차원에서 중요한 이슈 중 하나가 되고 있으며, 이에 따라 산업 분야별 한국산업표준 제정과 활용에 대한 분석은 표준과 관련된 연구에서 중요한 부분이 되고 있다. 본 연구는 분야별 KS 보유 및 제정현황 분석 그리고 열람실적을 이용하여 표준의 활용도를 분석한다. 먼저 KS의 보유현황을 국가정책적인 이슈와 함께 살펴보고, 세부적으로 KS 제정현황이 유사한 분야들은 무엇인지 파악하기 위해 다차원 척도법을 이용하여 시각화 및 군집화를 실시한다. 이후 각 군집별 제정현황이 유사한 분야들의 표준화 제정활동에 영향을 미치는 결정요인이 무엇인지 가설설정에 따른 회귀분석을 실시한다. 연구결과 자본집약도, 연구개발 그리고 매출액이 표준화 제정활동에 영향을 미치는 것으로 나타났다. 이에 따라 정부는 자본집약도가 큰 기업들이 표준화 과정에서 선도적 역할을 유도하고, 연구개발에 따른 표준과 기술특허 등을 정책적으로 연계시키며, 매출액이 큰 기업들이 표준화 활동을 선도하도록 지원정책을 수립해야 한다. 두 번째로 표준의 활용도를 분석하기 위해, KS 열람실적 데이터를 사용하며, 각 KS의 제정연도, 형태 분야별 활용도가 어떻게 다른지 기초통계분석과 의사결정나무를 사용하여 분석을 수행한다. 그 결과 표준의 제정시기가 활용도에 영향을 크게 미치며, 특정 분야와 형태의 KS들은 최근에 제정되었더라도 활용도가 높은 것으로 나타났다. 이에 따라 열람실적이 낮은 표준들에 대한 홍보 정책과 함께, 표준을 제정할 때 미열람되는 표준이 적어지도록 활용도를 고려하는 정책을 수립해야 한다.