• 제목/요약/키워드: time series regression analysis

검색결과 311건 처리시간 0.023초

Application of Statistical Models for Default Probability of Loans in Mortgage Companies

  • Jung, Jin-Whan
    • Communications for Statistical Applications and Methods
    • /
    • 제7권2호
    • /
    • pp.605-616
    • /
    • 2000
  • Three primary interests frequently raised by mortgage companies are introduced and the corresponding statistical approaches for the default probability in mortgage companies are examined. Statistical models considered in this paper are time series, logistic regression, decision tree, neural network, and discrete time models. Usage of the models is illustrated using an artificially modified data set and the corresponding models are evaluated in appropriate manners.

  • PDF

딥러닝 시계열 알고리즘 적용한 기업부도예측모형 유용성 검증 (Corporate Default Prediction Model Using Deep Learning Time Series Algorithm, RNN and LSTM)

  • 차성재;강정석
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.1-32
    • /
    • 2018
  • 본 연구는 경제적으로 국내에 큰 영향을 주었던 글로벌 금융위기를 기반으로 총 10년의 연간 기업데이터를 이용한다. 먼저 시대 변화 흐름에 일관성있는 부도 모형을 구축하는 것을 목표로 금융위기 이전(2000~2006년)의 데이터를 학습한다. 이후 매개 변수 튜닝을 통해 금융위기 기간이 포함(2007~2008년)된 유효성 검증 데이터가 학습데이터의 결과와 비슷한 양상을 보이고, 우수한 예측력을 가지도록 조정한다. 이후 학습 및 유효성 검증 데이터를 통합(2000~2008년)하여 유효성 검증 때와 같은 매개변수를 적용하여 모형을 재구축하고, 결과적으로 최종 학습된 모형을 기반으로 시험 데이터(2009년) 결과를 바탕으로 딥러닝 시계열 알고리즘 기반의 기업부도예측 모형이 유용함을 검증한다. 부도에 대한 정의는 Lee(2015) 연구와 동일하게 기업의 상장폐지 사유들 중 실적이 부진했던 경우를 부도로 선정한다. 독립변수의 경우, 기존 선행연구에서 이용되었던 재무비율 변수를 비롯한 기타 재무정보를 포함한다. 이후 최적의 변수군을 선별하는 방식으로 다변량 판별분석, 로짓 모형, 그리고 Lasso 회귀분석 모형을 이용한다. 기업부도예측 모형 방법론으로는 Altman(1968)이 제시했던 다중판별분석 모형, Ohlson(1980)이 제시한 로짓모형, 그리고 비시계열 기계학습 기반 부도예측모형과 딥러닝 시계열 알고리즘을 이용한다. 기업 데이터의 경우, '비선형적인 변수들', 변수들의 '다중 공선성 문제', 그리고 '데이터 수 부족'이란 한계점이 존재한다. 이에 로짓 모형은 '비선형성'을, Lasso 회귀분석 모형은 '다중 공선성 문제'를 해결하고, 가변적인 데이터 생성 방식을 이용하는 딥러닝 시계열 알고리즘을 접목함으로서 데이터 수가 부족한 점을 보완하여 연구를 진행한다. 현 정부를 비롯한 해외 정부에서는 4차 산업혁명을 통해 국가 및 사회의 시스템, 일상생활 전반을 아우르기 위해 힘쓰고 있다. 즉, 현재는 다양한 산업에 이르러 빅데이터를 이용한 딥러닝 연구가 활발히 진행되고 있지만, 금융 산업을 위한 연구분야는 아직도 미비하다. 따라서 이 연구는 기업 부도에 관하여 딥러닝 시계열 알고리즘 분석을 진행한 초기 논문으로서, 금융 데이터와 딥러닝 시계열 알고리즘을 접목한 연구를 시작하는 비 전공자에게 비교분석 자료로 쓰이기를 바란다.

시계열분석을 적용한 저장탄약수명 예측 기법 연구 - 추진장약의 안정제함량 변화를 중심으로 - (Prediction of the shelf-life of ammunition by time series analysis)

  • 이정우;김희보;김영인;홍윤기
    • 한국국방경영분석학회지
    • /
    • 제37권1호
    • /
    • pp.39-48
    • /
    • 2011
  • 야전에 저장된 탄약의 수명을 예측하는 것은 군의 전투지원 핵심요소로 실무적으로 매우 중요한 의미가 있다. 본 연구는 6년간 수행한 155mm 추진장약(KD541)의 ASRP(Ammunition Stockpile Reliability Program : 저장탄약신뢰성평가) 결과를 기초로 추진장약 추진제의 안정제함량 변화에 따른 시계열분석 (ARIMA 모델) 방법론을 적용 저장탄약수명을 예측하였다. 이번 연구는 기존의 회귀분석 모델을 활용한 연구방법과 다르게 시계열분석을 적용하되 미니 탭 프로그램을 활용하여 시계열분석을 적용 저장탄약수명을 예측하였다. 이러한 분석결과 155mm 추진장약(KD541) 저장수명은 35~43년으로 예측되었다.

Speed-up of the Matrix Computation on the Ridge Regression

  • Lee, Woochan;Kim, Moonseong;Park, Jaeyoung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권10호
    • /
    • pp.3482-3497
    • /
    • 2021
  • Artificial intelligence has emerged as the core of the 4th industrial revolution, and large amounts of data processing, such as big data technology and rapid data analysis, are inevitable. The most fundamental and universal data interpretation technique is an analysis of information through regression, which is also the basis of machine learning. Ridge regression is a technique of regression that decreases sensitivity to unique or outlier information. The time-consuming calculation portion of the matrix computation, however, basically includes the introduction of an inverse matrix. As the size of the matrix expands, the matrix solution method becomes a major challenge. In this paper, a new algorithm is introduced to enhance the speed of ridge regression estimator calculation through series expansion and computation recycle without adopting an inverse matrix in the calculation process or other factorization methods. In addition, the performances of the proposed algorithm and the existing algorithm were compared according to the matrix size. Overall, excellent speed-up of the proposed algorithm with good accuracy was demonstrated.

시계열 자료의 데이터마이닝을 위한 패턴분류 모델설계 및 성능비교 (Pattern Classification Model Design and Performance Comparison for Data Mining of Time Series Data)

  • 이수용;이경중
    • 한국지능시스템학회논문지
    • /
    • 제21권6호
    • /
    • pp.730-736
    • /
    • 2011
  • 본 연구는 순차적인 시계열 자료들에서 가장 최근의 추세가 반영될 수 있는 패턴분류 모델을 설계하였다. 의사결정을 지원하는 데이터마이닝 패턴분류 모델을 설계할 때 통계 기법과 인공지능 기법을 융합한 모델들이 기존의 모델보다 우수함을 입증하였다. 특히 퍼지이론과 융합된 패턴분류 모델들의 적중률이 상대적으로 더 향상되었다. 예를 들어, 통계적 이론을 기반으로 한 SVM모델과 퍼지소속함수와의 결합, 혹은 신경망과 FCM을 결합한 모델들의 성능이 우수하였다. 실험에서 사용한 패턴분류 모델들은 BPN, PNN, FNN, FCM, SVM, FSVM, Decision Tree, Time Series Analysis, Regression Analysis 등이다. 그리고 데이터베이스는 시계열 속성을 지닌 금융시장의 경제지표 DB(한국, KOSPI200 데이터베이스)와 병원 응급실의 부정맥환자에 대한 심전도 DB(미국 MIT-BIH 데이터베이스)들을 사용하였다.

토픽모델링과 시계열회귀분석을 활용한 정보시스템분야 연구동향 분석 (Investigation of Research Trends in Information Systems Domain Using Topic Modeling and Time Series Regression Analysis)

  • 김창식;최수정;곽기영
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권6호
    • /
    • pp.1143-1150
    • /
    • 2017
  • 본 연구의 목적은 국내에서 2002년부터 2016년까지 출판된, 대표적인 정보시스템분야 저널의 연구동향을 조사하는 것이다. 연구의 목적을 달성하기 위해서 Asia Pacific Journal of Information Systems, Information Systems Review, The Journal of Information Systems에 출판된 논문의 초록 1,245편을 분석 하였다. 본 연구에서는 최근 중요하게 다루어지는 토픽모델링과 시계열회귀분석 기법을 활용하였다. 토픽모델링 분석결과, 20개의 토픽이 도출되었고 "시스템구축", "혁신역량", 및 "고객충성도" 등의 순으로 확인되었다. 둘째, 시계열회귀분석 결과, 상승 추세를 나타내는 토픽으로는 "고객충성도", "소통혁신", "정보보호", 및 "개인정보보호" 가 나타났고, 하락 추세를 나타나는 토픽으로는 "시스템구축" 및 "웹사이트" 가 도출되었다.

지적측량업무 영향요인 분석을 통한 수요예측모형 연구 (A Study on Demanding forecasting Model of a Cadastral Surveying Operation by analyzing its primary factors)

  • 송명숙
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2007년도 추계학술대회 및 정기총회
    • /
    • pp.477-481
    • /
    • 2007
  • The purpose of this study is to provide the ideal forecasting model of cadastral survey work load through the Economeatric Analysis of Time Series, Granger Causality and VAR Model Analysis, it suggested the forecasting reference materials for the total amount of cadastral survey general work load. The main result is that the derive of the environment variables which affect cadastral survey general work load and the outcome of VAR(vector auto regression) analysis materials(impulse response function and forecast error variance decomposition analysis materials), which explain the change of general work load depending on altering the environment variables. And also, For confirming the stability of time series data, we took a unit root test, ADF(Augmented Dickey-Fuller) analysis and the time series model analysis derives the best cadastral forecasting model regarding on general cadastral survey work load. And also, it showed up the various standards that are applied the statistical method of econometric analysis so it enhanced the prior aggregate system of cadastral survey work load forecasting.

  • PDF

회귀모형에 의한 서해안 평균해면의 연시계열자료의 평가 (The Evaluation of the Annual Time Series Data for the Mean Sea Level of the West Coast by Regression Model)

  • 조기태;박영기;이장춘
    • 한국환경과학회지
    • /
    • 제9권1호
    • /
    • pp.19-25
    • /
    • 2000
  • As the tideland reclamation is done on a large scale these days, construction work is active in the coastal areas. Facilities in the coastal areas must be built with the tide characteristics taken into consideration. Thus the tide characteristics affect the overall reclamation plan. The analysis of the tide data boils down to a harmonic analysis of the hourly changes of long-term tide data and extraction of unharmonic coefficients from the results. Since considerable amount of tide data of the West Coast are available, the existing data can be collected and can be used to obtain the temporal changes of the tide by being fitted into the tide prediction model. The goal of this thesis lies in assessing whether the mean sea level used in the field agrees with the analysis results from the long-term observation data obtained with their homogeneity guaranteed. To achieve this goal, the research was conducted as follows. First the present conditions of the observation stations, the land level standard, and the sea level standard were analyzed to set up a time series model formula for representing them. To secure the homogeneity of the time series, each component was separated. Lastly the mean sea level used in the field was assessed based on the results obtained form the analysis of the time series.

  • PDF

주기 패턴을 이용한 센서 네트워크 데이터의 이상치 예측 (Outlier prediction in sensor network data using periodic pattern)

  • 김형일
    • 센서학회지
    • /
    • 제15권6호
    • /
    • pp.433-441
    • /
    • 2006
  • Because of the low power and low rate of a sensor network, outlier is frequently occurred in the time series data of sensor network. In this paper, we suggest periodic pattern analysis that is applied to the time series data of sensor network and predict outlier that exist in the time series data of sensor network. A periodic pattern is minimum period of time in which trend of values in data is appeared continuous and repeated. In this paper, a quantization and smoothing is applied to the time series data in order to analyze the periodic pattern and the fluctuation of each adjacent value in the smoothed data is measured to be modified to a simple data. Then, the periodic pattern is abstracted from the modified simple data, and the time series data is restructured according to the periods to produce periodic pattern data. In the experiment, the machine learning is applied to the periodic pattern data to predict outlier to see the results. The characteristics of analysis of the periodic pattern in this paper is not analyzing the periods according to the size of value of data but to analyze time periods according to the fluctuation of the value of data. Therefore analysis of periodic pattern is robust to outlier. Also it is possible to express values of time attribute as values in time period by restructuring the time series data into periodic pattern. Thus, it is possible to use time attribute even in the general machine learning algorithm in which the time series data is not possible to be learned.

빅 데이터 분석을 활용한 회귀분석 기반 식품 첨가물과 암 발생 관계 (Relation between Regression-based Food Additives and Carcinogenesis using Big Data Analysis)

  • 이국형;이준희;김정준;김영곤
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.203-210
    • /
    • 2018
  • 최근 웰빙(Well-Bing) 열품에 힘입어 화학적으로 가공되지 않은 천연 식품을 찾는 소비 형태가 많이 부각되고 있다. 하지만 현대 시대를 살아감에 있어 화학 식품 첨가물이 포함되지 않은 식품을 주변에서 찾기는 매우 힘들다. 또한 가공 조리된 식품에는 화학 식품 첨가물의 성분이 제대로 표기되어 있지 않거나 표기가 생략되어 나오는 제품이 상당수다. 본 논문은 한국의 연간 화학 식품 첨가물 소비량 데이터를 기반으로 첨가물 별 대두 되고 있는 암 발생을 빅 데이터 분석 기법 중 하나인 시계열 분석과 회귀 분석을 통해 검증 할 것이며, 이러한 식품 첨가물이 사회의 어떠한 요인 때문에 소비가 증가했는지에 대한 빅 데이터 분석을 실시해 검증한다.