• 제목/요약/키워드: Time series Analysis

검색결과 3,272건 처리시간 0.029초

시계열 분석을 이용한 소프트웨어 미래 고장 시간 예측에 관한 연구 (The Study for Software Future Forecasting Failure Time Using Time Series Analysis.)

  • 김희철;신현철
    • 융합보안논문지
    • /
    • 제11권3호
    • /
    • pp.19-24
    • /
    • 2011
  • 소프트웨어 고장 시간은 테스팅 시간과 관계없이 일정하거나, 단조증가 혹은 단조 감소 추세를 가지고 있다. 이러한 소프트웨어 신뢰모형들을 분석하기 위한 자료척도로 자료에 대한 추세 검정이 개발되어 있다. 추세 분석에는 산술평균 검정과 라플라스 추세 검정 등이 있다. 추세분석들은 전체적인 자료의 개요의 정보만 제공한다. 본 논문에서는 고장시간을 측정하다가 시간 절단이 될 경우에 미래의 고장 시간 예측에 관하여 연구 하였다. 시계열 분석에 이용되는 단순이동 평균법과 가중이동평균법, 지수평활법을 이용하여 미래고장 시간을 예측하여 비교하고자 한다. 실증분석에서는 고장간격 자료를 이용하여 모형들에 대한 예측값을 평균자승오차를 이용하여 비교하고 효율적 모형을 선택 하였다.

시계열분석을 통한 산업재해율 예측 (The Prediction of Industrial Accident Rate in Korea: A Time Series Analysis)

  • 최은숙;전경숙;이원기;김영선
    • 한국직업건강간호학회지
    • /
    • 제25권1호
    • /
    • pp.65-74
    • /
    • 2016
  • Purpose: The purpose of this study is to predict industrial accident rate using time series analysis. Methods: The rates of industrial accident and occupational injury death were analyzed using industrial accident statistics analysis system of the Korea Occupational Safety and Health Agency from 2001 to 2014. Time series analysis was done using the most recent data, such as raw materials of Economically Active Population Survey, Economic Statistics System of the Bank of Korea, and e-National indicators. The best-fit model with time series analysis to predict occupational injury was developed by identifying predictors when the value of Akaike Information Criteria was the lowest point. Variables into the model were selected through a series of expertises' consultations and literature review, which consisted of socioeconomic structure, labor force structure, working conditions, and occupational accidents. Results: Indexes at the meso- and macro-levels predicting well occurrence of occupational accidents and occupational injury death were labor force participation rate for ages 45-49 and budget for small scaled workplace support. The rates of industrial accident and occupational injury death are expected to decline. Conclusion: For reducing industrial accident continuously, we call for safe employment policy of economically active middle aged adults and support for improving safety work environment of small sized workplace.

Efficient Anomaly Detection Through Confidence Interval Estimation Based on Time Series Analysis

  • Kim, Yeong-Ju;Jeong, Min-A
    • International journal of advanced smart convergence
    • /
    • 제4권2호
    • /
    • pp.46-53
    • /
    • 2015
  • This paper suggests a method of real time confidence interval estimation to detect abnormal states of sensor data. For real time confidence interval estimation, the mean square errors of the exponential smoothing method and moving average method, two of the time series analysis method, were compared, and the moving average method with less errors was applied. When the sensor data passes the bounds of the confidence interval estimation, the administrator is notified through alarms. As the suggested method is for real time anomaly detection in a ship, an Android terminal was adopted for better communication between the wireless sensor network and users. For safe navigation, an administrator can make decisions promptly and accurately upon emergency situation in a ship by referring to the anomaly detection information through real time confidence interval estimation.

A Biclustering Method for Time Series Analysis

  • Lee, Jeong-Hwa;Lee, Young-Rok;Jun, Chi-Hyuck
    • Industrial Engineering and Management Systems
    • /
    • 제9권2호
    • /
    • pp.131-140
    • /
    • 2010
  • Biclustering is a method of finding meaningful subsets of objects and attributes simultaneously, which may not be detected by traditional clustering methods. It is popularly used for the analysis of microarray data representing the expression levels of genes by conditions. Usually, biclustering algorithms do not consider a sequential relation between attributes. For time series data, however, bicluster solutions should keep the time sequence. This paper proposes a new biclustering algorithm for time series data by modifying the plaid model. The proposed algorithm introduces a parameter controlling an interval between two selected time points. Also, the pruning step preventing an over-fitting problem is modified so as to eliminate only starting or ending points. Results from artificial data sets show that the proposed method is more suitable for the extraction of biclusters from time series data sets. Moreover, by using the proposed method, we find some interesting observations from real-world time-course microarray data sets and apartment price data sets in metropolitan areas.

Effect of land use and urbanization on groundwater recharge in metropolitan area: time series analysis of groundwater level data

  • Chae, Gi-Tak;Yun, Seong-Taek;Kim, Dong-Seung;Choi, Hyeon-Su
    • 한국지하수토양환경학회:학술대회논문집
    • /
    • 한국지하수토양환경학회 2004년도 임시총회 및 추계학술발표회
    • /
    • pp.113-114
    • /
    • 2004
  • In order to classify the groundwater recharge characteristics in an urban area, a time series analysis of groundwater level data was performed. For this study, the daily groundwater level data from 35 monitoring wells were collected for 3 years (Fig. 1). The use of the cross-correlation function (CCF), one of the time series analysis, showed both the close relationship between rainfall and groundwater level change and the lag time (delay time) of groundwater level fluctuation after a rainfall event. Based on the result of CCF, monitored wells were classified into two major groups. Group I wells (n=10) showed a fast response of groundwater level change to rainfall event, with a delay time of maximum correlation between rainfall and groundwater level near 1 to 7 days. On the other hand, the delay time of 17-68 days was observed from Group II wells (n=25) (Fig. 1). The fast response in Group I wells is possibly caused by the change of hydraulic pressure of bedrock aquifer due to the rainfall recharge, rather than the direct response to rainfall recharge.

  • PDF

초공간을 고려한 SA 508강의 재질열화 시계열 신호의 카오스성 평가 (Chaotic evaluation of material degradation time series signals of SA 508 Steel considering the hyperspace)

  • 고준빈;윤인식;오상균;이영호
    • Journal of Welding and Joining
    • /
    • 제16권6호
    • /
    • pp.86-96
    • /
    • 1998
  • This study proposes the analysis method of time series ultrasonic signal using the chaotic feature extraction for degradation extent evaluation. Features extracted from time series data using the chaotic time series signal analyze quantitatively degradation extent. For this purpose, analysis objective in this study is fractal dimension, lyapunov exponent, strange attractor on hyperspace. The lyapunov exponent is a measure of the rate at which nearby trajectories in phase space diverge. Chaotic trajectories have at least one positive lyapunov exponent. The fractal dimension appears as a metric space such as the phase space trajectory of a dynamical system. In experiment, fractal correlation) dimensions, lyapunov exponents, energy variation showed values of 2.217∼2.411, 0.097∼ 0.146, 1.601∼1.476 voltage according to degardation extent. The proposed chaotic feature extraction in this study can enhances precision ate of degradation extent evaluation from degradation extent results of the degraded materials (SA508 CL.3)

  • PDF

시계열에서의 연속이상치가 예측에 미치는 영향 (The effect of patchy outliers in time series forecasting)

  • 이재준;편영숙
    • 응용통계연구
    • /
    • 제9권1호
    • /
    • pp.125-137
    • /
    • 1996
  • 시계열 자료는 흔히 반복되지 않는 비정상적인 사건의 영향으로 이상치를 포함한다. 시계열 자료는 관측치들 사이에 종속구조를 갖기 때문에, 이상치의 영향은 다른 통계적 분석에서 보다 더 심각할 수 있다. 본 논문에서는 연속이상치가 예측에 미치는 영향을 파악하는 데에 촛점을 두었다. 특히, l 시점 후 예측오차의 평균제곱의 증가량을 유도하고, 이 증가량으로 연속이상치가 예측에 미치는 영향을 측정하였다. 일반적으로, 연속이상치가 예측 원점에서 아주 가까운 시점에서 발생하지 않았으며 그 증가량은 크지 않음을 밝히고, 실제 자료를 분석하여 확인하였다.

  • PDF

효율적인 문헌 분류를 위한 시계열 기반 데이터 집합 선정 기법 (Time-Series based Dataset Selection Method for Effective Text Classification)

  • 채영훈;정도헌
    • 한국콘텐츠학회논문지
    • /
    • 제17권1호
    • /
    • pp.39-49
    • /
    • 2017
  • 인터넷 기술이 발전함에 따라 온라인상의 데이터는 급격하게 증가하고 있고, 증가하는 데이터에 대해 점진적인 기계학습 기법을 통해 효율적으로 학습하기 위한 연구가 진행되고 있다. 온라인상의 문서는 대부분 게시일, 출판일과 같은 시계열적 정보를 포함하고 있고, 이를 분류에 반영한다면 효율적인 분류가 가능할 것이다. 본 연구에서는 웹 문서상에서 나타나는 어휘의 시계열적 변화를 분석하였고, 분석한 시계열 정보를 기반으로 데이터 집합을 분할하여 효율적인 분류 학습 기법을 제안한다. 실험 및 검증을 위해 온라인상의 뉴스 기사 100만 건을 시계열 정보를 포함하여 수집하였다. 수집된 데이터를 바탕으로 데이터 집합을 분할하여 $Na{\ddot{i}}ve$ Bayes 및 SVM 분류기를 사용하여 실험을 진행하였고, 각 모델에서 전체 데이터 집합 학습 대비 최대 2.02% 포인트, 2.32% 포인트의 성능 향상을 확인하였다. 본 연구를 통해 시계열적 어휘의 변화를 분류에 반영하여 분류의 성능을 향상시킬 수 있음을 확인하였다.

딥러닝 시계열 알고리즘 적용한 기업부도예측모형 유용성 검증 (Corporate Default Prediction Model Using Deep Learning Time Series Algorithm, RNN and LSTM)

  • 차성재;강정석
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.1-32
    • /
    • 2018
  • 본 연구는 경제적으로 국내에 큰 영향을 주었던 글로벌 금융위기를 기반으로 총 10년의 연간 기업데이터를 이용한다. 먼저 시대 변화 흐름에 일관성있는 부도 모형을 구축하는 것을 목표로 금융위기 이전(2000~2006년)의 데이터를 학습한다. 이후 매개 변수 튜닝을 통해 금융위기 기간이 포함(2007~2008년)된 유효성 검증 데이터가 학습데이터의 결과와 비슷한 양상을 보이고, 우수한 예측력을 가지도록 조정한다. 이후 학습 및 유효성 검증 데이터를 통합(2000~2008년)하여 유효성 검증 때와 같은 매개변수를 적용하여 모형을 재구축하고, 결과적으로 최종 학습된 모형을 기반으로 시험 데이터(2009년) 결과를 바탕으로 딥러닝 시계열 알고리즘 기반의 기업부도예측 모형이 유용함을 검증한다. 부도에 대한 정의는 Lee(2015) 연구와 동일하게 기업의 상장폐지 사유들 중 실적이 부진했던 경우를 부도로 선정한다. 독립변수의 경우, 기존 선행연구에서 이용되었던 재무비율 변수를 비롯한 기타 재무정보를 포함한다. 이후 최적의 변수군을 선별하는 방식으로 다변량 판별분석, 로짓 모형, 그리고 Lasso 회귀분석 모형을 이용한다. 기업부도예측 모형 방법론으로는 Altman(1968)이 제시했던 다중판별분석 모형, Ohlson(1980)이 제시한 로짓모형, 그리고 비시계열 기계학습 기반 부도예측모형과 딥러닝 시계열 알고리즘을 이용한다. 기업 데이터의 경우, '비선형적인 변수들', 변수들의 '다중 공선성 문제', 그리고 '데이터 수 부족'이란 한계점이 존재한다. 이에 로짓 모형은 '비선형성'을, Lasso 회귀분석 모형은 '다중 공선성 문제'를 해결하고, 가변적인 데이터 생성 방식을 이용하는 딥러닝 시계열 알고리즘을 접목함으로서 데이터 수가 부족한 점을 보완하여 연구를 진행한다. 현 정부를 비롯한 해외 정부에서는 4차 산업혁명을 통해 국가 및 사회의 시스템, 일상생활 전반을 아우르기 위해 힘쓰고 있다. 즉, 현재는 다양한 산업에 이르러 빅데이터를 이용한 딥러닝 연구가 활발히 진행되고 있지만, 금융 산업을 위한 연구분야는 아직도 미비하다. 따라서 이 연구는 기업 부도에 관하여 딥러닝 시계열 알고리즘 분석을 진행한 초기 논문으로서, 금융 데이터와 딥러닝 시계열 알고리즘을 접목한 연구를 시작하는 비 전공자에게 비교분석 자료로 쓰이기를 바란다.

Improved Linear Dynamical System for Unsupervised Time Series Recognition

  • Thi, Ngoc Anh Nguyen;Yang, Hyung-Jeong;Kim, Soo-Hyung;Lee, Guee-Sang;Kim, Sun-Hee
    • International Journal of Contents
    • /
    • 제10권1호
    • /
    • pp.47-53
    • /
    • 2014
  • The paper considers the challenges involved in measuring the similarities between time series, such as time shifts and the mixture of frequencies. To improve recognition accuracy, we investigate an improved linear dynamical system for discovering prominent features by exploiting the evolving dynamics and correlations in a time series, as the quality of unsupervised pattern recognition relies strongly on the extracted features. The proposed approach yields a set of compact extracted features that boosts the accuracy and reliability of clustering for time series data. Experimental evaluations are carried out on time series applications from the scientific, socio-economic, and business domains. The results show that our method exhibits improved clustering performance compared to conventional methods. In addition, the computation time of the proposed approach increases linearly with the length of the time series.