• Title/Summary/Keyword: 시계열 비교분석

Search Result 700, Processing Time 0.034 seconds

Determining on Model-based Clusters of Time Series Data (시계열데이터의 모델기반 클러스터 결정)

  • Jeon, Jin-Ho;Lee, Gye-Sung
    • The Journal of the Korea Contents Association
    • /
    • v.7 no.6
    • /
    • pp.22-30
    • /
    • 2007
  • Most real word systems such as world economy, stock market, and medical applications, contain a series of dynamic and complex phenomena. One of common methods to understand these systems is to build a model and analyze the behavior of the system. In this paper, we investigated methods for best clustering over time series data. As a first step for clustering, BIC (Bayesian Information Criterion) approximation is used to determine the number of clusters. A search technique to improve clustering efficiency is also suggested by analyzing the relationship between data size and BIC values. For clustering, two methods, model-based and similarity based methods, are analyzed and compared. A number of experiments have been performed to check its validity using real data(stock price). BIC approximation measure has been confirmed that it suggests best number of clusters through experiments provided that the number of data is relatively large. It is also confirmed that the model-based clustering produces more reliable clustering than similarity based ones.

Forecasting Spot Freight Rate in LNG Market (LNG 운송시장의 스팟운임 예측 연구)

  • Lim, Sangseop;Kim, Seok-Hun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.01a
    • /
    • pp.325-326
    • /
    • 2021
  • LNG는 환경규제에 따라 화석에너지에서 친환경 재생에너지로 전환되는데 중요한 역할을 하는 에너지원이다. UN산하 세계해사기구(IMO)의 MARPOL협약에 따라 선박 황산화물 배출가스규제로 LNG추진 선박에 대한 수요가 증가되고 있을 뿐만 아니라 미국의 쉐일혁명으로 LNG를 수출함에 따라 공급의 변화가 급격하게 이뤄지고 있다. 과거 국가 주도의 프로젝트 성격이 강한 LNG 운송시장은 장기정기용선계약이 대부분이었으나 수요와 공급시장의 급격한 변화로 스팟시장의 중요성이 커지고 있다. 따라서 본 논문은 LNG 운송시장에서 시장참여자들의 스팟거래에 합리적인 의사결정이 이뤄지도록 과학적인 예측방법을 제시하고자 한다. LNG 스팟운임 예측에 기계학습모델 중 인공신경망 모델을 적용할 것이며 기존의 시계열분석 방법인 ARIMA모델과 비교하여 본문에서 제시된 모델의 예측성능의 우수성을 확인하였다. 본 논문은 LNG 스팟운임을 다룬 최초의 연구로서 학문적인 차별성이 기대된다.

  • PDF

A Study on LSTM Learning for Detecting Anomalous Trajectories of Protected Individuals by using GPS (신변보호자 경로이탈 감지를 위한 GPS 기반 LSTM 학습 연구 )

  • Jihyoung Kim;Jaehyun Yoo
    • Annual Conference of KIPS
    • /
    • 2024.05a
    • /
    • pp.633-634
    • /
    • 2024
  • 본 연구는 LSTM 모델이 수용 가능한 익명 보행자의 GPS 경로 범위와 훈련 데이터 셋의 크기에 대한 양상 분석을 목적으로 한다. 시계열 데이터인 GPS 경로 그리고 순환 신경망 LSTM 과 입력 구조를 이해하고, 두 가지 실험을 설계하여 LSTM 의 훈련 데이터 셋 수용을 파악한다. 실험에서는 장거리 데이터 셋을 학습한 모델과 그렇지 않은 모델을 비교하고, 훈련 데이터 셋 크기에 따른 학습 모델의 예측 값을 비교한다. 두 실험을 통해 GPS 경로 범위와 학습 가능한 경로의 가짓수에 대한 비교 분석 결과를 제시한다.

Analysis of storm effects on floods using runoff coefficient (유출계수를 이용한 호우가 홍수에 미치는 영향 분석)

  • Kim, Nam Won;Shin, Mun-Ju
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.265-265
    • /
    • 2016
  • 호우가 홍수에 미치는 영향의 분석은 수문현상을 이해하고 수공구조물을 설계하는데 반드시 필요한 절차이다. 호우가 홍수에 미치는 영향을 분석하기 위해서 독립된 소유역부터 비독립된 대유역까지 홍수량을 계산하고 그 상관성을 이해해야 하지만 상류쪽의 소유역의 경우 관측자료의 부재가 빈번하여 이러한 전반적인 분석이 쉽지 않다. 그리고 소유역과 대유역의 홍수특성을 연관지어 분석하기 위해서는 비교가능한 홍수특성을 추출해야 하며 이러한 일관된 잣대를 사용한 홍수분석은 중요하다. 본 연구에서는 소유역의 자료부재를 보완하기 위해 자료공간확장 방법을 제안하고 이를 통하여 안동댐 유역내 총 50개 지점의 홍수 시계열자료를 생성하였다. 자료공간확장 방법으로써, 안동댐유역의 1989년부터 2009년까지의 자료의 질이 좋은 20개의 사상을 추출하였고 안동댐유역 내에 위치한 안동댐, 도산, 소천의 수위관측지점의 관측유량자료에 대해 분포형 모형인 GRM 모형의 매개변수를 시행착오법으로 동시에 보정하여 한 개셋의 최적 매개변수를 추정하였다. 이때 모의결과를 평가하기 위하여 Nash-Sutcliffe (NS) 계수를 사용하였으며 20갯 사상의 세군데 관측수위지점에 대해서 모의결과가 전반적으로 0.5 NS 계수 이상으로써 만족할 만한 결과를 얻었다. 이 추정된 매개변수는 47개의 추가적인 관심지점의 유출모의에 사용되었으며 이렇게 모의된 유출시계열 자료는 관측시계열 자료로 가정하여 사용하였다. 이렇게 공간확장되어 생성된 시계열 자료는 이동평균방법을 사용하여 홍수강도-지속시간 곡선으로 변환되었고 50개 유역의 평균강우량 시계열 자료 또한 같은 밥법을 사용하여 강우강도-지속시간 곡선으로 변환되었다. 50개 유역의 비교가능한 일관된 홍수특성을 추출하기 위해 비유량법의 유출계수를 계산하였다. 유출계수를 계산하기 위해 유역별 도달시간을 계산하였으며 이 도달시간에 해당하는 강우강도를 추출하였다. 그리고 유역별 첨두 홍수강도를 유역별 도달시간에 해당하는 강우강도로 나눠줌으로써 유역별 유출계수를 계산하였고 이 유출계수를 유역면적에 대해 도시함으로써 그 경향을 조사하였다. 조사 결과 유역면적이 $100km^2$ 이상으로써 상류에서 하류방향으로 유역이 중첩되면서 증가하는 비독립적인 유역들의 경우 유역면적이 증가함에 따라 유출계수가 작아지거나 커지는 어떠한 경향을 보였다. 하지만 유역면적이 $100km^2$ 이하로써 독립적인 소유역의 경우 유역면적이 증가함에 따라 유출계수는 무작위로 분포되었다. 이것은 비독립적인 유역의 경우에는 호우가 홍수에 어떠한 일관된 영향을 미치나 각각 독립된 소유역의 경우에는 일관된 영향을 미치지 않음으로써 지역화방법에 의한 독립된 인근 미계측유역의 유출추정은 그 신뢰성이 높지 않다는 것을 의미한다.

  • PDF

Fuzzy Support Vector Machine for Pattern Classification of Time Series Data of KOSPI200 Index (시계열 자료 코스피200의 패턴분류를 위한 퍼지 서포트 벡타 기계)

  • Lee, S.Y.;Sohn, S.Y.;Kim, C.E.;Lee, Y.B.
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.14 no.1
    • /
    • pp.52-56
    • /
    • 2004
  • The Information of classification and estimate about KOSPI200 index`s up and down in the stock market becomes an important standard of decision-making in designing portofolio in futures and option market. Because the coming trend of time series patterns, an economic indicator, is very subordinate to the most recent economic pattern, it is necessary to study the recent patterns most preferentially. This paper compares classification and estimated performance of SVM(Support Vector Machine) and Fuzzy SVM model that are getting into the spotlight in time series analyses, neural net models and various fields. Specially, it proves that Fuzzy SVM is superior by presenting the most suitable dimension to fuzzy membership function that has time series attribute in accordance with learning Data Base.

Anomaly Detection In Real Power Plant Vibration Data by MSCRED Base Model Improved By Subset Sampling Validation (Subset 샘플링 검증 기법을 활용한 MSCRED 모델 기반 발전소 진동 데이터의 이상 진단)

  • Hong, Su-Woong;Kwon, Jang-Woo
    • Journal of Convergence for Information Technology
    • /
    • v.12 no.1
    • /
    • pp.31-38
    • /
    • 2022
  • This paper applies an expert independent unsupervised neural network learning-based multivariate time series data analysis model, MSCRED(Multi-Scale Convolutional Recurrent Encoder-Decoder), and to overcome the limitation, because the MCRED is based on Auto-encoder model, that train data must not to be contaminated, by using learning data sampling technique, called Subset Sampling Validation. By using the vibration data of power plant equipment that has been labeled, the classification performance of MSCRED is evaluated with the Anomaly Score in many cases, 1) the abnormal data is mixed with the training data 2) when the abnormal data is removed from the training data in case 1. Through this, this paper presents an expert-independent anomaly diagnosis framework that is strong against error data, and presents a concise and accurate solution in various fields of multivariate time series data.

Spatial Pattern and Trend Analysis of Parking-related Electronic Civil Complaints in Jinju-Si (진주시 주차관련 전자민원의 공간패턴분석 및 추이분석)

  • Won, Tae-Hong;Seo, Min-Song;Yoo, Hwan-Hee
    • Journal of Cadastre & Land InformatiX
    • /
    • v.47 no.1
    • /
    • pp.5-14
    • /
    • 2017
  • Korea, which has undergone a rapid urbanization, faces various problems such as the management of facilities, safety, environment and transportation. To solve civil complaints, local governments receive electronic complaints, but complaints are increasing. Therefore, this study conducted the spatial distribution pattern analysis and the trend analysis by presenting location data on spatial information through Geo-coding by collecting electronic civil petition data over the last 10 years targeting Jinju city. Using the ARIMA model, this study predicted the occurrence of complaints over the next two years (2016~2017) through a time series forecast analysis. As a result, the complaints related to illegal parking were the highest, the complaint related to noise was the second highest, and the complaints related to illegal garbage dumping was the third highest. In addition, the analysis of the spatial distribution pattern shows that the largest hot spot was formed in the central commercial district every year. As a result of the time series forecasting analysis for the crackdown of the illegal parking, complaints increased slightly. To compare the predicted value and the actual data showed a similar pattern. It is judged that this study will be utilized to establish effective countermeasures against civil complaints.

LNG Gas Demand Forecasting in Incheon Port based on Data: Comparing Time Series Analysis and Artificial Neural Network (데이터 기반 인천항 LNG 수요예측 모형 개발: 시계열분석 및 인공신경망 모형 비교연구)

  • Beom-Soo Kim;Kwang-Sup Shin
    • The Journal of Bigdata
    • /
    • v.8 no.2
    • /
    • pp.165-175
    • /
    • 2023
  • LNG is a representative imported cargo at Incheon Port and has a relatively high contribution to the increase/decrease in overall cargo volume at Incheon Port. In addition, in the view point of nationwide, LNG is the one of the most important key resource to supply the gas and generate electricity. Thus, it is very essential to identify the factors that have impact on the demand fluctuation and build the appropriate forecasting model, which present the basic information to make balance between supply and demand of LNG and establish the plan for power generation. In this study, different to previous research based on macroscopic annual data, the weekly demand of LNG is converted from the cargo volume unloaded by LNG carriers. We have identified the periodicity and correlations among internal and external factors of demand variability. We have identified the input factors for predicting the LNG demand such as seasonality of weekly cargo volume, the peak power demand, and the reserved capacity of power supply. In addition, in order to predict LNG demand, considering the characteristics of the data, time series prediction with weekly LNG cargo volume as a dependent variable and prediction through an artificial neural network model were made, the suitability of the predictions was verified, and the optimal model was established through error comparison between performance and estimates.

Analysis of Abnormal Wave at the West Coast on 31 March 2007 (2007년 3월 31일 서해안에 발생한 이상파랑에 대한 원인 분석)

  • Eom, Hyun-Min;Seung, Young-Ho;Woo, Seung-Buhm;You, Sung-Hyup
    • Journal of Korean Society of Coastal and Ocean Engineers
    • /
    • v.24 no.3
    • /
    • pp.217-227
    • /
    • 2012
  • On 31 March 2007, the abnormal wave occurred along western coast of Korean including Yeonggwang. In this paper, this event is studied using available field measurement data for the event analysis and numerical model for reproducing the unknown waves. We found several 1-min interval tidal elevation and mean sea level pressure (MSLP) data along the western coast of Korea and analyzed it using wavelet technique. We computed the arrival time and the propagation direction of abnormal wave using wavelet results and performed the numerical simulation using 2 dimensional shallow water wave model. The sea level under the forcing of air pressure jump was obviously amplified by the Proudman resonant effect. The computed sea levels compared with observations are underestimated, but the order of arrival time at the tidal station showed good agreement.

Chaos analysis of real estate auction sale price rate time series (부동산 경매 낙찰가율 시계열의 Chaos 분석)

  • Kang, Jun;Kim, Jiwoo;Lee, Hyun Jun;Oh, Kyong Joo
    • Journal of the Korean Data and Information Science Society
    • /
    • v.28 no.2
    • /
    • pp.371-381
    • /
    • 2017
  • There has never been research on Chaos analysis using real estate auction sale price rate in Korea. In this study, three Chaos analysis methodologies - Hurst exponent, correlation dimension, and maximum Lyapunov exponent - in order to capture the nonlinear deterministic dynamic system characteristics. High level of Hurst exponent and the extremely low maximum Lyapunov exponent provide the tendency and the persistence of the data. The empirical results give two meaningful facts. First, monthly time lags of the correlation dimension are coincident with the time period from the approval auction start day to the sale price fixing day. Second, its weekly time lags correspond to the time period from the last day of request for sale price allocation to the sale price fixing day. Then, this study potentially examines the predictability of the real estate auction price rate time series.