• 제목/요약/키워드: high-dimensional time series

검색결과 71건 처리시간 0.021초

Performance Evaluation of a Feature-Importance-based Feature Selection Method for Time Series Prediction

  • Hyun, Ahn
    • Journal of information and communication convergence engineering
    • /
    • 제21권1호
    • /
    • pp.82-89
    • /
    • 2023
  • Various machine-learning models may yield high predictive power for massive time series for time series prediction. However, these models are prone to instability in terms of computational cost because of the high dimensionality of the feature space and nonoptimized hyperparameter settings. Considering the potential risk that model training with a high-dimensional feature set can be time-consuming, we evaluate a feature-importance-based feature selection method to derive a tradeoff between predictive power and computational cost for time series prediction. We used two machine learning techniques for performance evaluation to generate prediction models from a retail sales dataset. First, we ranked the features using impurity- and Local Interpretable Model-agnostic Explanations (LIME) -based feature importance measures in the prediction models. Then, the recursive feature elimination method was applied to eliminate unimportant features sequentially. Consequently, we obtained a subset of features that could lead to reduced model training time while preserving acceptable model performance.

유사 시퀀스 매칭을 위한 하이브리드 저차원 변환 (Hybrid Lower-Dimensional Transformation for Similar Sequence Matching)

  • 문양세;김진호
    • 정보처리학회논문지D
    • /
    • 제15D권1호
    • /
    • pp.31-40
    • /
    • 2008
  • 유사 시퀀스 매칭에서는 고차원인 시퀀스를 저차원의 점으로 변환하기 위하여 저차원 변환을 사용한다. 그런데, 이러한 저차원 변환은 시계열 데이터의 종류에 따라 인덱싱 성능에 있어서 큰 차이를 나타낸다. 즉, 어떤 저차원 변환을 선택하느냐가 유사 시퀀스 매칭의 인덱싱 성능에 큰 영향을 주게 된다. 이 문제를 해결하기 위하여, 본 논문에서는 하나의 인덱스에서 두 개 이상의 저차원 변환을 통합하여 사용하는 하이브리드 접근법을 제안한다. 먼저, 하나의 시퀀스에 두 개 이상의 저차원 변환을 적용하는 하이브리드 저차원 변환의 개념을 제안하고, 변환된 시퀀스간의 거리를 계산하는 하이브리드 거리를 정의한다. 다음으로, 이러한 하이브리드 접근법 사용하면 유사 시퀀스 매칭을 정확하게 수행할 수 있음을 정형적으로 증명한다. 또한, 제안한 하이브리드 접근법을 사용하는 인덱스 구성 및 유사 시퀀스 매칭 알고리즘을 제시한다. 다양한 시계열 데이터에 대한 실험 결과, 제안한 하이브리드 접근법은 단일 저차원 변환을 사용하는 경우에 비해서 우수한 성능을 보이는 것으로 나타났다. 이 같은 결과를 볼 때, 제안한 하이브리드 접근법은 다양한 특성을 지닌 다양한 시계열 데이터에 두루 적용될 수 있는 우수한 방법이라 사료된다.

Volatility for High Frequency Time Series Toward fGARCH(1,1) as a Functional Model

  • Hwang, Sun Young;Yoon, Jae Eun
    • Quantitative Bio-Science
    • /
    • 제37권2호
    • /
    • pp.73-79
    • /
    • 2018
  • As high frequency (HF, for short) time series is now prevalent in the presence of real time big data, volatility computations based on traditional ARCH/GARCH models need to be further developed to suit the high frequency characteristics. This article reviews realized volatilities (RV) and multivariate GARCH (MGARCH) to deal with high frequency volatility computations. As a (functional) infinite dimensional models, the fARCH and fGARCH are introduced to accommodate ultra high frequency (UHF) volatilities. The fARCH and fGARCH models are developed in the recent literature by Hormann et al. [1] and Aue et al. [2], respectively, and our discussions are mainly based on these two key articles. Real data applications to domestic UHF financial time series are illustrated.

Thermal-hydraulic simulation and evaluation of a natural circulation thermosyphon loop for a reactor cavity cooling system of a high-temperature reactor

  • Swart, R.;Dobson, R.T.
    • Nuclear Engineering and Technology
    • /
    • 제52권2호
    • /
    • pp.271-278
    • /
    • 2020
  • The investigation into a full-scale 27 m high, by 6 m wide, thermosyphon loop. The simulation model is based on a one-dimensional axially-symmetrical control volume approach, where the loop is divided into a series of discreet control volumes. The three conservation equations, namely, mass, momentum and energy, were applied to these control volumes and solved with an explicit numerical method. The flow is assumed to be quasi-static, implying that the mass-flow rate changes over time. However, at any instant in time the mass-flow rate is constant around the loop. The boussinesq approximation was invoked, and a reasonable correlation between the experimental and theoretical results was obtained. Experimental results are presented and the flow regimes of the working fluid inside the loop identified. The results indicate that a series of such thermosyphon loops can be used as a cavity cooling system and that the one-dimensional theoretical model can predict the internal temperature and mass-flow rate of the thermosyphon loop.

시계열 데이터베이스에서 DFT-기반 다차원 인덱스를 위한 물리적 데이터베이스 설계 (Physical Database Design for DFT-Based Multidimensional Indexes in Time-Series Databases)

  • 김상욱;김진호;한병일
    • 한국멀티미디어학회논문지
    • /
    • 제7권11호
    • /
    • pp.1505-1514
    • /
    • 2004
  • 시퀀스 매칭은 시계열 데이터베이스로부터 질의 시퀀스와 변화의 추세가 유사한 데이터 시퀀스들을 검색하는 연산이다. 기존의 대부분의 연구에서는 효과적인 시퀀스 매칭을 위하여 다차원 인덱스를 사용하며, 데이터 시퀀스를 이산 푸리에 변환(Discrete Fourier Transform: DFT)한 후, 단순히 앞의 두 개 내지 세 개의 DFT 계수만을 구성 속성 (organizing attributes)으로 사용함으로써 고차원의 경우 발생하는 차원 저주(dimensionality curse) 문제를 해결한다. 본 논문에서는 기존의 단순한 기법이 가지는 성능 상의 문제점들을 지적하고, 이러한 문제점들을 해결하는 최적의 다차원 인덱스 구성 기법을 제안한다. 제안된 기법은 대상이 되는 시계열 데이터베이스의 특성을 사전에 분석함으로써 변별력이 뛰어난 요소들을 다차원 인덱스의 구성 속성으로 선정하며, 비용 모델(cost model)을 기반으로 한 시퀀스 매칭 비용의 추정을 통하여 다차원 인덱스에 참여하는 최적의 구성 속성의 수를 결정한다. 제안된 기법의 우수성을 규명하기 위하여 실험을 통한기존 기법과의 성능 비교를 수행하였다 실험 결과에 의하면, 제안된 기법은 기존의 기법에 비교하여 매우 큰 성능 개선 효과를 가지는 것으로 나타났다.

  • PDF

MOSUM 성근 프로젝션을 이용한 고차원 시계열의 변화점 추정 (High-dimensional change point detection using MOSUM-based sparse projection)

  • 김문정;백창룡
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.63-75
    • /
    • 2022
  • 본 논문은 Wang과 Samworth (2018)가 제안한 성근 프로젝션 방법을 개선하여 MOSUM을 이용하여 고차원의 시계열데이터에 존재하는 다중 평균 변화점을 추정하는 방법에 대해서 제안한다. 제안한 방법은 국소방법으로 다중 변화점을 동시에 찾을 수 있어 순차적 오류를 최소화 할 뿐만 아니라 평균이 상쇄되는 경우에도 변화점을 추정하는 장점을 지니고 있다. 또한 데이터 의존적인 방법으로 블록 와일드 붓스트랩 방법을 활용하여 임계점을 찾는 방법을 제안한다. 모의 실험을 통해 제안한 방법이 좋은 성능을 보임을 확인하였으며 S&P 500 지수를 구성하는 개별 기업들의 금융 자료에 적용하여 최근 6년간 네 번의 변화점을 찾았다.

시계열 분류를 위한 PIPs 탐지와 Persist 이산화 기법들을 결합한 시계열 표현 (Time Series Representation Combining PIPs Detection and Persist Discretization Techniques for Time Series Classification)

  • 박상호;이주홍
    • 한국콘텐츠학회논문지
    • /
    • 제10권9호
    • /
    • pp.97-106
    • /
    • 2010
  • 시계열 데이터를 효율적이고 효과적으로 처리하기 위해 다양한 시계열 표현 방법들이 제안되었다. SAX(Symbolic Aggregate approXimation)는 단편화와 이산화 기법들을 결합한 시계열 표현 방법으로, 시계열 분류 문제에 성공적으로 적용되었다. 그러나 SAX는 시계열의 움직임을 평활하여 시계열의 중요한 동적 패턴들을 정확히 표현하기 위해 세그먼트 수를 크게 해야 한다. 본 논문은 PIPs (Perceptually Important Points)탐지 기법과 Persist 이산화 방법을 결합한 시계열 표현 방법을 제안한다. 제안된 방법은 시계열의 중요한 변곡점들을 나타내는 PIP 들을 탐지하여 고차원 시계열의 동적 움직임을 저차원 공간에서 표현한다. 그리고 시계열의 자기 전이와 주변 확률 분포를 KL 다이버전스에 적용하여 최적의 이산화 영역들을 결정한다. 제안된 방법은 시계열의 차원 축소과정에서 정보 손실을 최소화하여 시계열 분류의 성능을 향상시킨다.

점진적 프로젝션을 이용한 고차원 글러스터링 기법 (High-Dimensional Clustering Technique using Incremental Projection)

  • 이혜명;박영배
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.568-576
    • /
    • 2001
  • 대부분의 클러스터링 알고리즘들은 고차원 공간에서 성능이 급격히 저하되는 경향이 있다. 더욱이 고차원 데이타는 상당한 양의 잡음 데이타를 포함하고 있으므로 알고리즘의 추가적인 효과성 문제를 야기한다. 그러므로 고차원 데이타의 구조와 특성을 지원하는 적합한 클러스터링 기법이 개발되어야 한다. 본 논문에서는 선형변환 프로젝션을 이용한 클러스터링 알고리즘 CLIP을 제안한다. CLIP은 고차원 클러스터링의 효율성 및 효과성 문제를 극복하기 위해 개발되었으며, 클러스터 형성에 밀접하게 연관된 부분 공간에서 클러스터를 탐사하는 기법이다. 알고리즘의 주요 사상은 각1차원적 부분공간에서의 클러스터링에 기본을 두고 있지만. 점진적인 프로젝션을 이용하여 고차원 클러스터를 탐사한 뿐만 아니라 연산을 획기적으로 줄인다. CLIP의 성능을 평가하기 위해 합성 데이타를 이용한 일련의 실험을 통하여 효율성 및 효과성을 증명한다

  • PDF

사람 행동 인식에서 반복 감소를 위한 저수준 사람 행동 변화 감지 방법 (Detection of Low-Level Human Action Change for Reducing Repetitive Tasks in Human Action Recognition)

  • 노요환;김민정;이도훈
    • 한국멀티미디어학회논문지
    • /
    • 제22권4호
    • /
    • pp.432-442
    • /
    • 2019
  • Most current human action recognition methods based on deep learning methods. It is required, however, a very high computational cost. In this paper, we propose an action change detection method to reduce repetitive human action recognition tasks. In reality, simple actions are often repeated and it is time consuming process to apply high cost action recognition methods on repeated actions. The proposed method decides whether action has changed. The action recognition is executed only when it has detected action change. The action change detection process is as follows. First, extract the number of non-zero pixel from motion history image and generate one-dimensional time-series data. Second, detecting action change by comparison of difference between current time trend and local extremum of time-series data and threshold. Experiments on the proposed method achieved 89% balanced accuracy on action change data and 61% reduced action recognition repetition.

Electricity Price Prediction Model Based on Simultaneous Perturbation Stochastic Approximation

  • Ko, Hee-Sang;Lee, Kwang-Y.;Kim, Ho-Chan
    • Journal of Electrical Engineering and Technology
    • /
    • 제3권1호
    • /
    • pp.14-19
    • /
    • 2008
  • The paper presents an intelligent time series model to predict uncertain electricity market price in the deregulated industry environment. Since the price of electricity in a deregulated market is very volatile, it is difficult to estimate an accurate market price using historically observed data. The parameter of an intelligent time series model is obtained based on the simultaneous perturbation stochastic approximation (SPSA). The SPSA is flexible to use in high dimensional systems. Since prediction models have their modeling error, an error compensator is developed as compensation. The SPSA based intelligent model is applied to predict the electricity market price in the Pennsylvania-New Jersey-Maryland (PJM) electricity market.