• 제목/요약/키워드: time series clustering

검색결과 185건 처리시간 0.023초

C-Means 클러스터링 기반의 Type-2 퍼지 논리 시스템을 이용한 비선형 모델 설계 (Design of Nonlinear Model Using Type-2 Fuzzy Logic System by Means of C-Means Clustering)

  • 백진열;이영일;오성권
    • 한국지능시스템학회논문지
    • /
    • 제18권6호
    • /
    • pp.842-848
    • /
    • 2008
  • 본 논문에서는 비선형 모델의 설계를 위해 Type-2 퍼지 논리 집합을 이용하여 불확실성 문제를 다룬다. 제안된 모델은 규칙의 전 후반부가 Type-2 퍼지 집합으로 주어진 Type-2 퍼지 논리 시스템을 설계하고 불확실성의 변화에 대한 비선형 모델의 성능을 해석한다 여기서 규칙 전반부 멤버쉽 함수의 정점 선택은 C-means 클러스터링 알고리즘을 이용하고, 규칙 무반부 퍼지 집합의 정점 결정에는 경사 하강법(Gradient descent method)을 이용한 오류 역전파 알고리즘을 사용하여 학습한다. 또한, 제안된 모델에 관련된 파라미터는 입자 군집 최적화(Particle Swarm Optimization; PSO) 알고리즘으로 동조한다. 제안된 모델은 모의 데이터집합(Synthetic dadaset), Mackey-Glass 시계열 공정 데이터를 적용하여 논증되고, 기존 Type-1 퍼지 논리 시스템과의 근사화 및 일반화 능력에 대하여 비교 토의한다.

정보 입자기반 연속전인 최적화를 통한 자기구성 퍼지 다항식 뉴럴네트워크 : 설계와 해석 (Self-Organizing Fuzzy Polynomial Neural Networks by Means of IG-based Consecutive Optimization : Design and Analysis)

  • 박호성;오성권
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제55권6호
    • /
    • pp.264-273
    • /
    • 2006
  • In this paper, we propose a new architecture of Self-Organizing Fuzzy Polynomial Neural Networks (SOFPNN) by means of consecutive optimization and also discuss its comprehensive design methodology involving mechanisms of genetic optimization. The network is based on a structurally as well as parametrically optimized fuzzy polynomial neurons (FPNs) conducted with the aid of information granulation and genetic algorithms. In structurally identification of FPN, the design procedure applied in the construction of each layer of a SOFPNN deals with its structural optimization involving the selection of preferred nodes (or FPNs) with specific local characteristics and addresses specific aspects of parametric optimization. In addition, the fuzzy rules used in the networks exploit the notion of information granules defined over system's variables and formed through the process of information granulation. That is, we determine the initial location (apexes) of membership functions and initial values of polynomial function being used in the premised and consequence part of the fuzzy rules respectively. This granulation is realized with the aid of the hard c-menas clustering method (HCM). For the parametric identification, we obtained the effective model that the axes of MFs are identified by GA to reflect characteristic of given data. Especially, the genetically dynamic search method is introduced in the identification of parameter. It helps lead to rapidly optimal convergence over a limited region or a boundary condition. To evaluate the performance of the proposed model, the model is experimented with using two time series data(gas furnace process, nonlinear system data, and NOx process data).

ICS 사이버 공격 탐지를 위한 딥러닝 전처리 방법 연구 (A Study on Preprocessing Method in Deep Learning for ICS Cyber Attack Detection)

  • 박성환;김민석;백은서;박정훈
    • 스마트미디어저널
    • /
    • 제12권11호
    • /
    • pp.36-47
    • /
    • 2023
  • 주요 산업현장에서 설비를 제어하는 산업제어시스템(ICS, Industrial Control System)이 네트워크로 다른 시스템과 연결되는 사례가 증가하고 있다. 또한, 이러한 통합과 함께 한 번의 외부 침입이 전체 시스템 마비로 이루어질 수 있는 지능화된 공격의 발달로, 산업제어시스템에 대한 보안에 대한 위험성과 파급력이 증가하고 있어, 사이버 공격에 대한 보호 및 탐지 방안의 연구가 활발하게 진행되고 있으며, 비지도학습 형태의 딥러닝 모델이 많은 성과를 보여 딥러닝을 기반으로 한 이상(Anomaly) 탐지 기술이 많이 도입되고 있다. 어어, 본 연구에서는 딥러닝 모델에 전처리 방법론을 적용하여 시계열 데이터의 이상 탐지성능을 향상시키는 것에 중점을 두어, 그 결과 웨이블릿 변환(WT, Wavelet Transform) 기반 노이즈 제거 방법론이 딥러닝 기반 이상 탐지의 전처리 방법론으로 효과적임을 알 수 있었으며, 특히 센서에 대한 군집화(Clustering)를 통해 센서의 특성을 반영하여 Dual-Tree Complex 웨이블릿 변환을 차등적으로 적용하였을 때 사이버 공격의 탐지성능을 높이는 것에 가장 효과적임을 확인하였다.

AREA 활용 전력수요 단기 예측 (Short-term Forecasting of Power Demand based on AREA)

  • 권세혁;오현승
    • 산업경영시스템학회지
    • /
    • 제39권1호
    • /
    • pp.25-30
    • /
    • 2016
  • It is critical to forecast the maximum daily and monthly demand for power with as little error as possible for our industry and national economy. In general, long-term forecasting of power demand has been studied from both the consumer's perspective and an econometrics model in the form of a generalized linear model with predictors. Time series techniques are used for short-term forecasting with no predictors as predictors must be predicted prior to forecasting response variables and containing estimation errors during this process is inevitable. In previous researches, seasonal exponential smoothing method, SARMA (Seasonal Auto Regressive Moving Average) with consideration to weekly pattern Neuron-Fuzzy model, SVR (Support Vector Regression) model with predictors explored through machine learning, and K-means clustering technique in the various approaches have been applied to short-term power supply forecasting. In this paper, SARMA and intervention model are fitted to forecast the maximum power load daily, weekly, and monthly by using the empirical data from 2011 through 2013. $ARMA(2,\;1,\;2)(1,\;1,\;1)_7$ and $ARMA(0,\;1,\;1)(1,\;1,\;0)_{12}$ are fitted respectively to the daily and monthly power demand, but the weekly power demand is not fitted by AREA because of unit root series. In our fitted intervention model, the factors of long holidays, summer and winter are significant in the form of indicator function. The SARMA with MAPE (Mean Absolute Percentage Error) of 2.45% and intervention model with MAPE of 2.44% are more efficient than the present seasonal exponential smoothing with MAPE of about 4%. Although the dynamic repression model with the predictors of humidity, temperature, and seasonal dummies was applied to foretaste the daily power demand, it lead to a high MAPE of 3.5% even though it has estimation error of predictors.

RCGKA기반 퍼지 시스템 최적화 및 시계열 예측 응용 (Fuzzy System Optimization Based on RCGKA and its Application to Time Series Prediction)

  • 방영근;심재선;박종국;이철희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2009년도 제40회 하계학술대회
    • /
    • pp.1644_1645
    • /
    • 2009
  • 본 논문은 비정상 시계열 예측을 위한 다중모델 퍼지 시스템과, 제안된 시스템의 최적화를 위한 유전 알고리즘의 응용을 다룬다. 일반적으로, 퍼지 예측시스템의 성능은 비선형 데이터가 가지고 있는 다양한 패턴이나 법칙성, 경향 등을 잘 분석하고 시스템에 반영함으로써 개선될 수 있다. 따라서, 본 논문은 원형 시계열의 특성을 보다 잘 반영할 수 있는 그들의 차분데이터를 시스템에 적용하며, 생성 가능한 차분 데이터들 중 원형 시계열의 특징에 가까운 일부를 추출하여 다중모델 퍼지 예측 시스템을 구현함으로써 다양한 원형시계열의 패턴이나 법칙성 등이 고려될 수 있도록 하였다. 다중 모델 퍼지 시스템의 각각의 예측기에는 구조가 간단한 k-means 클러스터링 기법을 적용하여 구현의 용이성을 꽤하였으며, 성능평가를 통해 선택된 최종 예측기는 RCGKA(real-coded genetic k-means clustering algorithms)를 통해 더욱 최적화된 규칙기반을 가지게 함으로써 예측성능이 개선될 수 있도록 하였다. 본 논문에 사용된 최적화 기법인 RCGKA에는 또한 성능이 우수한 다양한 유전연산자를 도입하여 더욱 예측기 성능이 강화될 수 있도록 하였으며, 시뮬레이션을 통해 제안된 예측시스템의 효용성을 증명하였다.

  • PDF

CONSTRUCTING GENE REGULATORY NETWORK USING FREQUENT GENE EXPRESSION PATTERN MINING AND CHAIN RULES

  • Park, Hong-Kyu;Lee, Heon-Gyu;Cho, Kyung-Hwan;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 Proceedings of ISRS 2006 PORSEC Volume II
    • /
    • pp.623-626
    • /
    • 2006
  • Group of genes controls the functioning of a cell by complex interactions. These interacting gene groups are called Gene Regulatory Networks (GRNs). Two previous data mining approaches, clustering and classification have been used to analyze gene expression data. While these mining tools are useful for determining membership of genes by homology, they don't identify the regulatory relationships among genes found in the same class of molecular actions. Furthermore, we need to understand the mechanism of how genes relate and how they regulate one another. In order to detect regulatory relationships among genes from time-series Microarray data, we propose a novel approach using frequent pattern mining and chain rule. In this approach, we propose a method for transforming gene expression data to make suitable for frequent pattern mining, and detect gene expression patterns applying FP-growth algorithm. And then, we construct gene regulatory network from frequent gene patterns using chain rule. Finally, we validated our proposed method by showing that our experimental results are consistent with published results.

  • PDF

평활된 주기도를 이용한 강수량자료의 군집화 (Classification of Precipitation Data Based on Smoothed Periodogram)

  • 박만식;김희영
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.547-560
    • /
    • 2008
  • 스펙트럼 밀도함수(spectral density function)는 시계열 자료가 정상성(stationarity)을 만족하는 경우에 주파수 영역(frrqllrnFr domain)에서 시계열 자료의 자기공분산함수(auto-covariance function)을 결정짓는 함수이고, 평활된 주기도(smoothed periodogram)는 스펙트럼 밀도함수의 일치 추정량(consistent estimator)이 됨이 잘 알려져 있다. 본 연구에서는 시계열 자료를 평활된 주기도를 이용하여 군집화하는 방법을 소개한다. 최근 김희영과 박만식 (2007)의 연구에 의하면 이 거리는 정상시계열들을 효율적으로 분류하고 있음을 알 수 있다. 본 연구는 시계열 자료를 분류하는데 사용된 기존의 거리들을 간략히 소개하고, 우리나라 22개 지역에서 1987년 1월부터 2007년 12월까지 측정한 월별 강수량 자료를 대상으로 평활된 주기도 거리를 이용하여 지역을 군집화한다.

Image Processing-based Object Recognition Approach for Automatic Operation of Cranes

  • Zhou, Ying;Guo, Hongling;Ma, Ling;Zhang, Zhitian
    • 국제학술발표논문집
    • /
    • The 8th International Conference on Construction Engineering and Project Management
    • /
    • pp.399-408
    • /
    • 2020
  • The construction industry is suffering from aging workers, frequent accidents, as well as low productivity. With the rapid development of information technologies in recent years, automatic construction, especially automatic cranes, is regarded as a promising solution for the above problems and attracting more and more attention. However, in practice, limited by the complexity and dynamics of construction environment, manual inspection which is time-consuming and error-prone is still the only way to recognize the search object for the operation of crane. To solve this problem, an image-processing-based automated object recognition approach is proposed in this paper, which is a fusion of Convolutional-Neutral-Network (CNN)-based and traditional object detections. The search object is firstly extracted from the background by the trained Faster R-CNN. And then through a series of image processing including Canny, Hough and Endpoints clustering analysis, the vertices of the search object can be determined to locate it in 3D space uniquely. Finally, the features (e.g., centroid coordinate, size, and color) of the search object are extracted for further recognition. The approach presented in this paper was implemented in OpenCV, and the prototype was written in Microsoft Visual C++. This proposed approach shows great potential for the automatic operation of crane. Further researches and more extensive field experiments will follow in the future.

  • PDF

[논문철회]지표변위계를 활용한 비탈면 안정성 예측 ([Retracted]Analysis of Slope Safety by Tension Wire Data)

  • 이석영;장서용;김태수;한희수
    • 한국지반환경공학회 논문집
    • /
    • 제16권4호
    • /
    • pp.5-12
    • /
    • 2015
  • 사면붕괴의 위험성이 있는 다양한 실계측 데이터들이 토목기술자들에게 주어졌지만 이를 해석, 가공 후 실시간 사면거동양상을 분석하고 사면안정에 대한 결론을 유도하는 일은 결코 쉬운 일이 아니다. 최근 많은 연구기관들이 실시간 계측시스템을 위험 사면 현장에 설치하고 이를 계측하고 있으나, 대부분이 하드웨어 시스템의 설치에 초점을 맞추고 있어 이들 계측시스템에서 구한 실시간 계측자료를 해석하는 소프트웨어는 상대적으로 약하다고 할 수 있다. 그러므로 이 연구는 시간에 따라 변위가 지속적으로 증가하는 사면거동에 대한 계측자료들이 서로 어떤 상호관련성이 있고 군집화되는지를 보여주고자 하는 데 목적이 있다. 실시간 계측자료들을 분류함에 있어 저자들은 세 가지의 수학적 개념을 사용하고자 한다. 즉 평균변위차지수($AD_{i,j}$), 평균상대변위차($\overline{RD}_{i,j}$) 및 평균상대좌표시스템($\overline{RD}$, AD)을 사용하고자 한다. 이 세 가지 개념은 통계학적 방법 및 사면파괴거동에 토대를 두고 있다. 그러므로 이 방법들은 파괴거동을 일으키는 같은 대상 사면영역의 군집특성을 보여준다.

중기예보를 이용한 태양광 일사량 예측 연구 (A study on solar radiation prediction using medium-range weather forecasts)

  • 박수진;김효정;김삼용
    • 응용통계연구
    • /
    • 제36권1호
    • /
    • pp.49-62
    • /
    • 2023
  • 급속적으로 비중이 증가하고 있는 태양광 에너지는 지속적인 개발 및 투자가 이루어지고 있다. 신재생에너지 정책인 그린뉴딜과 가정용 태양광 패널의 설치가 증가함에 따라 국내 태양광 에너지 보급이 점차 확대되어 그에 맞추어 발전량의 정확한 수요 예측 연구가 활발하게 진행되고 있는 시점이다. 또한, 일사량 예측이 발전량 수요 예측에 가장 영향을 미치는 요소로 작용하고 있다는 점에서 일사량 예측의 중요성을 파악하였다. 덧붙여, 본 연구는 선행 연구들에서 사용되지 않은 중기예보 기상 데이터를 활용하여 일사량 예측을 하고자 하였다는 점에서 가장 큰 차이점을 확인할 수 있다. 본 논문에서는 서울, 인천, 수원, 춘천, 대구, 대전의 총 여섯 지역의 태양광 일사량 예측을 위하여 다중선형회귀모형, KNN, Random Forest 그리고 SVR 모형과 클러스터링 기법인 K-means 기법을 결합한 후, 클러스터별 확률밀도함수를 계산하여 시간별 일사량 예측을 진행하고자 하였다. 중기예보 데이터를 사용하기 전, 모형 예측 결과를 비교하기 위한 지표로서 MAE (mean absolute error)와 RMSE (root mean squared error)를 사용하였다. 데이터는 2017년 3월 1일부터 2022년 2월 28일까지의 시간별 원 관측 데이터를 중기예보 데이터 양식에 맞추어 일별 데이터로 변환하였다. 모형의 예측 성능 비교 결과, Random Forest로 일별 일사량을 예측한 후, K-means 클러스터링으로 기후요인이 유사한 날짜들을 분류한 뒤 클러스터별 일사량의 확률밀도함수를 계산하여 시간별 일사량 예측값을 나타낸 방법이 가장 우수한 성능을 보였다. 또한 이 방법론을 이용하여 중기예보 데이터에 모형 적합 후, 예측 결과를 확인하였을 때, 일자별로 예측 오류가 상승하는 것을 확인할 수 있었다. 이는 중기예보 기상데이터의 예측 오류로 인한 것으로 보인다. 향후 연구에서는 중기예보 데이터에서 활용할 수 있는 기상요인 중, 강수 여부와 같은 외생 변수를 추가하거나 시계열 클러스터링 기법을 적용한 연구가 이루어져야할 것으로 보인다.