• 제목/요약/키워드: Time Series Cluster Analysis

검색결과 75건 처리시간 0.024초

물 사용량 예측을 위한 선형 모형과 딥러닝 알고리즘의 비교 분석 (Comparative analysis of linear model and deep learning algorithm for water usage prediction)

  • 김종성;김동현;왕원준;이하늘;이명진;김형수
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1083-1093
    • /
    • 2021
  • 물 사용량 예측은 최적의 용수 공급 운영 방안을 수립하고 전력 소비량 절감을 위하여 꼭 필요한 과정이라고 할 수 있다. 그러나 수용가 단위의 물 사용량은 용도, 사용자의 패턴, 날씨 등의 다양한 요인으로 인해 변화하는 비선형적 특성을 지니고 있다. 따라서 본 연구에서는 비선형적인 수용가 단위의 물 사용량을 예측하기 위하여 다양한 기법들을 연계한 KWD 프레임워크를 제안하고자 하였다. 즉, 먼저 개별 수용가 마다 용도에 따른 유사한 패턴을 파악하기 위해 K-means (K) 군집분석을 수행하였고, 잡음성분을 제거함으로써 핵심적인 주기패턴을 파악하기 위해 Wavelet (W) 방법을 적용하였다. 또한 비선형적 특성을 학습시키기 위해 Deep learning (D) 알고리즘을 적용하였다. 그리고 기존의 선형 시계열 모형인 ARMA 모형과 비교하여 KWD 프레임워크의 성능을 분석하였다. 그 결과 제안된 모형의 상관성은 92%, ARMA 모형은 약 39%로 KWD 프레임워크가 2배 이상의 성능을 가지는 것으로 분석되었다. 따라서 본 연구에서 제안한 방법을 활용할 경우 정확한 물 사용량 예측이 가능해질 것이며, 상황에 따른 최적의 공급 방안을 수립할 수 있을 것이다.

한국과 서독간의 교통안전 비교 (Methoden Zur Beschreibung dar Unfallgeschehens des - Versuch eines Vergleichs Zwischen der Bundesrepublik Deutschland und der Republik Korea -)

  • 김홍상
    • 대한교통학회지
    • /
    • 제5권2호
    • /
    • pp.55-72
    • /
    • 1987
  • The work analyzes the existing situation and defines special problems concerning traffic accidents in the two countries. The report is divided into three parts: 1) Using the global approach of SMEED, the data were evaluated using multiple regression analysis, and homogeneous groups of countries were defined by cluster analysis. In the global approach, the linear model is better than SMEED's non-linear model in explaining the number of fatalities. Among the different groups of countries, the linear approach was found to be better suited for industrialized countries and the non-linear approach better for the developing countries. T도 comparison of traffic fatality data for the Federal Republic the developing countries. The comparison of traffic fatality data for the Federal Republic of Germany and the Republic of Korea showed different regression equations during the same time period. 2) The BOX/JENKINS time series analysis on a monthly basis points out clearly similar seasonal patterns for the two countries over the years studied. The decrease in traffic accidents following the intensification of the safety belt requirement was proved in the ARIMA model. It amounts to 7 to 8 percent fewer personal injury accidents and fatal accidents. The identified increase in safety in the Federal Republic of Germany since the 1970s is mainly due to the reduction of accident severity in residential areas. 3) Speeds and headways on motorways in th3e two countries were also compared. The measurements point out that German road users drive faster, take more risks, and accept shorter time gaps than Korean road users. However, the accident statistics show accident rates for Korea that are several times higher than those in the Federal Republic of Germany.

  • PDF

Concentration variability of atmospheric radon and gaseous pollutants at background area of Korea between 2017 and 2018

  • Kim, Won-Hyung;Yang, Hyo-Sun;Bu, Jun-Oh;Kang, Chang-Hee;Song, Jung-Min;Chambers, S.
    • 분석과학
    • /
    • 제35권1호
    • /
    • pp.32-40
    • /
    • 2022
  • The concentrations of radon in the atmosphere were measured at the Gosan site of Jeju Island during 2017-2018, in order to investigate the time-series variation characteristics and the dependency of airflow transport pathways. The mean 222Rn concentration was 2,480 mBq m-3, and its monthly concentration in November was 3,262 mBq m-3, more than twice as that in July (1,459 mBq m-3). The diurnal radon concentrations increased throughout the nighttime to the maximum (2,862 mBq m-3) at around 7 a.m., then gradually decreased throughout the daytime by the minimum (1,997 mBq m-3) at around 3 p.m. The seasonal and monthly variations of CO, NO2, O3 showed a roughly similar pattern to that of radon for the same period, as high in winter and low in summer. The cluster back trajectory analysis described that about 60 % of overall airflow pathways was influenced by the airflow from China. The concentrations of radon and gaseous pollutants were relatively high as the airflow was influenced by China continent, but comparatively much lower as influenced by the northern Pacific Ocean.

A study on Digital Agriculture Data Curation Service Plan for Digital Agriculture

  • Lee, Hyunjo;Cho, Han-Jin;Chae, Cheol-Joo
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권2호
    • /
    • pp.171-177
    • /
    • 2022
  • 본 논문에서는 다출처 농업 데이터를 통찰할 수 있는 지식체계를 마련하고, 시간 흐름을 가지는 환경인자 분석 정보를 클러스터링 할 수 있는, 농작물 환경 인자 큐레이션 서비스 방법을 제안한다. 제안하는 큐레이션 서비스는 크게 수집, 전처리, 저장, 분석의 네 단계로 구성된다. 첫째, 수집 단계에서는 OpenAPI 기반의 웹크롤러를 이용하여 다출처 농업 데이터에 대한 수집 및 정리를 수행한다. 둘째, 전처리 단계에서는 데이터 측정 오차를 감소시키기 위해 데이터 평활화를 수행한다. 이때 온실, 노지 등의 시설 특성에 따른 오차율을 고려하여 시설 유형별 평활화 방법을 적용한다. 셋째, 저장단계에서는 대용량 농업 데이터 관리를 위해, 농업 데이터 통합 스키마 및 Hadoop HDFS 기반의 저장 구조를 제안한다. 마지막으로 분석 단계에서는 농업 디지털 데이터의 시계열 특성을 고려한 DTW 기반의 시계열 분류를 수행한다. DTW 기반 시계열 분류를 통해 시계열 데이터의 특성을 손실 없이 반영하여 예측 결과 정확도를 향상시킨다. 향후 연구로는 제안한 서비스 방법을 구현하여 스마트팜 온실에 적용하고, 테스트 및 검증을 수행할 예정이다.

Statistical Properties of Flare Variability, Energy, and Frequency in Low-Mass Stars

  • 정서원;변요익
    • 천문학회보
    • /
    • 제36권1호
    • /
    • pp.29.2-29.2
    • /
    • 2011
  • Although stellar flares have a long history of observations, there are few concrete understanding about underlying physical processes and meaningful correlations with other stellar properties. Most of previous observations dealt with only a small number of sample stars, and therefore not sufficient to support generalized statistical studies. Based on one-month long MMT time-series observations of the open cluster M37, we monitored light variations of nearly 2,500 M-dwarf stars and successfully identified 606 flare events from 422 stars. This is a rare attempt to estimate true flare rates and properties among many stars of the same age and mass group. For each flare, we considered both observational and physical parameters including flare shape, duration before and after the peak, baseline magnitude before and after the peak, peak magnitudes, total energy and peak energy, etc. We find significant correlations between some of key parameters over a wide range of energy ($Er=10^{32}{\sim}10^{36}ergs$). For instance, regardless of stellar luminosities, the energy power spectrum of flares can be approximated by a power law (${\beta}=0.83-0.97$). This suggests that flares follow similar physical mechanisms for atmospheric heating and cooling among these low-mass stars. From this MMT data set, we derived an average flaring rate of $0.019 hr^{-1}$ among flare stars and $0.003 hr^{-1}$ for all M-dwarf candidates. We will report the details of our analysis and discuss physical implications.

  • PDF

코로나-19에 따른 서울시 생활인구 변화와 동별 반응 차이 분석 (Analysis of the differences in living population changes and regional responses by COVID-19 outbreak in Seoul)

  • 진주혜;성병찬
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.697-712
    • /
    • 2020
  • 최근 20년간 세계적으로 새로운 전염병이 반복해서 등장해왔으며 코로나-19에 들어서는 일상에까지 큰 변화와 피해를 주고 있다. 이에 더해 앞으로도 새로운 전염병의 등장을 간과할 수 없게 되면서 경제 타격에 대응하기 위한 정책 발굴이 지속적으로 요구되고 있다. 이러한 상황에서 생활인구는 시민들의 생활 패턴 변화를 드러내는 중요한 지표이다. 본 논문에서는 코로나-19에 의한 일상의 변화를 유동인구 관점에서 감지 및 분류하여 시간적 및 사회환경적 특징을 분석한다. 시간 단위로 측정된 서울시 424개 행정동별 생활인구 데이터를 분류하기 위해 k-shape clustering을 사용하였고, 이후에는 각 군집에 개입분석, One-way ANOVA 등을 적용하여 코로나-19 진행 여파에 따른 군집별 특성 및 생활인구 변화 양상을 자세히 살펴보았다. 결론적으로 국내 코로나 환자 발생 전후의 인구 유출입 변동에 있어 각 군집별로 뚜렷한 특징을 확인하였으며, 코로나-19 관련 사건을 바탕으로 지정한 개입 시점에 대해서도 민감하게 반응하는 군집과 그렇지 않은 군집을 구분할 수 있었다.

포아송 클러스터 강우 생성 모형을 이용한 도시 홍수 해석 (Application of the Poisson Cluster Rainfall Generation Model to the Urban Flood Analysis)

  • 박현진;양정석;한재문;김동균
    • 한국수자원학회논문집
    • /
    • 제48권9호
    • /
    • pp.729-741
    • /
    • 2015
  • 본 연구에서는 포아송 클러스터 강우생성모형의 일종인 Modified Bartlett-Lewis Rectangular Pulse (MBLRP) 강우생성 모형의 도시홍수 모의에 있어 적용성을 살펴보았다. 이를 위하여 서울 홍제천 유역의 남가좌 배수분구에 대하여 2차원 관망-지표면 홍수 모의프로그램인 XP-SWMM 모형을 구축하고, MBLRP 모형을 사용하여 생성된 200년 길이의 가상 강우 시계열을 입력 강우자료로 하여 홍수량, 침수면적을 산정하고 이를 설계 강우에 근거하여 산출된 값들과 비교하였다. 비교 결과, MBLRP 모형을 사용하여 산출된 홍수량 및 침수면적은 설계 강우에 근거한 값들과 비교하였을 때 다소 작은 값을 가졌고, 과소산 정의 정도는 8% (5년빈도)에서 34% (200년빈도)의 값을 가졌으며, 설계 강우의 재현기간에 따라 과소 산정의 정도는 증가하였다. 본 연구의 결과는 도시유역에서의 홍수 모의에 있어 몬테카를로 분석을 통한 침수관련 변수들의 불확실성을 정량적으로 표현할 수 있는 방법론을 제시하고 그 적용성 및 한계점을 제시했다는 점에서 그 의미를 찾을 수 있을 것이다.

한국 지방자치단체의 주민참여예산제도 운영에 관한 연구 - Support Vector Machine 기법을 이용한 유형 구분 (A Study on Korean Local Governments' Operation of Participatory Budgeting System : Classification by Support Vector Machine Technique)

  • 한준현;유재민;배재연;임충혁
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.461-466
    • /
    • 2024
  • 한국의 주민참여예산제도는 자치단체별로 자율적으로 운영되도록 하고 있어서, 본 연구는 이들을 몇 개의 유사한 유형들로 구분하여서 각각의 특징들을 살펴보고자 한다. 본 연구는 다양한 머신 러닝 기법들을 활용하여 2022년도 기초 시(市)를 중심으로 운영유형을 분류하였다. 그 결과, 여러 머신 러닝 기법(Neural Network, Rule Induction(CN2), KNN, Decision Tree, Random Forest, Gradient Boosting, SVM, Naïve Bayes) 중에서 SVM 기법이 성능이 가장 좋은 것으로 확인되었다. SVM 기법이 밝혀낸 운영유형은 모두 3개인데, 하나는 위원회 활동은 적게 하지만, 참여예산은 많이 확보하는 클러스터(C1)이고, 다른 하나는 주민참여예산제에 매우 소극적인 도시들의 클러스터(C3)이다. 마지막 클러스터(C2)는 참여예산에 전반적으로 적극적인데, 대다수 지역이 여기에 해당한다. 결론적으로 한국의 대다수 자치단체는 주민참여예산제를 긍정적으로 운영하고 있으며, 오직 소수의 자치단체만 소극적이다. 후속 연구로 지난 10여 년간의 시계열 자료를 분석한다면, 우리는 주민참여예산에 관한 지방자치단체 유형 분류의 신뢰도를 더욱 높일 수 있을 것으로 기대한다.

Differential Expressions of Apoptosis-related Genes in Lung Cancer Cell Lines Determine the Responsiveness to Ionizing Radiation

  • Lee, Su-Yeon;Choi, Moon-Kyung;Lim, Jung-Min;Wu, Hong-Gyun;Kim, Ju-Han;Park, Woong-Yang
    • Genomics & Informatics
    • /
    • 제6권1호
    • /
    • pp.36-43
    • /
    • 2008
  • Radiotherapy would be the choice of treatment for human cancers, because of high cost-effectiveness. However, a certain population of patients shows a resistance to radiotherapy and recurrence. In an effort to increase the efficacy of radiotherapy, many efforts were driven to find the genes causing the unresponsiveness to ionizing radiation. In this paper, we compared the gene expression profiles of two lung cancer cell lines, H460 and H1299, which showed differential responses to ionizing radiations. Each cell were irradiated at 2 Gy, and harvested after 0, 2, 4, 8, 12 and 24 hours to examine the expressions. Two-way ANOVA analysis on time-series experiments of two cells could select 2863 genes differentially expressed upon ionizing radiation among 32,321 genes in microarray (p<0.05). We classified these genes into 21 clusters by SOM clustering according to the interaction between cell types and time. Two SOM clusters were enriched with apoptosis-related genes in pathway analysis. One cluster contained higher levels of phosphatidyl inositol 3-phosphate kinase (PI3K) subunits in H1299, radio-resistant cells than H460, radiosensitive cells. TRAIL receptors were expressed in H460 cells while the decoy receptor for TRAIL was expressed in H1299 cells. From these results, we could characterize the differential responsiveness to ionizing radiation according to their differential expressions of apoptosis-related genes, which might be the candidates to increase the power of radiotherapy.

자기조직화지도 클러스터링을 이용한 종단자료의 탐색적 분석방법론 (An Exploratory Methodology for Longitudinal Data Analysis Using SOM Clustering)

  • 조영빈
    • 융합정보논문지
    • /
    • 제12권5호
    • /
    • pp.100-106
    • /
    • 2022
  • 종단연구는 동일 대상에 대하여 반복적으로 측정한 종단자료를 기반으로 하는 연구방법을 말한다. 대부분의 종단분석 방법은 예측이나 추론에 적합하고, 탐색적 목적으로 사용하기에는 적합하지 않은 경우가 많다. 본 연구에서는 종단자료를 분석하는 탐색적 방법을 제시한다. 이 방법은 자기조직화지도기법을 사용하여 종단자료를 군집화 하여 최선의 군집 수를 정한 후 종단궤적을 찾는 방법이다. 제안한 방법론은 고용정보원의 종단자료에 적용되었으며, 총 2,610개의 샘플에 대하여 분석을 하였다. 방법론을 적용한 결과 패널 별로 시계열적으로 군집 화되는 결과를 얻었다. 이는 종단자료를 사전에 클러스터링하고 다층 종단분석을 하는 것이 더욱 효과적이라는 사실을 나타낸다.