• 제목/요약/키워드: time series clustering

검색결과 185건 처리시간 0.026초

아시아-오세아니아 지역의 MODIS 지면피복분류 개선 (Improvement of MODIS land cover classification over the Asia-Oceania region)

  • 박지열;서명석
    • 대한원격탐사학회지
    • /
    • 제31권2호
    • /
    • pp.51-64
    • /
    • 2015
  • 본 연구에서는 MODerate resolution Imaging Spectroradiometer (MODIS) 지면피복 분류자료(MCD12Q1)에서 분류오류로 판단되는 화소들을 재분류함으로써 분류 정확도를 개선하였다. 최근 12년(2001-2012)간의 MODIS 지면피복 분류자료에서 지면피복 유형이 3개 이상으로 분류된 화소는 분류상에 오류가 있다고 판단하여 지면피복 재분류 화소로 선정하였다. 지면피복 재분류를 위해 공간해상도는 1 km이고 시간주기는 8일인 MODIS Normalized Difference Vegetation Index (NDVI) 자료를 이용하였다. NDVI 자료 중 구름 등으로 오염된 화소를 보정하기 위해 시 공간 연속성을 이용한 보정기법인 Correction based on Spatial and Temporal Continuity (CSaTC) 기법을 이용하였다. 보정된 NDVI 자료를 1개월 주기로 합성한 후 분류 오류로 판단된 화소들에 대해 Iterative Self-Organizing Data Analysis (ISODATA) 기법으로 군집화를 수행하였다. 각 군집별 식생 계절변동 특성을 고려하여 지면피복을 분류한 후 정상으로 판정된 MODIS 지면피복과 합성하여 최종 지면피복 재분류 자료를 산출하였다. 분류 정확도는 GPS를 이용한 현장관측 자료와 유럽우주국의 지상검증참조자료 등 총 138개 지상 관측자료를 이용하여 검증을 수행하였다. 2012년 MODIS 지면피복 분류자료의 정확도는 약 68%이었으나 본 연구에서 재분류한 지면피복자료의 정확도는 약 74%로 나타나 일부 화소들에서 분류 정확도가 개선되었다.

A study on Digital Agriculture Data Curation Service Plan for Digital Agriculture

  • Lee, Hyunjo;Cho, Han-Jin;Chae, Cheol-Joo
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권2호
    • /
    • pp.171-177
    • /
    • 2022
  • 본 논문에서는 다출처 농업 데이터를 통찰할 수 있는 지식체계를 마련하고, 시간 흐름을 가지는 환경인자 분석 정보를 클러스터링 할 수 있는, 농작물 환경 인자 큐레이션 서비스 방법을 제안한다. 제안하는 큐레이션 서비스는 크게 수집, 전처리, 저장, 분석의 네 단계로 구성된다. 첫째, 수집 단계에서는 OpenAPI 기반의 웹크롤러를 이용하여 다출처 농업 데이터에 대한 수집 및 정리를 수행한다. 둘째, 전처리 단계에서는 데이터 측정 오차를 감소시키기 위해 데이터 평활화를 수행한다. 이때 온실, 노지 등의 시설 특성에 따른 오차율을 고려하여 시설 유형별 평활화 방법을 적용한다. 셋째, 저장단계에서는 대용량 농업 데이터 관리를 위해, 농업 데이터 통합 스키마 및 Hadoop HDFS 기반의 저장 구조를 제안한다. 마지막으로 분석 단계에서는 농업 디지털 데이터의 시계열 특성을 고려한 DTW 기반의 시계열 분류를 수행한다. DTW 기반 시계열 분류를 통해 시계열 데이터의 특성을 손실 없이 반영하여 예측 결과 정확도를 향상시킨다. 향후 연구로는 제안한 서비스 방법을 구현하여 스마트팜 온실에 적용하고, 테스트 및 검증을 수행할 예정이다.

다변량 스트림 데이터 축소 기법 평가 (Evaluation of Multivariate Stream Data Reduction Techniques)

  • 정훈조;서성보;최경주;박정석;류근호
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.889-900
    • /
    • 2006
  • 센서 네트워크는 애플리케이션 분야에 따라 데이터 특성과 사용자의 요구사항이 다양함에도 불구하고, 현존하는 스트림 데이터 축소 연구는 데이터의 본질적인 특징보다 특정 축소 기법의 성능 향상 측면에 중점을 두고 있다. 이 논문은 계층/분산형 센서 네트워크 구조와 데이터 모델을 소개하고, 선택적으로 축소 기법을 적용하기 위해 데이터 특성과 사용자의 요구에 적합한 다변량 데이터 축소 기법을 비교 평가한다. 다변량 데이터 축소 기법의 성능을 비교 분석하기 위해, 우리는 웨이블릿, HCL(Hierarchical Clustering), SVD(Singular Value Decomposition), 샘플링과 같은 표준화 된 다변량 축소 기법을 이용한다. 실험 데이터는 다차원 시계열 데이터와 로봇 센서 데이터를 사용한다. 실험 결과 SVD와 샘플링 기법이 상대 에러 비율과 수행 성능 측면에서 웨이블릿과 HCL기법에 비해 우수하였다. 특히 각 데이터 축소 기법의 상대 에러 비율은 입력 데이터 특성에 따라 다르기 때문에 선택적으로 데이터 축소 기법을 적용하는 것이 좋은 성능을 보였다. 이 논문은 다차원 센서 데이터가 수집되는 센서 네트워크를 디자인하고 구축하는 응용 분야에 유용하게 활용될 것이다.

Differential Expressions of Apoptosis-related Genes in Lung Cancer Cell Lines Determine the Responsiveness to Ionizing Radiation

  • Lee, Su-Yeon;Choi, Moon-Kyung;Lim, Jung-Min;Wu, Hong-Gyun;Kim, Ju-Han;Park, Woong-Yang
    • Genomics & Informatics
    • /
    • 제6권1호
    • /
    • pp.36-43
    • /
    • 2008
  • Radiotherapy would be the choice of treatment for human cancers, because of high cost-effectiveness. However, a certain population of patients shows a resistance to radiotherapy and recurrence. In an effort to increase the efficacy of radiotherapy, many efforts were driven to find the genes causing the unresponsiveness to ionizing radiation. In this paper, we compared the gene expression profiles of two lung cancer cell lines, H460 and H1299, which showed differential responses to ionizing radiations. Each cell were irradiated at 2 Gy, and harvested after 0, 2, 4, 8, 12 and 24 hours to examine the expressions. Two-way ANOVA analysis on time-series experiments of two cells could select 2863 genes differentially expressed upon ionizing radiation among 32,321 genes in microarray (p<0.05). We classified these genes into 21 clusters by SOM clustering according to the interaction between cell types and time. Two SOM clusters were enriched with apoptosis-related genes in pathway analysis. One cluster contained higher levels of phosphatidyl inositol 3-phosphate kinase (PI3K) subunits in H1299, radio-resistant cells than H460, radiosensitive cells. TRAIL receptors were expressed in H460 cells while the decoy receptor for TRAIL was expressed in H1299 cells. From these results, we could characterize the differential responsiveness to ionizing radiation according to their differential expressions of apoptosis-related genes, which might be the candidates to increase the power of radiotherapy.

Identification of Fuzzy Inference System Based on Information Granulation

  • Huang, Wei;Ding, Lixin;Oh, Sung-Kwun;Jeong, Chang-Won;Joo, Su-Chong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제4권4호
    • /
    • pp.575-594
    • /
    • 2010
  • In this study, we propose a space search algorithm (SSA) and then introduce a hybrid optimization of fuzzy inference systems based on SSA and information granulation (IG). In comparison with "conventional" evolutionary algorithms (such as PSO), SSA leads no.t only to better search performance to find global optimization but is also more computationally effective when dealing with the optimization of the fuzzy models. In the hybrid optimization of fuzzy inference system, SSA is exploited to carry out the parametric optimization of the fuzzy model as well as to realize its structural optimization. IG realized with the aid of C-Means clustering helps determine the initial values of the apex parameters of the membership function of fuzzy model. The overall hybrid identification of fuzzy inference systems comes in the form of two optimization mechanisms: structure identification (such as the number of input variables to be used, a specific subset of input variables, the number of membership functions, and polyno.mial type) and parameter identification (viz. the apexes of membership function). The structure identification is developed by SSA and C-Means while the parameter estimation is realized via SSA and a standard least square method. The evaluation of the performance of the proposed model was carried out by using four representative numerical examples such as No.n-linear function, gas furnace, NO.x emission process data, and Mackey-Glass time series. A comparative study of SSA and PSO demonstrates that SSA leads to improved performance both in terms of the quality of the model and the computing time required. The proposed model is also contrasted with the quality of some "conventional" fuzzy models already encountered in the literature.

홍수 위험도 판별을 위한 CNN 기반의 분류 모델 구현 (Implementation of CNN-based classification model for flood risk determination)

  • 조민우;김동수;정회경
    • 한국정보통신학회논문지
    • /
    • 제26권3호
    • /
    • pp.341-346
    • /
    • 2022
  • 지구온난화 및 이상 기후로 인해 홍수의 빈도 및 피해 규모가 늘어나고 있으며, 홍수 취약 지역에 노출된 사람이 2000년도에 비하여 25% 증가하였다. 홍수는 막대한 금전적, 인명적 손실을 유발하며, 홍수로 인한 손실을 줄이기 위해 홍수를 미리 예측하고 빠른 대피를 결정해야 한다. 본 논문은 홍수 예측을 위한 핵심 데이터인 강우량과 수위 데이터를 활용하여 시기적절한 대피 결정이 이루어질 수 있도록 CNN기반 분류 모델을 활용하여 홍수 위험도 판별 모델을 제안한다. 본 논문에서 제안한 CNN 기반 분류 모델과 DNN 기반의 분류 모델의 결과를 비교하여 더 좋은 성능을 보이는 것을 확인하였다. 이를 통해 홍수의 위험도를 판별하여, 대피 여부 판단하며 최적의 시기에 대피 결정을 내릴 수 있도록 하는 초기 연구로서 활용할 수 있을 것으로 사료된다.

쇼핑 웹사이트 탐색 유형과 방문 패턴 분석 (Analysis of shopping website visit types and shopping pattern)

  • 최경빈;남기환
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.85-107
    • /
    • 2019
  • 온라인 소비자는 쇼핑 웹사이트에서 특정 제품군이나 브랜드에 속한 제품들을 둘러보고 구매를 진행할 수 있고, 혹은 단순히 넓은 범위의 탐색 반경을 보이며 여러 페이지들을 돌아보다 구매를 진행하지 않고 이탈할 수 있다. 이러한 온라인 소비자의 행동과 구매에 관련된 연구는 꾸준히 진행되어왔으며, 실무에서도 소비자들의 행동 데이터를 바탕으로 한 서비스 및 어플리케이션이 개발되고 있다. 최근에는 빅데이터 기술의 발달로 소비자 개인 단위의 맞춤화 전략 및 추천 시스템이 활용되고 있으며 사용자의 쇼핑 경험을 최적화하기 위한 시도가 진행되고 있다. 하지만 이와 같은 시도에도 온라인 소비자가 실제로 웹사이트를 방문해 제품 구매 단계까지 전환될 확률은 매우 낮은 실정이다. 이는 온라인 소비자들이 단지 제품 구매를 위해 웹사이트를 방문하는 것이 아니라 그들의 쇼핑 동기 및 목적에 따라 웹사이트를 다르게 활용하고 탐색하기 때문이다. 따라서 단지 구매가 진행되는 방문 외에도 다양한 방문 형태를 분석하는 것은 온라인 소비자들의 행동을 이해하는데 중요하다고 할 수 있다. 이러한 관점에서 본 연구에서는 온라인 소비자의 탐색 행동의 다양성과 복잡성을 설명하기 위해 실제 E-commerce 기업의 클릭스트림 데이터를 기반으로 세션 단위의 클러스터링 분석을 진행해 탐색 행동을 유형화하였다. 이를 통해 각 유형별로 상세 단위의 탐색 행동과 구매 여부가 차이가 있음을 확인하였다. 또한 소비자 개인이 여러 방문에 걸친 일련의 탐색 유형에 대한 패턴을 분석하기 위해 순차 패턴 마이닝 기법을 활용하였으며, 같은 기간 내에 제품 구매까지 완료한 소비자와 구매를 진행하지 않은 채 방문만 진행한 소비자들의 탐색패턴에 대한 차이를 확인할 수 있었다. 본 연구의 시사점은 대규모의 클릭스트림 데이터를 활용해 온라인 소비자의 탐색 유형을 분석하고 이에 대한 패턴을 분석해 구매 과정 상의 행동을 데이터 기반으로 설명하였다는 점에 있다. 또한 온라인 소매 기업은 다양한 형태의 탐색 유형에 맞는 마케팅 전략 및 추천을 통해 구매 전환 개선을 시도할 수 있으며, 소비자의 탐색 패턴의 변화를 통해 전략의 효과를 평가할 수 있을 것이다.

해양환경 공간분포 패턴 분석을 위한 공간자기상관 적용 연구 - 광양만을 사례 지역으로 - (Application of Spatial Autocorrelation for the Spatial Distribution Pattern Analysis of Marine Environment - Case of Gwangyang Bay -)

  • 최현우;김계현;이철용
    • 한국지리정보학회지
    • /
    • 제10권4호
    • /
    • pp.60-74
    • /
    • 2007
  • 해양환경의 시공간적 분포 패턴을 정량적으로 분석하기 위해 남해 광양만 해양환경 관측 자료를 이용하여 글로벌 및 국지적 공간자기상관 통계를 적용하였다. 연구지역 전체의 해양환경 분포 패턴을 이해하기 위해 Moran's I, General G와 같은 글로벌 공간자기상관 지수를 사용하였으며, 대상 피쳐(feature)와 이웃 피쳐들과의 유사성 정도를 측정하고 hot spot 및 cold spot을 탐지하기 위해 국지적 Moran's I ($I_i$), $G_i{^*}$와 같은 LISA(local indicators of spatial association)를 사용하였고, 공간 군집 패턴의 신뢰성은 Z-score를 통한 통계적 유의성 검증을 수행하였다. 공간 통계 결과를 통해 년 중 해양환경 공간분포 패턴의 변화를 정량적으로 알 수 있었는데, 일반 해양수질, 영양염, 클로로필 및 식물플랑크톤은 여름철에 강한 군집 패턴을 보였다. 글로벌 지수에서 강한 군집 패턴을 보였을 때 속성 값의 공간적인 변화가 심한 음적 $I_i$ 값을 가지는 전선지역이 탐지되었다. 또한, 글로벌 지수에서 임의적 패턴을 보였을 때 국지적 지수인 $G_i{^*}$에서는 좁은 지역에서 hot spot과(또는) cold spot이 탐지되었다. 따라서 글로벌 지수는 연구 지역 전체 군집 패턴의 강도와 시계열적 변화 과정 탐지에, 국지적 지수를 통해서는 hot spot과 cold spot 위치 추적에 유용함을 알 수 있었다. 해양환경 공간분포 패턴과 군집 특성을 정량화는 것은 해양환경을 보다 깊이 이해할 수 있도록 할 뿐 아니라, 패턴의 원인을 찾는데도 중요한 역할을 할 것이다.

  • PDF

도심지 도로 지하공동 탐지를 위한 딥러닝 기반 GPR 자료 해석 기법 (Deep-learning-based GPR Data Interpretation Technique for Detecting Cavities in Urban Roads)

  • 최병훈;편석준;최우창;조철현;윤진성
    • 지구물리와물리탐사
    • /
    • 제25권4호
    • /
    • pp.189-200
    • /
    • 2022
  • 도심지 도로에서의 지하공동 붕괴로 인한 지반침하 문제는 인명 및 재산 피해로 이어질 수 있기 때문에 이를 예방하기 위해서는 사전에 지하공동을 탐지하고 복구하는 과정이 필요하다. 지하공동 탐지는 주로 지표투과레이더(ground penetrating radar, GPR) 탐사를 통해 이루어지는데, 방대한 탐사 자료로 인해 해석에 많은 시간이 소모되고 전문가의 숙련도와 주관에 따라 해석 결과가 달라질 수 있다. 이러한 문제를 해결하기 위해 GPR 자료 해석 자동화 및 정량화 기법들이 연구되어 왔으며, 최근에는 딥러닝 기반의 해석 기법들이 많이 활용되고 있다. 이 연구에서는 딥러닝 기반의 GPR 자료해석 기법 중 쌍곡선(hyperbola) 신호를 탐지하는 과정에 대해 기존 연구에서 개발된 기법을 단계별로 실증 예제를 통해 설명하였다. 먼저, 쌍곡선 신호를 자동으로 탐지하기 위해서 딥러닝 기반 YOLOv3 객체탐지 기법을 적용했다. 다음으로는 column-connection clustering (C3) 알고리즘을 통해 쌍곡선 신호만을 추출하였고, 최종적으로 회귀분석을 통해 지하공동의 수평위치를 결정했다. YOLOv3 객체탐지 기법을 이용한 쌍곡선 신호 탐지 성능은 AP50 기준으로 정밀도 84%, 재현율 92%를 달성했다. 지하공동 수평위치 정확도는 4개 샘플에 대해 실제 위치와 약 0.12 ~ 0.36 m 정도의 차이를 보였다. 이를 통해 지하공동에 의해 나타나는 쌍곡선 신호에 대한 딥러닝 기반 탐지 기법의 적용성을 확인할 수 있었다.

빈발 유전자 발현 패턴과 연쇄 규칙을 이용한 유전자 조절 네트워크 구축 (Constructing Gene Regulatory Networks using Frequent Gene Expression Pattern and Chain Rules)

  • 이헌규;류근호;정두영
    • 정보처리학회논문지D
    • /
    • 제14D권1호
    • /
    • pp.9-20
    • /
    • 2007
  • 유전자들의 그룹은 복잡한 상호작용들을 통해 세포의 기능이 조절되며 이러한 상호작용을 하는 유전자 그룹들을 유전자 조절 네트워크 (GRNs: Gene Regulatory Networks)라고 한다. 이전의 유전자 발현 분석 기법인 군집화와 분류는 단지 상동성에 의한 유전자들 사이의 소속을 결정하는 데에는 유용하나 분자 활동에서의 같은 클래스에서 발견되어지는 유전자들 사이의 조절 관계를 식별할 수 없다. 더욱이 유전자들이 어떻게 연관되는 지와 유전자들이 서로 어떻게 조절하는지에 대한 매커니즘의 이해가 필요하다. 따라서 이 논문에서는 시계열 마이크로어레이 데이터로부터의 유전자들의 조절 관계를 발견하기 위해서 빈발 패턴 마이닝과 연쇄 규칙을 이용한 새로운 접근법을 제안하였다. 이 기법에서는 먼저, 빈발 패턴 마이닝 적용을 위한 적절한 데이터 변환 방법을 제안하였고 FP-growth을 이용하여 유전자 발현 패턴들을 발견한다. 그런 다음, 연쇄 규칙을 이용하여 빈발한 유전자 패턴들로부터 유전자 조절 네트워크를 구축하였다. 마지막으로 제안된 기법의 검증은 공개된 유전자들의 조절 관계와 실험 결과의 일치함을 보임으로써 평가하였다.