• 제목/요약/키워드: 시계열분석방법

검색결과 795건 처리시간 0.024초

기상 예보 및 위성 자료를 이용한 우리나라 산불위험지수의 시공간적 고도화 (Spatio-temporal enhancement of forest fire risk index using weather forecast and satellite data in South Korea)

  • 강유진;박수민;장은나;임정호;권춘근;이석준
    • 한국지리정보학회지
    • /
    • 제22권4호
    • /
    • pp.116-130
    • /
    • 2019
  • 우리나라는 산림 내 연료 물질 증가와 기후변화 등의 요인으로 산불의 연중화와 대형화가 증가하는 추세에 있으므로 산불 발생 확률에 대한 정보를 제공함으로써 산불 발생을 예방하여 피해를 최소화할 필요성이 대두되고 있다. 본 연구에서는 현 산불예보시스템에서 제공하는 산불위험지수(DWI; Daily Weather Index)를 개선하기 위한 방법을 살펴보았다. 즉, 우리나라 산불위험지수의 시간 및 공간적 정확성 향상을 통한 고도화를 목적으로, 기상청에서 제공하는 동네예보 자료, 위성기반의 가뭄 지수, 산불 다발 지역 지도를 융합하여 5km 격자 형태로 제공되는 새로운 산불위험지수(FRI; Fire Risk Index)를 제안하였다. 산불위험지수는 캐나다에서 현업으로 사용되는 미세 연료 지수를 기반으로 우리나라에 최적화한 미세 연료 지수, 가뭄지수의 곱과 시간 및 공간적 가중치를 통하여 산출된다. 시간적인 정확성 향상을 위하여 산림청에서 제공하는 산불 피해 대장 표를 이용하여 월별 산불 통계량을 통한 월별 가중치를 적용하였으며, 공간적인 정확성 향상을 위하여 산불 다발 지역 지도의 산불 밀도 정보를 이용하여 가중치를 적용하였다. 월별 산불 발생 건수와 제안된 산불위험지수의 시계열을 분석하였을 때 증가 및 감소 경향을 잘 모의하고 있었으며, 5km 격자 형태로 산불위험지수를 제공함으로써 행정 구역 단위로 산불위험지수를 제공할 때보다 상세한 정보를 제공할 수 있었으므로 지역적으로 더욱 정확하고 구체적인 산불 예방에 대한 의사 결정에 도움이 될 것으로 기대된다.

강원도 지역 산불발생인자의 지역별 유형화 (Regional Analysis of Forest Eire Occurrence Factors in Kangwon Province)

  • 이시영;한상열;안상현;오정수;조명희;김명수
    • 한국농림기상학회지
    • /
    • 제3권3호
    • /
    • pp.135-142
    • /
    • 2001
  • 이 연구는 강원도 지역의 시계열 기상자료와 산불발생현황자료를 이용하여 시ㆍ군별 산불발생유형을 구분하고자 지역간 기상요인과 발생원인 그리고 산불발생 일을 근거로 한 지역별 유형화 구분을 목적으로 시도되었다. 기상요인에 의한 산불발생 유형화에서는 최근 6년간의 강원도 소재 기상대의 기상자료를 적용하였으며, 지역과 산불발생원인과의 관련성 규명과 산불발생일의 불일치계수를 이용한 수량화된 다차원척도법 유형화에서는 최근 10년간의 산불발생현황자료를 적용하였다. 연구결과를 요약하면 다음과 같다. 첫째, 강원도 동해안산불과 같은 대형산불에 관련되는 기상요인으로는 평균온도, 최저온도, 최저초상온도, 평균풍속, 최대풍속 등으로 규명되었다. 둘째, 산불발생원인과 지역간의 관계를 도식화한 대응일치분석 결과에서는 지역과 산불발생원인과의 관계에서 가장 확연히 구분되는 지역으로는 '강릉'의 경우로 '방화'와 깊은 관련이 있는 것으로 나타났으며, '삼척'은 '입산자실화'와 '철원', '화천', '양구'지역은 군사훈련과 관계하는 것으로 보여지며, '속초'와 '춘천'의 경우에는 '쓰레기 소각'과 '담뱃불'이 타지역보다 밀접한 관련성이 있는 것으로 나타났다. 마지막으로 산화발생일을 근거로 각 시ㆍ군의 산불발생 유사성 정도 및 유형화 구분을 위한 다차원척도법 적용결과에서는 강원도 18개 시ㆍ군 지역이 5개의 유형으로 분류되었는데, 유형 I로 구분된 지역으로는 삼척, 강릉, 춘천, 원주, 홍천, 횡성으로 나타났으며, 유형 Ⅱ는 동해, 태백, 양양, 평창지역, 유형 Ⅲ은 정선, 철원, 화천지역, 유형 Ⅵ는 고성, 인제, 양구지역이, 그리고 마지막으로 유형 V는 속초와 영월지역으로 구분되었다. 지금까지의 도출된 연구결과들은 산불현황자료와 기상자료를 기초로 하여 도출된 결과를 근거로 제시하였고, 지역별 산불발생 특성을 보다 체계적으로 구분하기 위하여는 이외에도 지역별 임상요인과 지형 및 사회적 요인에 대한 검토들이 병행되어야 할 것으로 판단된다.의 경쟁이 생장에 영향을 미치는 것이 사실이다. 따라서 앞으로의 연구에서는 지형, 토양, 미기후 조건, 그리고 임목 간의 경쟁관계가 종합적으로 고려된 환경요인에 의한 생장특성을 파악하는 연구가 필요하다. 아울러 본 연구에서와 같이 지형기후학적 방법에 의하여 추정된 미기후를 통하여 보다 정확한 결과를 얻기 위해서는 무인자동기상관측 망의 설치를 통하여 이를 검증하는 작업이 필요하다.deling of self-similar traffic.ti colored dan have been produced after 1960's. Around the end of 1980's, automatic shuttle change loom have been generalized and 7 color dan(칠색단), 9 color gumsadan (구색금사단) have been current in multi colored dan. In terms of materials, synthetic and chemical textiles had been used widely and alter 1980's most fabrics, of which the ground weave is not being woven with satin-weave but being woven with plain or twill-weave, are named Dan in general.Standards for Livestock Products of Korea". The measured mean concentrations of Ca, Fe, Zn were generally higher than lower limit of labeled value(above 80% of labeled value). The mean concentration of sodium was lower than upper limit of labeled value(below 120% of labeled value).

  • PDF

역전파 신경망 모델을 이용한 기준 작물 증발산량 산정 (Estimation of Reference Crop Evapotranspiration Using Backpropagation Neural Network Model)

  • 김민영;최용훈;수잔 오샤네시;폴 콜레이지;김영진;전종길;이상봉
    • 한국농공학회논문집
    • /
    • 제61권6호
    • /
    • pp.111-121
    • /
    • 2019
  • 작물 증발산량은 수자원 계획 및 관리, 물수지 분석, 작물 관개 계획 및 생산량 추정 등에 널리 활용되고 있으며, 특히 FAO에서 공인한 Penman-Monteith식 (FAO 56-PM)은 잠재 증발산량 산정을 위한 표준방법으로 많이 사용되고 있다. Penman-Monteith식을 이용한 잠재증발산량 산정은 최소온도, 평균온도, 최대온도, 상대습도, 풍속과 일사량인 6가지 항목에 대한 시계열 자료가 필요한데, 결측 또는 미계측된 경우에는 사용이 어려운 단점을 가지고 있다. 따라서, 본 연구에서는 역전파 신경망(BPNN) 모델을 이용해서 6개 미만의 기상항목으로도 잠재증발산량이 추정가능한지를 확인하였다. 여섯 가지 기상항목을 각각 1~6개의 조합으로 입력자료를 구성하고, BPNN 모델을 이용해서 학습, 검증 및 테스트를 한 결과, 입력 자료가 많아질수록 좋은 결과가 산출되었으며, 일사량, 최대온도와 상대습도만으로도 결정계수($R^2$)가 0.94정도로 비교적 높은 예측결과를 얻을 수 있었다. 또한 산정 오차를 줄이고, 항목간의 상관관계를 높이기 위해서는 역전파 신경망 구조의 적절한 선택이 중요한 것으로 확인되었다. 역전파 신경망 모델을 사용하면 요구되는 기상 항목과 데이터의 양에 대한 제약 없이 예측이 가능할 수 있기 때문에 기준 증발산량 산정에 유용하게 활용될 수 있을 것이며 향후 작물 재배를 위한 적정 관개계획 수립에도 유용하게 사용될 것이라 사료된다.

Hierarchical Attention Network를 이용한 복합 장애 발생 예측 시스템 개발 (Development of a complex failure prediction system using Hierarchical Attention Network)

  • 박영찬;안상준;김민태;김우주
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.127-148
    • /
    • 2020
  • 데이터 센터는 컴퓨터 시스템과 관련 구성요소를 수용하기 위한 물리적 환경시설로, 빅데이터, 인공지능 스마트 공장, 웨어러블, 스마트 홈 등 차세대 핵심 산업의 필수 기반기술이다. 특히, 클라우드 컴퓨팅의 성장으로 데이터 센터 인프라의 비례적 확장은 불가피하다. 이러한 데이터 센터 설비의 상태를 모니터링하는 것은 시스템을 유지, 관리하고 장애를 예방하기 위한 방법이다. 설비를 구성하는 일부 요소에 장애가 발생하는 경우 해당 장비뿐 아니라 연결된 다른 장비에도 영향을 미칠 수 있으며, 막대한 손해를 초래할 수 있다. 특히, IT 시설은 상호의존성에 의해 불규칙하고 원인을 알기 어렵다. 데이터 센터 내 장애를 예측하는 선행연구에서는, 장치들이 혼재된 상황임을 가정하지 않고 단일 서버를 단일 상태로 보고 장애를 예측했다. 이에 본 연구에서는, 서버 내부에서 발생하는 장애(Outage A)와 서버 외부에서 발생하는 장애(Outage B)로 데이터 센터 장애를 구분하고, 서버 내에서 발생하는 복합적인 장애 분석에 중점을 두었다. 서버 외부 장애는 전력, 냉각, 사용자 실수 등인데, 이와 같은 장애는 데이터 센터 설비 구축 초기 단계에서 예방이 가능했기 때문에 다양한 솔루션이 개발되고 있는 상황이다. 반면 서버 내 발생하는 장애는 원인 규명이 어려워 아직까지 적절한 예방이 이뤄지지 못하고 있다. 특히 서버 장애가 단일적으로 발생하지 않고, 다른 서버 장애의 원인이 되기도 하고, 다른 서버부터 장애의 원인이 되는 무언가를 받기도 하는 이유다. 즉, 기존 연구들은 서버들 간 영향을 주지 않는 단일 서버인 상태로 가정하고 장애를 분석했다면, 본 연구에서는 서버들 간 영향을 준다고 가정하고 장애 발생 상태를 분석했다. 데이터 센터 내 복합 장애 상황을 정의하기 위해, 데이터 센터 내 존재하는 각 장비별로 장애가 발생한 장애 이력 데이터를 활용했다. 본 연구에서 고려되는 장애는 Network Node Down, Server Down, Windows Activation Services Down, Database Management System Service Down으로 크게 4가지이다. 각 장비별로 발생되는 장애들을 시간 순으로 정렬하고, 특정 장비에서 장애가 발생하였을 때, 발생 시점으로부터 5분 내 특정 장비에서 장애가 발생하였다면 이를 동시에 장애가 발생하였다고 정의하였다. 이렇게 동시에 장애가 발생한 장비들에 대해서 Sequence를 구성한 후, 구성한 Sequence 내에서 동시에 자주 발생하는 장비 5개를 선정하였고, 선정된 장비들이 동시에 장애가 발생된 경우를 시각화를 통해 확인하였다. 장애 분석을 위해 수집된 서버 리소스 정보는 시계열 단위이며 흐름성을 가진다는 점에서 이전 상태를 통해 다음 상태를 예측할 수 있는 딥러닝 알고리즘인 LSTM(Long Short-term Memory)을 사용했다. 또한 단일 서버와 달리 복합장애는 서버별로 장애 발생에 끼치는 수준이 다르다는 점을 감안하여 Hierarchical Attention Network 딥러닝 모델 구조를 활용했다. 본 알고리즘은 장애에 끼치는 영향이 클 수록 해당 서버에 가중치를 주어 예측 정확도를 높이는 방법이다. 연구는 장애유형을 정의하고 분석 대상을 선정하는 것으로 시작하여, 첫 번째 실험에서는 동일한 수집 데이터에 대해 단일 서버 상태와 복합 서버 상태로 가정하고 비교분석하였다. 두 번째 실험은 서버의 임계치를 각각 최적화 하여 복합 서버 상태일 때의 예측 정확도를 향상시켰다. 단일 서버와 다중 서버로 각각 가정한 첫 번째 실험에서 단일 서버로 가정한 경우 실제 장애가 발생했음에도 불구하고 5개 서버 중 3개의 서버에서는 장애가 발생하지 않은것으로 예측했다. 그러나 다중 서버로 가정했을때에는 5개 서버 모두 장애가 발생한 것으로 예측했다. 실험 결과 서버 간 영향이 있을 것이라고 추측한 가설이 입증된 것이다. 연구결과 단일 서버로 가정했을 때 보다 다중 서버로 가정했을 때 예측 성능이 우수함을 확인했다. 특히 서버별 영향이 다를것으로 가정하고 Hierarchical Attention Network 알고리즘을 적용한 것이 분석 효과를 향상시키는 역할을 했다. 또한 각 서버마다 다른 임계치를 적용함으로써 예측 정확도를 향상시킬 수 있었다. 본 연구는 원인 규명이 어려운 장애를 과거 데이터를 통해 예측 가능하게 함을 보였고, 데이터 센터의 서버 내에서 발생하는 장애를 예측할 수 있는 모델을 제시했다. 본 연구결과를 활용하여 장애 발생을 사전에 방지할 수 있을 것으로 기대된다.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).