• 제목/요약/키워드: time-series model

검색결과 2,648건 처리시간 0.027초

기상 데이터를 활용한 LSTM 기반의 해양 혼합층 수온 예측 (LSTM Based Prediction of Ocean Mixed Layer Temperature Using Meteorological Data)

  • 고관섭;김영원;변성현;이수진
    • 대한원격탐사학회지
    • /
    • 제37권3호
    • /
    • pp.603-614
    • /
    • 2021
  • 최근 우리나라 주변 해역의 해수면 온도가 상승하고 있다. 이러한 수온 상승은 어족자원의 변화를 일으켜 낚시와 같은 레저활동에 영향을 미치기도 하며, 특히 고수온은 적조 발생으로 이어져 양식업과 같은 해양산업에 극심한 피해를 유발하기도 한다. 한편 수온 변화는 잠수함을 탐지하는 군사작전과도 밀접하게 연관되어 있다. 이는 잠수함을 탐지하기 위한 음파가 수온층에 따라 회절, 굴절 및 반사되는 정도가 달라지기 때문이다. 이와 같이 해양과 관련된 다양한 분야에서 중요성을 가지는 해양 수온의 변화를 예측하기 위한 연구가 현재 활발하게 진행되고 있다. 그러나 기존 연구들은 대부분 해수면 온도만을 예측하는데 중점을 두고 있어 수심별 어족자원의 변화나 잠수함 탐지와 같은 군사분야 활용이 제한된다. 이에 본 연구에서는 수심별 수온자료 및 해수면 온도와 상관관계를 가지는 기온, 기압, 일조량 등의 기상 데이터를 함께 활용하여 수심 38 m 혼합층의 수온을 예측하였다. 사용된 데이터는 이어도 해양과학기지에서 관측한 2016년부터 2020년까지의 기상 데이터와 수심별 수온 자료이며, 예측의 정확성과 효율성을 높이기 위해 딥러닝 기법 중 시계열 자료에 적합하다고 알려진 LSTM(Long Short-Term Memory)을 사용하였다. 실험 결과 1시간 예측을 기준으로 기온과 기압, 일조량 자료를 함께 활용한 모델의 RMSE(Root Mean Square Error)는 0.473으로 나타났다. 반면 해수면 수온만을 활용한 모델의 RMSE는 0.631로 나타나 기상데이터를 함께 활용한 모델이 상부 혼합층 수온 예측에서 보다 우수한 성능을 보임을 확인하였다.

대기오염물질 농도에 따른 천식 응급환자 수 예측 연구 (A prediction study on the number of emergency patients with ASTHMA according to the concentration of air pollutants)

  • 이한주;지민규;김청원
    • 서비스연구
    • /
    • 제13권1호
    • /
    • pp.63-75
    • /
    • 2023
  • 산업이 발전하면서 대기오염물질에 대한 관심도는 높아졌다. 대기오염물질은 환경오염, 지구 온난화 등 다양한 분야에 영향을 미쳤다. 그 중 환경성 질환은 대기오염물질에 의해 영향을 받은 분야 중 하나이다. 대기오염물질은 분자의 크기가 작아 인체의 피부나 호흡기를 통해 영향을 미칠 수 있다. 이러한 점 때문에 대기오염물질과 환경성 질환에 대한 연구가 다양하게 진행됐다. 환경성 질환의 일환인 천식은 증상이 심해져 천식발작을 일으킬 경우 생명에 위협을 줄 수 있고 성인 천식의 경우 한번 발병을 하면 완치가 어렵다. 천식을 악화시키는 요인에는 황사, 대기오염이 포함된다. 전 세계적으로 천식은 유병률이 증가하고 있는 추세이다. 본 논문에서는 대기오염물질이 천식 환자의 응급실 입원 건수와 어떤 상관관계를 가지는지 연구하고 상관관계가 높은 대기오염물질을 이용하여 미래의 천식 환자 수를 예측했다. 대기오염물질은 아황산가스(SO2), 일산화탄소(CO2), 오존(O3), 이산화질소(NO2)와 미세먼지(PM10) 5가지 대기오염물질의 농도를 이용하고 환경성 질환은 천식 환자의 응급실 입원 건수 데이터를 이용하였다. 대기오염물질과 천식의 응급환자 수에 대한 데이터는 2013년 1월1일 부터 2017년 12월 31일 까지 총 5년 치의 데이터를 이용하였다. 모델은 Informer와 LTSF-Linear의 두 가지 모델을 이용하여 예측을 진행하였고 모델의 성능을 측정하기 위해 MAE, MAPE, RMSE 의 성능지표를 이용했다. 천식의 응급환자 수 예측은 응급환자 수를 포함하여 예측을 진행한 경우와 포함하지 않고 진행한 두 가지 경우 모두 진행하여 결과를 비교했다. 본 논문은 Informer와 LTSF-Linear 모델을 이용한 천식 응급환자 수의 예측에 모델의 성능을 향상 시키는 대기 오염물질을 제시한다.

기업형 슈퍼마켓(SSM)의 시장진입이 소매업태간 시장점유율 변화에 미친 영향 (The Impact of SSM Market Entry on Changes in Market Shares among Retailing Types)

  • 최지호;윤민석;문연희;최성호
    • 한국유통학회지:유통연구
    • /
    • 제17권3호
    • /
    • pp.115-132
    • /
    • 2012
  • 본 연구의 목적은 최근 급격하게 확산되고 있는 기업형 슈퍼마켓(SSM)의 시장 진입이 국내 소매업 경쟁구조에 미친 영향을 실증하는데 있다. 자료의 분석기간은 2000년 1월부터 2010년 12월까지이며, 기업형 슈퍼마켓이 월별로 진입한 점포수, 누적 점포수, 신규 SSM 사업체 중 $165m^2$ 미만 점포비율이 분석모형에 고려되어 소매업태별 상대적 시장점유율에 미치는 효과가 분석되었다. 한국표준산업분류 코드에서 종합소매업에 속해 있는 백화점, 대형마트, 슈퍼마켓, 체인화 편의점, 기타 음식료품 위주 종합 소매업으로 구분된 소매업태간 시장점유율은 매월 각 소매업태별 판매액을 합산하여 월별 총 소매판매액을 계산한 후, 각 소매업태의 판매액이 총 소매판매액에서 차지하는 비율로 측정하였다. 통제변수로 소매업태별 종사자 수, 통화량(M2)이 모형에 추가되어 분석되었다. 분석결과, 신규 SSM 시장진입으로 인한 소매업태별 시장점유율 변화는 대형마트에서만 통계적으로 유의한 결과가 도출되었다. SSM의 누적 점포수는 모든 소매업태의 시장점유율 변화에 유의한 영향을 미쳤으나 그 영향력에 대한 방향성이 소매업태별로 다르게 나타났다. 먼저 SSM의 확산은 대형마트와 편의점의 시장점유율을 감소시킨 반면에 백화점, 슈퍼마켓, 기타 음식료품 위주 종합 소매점의 시장점유율에는 긍정적인 공헌을 한 것으로 나타났다. 이러한 결과에 대한 논의, 시사점, 그리고 향후 연구 방향이 제시되었다.

  • PDF

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.

전방 자유면의 암반 이동에 관한 연구 (A Study on Movement of the Free Face During Bench Blasting)

  • 이기근;김갑수;양국정;강대우;허원호
    • 화약ㆍ발파
    • /
    • 제30권2호
    • /
    • pp.29-42
    • /
    • 2012
  • 발파 시 자유면의 이동은 대상암반의 역학적 특성 및 발파조건, 특히 암반의 불연속면 특성과 폭약의 종류, 장약량, 저항선, 공간격, 공간 또는 열간 기폭시차 및 전색상태 등 여러 가지 변수들에 의해 달라지며, 이는 발파진동의 크기, 폭음 및 파쇄도에 커다란 영향을 미친다. 현재 국내 노천발파 현장의 발파설계는 대부분 인접 보안물건에 대한 안전성을 최우선으로 하고 있으나 대규모 발파가 이루어지는 노천현장에서는 발파 시 자유면의 이동을 분석하여 진동을 제어하고 파쇄도를 향상시키기 위한 최적 조건의 발파 설계를 하는 것은 매우 중요하다. 고속 디지털 동영상 분석을 통하여 발파 후 최초 자유면 암반의 움직임, 전색의 적정성, 발파암의 이동 궤적, 발파암의 이동방향과 속도, 최적의 기폭시스템 분석이 가능하다. 외국에서는 이와 같은 방법이 발파설계 및 평가를 위한 유용한 도구로 활용되고 있으나 국내에서는 그 연구가 미미하다. 따라서 본 연구는 디지털 고속 동영상 분석에 의한 최적 발파설계 및 평가에 대한 기초적인 연구를 수행하였다. 셰일과 화강암으로 구성된 대규모 노천 발파현장 2개소에서 Emulsion과 ANFO 두 종류 폭약에 대한 암반 파쇄과정을 촬영한 디지털 고속동영상을 분석하여 자유면 암반의 변위, 이동속도 등을 분석하고 2차원 유한요소 해석 프로그램인 AUTODYN을 사용하여 폭약의 폭굉압력, 폭굉 전달시간, 발파 후 최초로 암반에 변위가 발생되는 반응시간, 발파 후 자유면 암반의 이동형상에 대한 수치해석을 수행하였다. 수치해석 및 디지털 고속 동영상을 분석한 결과, 암반의 종류에 관계없이 발파공 전면 자유면 암반의 이동형상은 주상 장약부의 중간 부근에서 변위 및 이동속도가 가장 크게 발생되어 가운데 부분이 활처럼 휘어진 형상을 나타내었다. 폭약의 폭굉압력, 폭굉 전달시간, 발파 후 최초로 자유면 암반에 변위가 발생되는 반응시간의 경우 Emulsion 폭약이 ANFO보다 폭굉압력 및 폭속이 크고 초기 변위 반응시간이 빠르게 진행되는 것으로 분석되었다.

서해안 곰소만 갯벌 온도의 구조 및 변화 (Structure and Variation of Tidal Flat Temperature in Gomso Bay, West Coast of Korea)

  • 이상호;조양기;유광우;김영곤;최현용
    • 한국해양학회지:바다
    • /
    • 제10권1호
    • /
    • pp.100-112
    • /
    • 2005
  • 갯벌의 온도구조와 열적 특성변화를 조사하기 위해 서해안 공소만 갯벌조간대에서 고도가 다른 3개 지점을 설정하여 40 cm깊이까지 계절별로 1개월간의 온도관측을 수행하였다. 표층에서 평균온도는 하계에 아래층보다 높고 동계에는 낮아져 표층가열과 냉각에 의한 온도구조와 변화 형태를 보여주었으며 표준편차는 아래층으로 갈수록 감소하였다. 주기성이 뚜렷한 일사량과 조위 변화가 주로 단기적 온도변화를 야기하였고, 간헐적으로는 강우와 강한 풍속도 영향을 주었다. 시계열분석에 의하면 24시간, 12시간 그리고 8시간 주기 성분에 강한 에너지 첨두(peak)를 보였으며, 24시간 주기성분이 가장 큰 에너지를 보였다. 24시간 주기 성분은 일사량변화, 12시간 주기는 반일주조 조위변화 그리고 8시간 주기성분은 일사량과 조위변화의 상호작용에 의한 온도파동으로 해석되었다. EOF분석에서 제 1모드와 제 2모드가 수직온도구조 변화의 96%를 차지하였다 제 1모드는 갯벌 표층에서의 가열과 냉각에 의한 현상으로, 제 2모드는 갯벌내부의 열 전파과정에서 발생하는 지연효과로 해석되었다. 교차스펙트럼 분석에서 24시간 주기성분 온도파동에 의한 열전달위상은 깊이에 따라 선형적으로 증가하는 평균위상 차이를 보였고, 표층에서 10 cm, 20 cm, 40 cm 깊이까지의 위상 차이에 의한 지연시간은 각각 3.2시간, 6.5시간 9.8시간이었다. 일차원적 열확산모델에서 산출된 24시간 주기성분 온도파동의 수직 확산계수는 깊이와 계절에 걸쳐 평균하였을 때 중부조간대 정점에서는 $0.70{\times}10^{-6}m^2/s$, 하부조간대 정점에서는 $0.57{\times}10^{-6}m^2/s$의 값을 보였다. 깊이 평균된 확산계수는 봄철에 크고 여름철에 작았고, 계절 평균된 확산계수는 2cm부터 10cm깊이까지 증가하고 10cin부터 40cm깊이까지는 감소하는 수직구조를 보였다. 평균 열확산계수를 사용하여 구한 온도전파 확산속도는 2 cm 깊이로부터 10 cm, 20cm, 40cm까지 각각 $8.75{\times}10^{-4}cm/s,\;3.8{\times}10{-4}cm/s,\;1.7{\times}10^{-4}cm/s$정도의 값이 되어 표층에서 깊어질수록 작아졌다.

9-hydroxypheophorbide-a와 660 nm 다이오드 레이저를 이용한 광역학치료의 항암효과와 치료기전에 대한 연구 (The Anticancer Effect and Mechanism of Photodynamic Therapy Using 9-Hydroxypheophorbide-a and 660 nm Diode Laser on Human Squamous Carcinoma Cell Line.)

  • 안진철
    • 생명과학회지
    • /
    • 제19권6호
    • /
    • pp.770-780
    • /
    • 2009
  • 녹조류인 Spirulina platensis에서 추출하여 만든 새로운 광감작제와 660 nm의 다이오드 레이저를 이용한 광역학치료의 항암효과와 치료기전을 알아보았다. 세포 독성능은 MTT assay를 이용하였고, 세포사멸기전은 propidium iodide과 Hoechst 33342 염색법과 투과전자현미경으로 확인하였다. 또한 암세포가 이종 이식된 누드마우스 모델에서 광역학치료를 시행하여 항암효과를 확인하였다. 3종류의 클로로필 유도체 중 9-hydroxypheophorbide-a (9-HpbD-a)의 세포 독성능이 가장 우수하였고, 9-HpbD-a의 적정 레이저조사 시간은 30분 (3.2 J/$cm^{2}$), 광감작제를 투여하고 레이저조사시간까지의 배양시간은 최소 6시간 이상임을 확인하였다. 광역학치료의 세포사멸기전은 낮은 9-HpbD-a 농도에서 세포고사가 주된 세포사멸기전이었고, 높은 농도의 9-HpbD-a에서는 세포괴사에 의한 세포사멸이 주된 기전임을 확인하였다. 투과전자현미경 하에서도 같은 양상을 관찰하였다. 그리고 암세포가 이종 이식된 누드마우스 모델에서의 광역학치료는 제1군 정상대조군과 제2군 9-HpbD-a만을 투여한 종양조직모두 지속적인 종양의 성장(100% )을 보였고, 제3군인 레이저만을 종양조직에 조사한 실험군에서는 3 마리는 치료가 되지 않았고(75.0%), 1 마리는 재발(25.0%) 하였다. 제4군 광역학치료군에서 총16 마리의 종양에서 10 마리는 완치(62.5%), 4 마리는 재발(25.0%), 2 마리는 치유되지 않았음(12.5% )을 확인하였다. 9-HpbD-a와 660 nm 다이오드 레이저를 이용한 광역학치료는 유의한 항암효과를 나타내었고 9-HpbD-a를 이용한 광역학치료는 새로운 치료방법으로서 향후 암치료의 유용한 치료방법으로 기대된다.

항공산업 미래유망분야 선정을 위한 텍스트 마이닝 기반의 트렌드 분석 (Text Mining-Based Emerging Trend Analysis for the Aviation Industry)

  • 김현정;조남옥;신경식
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.65-82
    • /
    • 2015
  • 최근 경제적 사회적 부가가치를 창출할 수 있는 유망분야를 선정하여 국가 전략 및 정책 수립 시 반영하기 위해 미래 핵심 이슈를 발견하고 트렌드를 분석하는 것에 대한 관심이 급증하고 있다. 기존에는 미래의 핵심 기술이나 이슈를 발견하고 트렌드 분석을 통해 미래유망분야를 선정하는 연구를 위해 문헌 조사 또는 전문가 평가와 같은 정성적 연구방법이 사용되어 왔다. 그러나 이 연구방법은 대량의 정보로부터 결과를 도출하는데 많은 시간과 비용이 소요될 뿐만 아니라 전문가의 주관적인 가치가 반영될 가능성이 존재한다. 이와 같은 한계점을 보완하고자 최근 국토교통, 안전, 정보통신기술 등 다양한 분야에서 미래유망분야를 선정하기 위하여 정성적 연구방법에 텍스트 마이닝과 같은 정량적 연구방법을 상호 보완적으로 활용하는 방식으로 트렌드 분석을 수행하는 연구 방법론의 패러다임 변화가 시도되고 있다. 본 연구는 항공산업 전반적인 분야에 빅데이터 분석 방법인 텍스트 마이닝 기법을 적용하여 항공 분야의 연구동향을 파악하고 미래유망분야를 전망하였다. 텍스트 마이닝 기법 중하나인 토픽 분석을 이용하여 항공산업 전반적인 분야의 문서 집합 내 잠재된 토픽을 추출하고, 연도별로 핵심 토픽의 추이를 분석하였다. 분석 결과 항공산업의 미래유망분야로 항공안전정책, 항공운임(저가항공), 그리고 친환경 고연비 연료가 도출되었다. 본 연구결과는 분석 대상을 논문에 한정하여 수행하였다는 한계점이 존재하나, 항공산업 분야의 핵심 이슈를 도출하기 위하여 텍스트 마이닝 기반의 트렌드 분석에 대한 활용가능성을 제시하고, 미래유망분야를 선정하기 위한 정량적인 분석 방법론의 전형을 마련하였다는 점에서 의의가 있다.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).

Hierarchical Attention Network를 이용한 복합 장애 발생 예측 시스템 개발 (Development of a complex failure prediction system using Hierarchical Attention Network)

  • 박영찬;안상준;김민태;김우주
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.127-148
    • /
    • 2020
  • 데이터 센터는 컴퓨터 시스템과 관련 구성요소를 수용하기 위한 물리적 환경시설로, 빅데이터, 인공지능 스마트 공장, 웨어러블, 스마트 홈 등 차세대 핵심 산업의 필수 기반기술이다. 특히, 클라우드 컴퓨팅의 성장으로 데이터 센터 인프라의 비례적 확장은 불가피하다. 이러한 데이터 센터 설비의 상태를 모니터링하는 것은 시스템을 유지, 관리하고 장애를 예방하기 위한 방법이다. 설비를 구성하는 일부 요소에 장애가 발생하는 경우 해당 장비뿐 아니라 연결된 다른 장비에도 영향을 미칠 수 있으며, 막대한 손해를 초래할 수 있다. 특히, IT 시설은 상호의존성에 의해 불규칙하고 원인을 알기 어렵다. 데이터 센터 내 장애를 예측하는 선행연구에서는, 장치들이 혼재된 상황임을 가정하지 않고 단일 서버를 단일 상태로 보고 장애를 예측했다. 이에 본 연구에서는, 서버 내부에서 발생하는 장애(Outage A)와 서버 외부에서 발생하는 장애(Outage B)로 데이터 센터 장애를 구분하고, 서버 내에서 발생하는 복합적인 장애 분석에 중점을 두었다. 서버 외부 장애는 전력, 냉각, 사용자 실수 등인데, 이와 같은 장애는 데이터 센터 설비 구축 초기 단계에서 예방이 가능했기 때문에 다양한 솔루션이 개발되고 있는 상황이다. 반면 서버 내 발생하는 장애는 원인 규명이 어려워 아직까지 적절한 예방이 이뤄지지 못하고 있다. 특히 서버 장애가 단일적으로 발생하지 않고, 다른 서버 장애의 원인이 되기도 하고, 다른 서버부터 장애의 원인이 되는 무언가를 받기도 하는 이유다. 즉, 기존 연구들은 서버들 간 영향을 주지 않는 단일 서버인 상태로 가정하고 장애를 분석했다면, 본 연구에서는 서버들 간 영향을 준다고 가정하고 장애 발생 상태를 분석했다. 데이터 센터 내 복합 장애 상황을 정의하기 위해, 데이터 센터 내 존재하는 각 장비별로 장애가 발생한 장애 이력 데이터를 활용했다. 본 연구에서 고려되는 장애는 Network Node Down, Server Down, Windows Activation Services Down, Database Management System Service Down으로 크게 4가지이다. 각 장비별로 발생되는 장애들을 시간 순으로 정렬하고, 특정 장비에서 장애가 발생하였을 때, 발생 시점으로부터 5분 내 특정 장비에서 장애가 발생하였다면 이를 동시에 장애가 발생하였다고 정의하였다. 이렇게 동시에 장애가 발생한 장비들에 대해서 Sequence를 구성한 후, 구성한 Sequence 내에서 동시에 자주 발생하는 장비 5개를 선정하였고, 선정된 장비들이 동시에 장애가 발생된 경우를 시각화를 통해 확인하였다. 장애 분석을 위해 수집된 서버 리소스 정보는 시계열 단위이며 흐름성을 가진다는 점에서 이전 상태를 통해 다음 상태를 예측할 수 있는 딥러닝 알고리즘인 LSTM(Long Short-term Memory)을 사용했다. 또한 단일 서버와 달리 복합장애는 서버별로 장애 발생에 끼치는 수준이 다르다는 점을 감안하여 Hierarchical Attention Network 딥러닝 모델 구조를 활용했다. 본 알고리즘은 장애에 끼치는 영향이 클 수록 해당 서버에 가중치를 주어 예측 정확도를 높이는 방법이다. 연구는 장애유형을 정의하고 분석 대상을 선정하는 것으로 시작하여, 첫 번째 실험에서는 동일한 수집 데이터에 대해 단일 서버 상태와 복합 서버 상태로 가정하고 비교분석하였다. 두 번째 실험은 서버의 임계치를 각각 최적화 하여 복합 서버 상태일 때의 예측 정확도를 향상시켰다. 단일 서버와 다중 서버로 각각 가정한 첫 번째 실험에서 단일 서버로 가정한 경우 실제 장애가 발생했음에도 불구하고 5개 서버 중 3개의 서버에서는 장애가 발생하지 않은것으로 예측했다. 그러나 다중 서버로 가정했을때에는 5개 서버 모두 장애가 발생한 것으로 예측했다. 실험 결과 서버 간 영향이 있을 것이라고 추측한 가설이 입증된 것이다. 연구결과 단일 서버로 가정했을 때 보다 다중 서버로 가정했을 때 예측 성능이 우수함을 확인했다. 특히 서버별 영향이 다를것으로 가정하고 Hierarchical Attention Network 알고리즘을 적용한 것이 분석 효과를 향상시키는 역할을 했다. 또한 각 서버마다 다른 임계치를 적용함으로써 예측 정확도를 향상시킬 수 있었다. 본 연구는 원인 규명이 어려운 장애를 과거 데이터를 통해 예측 가능하게 함을 보였고, 데이터 센터의 서버 내에서 발생하는 장애를 예측할 수 있는 모델을 제시했다. 본 연구결과를 활용하여 장애 발생을 사전에 방지할 수 있을 것으로 기대된다.