• 제목/요약/키워드: Computer Resource

검색결과 1,680건 처리시간 0.028초

인공지능(AI) 기반 인사관리의 윤리적·법적 영향 (Ethical and Legal Implications of AI-based Human Resources Management)

  • 이정우;이정수;권지훈;차민이;김규태
    • 융합신호처리학회논문지
    • /
    • 제25권2호
    • /
    • pp.100-112
    • /
    • 2024
  • 이 연구는 인공지능(AI)을 인적 자원 관리에 활용하는 것의 윤리적 및 법적 함의, 특히 채용 과정에서 AI 인터뷰에 초점을 맞추어 조사합니다. 추론, 학습, 적응과 같은 인간 지능과 관련된 작업을 수행할 수 있는 컴퓨터 프로그램의 능력으로 정의되는 AI는 점점 더 HR 관행에 통합되고 있습니다. AI가 주도하는 인터뷰를 통해 채용에 AI를 배치하면 효율성과 객관성을 약속하지만, 동시에 중요한 윤리적 및 법적 문제도 제기됩니다. 이러한 문제에는 AI 알고리즘의 잠재적 편향, AI 의사 결정 과정의 투명성, 데이터 프라이버시 문제, 기존 노동법 및 규정 준수 등이 포함됩니다. 이 논문은 사례 연구를 분석하고 관련 문헌을 검토함으로써 이러한 과제에 대한 포괄적인 이해를 제공하고 AI 기반 HR 관행에서 윤리적 및 법적 준수를 보장하기 위한 권장 사항을 제시하는 것을 목표로 합니다. 연구 결과는 AI가 채용 효율성을 향상시킬 수 있지만, 위험을 완화하고 공정하고 투명한 채용 관행을 보장하기 위해 견고한 윤리 지침과 법적 프레임워크를 마련하는 것이 필수적임을 시사합니다.

랜드마크 윈도우 기반의 빈발 패턴 마이닝 기법의 분석 및 성능평가 (Analysis and Evaluation of Frequent Pattern Mining Technique based on Landmark Window)

  • 편광범;윤은일
    • 인터넷정보학회논문지
    • /
    • 제15권3호
    • /
    • pp.101-107
    • /
    • 2014
  • 본 논문에서는 랜드마크 윈도우 기반의 빈발 패턴 마이닝 기법을 분석하고 성능을 평가한다. 본 논문에서는 Lossy counting 알고리즘과 hMiner 알고리즘에 대한 분석을 진행한다. 최신의 랜드마크 알고리즘인 hMiner는 트랜잭션이 발생할 때 마다 빈발 패턴을 마이닝 하는 방법이다. 그래서 hMiner와 같은 랜드마크 기반의 빈발 패턴 마이닝을 온라인 마이닝이라고 한다. 본 논문에서는 랜드마크 윈도우 마이닝의 초기 알고리즘인 Lossy counting와 최신 알고리즘인 hMiner의 성능을 평가하고 분석한다. 우리는 성능평가의 척도로 마이닝 시간과 트랜잭션 당 평균 처리 시간을 평가한다. 그리고 우리는 저장 구조의 효율성을 평가하기 위하여 최대 메모리 사용량을 평가한다. 마지막으로 우리는 알고리즘이 안정적으로 마이닝이 가능한지 평가하기 위해 데이터베이스의 아이템 수를 변화시키면서 평가하는 확장성 평가를 수행한다. 두 알고리즘의 평가 결과로, 랜드마크 윈도우 기반의 빈발 패턴 마이닝은 실시간 시스템에 적합한 마이닝 방식을 가지고 있지만 메모리를 많이 사용했다.

백두산 화산재 피해 시나리오에 따른 강원도 지역 농작물의 경제적 피해 추정 (Estimation of Economic Losses on the Agricultural Sector in Gangwon Province, Korea, Based on the Baekdusan Volcanic Ash Damage Scenario)

  • 이윤정;김수도;천준석;우균
    • 한국지구과학회지
    • /
    • 제34권6호
    • /
    • pp.515-523
    • /
    • 2013
  • 백두산 화산 폭발 시 남한 지역은 동해안을 중심으로 화산재에 의한 피해가 예상된다. 적은 양의 화산재라고 할지라도 농작물의 피해나 토양의 산성화를 유발하는 등 농업 분야에 심각한 영향을 줄 수 있다. 이에 이 논문에서는 화산재에 의한 농작물의 피해를 추정하고 구글 지도를 통해 시각화하고자 한다. 이를 위해서 화산재에 대한 피해 예측모델이 필요하다. 화산재 위험은 농작물의 종류와 화산재 두께에 따라 다르므로 피해 예측 모델의 취약도 함수는 화산재 두께와 농작물의 손상률 간의 관계를 나타내어야 한다. 이 논문에서는 RiskScape에서 정의한 화산재 두께에 따른 농작물별 손상률을 이용하여 취약도 함수를 정의하였다. 이 취약도 함수를 농작물 생산량과 가격 정보에 적용하여 화산재 두께에 따른 농작물 피해액을 추정할 수 있다. 또한, 이 논문에서는 화산재의 피해가 예측되는 강원도 지역을 대상으로 화산재에 의한 농작물 피해를 추정하였다. 연구 결과 2010년 강원도 농업 총 생산량을 기준으로 했을 때 화산재가 약 4 mm 정도 쌓이게 되면 농작물 피해액은 약 6,351억 원에 달하는 것으로 나타났다. 이는 강원도 총 농업생산액의 약 50%에 해당한다. 이 논문에서는 화산재에 의한 농작물의 1차적인 피해만을 고려하고 있다. 하지만 화산재는 토양 오염이나 시설물과 같은 농가의 자산에 잠재적인 위험을 줄 수 있다. 따라서 농업 분야 전체에 대한 총 피해 규모를 추정하기 위해서는 이와 같은 2차적인 피해도 함께 고려해야 할 것이다.

동결보존액에 Zardaverine의 첨가가 동결-융해 후 돼지 정자의 운동학적 특성에 미치는 영향 (Effects of Zardaverine in Freezing Extender on Kinetic Characteristics of Post-Thawed Boar Sperm)

  • 김정아;조은석;정용대;최요한;홍준기;김영신;정학재;백선영;사수진
    • 한국산학기술학회논문지
    • /
    • 제21권9호
    • /
    • pp.251-258
    • /
    • 2020
  • 본 연구에서는 동결보존액에 대한 Zardaverine (phosphodiesterase inhibitor) 첨가가 돼지 동결-융해 정자의 운동학적 특성에 미치는 효과를 조사하였다. 돼지정액의 동결보존은 보조 번식기술 및 유전자원 장기보존을 위해 유용하게 이용되는 중요한 기술이다. 하지만 정자세포를 동결-융해하는 과정에서 발생하는 온도충격은 정자의 수정능력을 급격히 저하시킨다. 정액샘플은 성숙한 Duroc종 수퇘지로부터 채취했으며, lactose-egg yolk 동결보존액에 다양한 농도로 Zardaverine (0, 20, 50, 75 및 100 𝜇M)을 첨가하여 정액을 동결하였다. 융해 후 정자세포의 운동학적 특성 분석은 정자운동성자동분석기(CASA; computer-assisted sperm analysis)를 이용하였다. 그 결과, 융해 직후 정자의 운동성(MOT)은 타처리구에 비해 20 𝜇M 처리구에서 가장 높았다(p<0.05). Curvilinear velocity (VCL)은 0 𝜇M 과 20 𝜇M 처리구가 75 𝜇M 처리구를 제외한 다른 처리구들에 비해 유의적으로 높은 값을 보였다(p<0.05). Average path velocity (VAP)는 20 𝜇M 처리구가 100 𝜇M 처리구에 비해 유의적으로 높았으며(p<0.05) Amplitude of head lateral displacement (ALH)는 20 𝜇M 처리구가 50 𝜇M과 100 𝜇M 처리구에 비해 유의적으로 높았다(p<0.05). 이상의 결과를 종합하면, 동결용 보존액에 대한 Zardaverine 첨가가 동결-융해된 돼지 정자의 운동학적 특성에 긍정적인 영향을 미치는 것으로 사료된다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.

The Recognition about Food Wastes Treatment at Yongin Area

  • Kim, Jeong-Hyun;Kang, Hee-Joo;Kim, Kyung-Tae;Kim, Hyun-Soo;Hwang, Seong-Hee;Kim, Yong-Chul;Kim, Pan-Gyi
    • 한국환경보건학회지
    • /
    • 제30권4호
    • /
    • pp.329-343
    • /
    • 2004
  • We conducted to investigate citizen's attitude to the treatment of food waste in Yongin city. The respondent of $41.81\%$ throws the food waste eliminate from home and store less than 1l in Yongin. When they dump the food waste, they speak out the inconvenience of damaged envelope by animals in case of home and store. This caused troubles for reason of sanitary. So a local autonomous entity must carefully consider of expand use specially designed container as like apartment house. They give an answer that the collecting time of food waste is suitable form dawn till morning. This answer shows the satisfaction of the period time to collect the food waste. They prefer to be appointed the exclusive place to collect food waste. The service interval of collect is suitable 1 time a day. They want to increase the number of washing of the collecting container. This is good method for sanitary condition, but the care of the period time to collect the food waste is more efficient than the care of the number of washing the collecting container. The care of the period time minimizes to incur the enmity of the people and to pollute in environment. The major of respondent handled the food waste after keeping the basket or a kit. This fact shows to us almost citizen doesn't feel the seriousness to remove the moisture of the food waste. Recently, many solutions which can be disposal efficiently are getting magnified and improved owing to increase utilities channel to loss in quantities and dry the food waste. We expect the reduction of food waste is solved getting easily step by step. The results of the awareness about the facility of food waste show citizen prefer recycling facility to the other facilities. If recycle facility and incineration facility are constructed, they were worried about bed smell. When some facility of the food waste is constructed, they have to maintain and to handle not to incur the enmity of the people. The spread rate of specially designed container already increased, the citizen set a high value on the use of specially designed container more than amount-rate vinyl envelope that people have used for several years. In the cost treatment about food waste, the major respondent answered the use cost of specially designed container is suitable price. So we can know the use charge is proper level. The majority of citizen more prefer autonomous plan which voluntary atmosphere creation and public information by mass media than levy system and rising treatment cost which forced plan. The citizens have pretty positive thinking of incineration, so the government needs more efforts for a public notice, which includes the incineration is no more than abandoned thing. Each of local self government has to sort the food waste and make kind of resource system related to collecting and carrying, constructing a suitable facility, proper disposal of the food waste and producing harmless in our surrounding in order to solve the invisible problems. To do above mentioned things, we have to analyze referred several problems till now. Also, to minimize the side effect, the government will have to improve through enforce the system.

선도적 농림기상 국제협력을 통한 농업과 식량안보분야 전지구기후 서비스체계 구축 전략 (Implementation Strategy of Global Framework for Climate Service through Global Initiatives in AgroMeteorology for Agriculture and Food Security Sector)

  • 이병열;페데리카 로씨;레이몬드 모타;로버트 스테판스키
    • 한국농림기상학회지
    • /
    • 제15권2호
    • /
    • pp.109-117
    • /
    • 2013
  • "전지구기후서비스체계" (GFCS)는 2009년 제3차 세계기후회의에서 기후변화 대응 취약 국가와 소외계층에 대해 보다 효율적인 기후정보를 제공하기 위한 전지구차원의 서비스 제공체계 구축 필요성에 대한 공감을 바탕으로 제안되어, 현재 세계기싱기구를 중심으로 관련 UN 및 국제기구간 공조를 통해 향후 약 10년 동안에 걸쳐 이를 이행하기 위한 노력을 기울일 예정이다. GFCS는 과학적 기후정보와 기후예측을 기후변화 적응과 기후위기관리를 상호 연계할 수 있는 기후서비스 개발을 주도하게 된다. GFCS의 기본구조는 5개 주요 요소로 구성되어 있는데, 이에는 관측/모니터링, 연구/모형/예측, 기후서비스정보시스템 및 사용자인터페이스 플랫폼과 함께 이들 모두를 포괄하는 역량개발이 포함되어 있다. 현재 GFCS의 편익분야 중 자연재해경감, 수자원, 보건 분야와 함께 농업/식량안보분야가 4대 우선순위에 포함되어 있는데, WMO의 농업기상위원회(CAgM)은 동분야에 대한 GFCS의 효율적 이행을 지원하기 위해 GFCS의 5개 요소별로 이를 보완하기 위한 전구차원 선도적 협력방안(GIAM)을 제안 추진하고 있다. GIAM의 취지는 기존의 기후서비스체계의 개별적 서비스 구조를 통합하거나 미흡한 부분을 보완하는 방법 등 최소한의 추가적인 자원 투입으로 최대 시너지효과를 도출하는데 중점을 두고 있다. 관측분야는 전구생물계절관측협의체 구축, 연구분야는 지역/전구 농림기상 파일롯프로젝트 도출, 기후서비스분야는 기존 농업기상웹서버인 WAMIS의 지역 및 기능 확대, 사용자인터페이스분야는 기존 사이버농업기상협의체를 보완하기 위한 전구 농림기상학술협의체 구축, 그리고 역량개발분야는 전구농림기상교육훈련센터 구축 등이 추진 중에 있으며, 이들간의 유기적인 연동 지원을 위한 조정기구와 지원사무국의 설립도 기상청에 의해 가시화되고 있으며, 효율적인 운영을 위한 새로운 거버넌스도 미국 조지메이슨대를 중심으로 구축 중에 있다. 한편 GIAM의 성공적인 이행을 위해서는 전산자원 인프라 구축이 선행되어야 함으로 현재 WAMIS를 지원하기 위해서 세계기상기구 정보시스템(WIS)의 자료수집/생산센터(DCPC-WAMIS) 구축 및 회원국간 전산자원공유를 위한 클라우드 및 그리드 환경 구축도 기상청과 KISTI/부경대 등의 협조를 얻어 추진 중에 있다, GIAM의 궁극적인 목표의 하나는 차세대 기후변화 대응 농림기상전문가의 양성에 있는데 이를 구현하는 방안으로 회원국의 추천을 받은 후보자를 전구농림기상 교육훈련센터 대학원 과정에 학비/수업료 면제조건으로 입학시킨 후, 지역 파일롯프로젝트에 연구원으로 참여, 이를 통해 생활비 등 지원을 받는 한편 농림기상 학술협의체 회원 활동, 국내외 실무그룹 활동 등을 통해 농림기상분야 국제전문가로 양성함으로써 향후 회원국 농업/식량안보분야 기후변화 대응에 절대적으로 필요한 핵심정책연구 담당자로서의 역할을 기대할 수 있을 것이다.

에이전트기반 개방병원 간호기록시스템 설계에 관한 연구 (A Study on Design of Agent based Nursing Records System in Attending System)

  • 김경환
    • 지능정보연구
    • /
    • 제16권2호
    • /
    • pp.73-94
    • /
    • 2010
  • 개방병원에 환자의 입원을 의뢰한 담당 의사들은 환자들의 상태와 제대로 된 간호서비스를 받고 있는지에 대한 정보를 간호기록을 열람함으로써 확인할 수 있다. 하지만 간호기록은 병원의 내부자료로써 외부기관에 쉽게 공개할 수 없는 자료이고 표준화가 확립되어 있지 않아 병원별로 다르게 작성되고 있어 필요한 정보를 공유하는데 많은 어려움이 따른다. 따라서 본 연구에서는 개방병원 간호기록의 작성과 공유를 지원하기 위한 시스템을 개발하고자 하였다. 본 시스템은 우선 간호기록을 실제로 작성하는 간호사의 편의성을 고려하여 간호기록항목사전을 설정하게 하고 간호사와 의사간의 지능형 에이전트를 이용한 협상으로 작성과 공개의 항목을 확정하도록 하였다. 이 모든 과정은 의료기관간의 네트워킹을 지원할 수 있도록 웹기반시스템으로 설계되었고 실제 구현을 통하여 실현가능성을 확인하였다.

클라우드 시스템에서 해양수치모델 성능 최적화 (Performance Optimization of Numerical Ocean Modeling on Cloud Systems)

  • 정광욱;조양기;탁용진
    • 한국해양학회지:바다
    • /
    • 제27권3호
    • /
    • pp.127-143
    • /
    • 2022
  • 최근 클라우드 컴퓨팅 환경에서 해양수치모델 실험을 수행하는 많은 연구가 활발하게 진행되고 있다. 클라우드 컴퓨팅 환경은 대규모 자원이 필요한 해양수치모델을 구현하는데 매우 효과적인 수단이 될 수 있다. 정보처리 기술의 발달로 클라우드 컴퓨팅 시스템은 가상화와 원격 고속 네트워크, 직접 메모리 액세스와 같은 수치모델의 병렬처리에 필요한 다양한 기술과 환경을 제공한다. 이러한 새로운 기능은 클라우드 컴퓨팅 시스템에서 해양수치모델링 실험을 용이하게 한다. 많은 과학자들과 엔지니어들은 해양수치모델 실험에 있어서 가까운 미래에 클라우드 컴퓨팅이 주류가 될 것으로 기대하고 있다. 해양수치모델링을 위한 클라우드 컴퓨팅의 처리성능 분석은 수치모델의 수행 시간과 리소스 활용량을 최소화하는 데 도움이 될 수 있으므로 최적의 시스템을 적용하는 데 필수적이다. 특히 모델 격자 내 다양한 변수들이 다차원 배열 구조로 되어 있기 때문에 대량의 입출력을 처리하는 해양수치모델의 구조는 캐시메모리의 효과가 크며, 대량의 자료가 이동하는 통신 특성으로 인해서 네트워크의 속도가 중요하다. 최근에 주요한 컴퓨팅환경으로 자리잡고 있는 클라우드 환경이 이러한 해양수치모델을 수행하기에 적합한지 실험을 통해서 검토할 필요가 있다. 본 연구에서는 상용 클라우드 시스템에서 해양수치모델로 대표적인 Regional Ocean Modeling System (ROMS)와 더불어 다른 해양모델의 클라우드 환경으로 전환에도 도움이 될 수 있게 병렬처리 시스템의 성능을 측정할 수 있는 표준 벤치마킹 소프트웨어 패키지인 High Performance Linpack을 활용하여 초당 부동소수점 연산횟수 처리능력과 및 STREAM 벤치마크를 활용하여 다중 노드들로 구성된 수치모델용 클러스터의 메모리처리성능을 평가하고 비교하였다. 이러한 평가내용은 클라우드 환경에서 해양수치모델을 어떻게 수행할 것인가에 대해 중요한 정보를 제공할 수 있다. 가상화 기반 상용 클라우드에서 얻은 실제 성능 자료와 구성 설정 분석을 통해 가상화 기반 클라우드 시스템에서 해양수치모델의 다양한 격자 크기에 대한 컴퓨터 리소스의 효율성을 평가했다. 본 연구를 통해서 캐시 계층과 용량이 큰 메모리를 사용하는 HPC 클러스터가 ROMS의 성능에 매우 중요하다는 것을 발견했다. 수치모델링의 실행 시간을 줄이기 위해 코어 수를 늘리는 것은 작은 격자 보다 큰 격자 모델에서 더 효과적이다. 이러한 처리 성능 분석 결과는 클라우드 컴퓨팅 시스템에서 해양수치모델을 효율적으로 구축하는 데 중요한 자료로 이용될 것이다.

Hierarchical Attention Network를 이용한 복합 장애 발생 예측 시스템 개발 (Development of a complex failure prediction system using Hierarchical Attention Network)

  • 박영찬;안상준;김민태;김우주
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.127-148
    • /
    • 2020
  • 데이터 센터는 컴퓨터 시스템과 관련 구성요소를 수용하기 위한 물리적 환경시설로, 빅데이터, 인공지능 스마트 공장, 웨어러블, 스마트 홈 등 차세대 핵심 산업의 필수 기반기술이다. 특히, 클라우드 컴퓨팅의 성장으로 데이터 센터 인프라의 비례적 확장은 불가피하다. 이러한 데이터 센터 설비의 상태를 모니터링하는 것은 시스템을 유지, 관리하고 장애를 예방하기 위한 방법이다. 설비를 구성하는 일부 요소에 장애가 발생하는 경우 해당 장비뿐 아니라 연결된 다른 장비에도 영향을 미칠 수 있으며, 막대한 손해를 초래할 수 있다. 특히, IT 시설은 상호의존성에 의해 불규칙하고 원인을 알기 어렵다. 데이터 센터 내 장애를 예측하는 선행연구에서는, 장치들이 혼재된 상황임을 가정하지 않고 단일 서버를 단일 상태로 보고 장애를 예측했다. 이에 본 연구에서는, 서버 내부에서 발생하는 장애(Outage A)와 서버 외부에서 발생하는 장애(Outage B)로 데이터 센터 장애를 구분하고, 서버 내에서 발생하는 복합적인 장애 분석에 중점을 두었다. 서버 외부 장애는 전력, 냉각, 사용자 실수 등인데, 이와 같은 장애는 데이터 센터 설비 구축 초기 단계에서 예방이 가능했기 때문에 다양한 솔루션이 개발되고 있는 상황이다. 반면 서버 내 발생하는 장애는 원인 규명이 어려워 아직까지 적절한 예방이 이뤄지지 못하고 있다. 특히 서버 장애가 단일적으로 발생하지 않고, 다른 서버 장애의 원인이 되기도 하고, 다른 서버부터 장애의 원인이 되는 무언가를 받기도 하는 이유다. 즉, 기존 연구들은 서버들 간 영향을 주지 않는 단일 서버인 상태로 가정하고 장애를 분석했다면, 본 연구에서는 서버들 간 영향을 준다고 가정하고 장애 발생 상태를 분석했다. 데이터 센터 내 복합 장애 상황을 정의하기 위해, 데이터 센터 내 존재하는 각 장비별로 장애가 발생한 장애 이력 데이터를 활용했다. 본 연구에서 고려되는 장애는 Network Node Down, Server Down, Windows Activation Services Down, Database Management System Service Down으로 크게 4가지이다. 각 장비별로 발생되는 장애들을 시간 순으로 정렬하고, 특정 장비에서 장애가 발생하였을 때, 발생 시점으로부터 5분 내 특정 장비에서 장애가 발생하였다면 이를 동시에 장애가 발생하였다고 정의하였다. 이렇게 동시에 장애가 발생한 장비들에 대해서 Sequence를 구성한 후, 구성한 Sequence 내에서 동시에 자주 발생하는 장비 5개를 선정하였고, 선정된 장비들이 동시에 장애가 발생된 경우를 시각화를 통해 확인하였다. 장애 분석을 위해 수집된 서버 리소스 정보는 시계열 단위이며 흐름성을 가진다는 점에서 이전 상태를 통해 다음 상태를 예측할 수 있는 딥러닝 알고리즘인 LSTM(Long Short-term Memory)을 사용했다. 또한 단일 서버와 달리 복합장애는 서버별로 장애 발생에 끼치는 수준이 다르다는 점을 감안하여 Hierarchical Attention Network 딥러닝 모델 구조를 활용했다. 본 알고리즘은 장애에 끼치는 영향이 클 수록 해당 서버에 가중치를 주어 예측 정확도를 높이는 방법이다. 연구는 장애유형을 정의하고 분석 대상을 선정하는 것으로 시작하여, 첫 번째 실험에서는 동일한 수집 데이터에 대해 단일 서버 상태와 복합 서버 상태로 가정하고 비교분석하였다. 두 번째 실험은 서버의 임계치를 각각 최적화 하여 복합 서버 상태일 때의 예측 정확도를 향상시켰다. 단일 서버와 다중 서버로 각각 가정한 첫 번째 실험에서 단일 서버로 가정한 경우 실제 장애가 발생했음에도 불구하고 5개 서버 중 3개의 서버에서는 장애가 발생하지 않은것으로 예측했다. 그러나 다중 서버로 가정했을때에는 5개 서버 모두 장애가 발생한 것으로 예측했다. 실험 결과 서버 간 영향이 있을 것이라고 추측한 가설이 입증된 것이다. 연구결과 단일 서버로 가정했을 때 보다 다중 서버로 가정했을 때 예측 성능이 우수함을 확인했다. 특히 서버별 영향이 다를것으로 가정하고 Hierarchical Attention Network 알고리즘을 적용한 것이 분석 효과를 향상시키는 역할을 했다. 또한 각 서버마다 다른 임계치를 적용함으로써 예측 정확도를 향상시킬 수 있었다. 본 연구는 원인 규명이 어려운 장애를 과거 데이터를 통해 예측 가능하게 함을 보였고, 데이터 센터의 서버 내에서 발생하는 장애를 예측할 수 있는 모델을 제시했다. 본 연구결과를 활용하여 장애 발생을 사전에 방지할 수 있을 것으로 기대된다.