• 제목/요약/키워드: Cluster Models

검색결과 355건 처리시간 0.019초

ICT 인프라 이상탐지를 위한 조건부 멀티모달 오토인코더에 관한 연구 (A Study of Anomaly Detection for ICT Infrastructure using Conditional Multimodal Autoencoder)

  • 신병진;이종훈;한상진;박충식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.57-73
    • /
    • 2021
  • ICT 인프라의 이상탐지를 통한 유지보수와 장애 예방이 중요해지고 있다. 장애 예방을 위해서 이상탐지에 대한 관심이 높아지고 있으며, 지금까지의 다양한 이상탐지 기법 중 최근 연구들에서는 딥러닝을 활용하고 있으며 오토인코더를 활용한 모델을 제안하고 있다. 이는 오토인코더가 다차원 다변량에 대해서도 효과적으로 처리가 가능하다는 것이다. 한편 학습 시에는 많은 컴퓨터 자원이 소모되지만 추론과정에서는 연산을 빠르게 수행할 수 있어 실시간 스트리밍 서비스가 가능하다. 본 연구에서는 기존 연구들과 달리 오토인코더에 2가지 요소를 가미하여 이상탐지의 성능을 높이고자 하였다. 먼저 다차원 데이터가 가지고 있는 속성별 특징을 최대한 부각하여 활용하기 위해 멀티모달 개념을 적용한 멀티모달 오토인코더를 적용하였다. CPU, Memory, network 등 서로 연관이 있는 지표들을 묶어 5개의 모달로 구성하여 학습 성능을 높이고자 하였다. 또한, 시계열 데이터의 특징을 데이터의 차원을 늘리지 않고 효과적으로 학습하기 위하여 조건부 오토인코더(conditional autoencoder) 구조를 활용하는 조건부 멀티모달 오토인코더(Conditional Multimodal Autoencoder, CMAE)를 제안하였다. 제안한 CAME 모델은 비교 실험을 통해 검증했으며, 기존 연구들에서 많이 활용된 오토인코더와 비교하여 AUC, Accuracy, Precision, Recall, F1-score의 성능 평가를 진행한 결과 유니모달 오토인코더(UAE)와 멀티모달 오토인코더(Multimodal Autoencoder, MAE)의 성능을 상회하는 결과를 얻어 이상탐지에 있어 효과적이라는 것을 확인하였다.

한국인의 시리얼 섭취실태와 영양 및 건강상태와의 관련성 연구 - 2012년도 국민건강영양조사 자료를 이용하여 - (The relationship of ready-to-eat cereal consumption with nutrition and health status in the Korean population based on the Korea National Health and Nutrition Examination Survey 2012)

  • 정진은
    • Journal of Nutrition and Health
    • /
    • 제48권3호
    • /
    • pp.258-268
    • /
    • 2015
  • 본 연구는 2012년 한국국민건강영양조사 자료를 이용하여 한국인의 성별, 연령별 시리얼 섭취실태를 알아보았다. 연령을 1~18세, 19~75세로 구분하여 시리얼 섭취여부에 따른 영양소 섭취량과 영양상태를 살펴보았고, 19~75세 성인을 대상으로 체위 및 혈액의 생화학적 지표 분석과 질병 유병률 등 건강상태를 비교하였다. 그 결과를 요약하면 다음과 같다. 한국인 중 시리얼을 먹은 사람의 비율은 3.8%이었고 시리얼 섭취량은 연령별로 볼 때 12~18세에서 가장 많았으며 남자가 여자보다 많았다. 시리얼 섭취여부와 사회경제적인 지표와의 관계를 chi-square test한 결과는 19~75세에서 연령군, 교육, 거주지, 직업군과 유의적인 관계가 나타났다. 영양소 섭취량은 시리얼 섭취군이 비섭취군 보다 모든 연령층에서 칼슘, 티아민, 리보플라빈, 나이아신, 비타민 C의 섭취량이 유의적으로 높게 나타났으며 19~75세는 에너지와 지방의 섭취도 유의적으로 높게 나타났다. 시리얼 섭취군이 비섭취군보다 영양소의 평균필요량보다 적게 섭취하는 사람들의 백분율은 칼슘, 비타민 A, 티아민, 리보플라빈, 나이아신, 비타민 C 에서 유의적으로 낮았고, 상한섭취량보다 많이 섭취하는 사람들의 비율은 19~75세에서 칼슘, 인, 철, 비타민 A에서 유의적으로 낮게 나타났다. 즉, 시리얼 섭취군이 비섭취군보다 대부분의 영양소 섭취량은 높았으며, 평균필요량보다 적게 섭취하는 사람들의 백분율과 상한섭취량보다 많이 섭취하는 사람들의 백분율은 낮은 것으로 나타나 영양상태가 좋은 것으로 나타났다. 시리얼 섭취여부에 따른 조사대상자의 체위 및 혈액 생화학적 지표 분석 결과 시리얼 섭취군이 비섭취군에 비해 수축기 혈압, 이완기 혈압, 혈청의 중성지방, 총콜레스테롤의 수치가 유의적으로 낮게 나타났다. 질병유병률은 시리얼 섭취군이 비섭취군에 비해 고혈압과 고콜레스테롤혈증에서 유의적으로 낮게 나타났으며 고혈압의 경우 오즈비가 0.19로 시리얼 섭취군이 비섭취군에 비해 고혈압의 발생이 유의적으로 81% 감소하는 것으로 나타났다 그 외 질병 (비만, 고중성지방혈증, 저HDL-콜레스테롤혈증, 당뇨병, 빈혈, 대사증후군)의 경우 오즈비가 모두 1 미만으로 시리얼 섭취군은 비섭취군에 비해 질병 발생 확률이 감소하는 경향으로 나타났다. 본 연구에서는 한국인을 대상으로 시리얼을 섭취하는 사람들과 섭취하지 않는 사람들의 영양섭취상태와 질병유병률을 비교한 결과 시리얼을 섭취하는 사람들이 섭취하지 않는 사람들에 비해 영양상태는 좋고 질병유병률은 낮은 것으로 나타났으므로 시리얼 섭취가 영양과 건강에 매우 긍정적인 효과를 나타내는 좋은 식품인 것으로 사료된다. 외국의 경우 아침에 시리얼과 우유를 먹는 것이 아침식사의 중요한 식사패턴의 하나로 자리매김하고 있는데 반해, 현재 한국인은 시리얼을 섭취하는 비율이 매우 적고 또한 시리얼을 식사대용으로 먹는 사람들이 많지 않은 실정이다. 그러므로 시리얼 섭취에 따른 영양상태의 우수성과 질병예방을 고려하여 한국인의 식습관이나 식문화와 조화를 이루면서 시리얼이 한국인의 식사에 많이 이용되도록 다양한 연구와 프로그램이 수행되면 좋을 것으로 사료된다. 또한 본 연구에서 사용한 data는 횡단적인 자료이므로 많은 제한점이 있는 것으로 생각되며 앞으로는 꾸준히 종단적인 연구도 필요할 것으로 사료되며, 시리얼, 당, 기타 가공식품 등의 과잉섭취에 대한 연구도 함께 수반되어야 할 것으로 사료된다.

비정상성 가뭄빈도 해석 기법에 따른 가뭄 심도-지속기간-재현기간 곡선 유도에 관한 연구 (A Study on derivation of drought severity-duration-frequency curve through a non-stationary frequency analysis)

  • 정민수;박서연;장호원;이주헌
    • 한국수자원학회논문집
    • /
    • 제53권2호
    • /
    • pp.107-119
    • /
    • 2020
  • 본 연구는 한반도의 관측 강우자료를 기반으로 하여 과거의 가뭄 특성을 파악함과 동시에 RCP 8.5 기후변화 시나리오를 활용한 장래 발생 가능한 극치 가뭄에 대한 장기전망을 수행하였다. 정량적인 가뭄 분석을 위해 기상학적 가뭄지수인 표준강수지수(Standardized Precipitation Index, SPI)를 적용하였으며 일단위 강우 관측 자료 및 RCP 시나리오를 단일한 장기 시계열 자료로 구축하여 1, 3, 6, 9, 12개월 지속기간의 SPI 입력인자로 활용하였다. 한반도의 지역별 가뭄특성 분석을 위한 대상 강우관측소는 1954년 시점부터 강우 자료를 보유하고 있는 12개 관측 지점을 선정하였으며, 동일 지점의 10개 GCM(General Circulation Model)을 적용하였다. 기후변화에 따른 가뭄 특성 변화 분석을 위해 강우발생일수와 총강수량에 대한 12개 강우관측소별 추세 변동 분석 및 군집화를 수행하였다. 샘플링 기법을 활용한 비정상성 빈도분석을 위해 베이지안 기반의 DE(Differential Evolution)와 MCMC(Markov Chain Monte Carlo)를 결합한 DEMC 기법을 채택하였고, 비정상성 가뭄빈도해석을 통하여 12개 지점별 SDF(Severity-Duration-Frequency) 곡선을 유도하였다. 비정상성을 가정한 장기 수문자료를 보유한 지점들의 SDF 곡선 산정을 통해 미래의 가뭄에 대한 정량적인 전망을 수행하였다. 장기시계열 자료를 보유한 12개 지점의 군집분석을 수행한 결과 Zone 1-2, 2, 3-2에 해당하는 제주를 제외한 전주, 광주, 여순, 목포, 추풍령 등에서 장래에 가뭄발생 위험이 높은 것으로 분석되었다. 장래 발생 가능한 가뭄 위험성을 정량적으로 파악함으로써 미래 가뭄관리 정책에 충분히 활용될 수 있을 것으로 기대된다.

M&S 지원을 위한 HEMOS-Cloud 서비스의 경제적 효과 (Economic Impact of HEMOS-Cloud Services for M&S Support)

  • 정대용;서동우;황재순;박성욱;김명일
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권10호
    • /
    • pp.261-268
    • /
    • 2021
  • 클라우드 컴퓨팅은 서비스 사용자 요구에 따라 컴퓨팅 자원을 임대하여 사용하는 컴퓨팅 패러다임이다. 클라우드 컴퓨팅에서 컴퓨팅 자원은 사용자의 서비스 수요에 따라 컴퓨팅 자원을 확장 또는 축소가 가능하여 전체 서비스 비용 절감 효과를 가질 수 있다. 그리고, M&S (Modeling and Simulation) 기술은 컴퓨팅 자원과 CAE 소프트웨어를 통해 엔지니어링 분석 작업 결과를 얻어, 실제 실험 결과가 없이 제품의 상태를 시뮬레이션을 수행하여 분석하는 방법이다. M&S 기술은 FEA(Finite Element Analysis), CFD(Computational Fluid Dynamics), MBD(Multibody Dynamics) 및 최적화 분야에서 활용된다. M&S 통한 작업 절차는 전처리, 해석, 후처리 단계로 구분된다. CAE 소트프웨어를 통한 3D 모델링 작업인 전/후처리는 GPU 연산이 집약적이며, 3D 모델 해석은 CPU 또는 GPU 연산이 요구된다. 일반적인 개인 데스크톱에서 복잡한 3D 모델을 해석하는 시간이 많이 소요된다. 결과적으로, M&S를 원활하게 수행하기 위해서는 고성능 컴퓨팅 자원이 요구된다. 이 문제를 해결하기 위해 우리는 통합 클라우드 및 클러스터 컴퓨팅 환경인 HEMOS-Cloud 서비스를 제안한다. 제안한 클라우드 기반 방식에서는 M&S에 필요한 전/후처리 및 솔버 작업을 원활하게 수행할 수 있도록 구성했다. 이 시스템에서 전/후처리는 VDI(Virtual Desktop Infrastructure)에서 수행되고 해석은 클러스터 환경에서 수행된다. 각 용도에 맞게 서로 다른 환경에서 분리하여 컴퓨팅 자원 간에 간섭을 최소화했다. HEMOS-Cloud 서비스는 기업 또는 학교에서 M&S의 경험이 필요로 하는 사용자에게 CAE 소프트웨어와 컴퓨팅 자원을 제공한다. 본 논문에서는 HEMOS-Cloud 서비스의 경제적 파급효과를 산업연관분석을 활용하여 분석했다. 전문가의 의견을 반영하여 조정된 계수를 통한 분석 결과는 생산유발효과 74억원, 부가가치유발효과 41억원, 취업자유발효과 10억원당 50명으로 분석되었다.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).