• Title/Summary/Keyword: 지속가능지능

검색결과 233건 처리시간 0.03초

비지도 학습 기반의 임베딩과 오토인코더를 사용한 침입 탐지 방법 (Intrusion Detection Method Using Unsupervised Learning-Based Embedding and Autoencoder)

  • 이준우;김강석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.355-364
    • /
    • 2023
  • 최근 지능화된 사이버 위협이 지속적으로 증가함에 따라 기존의 패턴 혹은 시그니처 기반의 침입 탐지 방식은 새로운 유형의 사이버 공격을 탐지하는데 어려움이 있다. 따라서 데이터 학습 기반 인공지능 기술을 적용한 이상 징후 탐지 방법에 관한 연구가 증가하고 있다. 또한 지도학습 기반 이상 탐지 방식은 학습을 위해 레이블 된 이용 가능한 충분한 데이터를 필요로 하기 때문에 실제 환경에서 사용하기에는 어려움이 있다. 최근에는 정상 데이터로 학습하고 데이터 자체에서 패턴을 찾아 이상 징후를 탐지하는 비지도 학습 기반의 방법에 대한 연구가 활발히 진행되고 있다. 그러므로 본 연구는 시퀀스 로그 데이터로부터 유용한 시퀀스 정보를 보존하는 잠재 벡터(Latent Vector)를 추출하고, 추출된 잠재 벡터를 사용하여 이상 탐지 학습 모델을 개발하는데 있다. 각 시퀀스의 특성들에 대응하는 밀집 벡터 표현을 생성하기 위하여 Word2Vec을 사용하였으며, 밀집 벡터로 표현된 시퀀스 데이터로부터 잠재 벡터를 추출하기 위하여 비지도 방식의 오토인코더(Autoencoder)를 사용하였다. 개발된 오토인코더 모델은 시퀀스 데이터에 적합한 순환신경망 GRU(Gated Recurrent Unit) 기반의 잡음 제거 오토인코더, GRU 네트워크의 제한적인 단기 기억문제를 해결하기 위한 1차원 합성곱 신경망 기반의 오토인코더 및 GRU와 1차원 합성곱을 결합한 오토인코더를 사용하였다. 실험에 사용된 데이터는 시계열 기반의 NGIDS(Next Generation IDS Dataset) 데이터이며, 실험 결과 GRU 기반의 오토인코더나, 1차원 합성곱 기반의 오토인코더를 사용한 모델보다 GRU와 1차원 합성곱을 결합한 오토인코더가 훈련 데이터로부터 유용한 잠재 패턴을 추출하기 위한 학습 시간적 측면에서 효율적이었고 이상 탐지 성능 변동의 폭이 더 작은 안정된 성능을 보였다.

캐글 플랫폼 활용한 태양광 데이터셋 형태 구축: 머신 러닝의 적용 가능성 (On Building the Solar Dataset Form using the Kaggle Platform: The applicability of Machine Learning)

  • 고주원;박정진;박진우;오도희;김민철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.255-258
    • /
    • 2022
  • 최근 환경 오염이 지속되면서 신재생 에너지에 대한 사람들의 관심이 높아지고 있다. 제주 지역은 태양광, 태양열, 바이오, 풍력 발전 등 신재생 에너지 발전이 많이 이루어지고 있지만, 그에 비하여 관련 데이터의 개방과 분석 사례는 부족한 상황이다. 이에 본 연구에서는 전 세계 데이터 사이언티스트(Data Scientists)들이 활동하고 있는 캐글(Kaggle) 플랫폼을 활용하여 태양광 생산량과 관련된 변수를 추출하고, 데이터에 적용할 수 있는 머신러닝(Machine Learning) 기법을 탐구하여 머신 러닝 설계를 위한 제주 지역의 태양광 발전 데이터셋(Dataset) 형태(Form)를 제시하고자 한다. 구체적으로는 캐글 데이터 플랫폼을 활용하여 태양광 에너지 분석을 진행한 후 제주 지역 태양광 데이터 수집에 대한 보완점을 제안할 수 있다. 이러한 시도는 제주 지역의 태양광 산업의 발전을 위한 데이터 분석에 활용이 가능할 것으로 기대할 수 있다. 즉, 현재 개방되어 있는 제주 지역의 태양광 발전 데이터셋 형태를 인공지능(Artificial Intelligent) 분석을 위한 머신러닝에 적합한 형태로 구축이 될 수 있도록 제안할 수 있다. 이를 통하여 제주 지역 태양광 산업의 발전의 효율을 높이는 방안을 마련하는데 기반 연구가 될 것이다.

  • PDF

머신러닝 기법을 이용한 납축전지 열화 예측 모델 개발 (Building battery deterioration prediction model using real field data)

  • 최근호;김건우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.243-264
    • /
    • 2018
  • 현재 전세계 배터리 시장은 이차전지 개발에 박차를 가하고 있는 실정이지만, 실제로 소비되는 배터리 중 가격 대비 성능이 좋고 재충전을 통해 다시 재사용이 가능한 납축전지(이차전지)의 소비가 광범위하게 이루어지고 있다. 하지만 납축전지는 복합적 셀(cell)을 묶어 하나의 배터리를 구성하여 활용하는 배터리의 특성상 하나의 셀에서 열화가 발생하면 전체 배터리의 손상을 가져와 열화가 빨리 진행되는 문제가 존재한다. 이를 극복하기 위해 본 연구는 기계학습을 통한 배터리 상태 데이터를 학습하여 배터리 열화를 예측할 수 있는 모델을 개발하고자 한다. 이를 위해 실제 현장에서 배터리 상태를 지속적으로 모니터링 할 수 있는 센서를 골프장 카트에 부착하여 실시간으로 배터리 상태 데이터를 수집하고, 수집한 데이터를 이용하여 기계학습 기법을 적용한 분석을 통해 열화 전조 현상에 대한 예측 모델을 개발하였다. 총 16,883개의 샘플을 분석 데이터로 사용하였으며, 예측 모델을 만들기 위한 알고리즘으로 의사결정나무, 로지스틱, 베이지언, 배깅, 부스팅, RandomForest를 사용하였다. 실험 결과, 의사결정나무를 기본 알고리즘으로 사용한 배깅 모델이 89.3923%이 가장 높은 적중률을 보이는 것으로 나타났다. 본 연구는 날씨와 운전습관 등 배터리 열화에 영향을 줄 수 있는 추가적인 변수들을 고려하지 못했다는 한계점이 있으나, 이는 향후 연구에서 다루고자 한다. 본 연구에서 제안하는 배터리 열화 예측 모델은 배터리 열화의 전조현상을 사전에 예측함으로써 배터리 관리를 효율적으로 수행하고 이에 따른 비용을 획기적으로 줄일 수 있을 것으로 기대한다.

적응형 사용자 프로파일기법과 검색 결과에 대한 실시간 필터링을 이용한 개인화 정보검색 시스템 (PIRS : Personalized Information Retrieval System using Adaptive User Profiling and Real-time Filtering for Search Results)

  • 전호철;최중민
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.21-41
    • /
    • 2010
  • 본 논문은 다양한 사용자의 개인적 검색요구를 충족시키지 못하는 기존 검색시스템의 문제점을 해결하기 위해 사용자의 묵시적 피드백을 이용한 적응형 사용자 기호정보 기반의 개인화 검색을 실현하고, 검색결과에 대한 실시간 필터링을 통해 사용자에게 적합한 검색 결과를 제공하는 시스템을 제안한다. 기존의 검색 시스템들은 검색의도의 불확실성 때문에 사용자의 검색실패율이 높다. 검색 의도의 불확실성은 동일한 사용자가 "java"와 같은 다의어에 대해 동일한 질의어를 사용하더라도 다른 검색 결과를 원할 수 있다는 것이며, 단어의 수가 적을수록 불확실성은 가중될 것이다. 실시간 필터링은 사용자의 도메인 지정여부에 따라 주어진 도메인에 해당하는 웹문서들만 추출하거나, 적절한 도메인을 추론하고 해당하는 웹문서들만 검색 결과로 보여주는 것으로, 일반적인 디렉토리 검색과 유사하지만 모든 웹문서에 대해 이루어진다는 것과 실시간으로 분류된다는 것이 다르다. 실시간 필터링을 개인화에 활용함으로써 검색 결과의 수를 줄이고 검색만족도를 개선했다. 본 논문에서 생성한 기호정보파일은 계층적 구조로 이루어지며, 상황정보의 반영이 가능하기 때문에 의도의 불확실성을 해결 할 수 있다. 또한 사용자의 도메인별 웹문서 검색 동작을 효과적으로 추적(track) 할 수 있으며, 사용자의 기호 변화를 적절하게 알아낼 수 있다. 각 사용자 식별을 위해 IP address를 사용했으며, 기호정보파일은 사용자의 검색 행동에 대한 관찰을 기반으로 지속적으로 갱신된다. 또한 사용자의 검색결과에 대한 행동 관찰을 통해, 사용자 기호를 인지하고, 기호정보를 동적으로 반영했으며, 검색결과에 대한 만족도를 측정했다. 기호정보파일과 반영비율은 사용자가 검색을 수행할 때 시스템에 의해 생성되거나 갱신된다. 실험결과 적응형 사용자 기호정보파일과 실시간 필터링을 함께 사용함으로써, 상위 10개의 검색결과 중 평균 4.7개의 결과들에 대해 만족하는 것으로 나타났으며, 이는 구글의 결과에 비해 약 23.2% 향상된 만족도를 나타내었다.

온라인 지식공유의 참여정도: 위키피디아에 대한 행태적 접근 (Participation Level in Online Knowledge Sharing: Behavioral Approach on Wikipedia)

  • 박현정;이홍주;김종우
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.97-121
    • /
    • 2013
  • 급변하는 환경 속에서 지속적인 경쟁우위와 혁신을 위한 지식의 중요성이 증대되면서, 그 동안 지식공유에 관한 많은 연구들이 있었다. 그런데, 이러한 연구들의 대부분이 응답자의 인지오차가 내재된 서베이에 의존해왔다. 본 연구는 대표적인 온라인 지식협업 커뮤니티인 위키피디아 유저들의 온라인 행위만을 토대로 지식공유 참여정도에 대한 행위 특성들간의 관계를 도출하였다. 그런데, 유저들의 편집 참여 패턴이 서로 다르기 때문에 편집횟수는 같아도 재방문기간은 달라질 수 있고 이에 따라 지식공유 결과가 달라질 수 있으므로, 지식공유 참여정도를 아티클 편집 참여횟수와 재방문기간의 두 가지 관점에서 접근하였다. 지식공유 참여정도에 영향을 미치는 행위특성으로는 위키 플랫폼에서 관찰이 가능한, 공적인 토론툴인 아티클 톡과 사적인 메시징 툴인 유저 톡 참여여부 및 정도, 그리고 커뮤니티 등록여부를 사용하였다. 행위 분석은 먼저, 행위특성 차원에 의한 유저 카테고리별 참여정도를 비교하였고, 행위 특성의 정도를 반영하는 독립변수들과 참여정도를 나타내는 종속변수간의 관계에 대한 로버스트 회귀분석을 수행하였다. 특히, 연구가설을 설정하는 단계에서 온라인 환경에 적합한 모티베이션 이론을 도입함으로써, 온라인 지식공유 참여정도에 관한 이론적인 설명 모델을 제시하였다. 결론적으로, 본 연구는 이론적인 시사점 외에 다음과 같은 실제적인 행위 결과를 얻었다. 첫째, 공적인 토론 및 사적인 메시징 참여와 지식공유 참여정도간에는 양의 관계가 성립한다. 둘째, 공적인 토론이 사적인 메시징 보다 지식공유 참여정도에 더 큰 영향력을 미친다. 셋째, 아티클 편집 참여횟수에 대해서는 공적인 토론과 사적인 메시징의 시너지 효과가 존재하는 반면에, 재방문기간에 대해서는 아주 약한 음의 상호작용효과를 나타낸다. 넷째, 커뮤니티 등록 여부는 재방문기간에 대해서는 절대적인 양의 영향력을 미치지만, 실질적인 편집 참여횟수에 대해서는 유의한 영향력을 나타내지 않는다. 다섯째, 사적인 메시징에 의한 관계성을 고려할 때, 관계의 범위보다는 빈도 또는 깊이가 더 중요한 것으로 보인다.

링크드 데이터를 이용한 인터랙티브 요리 비디오 질의 서비스 시스템 (An Interactive Cooking Video Query Service System with Linked Data)

  • 박우리;오경진;홍명덕;조근식
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.59-76
    • /
    • 2014
  • 스마트 미디어 장치의 발달로 인하여 시공간적인 제약이 없이 비디오를 시청 가능한 환경이 제공됨에 따라 사용자의 시청행태가 수동적인 시청에서 능동적인 시청으로 계속해서 변화하고 있다. 사용자는 비디오를 시청하면서 비디오를 볼 뿐 아니라 관심 있는 내용에 대한 세부적인 정보를 검색한다. 그 결과 사용자와 미디어 장치간의 인터랙션이 주요 관심사로 등장하였다. 이러한 환경에서 사용자들은 일방적으로 정보를 제공해주는 것보다는 자신이 원하는 정보를 웹 검색을 통해 사용자 스스로 정보를 찾지 않고, 쉽고 빠르게 정보를 얻을 수 있는 방법의 필요성을 인식하게 되었으며 그에 따라 인터랙션을 직접 수행하는 것에 대한 요구가 증가하였다. 또한 많은 정보의 홍수 속에서 정확한 정보를 얻는 것이 중요한 이슈가 되었다. 이러한 사용자들의 요구사항을 만족시키기 위해 사용자 인터랙션 기능을 제공하고, 링크드 데이터를 적용한 시스템이 필요한 상황이다. 본 논문에서는 여러 분야 중에서 사람들이 가장 관심 있는 분야중 하나인 요리를 선택하여 문제점을 발견하고 개선하기 위한 방안을 살펴보았다. 요리는 사람들이 지속적인 관심을 갖는 분야이다. 레시피, 비디오, 텍스트와 같은 요리에 관련된 정보들이 끊임없이 증가하여 빅 데이터의 한 부분으로 발전하였지만 사용자와 요리 콘텐츠간의 인터랙션을 제공하는 방법과 기능이 부족하고, 정보가 부정확하다는 문제점을 가지고 있다. 사용자들은 쉽게 요리 비디오를 시청할 수 있지만 비디오는 단 방향으로만 정보를 제공하기 때문에 사용자들의 요구사항을 충족시키기 어렵고, 검색을 통해 정확한 정보를 얻는 것이 어렵다. 이러한 문제를 해결하기 위하여 본 논문에서는 요리 비디오 시청과 동시에 정보제공을 위한 UI(User Interface), UX(User Experience)를 통해 사용자의 편의성을 고려한 환경을 제시하고, 컨텍스트에 맞는 정확한 정보를 제공하기 위해 링크드 데이터를 이용하여 사용자와 비디오 간에 인터랙션을 위한 요리보조 서비스 시스템을 제안한다.

경제적, 산업구조적, 문화적 요인을 기반으로 한 주요 국가의 한국 품목별 수입액 예측 모형 개발: 한국의, 한국에 대한 문화적 요인을 중심으로 (Development of the forecasting model for import volume by item of major countries based on economic, industrial structural and cultural factors: Focusing on the cultural factors of Korea)

  • 전승표;서봉군;박도형
    • 지능정보연구
    • /
    • 제27권4호
    • /
    • pp.23-48
    • /
    • 2021
  • 한국경제는 지난 수십년간 정부의 수출전략정책에 힘입어 지속적으로 경제 성장을 이룩해왔으며, 수출의 증가는 경제의 효율성 향상, 고용창출, 기술개발 촉진 등 우리나라의 경제 성장을 견인하는 주도적인 역할을 해왔다. 전통적으로 우리나라 수출에 영향을 미치는 주요 요인은 크게 경제적 요인과 산업구조적 요인이라는 두가지 관점에서 찾아볼 수 있다. 첫번째, 경제적 요인은 환율과 글로벌 경기 변동과 관련된 것으로서, 환율이 우리나라 수출에 미치는 영향은 환율 수준 및 환율 변동성에 따른 영향으로 나누어 살펴볼 수 있으며, 글로벌 경기 변동은 세계 수입 수요에 영향을 미쳐 우리나라 수출을 좌우하는 절대적 요인으로 볼 수 있다. 두 번째, 산업구조적 요인은 국제 분업화의 둔화, 중국의 특정 수입품 자국내 대체 증가, 수출 주력 산업의 해외생산 형태 변화 등 산업이나 제품에 따라 발생한 고유한 특징이다. 가장 최근 글로벌 교류와 관련된 연구들을 살펴보면, 경제적 요인 및 산업구조적 요인과 더불어 문화적인 측면이 중요함을 여러 문헌에서 피력하고 있다. 이에 따라 본 연구에서는 각국의 한국 수입액 예측 모형에 문화적 요인을 함께 반영하여 예측 모형을 개발하고자 하였으며, 구체적으로 문화적 요인이 수입액에 미치는 영향을 PUSH-PULL 프레임워크 관점에서 반영해보고자 하였다. PUSH 관점은 한국이 자신의 브랜드를 개발하고 적극 홍보하는 관점으로 K-POP, K-FOOD, K-CULTURE 등으로 대표되는 한국의 브랜드에 대한 각국의 관심 정도로 정의할 수 있다. 또한, PULL 관점은 각 국가의 국민들의 문화적, 심리적 특징으로 해당 국가의 지배체계, 남성성, 위험 회피성, 시간에 대한 단기/장기 지향성 등으로 대표되는 각 국의 문화 코드로서 한류문화를 얼마나 수용할 성향을 띄고 있는지로 정의할 수 있다. 본 연구에서 제시한 최종 예측 모델의 고유한 특징은 Design Principle에 기반하여 설계한 것인데, 1) 신규로 추가한 데이터 소스를 통해 한국에 대한 관심 및 문화적 특성이 반영될 수 있는 모형으로 구축하였고, 2) 경제적 요인 등의 변화와 품목 및 국가 Code를 입력하면 예측값을 바로 불러올 수 있도록 실용적으로 편의성 있게 설계하였으며, 3) 이론적으로도 의미 있는 결과를 도출하기 위해서 입력과 목표 변수간의 관계를 해석 가능한 알고리즘을 중심으로 설계하였다는 점이다. 본 연구는 기술적 측면, 경제적 측면, 정책적 측면에서 의미 있는 시사점을 제시할 수 있으며, 수입액 예측 모형을 활용하여 중소·중견기업의 수출 지원 전략에 의미 있는 기여를 할 수 있을 것으로 기대된다.

MIS Quarterly 연구동향 탐색: 토픽모델링 및 키워드 네트워크 분석 활용 (An Exploration of MIS Quarterly Research Trends: Applying Topic Modeling and Keyword Network Analysis)

  • 강은경;정연식;양선욱;권지윤;양성병
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.207-235
    • /
    • 2022
  • 지식과 정보산업이 경제의 주축인 지식기반 사회에 있어 지식의 공유와 확산 및 체계적인 관리는 국가 경쟁력 향상뿐만 아니라 지속 가능한 사회 발전의 필수 전략으로 인식되고 있다. 정보기술과 경영의 융합이 다양한 방식으로 일어나고 있는 정보시스템(Information Systems: IS) 연구분야에서, 연구자들이 서로 협력하여 오래된 지식을 과학적 지식네트워크의 관점에서 새로운 지식으로 만들어 낼 때 비로소 지식의 진화가 일어난다. 특히, 인용과 공저, 키워드와 같은 네트워크 기반의 학제적 접목을 통해 해당 연구분야의 관심 주제와 적용된 방법론, 연구동향 등을 파악함으로써 새로운 통찰을 이끌어낼 수 있다. 선행연구에서는 연구주제와 방법론, 공동저자 등의 관계를 밝혀 해당 커뮤니티의 지식체계 구조와 연구동향을 파악하려는 다양한 시도가 있어 왔으나, 두 개 이상의 저널을 일부 기간으로 한정해서 비교한 연구가 대부분을 차지하였으며, IS 연구의 전 역사를 아우르면서 연구동향을 살펴본 연구는 부족한 실정이다. 이에 본 연구에서는 IS 연구분야에서 관련 지식을 넓히는 데 주도적인 역할을 수행하고 있는 MIS Quarterly (MISQ) 저널을 중심으로 창간호(1977년)부터 최근(2022년 1분기)까지 게재된 모든 논문으로부터 (1) 키워드를 추출하고, (2) 추출된 키워드를 연구주제와 방법론, 이론 등으로 각각 구분한 후, (3) 토픽모델링과 키워드 네트워크 분석을 활용하여 IS 연구분야의 태동부터 현재까지의 변화 양상을 연대기적으로 파악하였다. 본 연구를 통해 MISQ에 게재된 IS 연구의 변화 양상을 살펴봄으로써, IS 연구분야의 발전 방향을 예측하고, IS 분야의 연구자들에게 새로운 연구방향을 제시하여 미래 지향적인 연구를 진행하는 데 실질적인 도움을 줄 수 있을 것으로 기대한다.

머신러닝을 이용한 터널발파설계 자동화를 위한 기초연구 (A fundamental study on the automation of tunnel blasting design using a machine learning model)

  • 김양균;이제겸;이승원
    • 한국터널지하공간학회 논문집
    • /
    • 제24권5호
    • /
    • pp.431-449
    • /
    • 2022
  • 지금까지 국내에서는 수 많은 터널들이 완공되어 오면서 시공에서뿐 아니라 설계에서도 다양한 경험과 기술이 지속적으로 축적되어 왔다. 따라서 이제는 매우 복잡한 지질조건 또는 특수한 터널구조가 아니라면 일반적인 터널설계작업은 설계 항목에 따라 기존 유사 설계사례를 수정 또는 보완하는 것만으로도 충분한 경우도 적지 않다. 특히 터널발파설계의 경우, 실제 터널시공시 현장에서 시험발파를 통해 시공을 위한 발파설계를 추가로 수행하는 것이 일반적이라는 것을 감안할때, 설계단계에서 수행하는 발파설계는 예비설계 성격을 지니고 있어 기존의 유사 설계사례를 참고하는 것도 타당하다고 사료된다. 한편 최근 4차산업혁명시대에 들어서면서 전 산업분야에 걸쳐 그 활용도가 급증하고 있는 인공지능은 터널 및 발파분야에서도 다양하게 활용되고 있지만, 발파터널의 경우 발파진동 및 암반분류 등의 예측 분야에서 주로 활용되고 있을 뿐 터널발파패턴 설계에 활용된 사례는 많지 않다. 따라서 본 연구에서는 터널발파설계를 인공지능의 한 분야인 머신러닝 모델을 이용하여 자동화하기 위한 시도를 하였다. 이를 위하여 25개 학습용 터널설계 자료 및 2개의 시험용 설계자료에서 4가지의 입력데이터(지보패턴, 도로유형, 상반 및 하반 단면적) 및 16개의 출력데이터(심발공 종류, 비장약량, 천공수, 각 발파공 그룹별 공간격과 저항선 등)를 발췌하였다. 이를 기반으로 3가지 머신러닝 모델, 즉, XGBoost, ANN, SVM 모델을 시험한 결과 XGBoost모델이 상대적으로 최상의 결과를 나타내었다. 또한 이를 이용하여 실제 발파설계 상황을 가정하여 발파패턴을 제안하도록 한 결과 일부 항목에서 보완이 필요하긴 하지만 일반적 설계와 유사한 결과를 나타내었다. 본 연구가 기초연구 성격이어서 전체 발파설계를 완벽하게 수행하기는 아직 부족하지만, 향후 충분한 발파설계데이터를 확보하고 세부적인 처리과정을 보완하여 실용적인 활용이 가능하도록 추가 연구를 수행할 계획이다.

빅데이터와 딥러닝을 활용한 동물 감염병 확산 차단 (Animal Infectious Diseases Prevention through Big Data and Deep Learning)

  • 김성현;최준기;김재석;장아름;이재호;차경진;이상원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.137-154
    • /
    • 2018
  • 조류인플루엔자와 구제역 같은 동물감염병은 거의 매년 발생하며 국가에 막대한 경제적 사회적 손실을 일으키고 있다. 이를 예방하기 위해서 그간 방역당국은 다양한 인적, 물적 노력을 기울였지만 감염병은 지속적으로 발생해 왔다. 최근 빅데이터와 딥러닝 기술을 활용하여 감염병의 예측모델을 개발하고자 하는 시도가 시작되고 있지만, 실제로 활용가능한 모델구축 연구와 사례보고는 활발히 진행되고 있지 않은 실정이다. KT와 과학기술정보통신부는 2014년부터 국가 R&D사업의 일환으로 축산관련 차량의 이동경로를 분석하여 예측하는 빅데이터 사업을 수행하고 있다. 동물감염병 예방을 위하여 연구진은 최초에는 차량이동 데이터를 활용한 회귀분석모델을 기반으로 한 예측모델을 개발하였다. 이후에는 기계학습을 활용하여 좀 더 정확한 예측 모델을 구성하였다. 특히, 2017년 예측모델에서는 시설물에 대한 확산 위험도를 추가하였고 모델링의 하이퍼 파라미터를 다양하게 고려하여 모델의 성능을 높였다. 정오분류표와 ROC 커브를 확인한 결과, 기계 학습 모델보다 2017년 구성된 모형이 우수함을 확인 할 수 있었다. 또한 2017에는 결과에 대한 설명을 추가하여 방역당국의 의사결정을 돕고 이해관계자를 설득할 수 있는 근거를 확보하였다. 본 연구는 빅데이터를 활용하여 동물감염병예방시스템을 구축한 사례연구로 모델주요변수값, 이에따른 실제예측성능결과, 그리고 상세하게 기술된 시스템구축 프로세스는 향후 감염병예방 영역의 지속적인 빅데이터활용 및 분석 모델 개발에 기여할 수 있을 것이다. 또한 본 연구에서 구축한 시스템을 통해 보다 사전적이고 효과적인 방역을 할 수 있을 것으로 기대한다.