• 제목/요약/키워드: 확진자 예측

검색결과 18건 처리시간 0.026초

머신러닝 모델을 이용한 일일 COVID-19 확진자 수 예측 (Predicting the number of confirmed COVID-19 daily using machine learning models)

  • 민송하;오명호;김종민
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.697-700
    • /
    • 2022
  • 최근 코로나-19(COVID-19)는 2022년 3월 18일 현재 확진자 8,250,000명, 사망자 11,481명으로 2020년 발생이후 계속해서 증가하고 있으며, 코로나-19 확산으로 인해 모임·행사·영업시간 등에 인원과 시간을 제한하여 우리의 일상생활이 코로나 확진자 수에 따라 변화하는 모습을 보이고 있다. 따라서 본 연구에서는 일상생활 제한에 대한 피해를 최소화하는데 기여할 다음 날 확진자 수를 예측하는 알고리즘을 구현하였다. 본 알고리즘은 3일 동안의 확진자 수 데이터를 가지고 그다음 날의 확진자 수를 예측하는 알고리즘으로, Sequential 모델을 사용하여 RNN, Dense 레이어를 추가하는 방식으로 예측하였으며, 지역별로 세분화된 인원 제한을 예측하기 위해 서울을 기준으로 일별 확진자 수에 따른 인원 제한을 매칭시켰다.

  • PDF

기상 요인을 고려한 일일 COVID-19 확진자 예측 (Prediction of COVID-19 Confirmed Cases in Consideration of Meteorological Factors)

  • 추경수;정담;이소현;김병식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.68-68
    • /
    • 2022
  • 코로나바이러스는(COVID-19)는 2019년 12일 중국 후베이성 우한시에서 시작된 코로나바이러스감염증으로 2020년 1월부터 전 세계로 퍼져, 일부 국가 및 지역을 제외한 대부분의 나라와 모든 대륙으로 확산되었다. 이에 WHO는 범 유행전염병(Pandemic)을 선언하였다. 2022년 3월 18일 현재 국내 누적 확진환자 8,657,609명과 11,782명의 사망자를 일으켰고 전 세계적으로도 많은 사상자를 내고 있는 실정이고 사회 및 경제적인 피해로도 계속 확대되고 있다. 많은 감염자와 사망자의수에 대한 예측은 코로나바이러스의 전염병을 예방하고 즉각적 조치를 취할 수 있는데 도움이 될 수 있다. 본 연구에서는 문화적 인자를 제외한 국내에서 연구 사례가 많지 않은 기상 요인을 인자로 포함하여 머신러닝 모델을 통해 확진자를 예측하였다. 그리고 여러 가지 모델을 성능 평가 기법인 Root Mean Square Error(RMSE) 및 Mean Absolute Percentage Error(MAPE)를 통해 성능을 평가하고 비교하여 정확도 높은 모델을 제시하였다.

  • PDF

한국 COVID-19 확진자 수에 대한 시계열 분석: HAR-TP-T 모형 접근법 (Time series analysis for Korean COVID-19 confirmed cases: HAR-TP-T model approach)

  • 유성민;황은주
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.239-254
    • /
    • 2021
  • 이 논문에서는, 2개의 혼합된 t-분포(TP-T)의 오차과정을 따르는 이질적 자기회귀 (HAR) 모형을 이용하여, 한국 코로나 (COVID-19) 확진자 수 데이터에 대한 시계열 분석, 즉 추정과 예측에 대하여 연구한다. HAR-TP-T 시계열 모형을 고려하여 HAR 모형의 계수 뿐 아니라 TP-T 오차과정의 모수를 추정하고자 단계별 추정법을 제안한다. 본 연구에서 제안하고 있는 단계별 추정법은, HAR 계수 추정을 위해서는 통상적 최소제곱추정법을 채택하고, TP-T 모수 추정을 위해서는 최대우도추정법을 이용한다. 단계별 추정법에 대한 모의실험을 수행하여, 성능이 우수함을 입증한다. 한국 코로나 확진자 수에 대한 실증적 데이터 분석에서, HAR 모형에서의 차수 p = 2, 3, 4에 대해, 모형의 평균제곱오차가 최소가 되도록 하는 최적화 시간간격(optimal lag)을 포함하여, 여러가지 시간간격을 고려한 HAR-TP-T 모형의 모수 추정값을 계산한다. 제안된 단계별 추정방법과 기존의 MLE만의 방법을, 추정 결과를 제시함으로 함께 비교한다. 본 연구에서 제안하고 있는 추정은 두 가지의 오차 측면, 즉 HAR 모형의 평균제곱오차와 잔차분포에 대한 밀도함수 추정의 평균제곱오차, 두 측면에서 모두 우수함을 입증하였다. 나아가, 추정 결과를 활용한 코로나 확진자 수 예측을 수행하였고, 예측정확도의 한 측도로서 mean absolute percentage error (MAPE)를 계산하여 0.0953%의 매우 작은 오차값을 얻었다. 본 연구에서 선택한 최적화 시간간격을 고려한 HAR-TP-T 시계열 모형 및 단계별 추정 방법은, 정확한 한국 코로나 확진자 수 예측 성능을 제공한다고 할 수 있다.

ARIMA모형을 이용한 코로나19 확진자수 예측 (Prediction of Covid-19 confirmed number of cases using ARIMA model)

  • 김재호;김장영
    • 한국정보통신학회논문지
    • /
    • 제25권12호
    • /
    • pp.1756-1761
    • /
    • 2021
  • 2019년 12월경 후베이 우한시에서 발생한 코로나19 바이러스가 점차 줄어드는 듯 보였으나, 2020년 11월, 2021년 6월 기준으로 점차 늘어나고 있으며, 전세계적으로 총 1억 9천 2백만명, 대한민국 기준 총 확진자는 대략 18만4천명으로 추정된다. 이에 따른 대책으로 중앙재난안전대책본부는 사회적 거리두기 4단계를 시행하면서 강력한 대응책을 내고있지만, 델타바이러스등 전염성이 강한 코로나 변이 바이러스가 기승을 부리면서 국내 일일 확진자 수는 1800명대 까지 증가하게 되었다. 그에따라 코로나바이러스의 심각성을 강조하고자 코로나 누적 확진자 수를 ARIMA 알고리즘을 이용해 예측한다. 그 과정에서 추세와 계절성을 제거하기 위해서 차분을 이용하고, MA, AR, 자기상관함수와 편자기상관함수를 이용해 ARIMA에서 p,d,q값을 결정하고 예측한다. 마지막으로 예측값과 실제값을 비교해 얼마나 잘 예측되었는지 평가한다.

K-평균 군집화 알고리즘 및 딥러닝 기반 군중 집계를 이용한 전염병 확진자 접촉 가능성 여부 판단 모니터링 시스템 제안 (Proposal of a Monitoring System to Determine the Possibility of Contact with Confirmed Infectious Diseases Using K-means Clustering Algorithm and Deep Learning Based Crowd Counting)

  • 이동수;;김영광;신혜주;김진술
    • 스마트미디어저널
    • /
    • 제9권3호
    • /
    • pp.122-129
    • /
    • 2020
  • 전 세계적으로 무증상의 코로나바이러스 감염증-19 감염자가 자신이 감염된 것을 모르고 주변인들에게 전파할 수 있다는 가능성은 국민이 전염병 확산에 대한 불안과 두려움에서 벗어나지 못하고 있다는 점에서 여전히 매우 중요한 이슈이다. 본 논문에서는 K-평균 군집화 알고리즘 및 딥러닝 기반 군중 집계를 이용한 전염병 확진자 접촉 가능성 여부 판단 모니터링 시스템을 제안하였다. 모든 입력 학습 영상에 대해 300회 반복 학습한 결과, PSNR값은 21.51, 전체 데이터 셋에 대한 최종 MAE값은 67.984였다. 이는 확진자와 주변인과의 거리와 감염률 산출, 잠재적 환자 동선 주변 인원의 위험도 순 그룹 및 감염률 예측에 대한 영상 속 화질 정보, 관측치 간의 평균 절대 오차를 의미하며 각 CCTV 장면에서 군중의 수가 4,000명 이하일 때에는 평균 절대 오차 값이 0에 가까움을 증명하였다.

SARIMA모형을 이용한 코로나19 확진자수 예측 (Prediction of Covid-19 confirmed number of cases using SARIMA model)

  • 김재호;김장영
    • 한국정보통신학회논문지
    • /
    • 제26권1호
    • /
    • pp.58-63
    • /
    • 2022
  • 코로나19의 일일 확진자 수는 천명 후반대에서 2천명대를 유지하고 있으며, 백신접종률이 증가함에도 불구하고 확진자수가 쉽게 줄어들지 않는 상황이다. 변이바이러스는 계속해서 등장하고, 현재는 뮤 변이 바이러스까지 국내에 유입되었다. 본 논문은 코로나 예방전략을 위해 SARIMA 모델을 통해 코로나19 국내 확진자 수를 예측한다. ADF Test와 KPSS Test를 통해 데이터에 추세와 계절성이 있음을 확인한다. SARIMA(p,d,q)(P,D,Q,S)의 p, d, q, P, D, Q의 값은 모형 차수결정 정리로 파라미터를 추출한다. ACF와 PACF를 통해 p, q 파라미터를 추론한다. 차분, 로그변환, 계절성제거 등을 통해 데이터를 정상성 형태로 변환하고, 도식화 하여 파라미터를 도출하고, 계절성이 있다면 S를 정하고, SARIMA P,D,Q를 정하고, 계절성을 제외한 차수에 대해 ACF와 PACF를 보고 ARIMA p,d,q를 정한다.

코로나 19 지표에 따른 교통수요 현황 및 상관관계 분석 (Analysis of the Current Status and Correlation of Traffic Demand according to the COVID-19 Indicator)

  • 한경희;김도경;강욱;소재현;이철기
    • 한국ITS학회 논문지
    • /
    • 제20권6호
    • /
    • pp.55-65
    • /
    • 2021
  • 코로나 19가 국내에서 2020년 1월 첫 확진자가 발생하며 현재까지 pandemic 상황이 지속하고 있다. 전례 없는 상황에 코로나 19는 교통 분야에도 영향을 끼쳤으며 시민들의 생활패턴변화로 교통량의 변화 및 대중교통 이용변화에 적절한 대응 방안이 존재하지 않았다. 현재 각 지자체에서는 pandemic 상황에 대한 질병 대책 방안은 별도로 수립하고 있지 않다. 향후 교통분야 질병 대책 방안 수립을 위해 교통량 및 대중교통 이용 건수를 분석하였으며 예측모형 개발을 위해 코로나 19 현황과 상관도 분석을 수행하였다. 분석 결과 교통량은 감소하였지만 개인 교통수단의 증가로 교통량 감소량은 대중교통 이용 건수에 비해 감소율이 낮다. 또한 대중교통 이용 현황은 초기에는 확진자 수에 영향을 받았지만 시간이 지남에 따라 확진자 수 보다는 사망자 수와 치명률에 더욱 민감하게 반응하는 것으로 분석되었다.

다중 선형 회귀와 랜덤 포레스트 기반의 코로나19 신규 확진자 예측 (Prediction of New Confirmed Cases of COVID-19 based on Multiple Linear Regression and Random Forest)

  • 김준수;최병재
    • 대한임베디드공학회논문지
    • /
    • 제17권4호
    • /
    • pp.249-255
    • /
    • 2022
  • The COVID-19 virus appeared in 2019 and is extremely contagious. Because it is very infectious and has a huge impact on people's mobility. In this paper, multiple linear regression and random forest models are used to predict the number of COVID-19 cases using COVID-19 infection status data (open source data provided by the Ministry of health and welfare) and Google Mobility Data, which can check the liquidity of various categories. The data has been divided into two sets. The first dataset is COVID-19 infection status data and all six variables of Google Mobility Data. The second dataset is COVID-19 infection status data and only two variables of Google Mobility Data: (1) Retail stores and leisure facilities (2) Grocery stores and pharmacies. The models' performance has been compared using the mean absolute error indicator. We also a correlation analysis of the random forest model and the multiple linear regression model.

포스트 Covid-19 시대의 배달소비 성향 분석 (Analysis of Delivery Consumption Trends in Post Covid-19 Era)

  • 정찬우;김지윤;신수현;김석호;유진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.289-290
    • /
    • 2021
  • 본 연구는 코로나-19 이후로 미지의 질병과 맞닥뜨렸을 때의 소비 경향에 중요한 영향을 끼치는 요소를 데이터베이스화하여 다각적인 방면에서 분석하고 성향 측정방법을 제시하였다. 포스트 코로나 시대는 디지털 혁명이 일어난 후 경제활동에 참여하고 있는 사람들 중 그 누구도 피해갈 수 없는 흐름이다. 또한, 소비의 흐름에 있어서 모바일을 통한 배달이 주류가 될 것이라는 것은 누구든 손쉽게 알 수 있을 것이다. 후에 제2의 포스트 코로나 이후 방대하고 구체적인 데이터를 사용하여 똑같은 방법으로 재분석 한다면 기업의 입장에서 발 빠른 대응으로 경제 침체 속의 호황을 맞이할 수 있을 것이라 기대된다.

  • PDF

코로나 바이러스 확진자 데이터 기반 시뮬레이션 모델 학습 방법 제안 (Suggestion of Corona Virus Infection Data-based Simulation Model Update Method)

  • 장미;이복주;강봉구;서경민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.334-337
    • /
    • 2020
  • 코로나감염-19, 사스, 메르스 등 바이러스성 질병이 전세계적으로 확산되어 많은 인구가 감염되어 왔다. 바이러스성 질병의 확산 예측 및 종결을 위해 실제 감염자 데이터를 기반으로 한 시뮬레이션 연구는 반드시 필요하다. 본 연구는 지역 내 클러스터 감염 시뮬레이션을 위한 바이러스 감염모델을 제안한다. 제안하는 모델은 여러 개의 셀로 구성되어 있으며, 각 셀은 군집을 표현하고 있다. 본 논문에서 제안한 모델은 실제 데이터를 기반으로 하여 정확도가 높으며, 이를 바탕으로 향후 지역의 특성을 반영한 전파 시뮬레이션 혹은 지역 간의 전파를 예상하는 시뮬레이션의 기초로 사용될 수 있다.