DOI QR코드

DOI QR Code

Analysis of Major COVID-19 Issues Using Unstructured Big Data

비정형 빅데이터를 이용한 COVID-19 주요 이슈 분석

  • Received : 2021.02.24
  • Accepted : 2021.06.03
  • Published : 2021.06.30

Abstract

As of late December 2019, the spread of COVID-19 pandemic began which put the entire world in panic. In order to overcome the crisis and minimize any subsequent damage, the government as well as its affiliated institutions must maximize effects of pre-existing policy support and introduce a holistic response plan that can reflect this changing situation- which is why it is crucial to analyze social topics and people's interests. This study investigates people's major thoughts, attitudes and topics surrounding COVID-19 pandemic through the use of social media and big data. In order to collect public opinion, this study segmented time period according to government countermeasures. All data were collected through NAVER blog from 31 December 2019 to 12 December 2020. This research applied TF-IDF keyword extraction and LDA topic modeling as text-mining techniques. As a result, eight major issues related to COVID-19 have been derived, and based on these keywords, this research presented policy strategies. The significance of this study is that it provides a baseline data for Korean government authorities in providing appropriate countermeasures that can satisfy needs of people in the midst of COVID-19 pandemic.

2019년 12월 말, 전 세계를 혼란에 빠트린 코로나바이러스감염증-19(COVID-19)의 팬데믹이 시작되었다. 이러한 위기를 극복하고 피해를 최소화하기 위해 정부와 기관에서는 기존의 정책지원 효과를 극대화하고 변화하는 사회를 반영한 전방위적 대응책 마련이 필요하다. 사회적으로 부각되는 논제와 관심사항의 주제를 파악하기 위해, 본 연구는 소셜미디어의 빅데이터를 통해 코로나19와 관련된 주요 생각, 태도, 감정 등을 파악한다. 특히 정부의 대응에 관한 대중의 견해를 알기 위해 '정부 대응방향'을 기준으로 시기를 나누어 분석을 진행했다. 분석에 활용한 데이터는 네이버를 통해 2019년 12월 31일부터 2020년 12월 12일까지 수집되었다. 또한, 분석을 위해 텍스트마이닝 기법 중 TF-IDF 키워드 추출과 LDA 토픽모델링을 활용하였다. 그 결과, 8개의 코로나19 관련 주요 이슈가 도출되었으며, 이러한 이슈 사항과 주요 키워드를 기반으로 해당 분야에서의 코로나19 및 감염병 대응 정책 전략을 제시하였다. 본 연구는 코로나19 팬데믹과 같은 위기상황에 정부와 관련 기관이 국민의 필요와 요구에 따른 정확한 대응책을 마련하는 데 기초자료를 제공했다는 점에서 의의를 가진다.

Keywords

Acknowledgement

이 논문 또는 저서는 2018년 대한민국 교육부와 한국연구재단의 지원을 받아 수행된 연구임 (NRF-2018S1A3A2075114)

References

  1. DMC미디어 (2020). 소셜 미디어 현황 및 전망.
  2. KBS (2020). 코로나19: 2차 국민인식 조사.
  3. 국민건강보험 보도자료 (2020). 코로나19로 인한 국민의 의료이용행태 변화.
  4. 권오정 (2020). 코로나 19에 의한 노인 운동행동 변화 사례연구. 한국스포츠심리학회지, 31(2), 123-134.
  5. 김기탁 (2020). 소셜네트워크 빅데이터를 활용한 코로나 19에 따른 프로야구 관람문화조사. 한국엔터테인먼트산업학회논문지, 14(6), 139-150.
  6. 김상미 (2020). 코로나 19 관련 온라인 교육에 관한 국내 언론보도기사 분석. 한국디지털콘텐츠학회 논문지, 21(6), 1091-1100.
  7. 도보람, 윤여림, 김태년, 최정혜 (2021). 코로나 19 상황에서 직무만족도와 모바일 생산활동: 결정요인 연구. 지식경영연구, 22(1), 39-56. https://doi.org/10.15813/KMR.2021.22.1.003
  8. 문화체육관광부 보도자료 (2020). 생활권 내 여가생활과 비대면 문화 활동 증가.
  9. 박성욱 (2020). 코로나 19 의 경제적 영향 및 정책대응 방향. 주간금융브리프, 29(6), 3-10.
  10. 박주현 (2020). 언론의 이념성향에 따른 '코로나 19' 보도프레임 비교 연구. 한국언론학보, 64(4), 40-85.
  11. 배영임, 신혜리 (2020). 코로나 19, 언택트 사회를 가속화하다. 이슈 & 진단, 416, 1-26.
  12. 서울시 보도자료 (2020). (석간) 서울시민 10명중 4명 코로나 19로 '정신건강 나빠졌다'...여가.여행 제약 제일 힘들어.
  13. 오픈서베이 (2020). 소셜미디어와 검색 포털에 관한 리포트 2020.
  14. 옥철 (2020). WHO, 코로나19 팬데믹 선언. 연합뉴스.
  15. 윤명희 (2007). 블로그의 사회적 유형분석: 1인 커뮤니티의 다층화. 한국사회학, 41(1), 156-193.
  16. 윤정현 (2020). COVID-19 이후, 뉴노멀과 미래 사회 변화. FUTURE HORIZON, 4-7.
  17. 이새미, 유승의, 안순재 (2020). 텍스트 마이닝을 활용한 매스 미디어와 소셜 미디어 의제 분석: '마스크 5 부제'를 중심으로. 한국콘텐츠학회논문지, 20(6), 460-469. https://doi.org/10.5392/JKCA.2020.20.06.460
  18. 이정연, 박미희, 소미영, 안수현 (2020). 코로나19와 교육: 학교구성원의 생활과 인식을 중심으로. 경기도교육연구원 이슈페이퍼 2020-08.
  19. 이정현, 선형주, 이홍주 (2020). 텍스트 마이닝을 활용한 스마트 스피커 제품의 포지셔닝: 인공지능 속성을 중심으로. 지식경영연구, 21(1), 197-210. https://doi.org/10.15813/kmr.2020.21.1.011
  20. 이종수 (2020). 코로나 19 관련 CNN 뉴스 영상분석: '타자'의 질병에서 '우리'의 질병으로. 미디어, 젠더 & 문화, 35(2), 245-298.
  21. 임현아, 최재원, 이홍주 (2019). 텍스트 분석을 통한 제품분류 체계 수립방안: 관광분야 App을 중심으로. 지식경영연구, 20(3), 139-154. https://doi.org/10.15813/kmr.2019.20.3.009
  22. 중앙사고수습본부 보도자료 (2020). 코로나바이러스감염증-19. 중앙사고수습본부 정례브리핑.
  23. 중앙재난안전대책본부 보도자료 (2020). 과일채소 섭취.짬짬이 운동... '코로나 시대 건강 생활수칙'.
  24. 통계청 보도자료 (2020). 2020년 8월 온라인쇼핑 동향.
  25. 홍순구, 유승의, 김나랑, 이태헌, 이새미, 안순재 (2020). 스마트 거버넌스 정책과정의 혁신. 유원북스.
  26. Abd-Alrazaq, A., Alhuwail, D., Househ, M., Hamdi, M., & Shah, Z. (2020). Top concerns of tweeters during the COVID-19 pandemic: Infoveillance study. Journal of Medical Internet Research, 22(4), e19016. https://doi.org/10.2196/19016
  27. Aggarwal, J., Rabinovich, E., & Stevenson, S. (2020). Exploration of gender differences in COVID-19 discourse on reddit. arXiv preprint arXiv: 2008.05713.
  28. Aslam, F., Awan, T. M., Syed, J. H., Kashif, A., & Parveen, M. (2020). Sentiments and emotions evoked by news headlines of coronavirus disease (COVID-19) outbreak. Humanities and Social Sciences Communications, 7(1), 1-9. https://doi.org/10.1057/s41599-020-0492-6
  29. Blei, D. M. (2012). Probabilistic topic models. Communications of the ACM, 55(4), 77-84. https://doi.org/10.1145/2133806.2133826
  30. Blei, D. M., & Lafferty, J. D. (2006, June). Dynamic topic models. In Proceedings of the 23rd International Conference on Machine Learning, 113-120.
  31. Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent dirichlet allocation. Journal of Machine Learning Research, 3, 993-1022.
  32. Damiano, A. D., & Allen Catellier, J. R. (2020). A content analysis of coronavirus tweets in the United States just prior to the pandemic declaration. Cyberpsychology, Behavior, and Social Networking, 23(12), 889-893. https://doi.org/10.1089/cyber.2020.0425
  33. Freeman, L. C. (2005). Graphical techniques for exploring social network data. Models and Methods in Social Network Analysis, 248-269.
  34. Liu, Q., Zheng, Z., Zheng, J., Chen, Q., Liu, G., Chen, S., ... & Ming, W. K. (2020). Health communication through news media during the early stage of the COVID-19 outbreak in China: Digital topic modeling approach. Journal of Medical Internet Research, 22(4), e19118. https://doi.org/10.2196/19118
  35. Murphy, M. P. (2020). COVID-19 and emergency eLearning: Consequences of the securitization of higher education for post-pandemic pedagogy. Contemporary Security Policy, 41(3), 492-505. https://doi.org/10.1080/13523260.2020.1761749
  36. Park, Y. J., Choe, Y. J., Park, O., Park, S. Y., Kim, Y. M., Kim, J., ... & COVID-19 National Emergency Response Center, Epidemiology and Case Management Team (2020). Contact tracing during coronavirus disease outbreak, South Korea, 2020. Emerging Infectious Diseases, 26(10), 2465-2468. https://doi.org/10.3201/eid2610.201315
  37. Slovic, P. (1987). Perception of risk. Science, 236(4799), 280-285. https://doi.org/10.1126/science.3563507
  38. Van Lancker, W., & Parolin, Z. (2020). COVID-19, school closures, and child poverty: A social crisis in the making. The Lancet Public Health, 5(5), e243-e244. https://doi.org/10.1016/s2468-2667(20)30084-0
  39. Yu, M., Li, Z., Yu, Z., He, J., & Zhou, J. (2020). Communication related health crisis on social media: A case of COVID-19 outbreak. Current Issues in Tourism, 1-7.
  40. Zhao, Y., Cheng, S., Yu, X., & Xu, H. (2020). Chinese public's attention to the COVID-19 epidemic on social media: Observational descriptive study. Journal of Medical Internet Research, 22(5), e18825.