DOI QR코드

DOI QR Code

Development of Social Data Collection and Loading Engine-based Reliability analysis System Against Infectious Disease Pandemic

감염병 위기 대응을 위한 소셜 데이터 수집 및 적재 엔진 기반 신뢰도 분석 시스템 개발

  • Received : 2022.11.18
  • Accepted : 2022.12.08
  • Published : 2022.12.31

Abstract

There are many institutions, organizations, and sites related to responding to infectious diseases, but as the pandemic situation such as COVID-19 continues for years, there are many changes in the initial and current aspects, and accordingly, policies and response systems are evolving. As a result, regional gaps arise, and various problems are scattered due to trust, distrust, and implementation of policies. Therefore, in the process of analyzing social data including information transmission, Twitter data, one of the major social media platforms containing inaccurate information from unknown sources, was developed to prevent facts in advance. Based on social data, which is unstructured data, an algorithm that can automatically detect infectious disease threats is developed to create an objective basis for responding to the infectious disease crisis to solidify international competitiveness in related fields.

감염병 대응과 관련된 기관, 조직, 사이트 등의 다수 운영되고 있으나 코로나-19와 같은 팬더믹 상황이 수년간 지속됨에 따라 초기양상과 현재 양상의 수많은 변화가 있으며 이에 따른 정책과 대응체계도 진화하고 있다. 이에 따른 지역별 격차가 발생하고 정책에 대한 신뢰와 불신, 이행도에 따른 여러 가지 문제들이 산재해 있다. 따라서 본 연구에서는 정보전염이 포함된 소셜 데이터를 분석하는 과정에서 루머가 포함된 데이터를 수집하는 과정에서 팩트 체크가 되는 언론 매체와 다르게 정확한 출처를 알 수 없는 부정확한 정보들이 포함되는 주요 소셜 미디어 플랫폼 중의 하나인 트위터 데이터를 수집하여 사실과 무관한 내용을 사전 차단하는 시스템을 개발했다. 비정형데이터인 소셜데이터를 기반으로 감염병 위협을 자동 감지할 수 있는 알고리즘을 개발하여 감염병 위기 대응과 관련된 객관적인 근거를 창출함으로써 관련 분야 국제경쟁력을 공고히 하고자 한다.

Keywords

Acknowledgement

This research was supported by a grant of the Information and Communications Promotion Fund through the National IT Industry Promotion Agency (NIPA), funded by the Ministry of Science and ICT (MSIT), Republic of Korea (No. S2002-21-1003).

References

  1. Institute of Medicine. Microbial Threats to Health: Emergence, Detection, and Response. Washington DC: Institute of Medicine, 2003. 
  2. Weiss RA, McMichael AJ. Social and environmental risk factors in the emergence of infectious diseases. Nature medicine. 2004;10(12 Suppl): S70-6  https://doi.org/10.1038/nm1150
  3. 옥철, "WHO, 코로나19 팬데믹 선언," 연합뉴스, 2020.3.12. 
  4. 천병철. 인수공통감염증의 역학적 특성. 대한의사협회지. 2004;47(11):1019-34. 
  5. Jones KE, Patel NG, Levy MA, Storeygard A, Balk D, Gittleman JL, et al. Global trends in emerging infectious diseases. Nature. 2008;451(7181):990-3.  https://doi.org/10.1038/nature06536
  6. Nature Index, By the numbers: counting the costs of infectious illness, 2021.10.27. 
  7. World Health Organization. Summary of probable SARS cases with onset of illness from 1 November 2002 to 31 July 2003 (Based on data as of the 31 December 2003). Available from: http://www.who.int/csr/sars/country/table2004_04_21/en/. 
  8. World Health Organization. Situation updates - Pandemic (H1N1) 2009. Available from: http://www.who.int/csr/disease/swineflu/updates/en/. 
  9. World Health Organization. Disease outbreak news - Middle East respiratory syndrome coronavirus (MERS-CoV). Available from: http://www.who.int/csr/don/archive/disease/coronavirus_infections/en/. 
  10. Shin, N.R., Baek, S.J., Yoo, H.S., & Shin, I.S.(2019),Global trends in preparation for future infectiousdiseases. Brief Report. 12(5), 120-126. 
  11. 제약바이오협회, 2020년 이후 발생한 신종 감염병 종류 및 특징, http://www.kpbma.or.kr/attach/KPBMA_Brief_20.pdf 
  12. 중앙방역대책본부, COVID-19 대응전략, 200722. 
  13. 주영기,유명순, "신문⋅TV뉴스의 신종 출몰형 질환 및 만성질환 보도 패턴 분석," 한국언론학보, 제54권, 제 2호, pp.363-381, 2010. 
  14. 주영기,유명순, "한국 언론의 신종플루 보도 연구," 한국언론학보, 제55권, 제5호, pp.30-54, 2011. 
  15. Kushin, M.J. and M. Yamamoto, "Did Social Media Really Matter? College Students' Use of Online Media and Political Decision Making in the 2008 Election", Mass Communication and Society, Vol.13, No.5, pp.608-630, November, 2010. DOI:10.1080/15205436.2010.516863 
  16. Michaelidou, N., N.T. Siamagka, and G. Christodoulides, "Usage, Barriers and Measurement of Social Media Marketing : An Exploratory Investigation of Small and Medium B2b Brands", Industrial Marketing Management, Vol.40, No.7, pp.1153-1159. October 2011, DOI: 10.1016/j.indmarman.2011.09.009 
  17. Man-Mo Kang, Sang-Rak Kim, Sang-Moo Park, "Analysis and Utilization of Big Data", Communications of the Korean Institute of Information Scientists and Engineers, Vol. 30, No. 6, 2012.6, pp. 25-32, June, 2012. 
  18. Keun-Tae Kim, "Environment Challenge in Company for Big Data Analysis", Korea Information Processing Society Review, Vol.19, No.2, March, 2012. 
  19. 김태종, 뉴스 빅데이터를 활용한 코로나19 언론보도 분석: 토픽모델링 분석을 중심으로, 한국청소년정책연구원 청소년정책분석평가센터, 2020. 
  20. Google ToolBox FactCheck, https://toolbox.google.com/factcheck/explorer/search/%EC%BD%94%EB%A1%9C%EB%82%98;hl=ko 
  21. py-hanspell, https://github.com/ssut/py-hanspell 
  22. BERT, https://github.com/KPFBERT/kpfbert) 
  23. KPFSBERT, https://github.com/KPFBERT/kpfSBERT 
  24. KONLPY, https://github.com/open-korean-text/open-korean-text 
  25. ELECTRA, https://github.com/google-research/electra 
  26. 이문환, 김응희, 김홍기. (2017). 약물-표적 단백질 연관관계 예측모델을 위한 쌍 기반 뉴럴네트워크. 인지과학, 28(4), 299-314. https://doi.org/10.19066/COGSCI.2017.28.4.005