DOI QR코드

DOI QR Code

Association Prediction Method Using Correlation Analysis between Fine Dust and Medical Subjects

미세먼지와 진료과목의 상관관계 분석을 통한 연관성 예측 방법

  • 임명진 (조선대학교 컴퓨터공학과) ;
  • 김선미 (조선대학교 소프트웨어융합공학과) ;
  • 신주현 (조선대학교 ICT융합학부)
  • Received : 2018.09.04
  • Accepted : 2018.09.27
  • Published : 2018.09.30

Abstract

Air pollution problems in Korea are gradually becoming a higher concern due to various reasons such as fine dust, causing anxiety among people with regard to their health. Although various studies have been carried out on the relationship between the influence of fine dust and a certain disease, they are mostly focusing on the analyzation that fine dust is related to specific illnesses such as respiratory and cardiovascular diseases, hypertension and diabetes. In this paper, we utilize the public data of medical history information to extract ten medical care subjects with the highest number of monthly care in 2016, and analyze the relation of fine dust with certain medical subjects using Pearson correlation coefficient. We also subdivide and analyze the correlation between fine dust and the medical subjects according to their gender and age. Middle-aged Female group with the strongest positive correlation between fine dust and the medical subjects is analyzed with the correlation from 2011 to 2015, with its relevance coefficient extracted by regression analysis in order to predict the correlation with the medical subjects according to the fine dust concentration.

미세먼지 등 다양한 원인으로 한국의 대기 오염 문제가 점점 심해지고 있다. 대기 오염 문제가 심해짐에 따라 많은 사람들이 미세먼지에 대한 관심과 건강에 대한 불안이 높아지고 있다. 따라서 미세먼지가 미치는 영향과 어떤 질환과의 상관관계가 있는 지에 대한 다양한 연구가 진행되고 있다. 하지만 단순히 미세먼지가 호흡기 및 심혈관 질환, 고혈압 그리고 당뇨병과 같은 특정 질환과의 관계가 있다고 분석하고 있다. 이에 본 논문에서는 진료내역정보 공공데이터를 활용하여 2016년도 월별 진료횟수가 가장 높은 진료과목 10개를 추출하고 피어슨 상관계수를 사용하여 미세먼지가 어떤 진료과목과 관계가 있는지 분석한다. 그리고 더 세분화하여 미세먼지와 성별과 연령대에 따른 진료과목과의 상관관계를 분석한다. 미세먼지와 진료과목이 가장 강한 양의 상관관계인 여성-중년군은 2011년부터 2015년까지의 상관관계를 분석하고 회귀 분석을 통해 연관성 계수를 추출하여 미세 먼지 농도에 따른 진료과목과의 연관성 예측 방법을 제안한다.

Keywords

References

  1. 강태천, 강행봉, "Domain Adaptation 방법을 이용한 기계학습 기반의 미세먼지 농도 예측," 멀티미디어학회논문지, 제20권, 제8호, 1208-1215쪽, 2017년 8월
  2. 손대성, 윤영선, 박용덕, 김성현, "빅데이터 활용 기반을 이용한 미세먼지 대응 방안 연구," 한국지능정보시스템학회 학술대회논문집, 23-24쪽, 한국과학기술회관, 대한민구, 2017년 11월.
  3. 서영화, "서울에서 채취한 고농도 미세먼지(PM10)에서 황산이온과 유기성 탄소물질과의 상관관계 분석," 환경관리학회지, 제20권, 제3호, 71-80쪽, 2014년 9월
  4. 엄세정, 김보미, 권용재, 윤성범, 권혁준, "미세먼지의 농도와 호흡기질환의 상관관계," 한국환경교육학회 학술대회 자료집, 183-186쪽, 서울에너지드림센터, 대한민국, 2017년 11월
  5. 권혁준, 안은규, 서민영, 김혜곤, "인천시를 기준으로 한 교통량과 미세먼지량과의 상관관계 분석," 한국환경교육학회 학술대회 자료집, 서울대학교, 대한민국, 164-167쪽, 2016년 6월
  6. 이석철, 황현숙, 김창수, "쾌적한 지하철 이용을 위한 실시간 환경 모니터링 시스템의 설계 및 구현," 한국멀티미디어학회 학술발표논문집, 79-82쪽, 동서대학교, 대한민국, 2006년 5월
  7. 김형근, 김태연, "실내 환경에 따른 미세먼지 흡입량 평가를 위한 호흡기 침착모델 적용," 대한건축학회 추계학술발표대회 논문집, 323-324쪽, 명지대학교, 대한민국, 2015년 10월
  8. 조용민, 이지호, "미세먼지 노출에 의한 건강영향과 공기청정기의 효율적 사용," 의료정책포럼, 제12권, 제2호, 45-54쪽, 2014년 11월
  9. Pope CA, Dockery DW, Kanner RE, Villegas GM, Schwartz J. "Oxygen saturation, pulse rate, and particulate air pollution : A daily time-series panel study," Am J Respir Crit Care Med., vol. 159, no. 2, pp. 365-372, Feb. 1999. https://doi.org/10.1164/ajrccm.159.2.9702103
  10. 손동욱, "성별에 따른 거주지역 대기 중 미세먼지($PM_{10}$) 오염도와 당뇨병 유병 위험도와의 상관관계 분석," 대한국토.도시계획학회, 제51권, 제4호, 211-223쪽, 2016년 8월
  11. 이환희, 김호, "반복측정 분석을 통한 미세먼지($PM_{10}$)와 고혈압 유병률의 상관관계 분석: 2009-2013 지역사회 건강조사 자료를 이용하여," 보건학논집, 제52권, 제1호, 43-48쪽, 2015년 3월
  12. 공공데이터포털(2011), https://www.data.go.kr/dataset/15007115/fileData.do(accessed Jun, 1, 2018).
  13. 기상자료개방포털(2015), https://data.kma.go.kr/data/climate/selectDustList.do?pgmNo=67(accessed Jun, 1, 2018).
  14. 여광수, 김철중, 이재현, 김순석, "상관도를 이용한 국내 의료기관용 개인정보 비식별화 방안에 관한 연구," 스마트미디어저널, 제5권, 제4호, 83-89쪽, 2016년 12월
  15. 김선홍, 신효섭, 손석현, "대용량 교통정보와 R을 이용한 교통정보 상관관계 분석," 정보과학회논문지 : 시스템 및 이론, 제41권, 제4호, 151-157쪽, 2014년 8월
  16. 임명진, 김선미, 신주현, "진료내역정보를 활용한 미세먼지와 진료과목의 상관관계 분석," 멀티미디어학회 학술발표대회논문집, 제21권, 제1호, 95-98쪽, 2018년 5월
  17. 주영지, 홍택은, 신주현, "교통사고 데이터의 패턴 분석과 Hybrid Model을 이용한 피해자 상해 심각도 예측," 스마트미디어저널, 제5권, 제4호, 75-82쪽, 2016년 12월