• 제목/요약/키워드: 질병예측인자

검색결과 28건 처리시간 0.031초

앙상블 기반 모델을 이용한 서울시 PM2.5 농도 예측 및 분석 (Prediction and Analysis of PM2.5 Concentration in Seoul Using Ensemble-based Model)

  • 류민지;손상훈;김진수
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1191-1205
    • /
    • 2022
  • 복잡하고 광범위한 원인을 가진 대기오염물질 중 particulate matter (PM)은 입자의 크기에 따라 분류된다. 그 중 PM2.5는 그 크기가 매우 작아 사람이 흡입하면 인간의 호흡기나 심혈관에 질병을 유발할 수 있다. 이러한 위험에 대비하기 위해서는 국가 중심의 관리와 사전에 예방할 수 있는 모니터링 및 예측이 중요하다. 본 연구는 고농도 미세먼지의 발생이 잦은 서울시의 PM2.5를 local data assimilation and prediction system (LDAPS) 기상 관련 인자 15가지와 aerosol optical depth (AOD), 화학인자 4가지를 독립변수로 하여 앙상블 모델 두 가지 random forest (RF)와 extreme gradient boosting (XGB)로 예측하고자 하였다. 예측에 사용된 두 모델의 성능 평가와 인자 중요도 평가를 수행하였으며, 계절별 모델 분석도 수행하였다. 예측 정확도 결과, RF가 R2 = 0.85, XGB가 R2 = 0.91의 높은 예측 정확도를 보이며 XGB가 RF보다 PM2.5 예측에 적합한 모델임을 확인하였다. 계절별 모델 분석 결과, 봄에 농도가 높은 관측 값과 비교하여 예측 수행이 잘 되었다고 할 수 있다. 본 연구는 다양한 인자를 이용하여 서울시의 PM2.5를 예측하였고, 좋은 성능을 보이는 앙상블 기반의 PM2.5 예측 모델을 구축하였다.

우리나라 주요(主要) 일간지(日刊紙) 및 TV 건강정보(健康情報)의 내용분석(內容分析) (Contents Analysis on the Health Information of Major Daily Newspaper and TV in Korea)

  • 이무식;임규광;나백주;김철웅;유인숙
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 춘계학술발표논문집
    • /
    • pp.114-118
    • /
    • 2009
  • 주요 일간지와 KBS 1 9시 뉴스에서 다루고 있는 건강관련 기사의 내용을 분석하여, 건강관련 정보의 경향을 파악하여, 건강 예보제 실시를 위한 현황 분석을 위해 본 연구를 실시하였다. 1. 일간지 건강정보 내용분석 결과요약: 기사 보도 분야에서는 생활건강(47.8%), 사회(14.6%), 종합(7.7%), 국제(4.7%), 경제(1.5%) 순이었고, 3/4분기에서만 국제와 경제 분야가 종합분야 보다 많이 보도 되었으며, 기타 분야가 22.9%로 많은 비율을 차지하였다. 건강정보를 대상 성별별로 분류 하였을 시 남녀 모두에 해당되는 자료가 대다수였고(87.9%), 여성이 대상인 정보(8.0%)가 남성(4.1%)보다 많았으며, 생애 주기별 대상으로 분류 하였을 시에 역시 특별히 구분되지 않은 모든 연령층에 해당 정보가 가장 많았고(60.8%), 성인(19.8%), 학동기 어린이(7.3%), 청소년 (4.9%), 노인(4.9%), 영유아(3.3%) 순이었다. 일간지별 기사의 주제를 조사한 결과 두 일간지의 총합은 병의 원인 및 위험인자(15.5%)가 가장 많이 보도 되었는데, 조선일보는 건강증진, 치료 및 술기, 투약, 기타의 순이었고, 한겨레신문은 건강증진, 행정, 치료 및 술기, 투약 순이었으며 각 주제별로 분기별로 약간의 차이를 나타내었다. 예측성에 관한 내용분석을 보면 예보성은 있는 경우(76.2%)가 없는 경우보다 많았고, 예보성의 정보는 알림성, 예측성, 행사성의 순이었고 예측성의 경우 건강형태가 가장 많았으나 한겨레 신문의 경우 기타에 속하는 경우가 가장 많았다. 사 ICD-10 체계, 21대 분류로 질병에 관한 기사를 분류한 결과 신생물(14.5%), 특정 감염성 및 기생충성 질환(13.6%), 정신 및 행동장애(9.5%)의 순이었으며 두 일간지간의 차이를 보였다. 2. TV 뉴스 건강정보 내용분석 결과요약: 건강정보의 대상 특징 성별은 모두 해당되는 경우가 265회 중 238회 (89.8%)로 가장 많았고, 생애주기별 대상으로 보면 모든 연령층에 해당 되는 것이 154회(58.1%)로 가장 많았다. 건강정보의 주제에 대해서 조사한 결과 병의 원인 및 위험인자가 73회(27.5%), 역학(역학조사 및 보도성)이 64회 (24.2%), 행정이 30회(11.3%), 증상 및 호소가 27회(10.2%) 등의 빈도순으로 조사 되었다. 건강정보의 내용의 분야를 보면 대분류로는 질병관리 분야가 102회(38.5%), 보건의료제도 및 행정 분야가 52회(19.6%), 보건행태 및 기타 42회(15.8%), 생활환경분야 39회(14.7%)의 빈도순으로 나타났다. 건강정보 내용을 질병의 분류 ICD-10 체계로 분석한 결과는 특정감염성 및 기생충성 질환 48회(26.8%), 소화기계의 질환, 손산, 중독 및 외인에 의한 특정기타 결과, 건강상태 및 보건서비스 접촉에 주는 요인 등의 빈도순으로 조사되었다.

  • PDF

융복합조사자료를 활용한 수면시간과 악력 간 관련성 연구 (Association between Sleep duration and Grip strength in Korean adults Using Convergence Survey Data)

  • 장세균;김재현;부유경
    • 디지털융복합연구
    • /
    • 제17권12호
    • /
    • pp.435-444
    • /
    • 2019
  • 본 연구는 한국의 19세 이상 성인에게서 주중 및 주말 평균 수면시간에 따른 악력의 관련성을 파악하기 위하여 수행되었다. 2016 국민건강영양조사를 이용하여, 총 4,707명 성인을 대상으로 카이제곱 검정 및 다중회귀분석을 실시하였다. 분석결과 주중 하루 평균 수면시간이 7시간인 군에 비해 9시간 이상인 군의 악력의 차이는 통계적으로 유의하게 낮았다. 주말 하루 평균 수면시간이 9시간 이상에서도 7시간 군보다 유의하게 낮은 것으로 나타났다. 50세 이상의 경우 주중 평균 하루 수면시간이 7시간 군에 비해 9시간 이상 군의 악력이 통계적으로 유의하게 낮았다. 본 연구에서는 수면시간이 길수록 악력이 감소되는 것과 50세 미만보다 50세 이상에서 악력 감소와 관련하여 더 강한 통계적 유의성을 관찰하였다. 근력의 감소는 개인의 질병을 예측할 수 있는 강력한 인자이며 악력은 이러한 근력을 측정할 수 있는 가장 단순한 지표로써 관련성에 대한 면밀한 후속연구가 필요함을 시사한다.

말기암환자에서 예후인자로서 혈청 Ferritin의 유용성 (Prognostic Value of Serum Ferritin in Terminally Ill Cancer Patients)

  • 이수희;최윤선;황인철;염창환;이준영
    • Journal of Hospice and Palliative Care
    • /
    • 제18권1호
    • /
    • pp.51-59
    • /
    • 2015
  • 목적: 말기암환자의 진료에 있어 여명을 예측하는 것은 매우 중요한 문제이다. 여러 악성 종양에서 혈청 ferritin이 증가되어 있고 높은 수치의 혈청 ferritin은 질병의 진행 및 나쁜 예후와 관련이 있다고 밝혀져 있으므로 본 연구에서는 말기암환자에서 ferritin과 생존기간과의 연관성을 알아보고 혈청 ferritin이 여명 예측 인자로 유용한지 검증하고자 하였다. 방법: 2012년 3월부터 2012년 6월까지 완화병동에 입원한 말기암환자 65명을 대상으로 혈청 ferritin을 포함한 기본적인 혈액검사를 시행하였고, 인구 통계학적 특성 및 임상증상 등을 조사하였다. 혈청 ferritin과 각 변수들간의 관련성을 파악하기 위해 Spearman's correlation analysis, Wilcoxon Rank Sum test 또는Kruskal-Wallis test등을 실시하였고 혈청 ferritin의 예후인자로서의 유용성을 평가하기 위해 다변수 콕스 비례위험 회귀분석(multivariable Cox's proportional hazard regression analysis)을 시행하였다. 결과: 상관 관계 분석 결과 ferritin은 생존기간과 유의한 음의 상관관계를 보였다. 단변량 분석에서 생존기간에 유의한 영향을 미치는 성별, ECOG 기능상태 지수, 크레아티닌, 백혈구 수치와 나이의 효과를 보정한 상태에서 혈청 ferritin은 말기암환자들의 생존기간과 통계적으로 유의한 관계를 나타내었다. 결론: 짧은 생존기간의 말기암환자에서도 혈청 ferritin은 독립적인 예후인자로 증명되었다. 기존의 여명 예측인자들과 더불어, 혈청 ferritin은 말기암환자들의 생존기간 예측에 도움을 줄 수 있을 것이라 생각한다.

암 진단 분자 마커로서 이동성 유전인자의 응용 (Application of Transposable Elements as Molecular-marker for Cancer Diagnosis)

  • 김혜민;김정안;우효정;홍정현;김진엽;김희수
    • 생명과학회지
    • /
    • 제27권10호
    • /
    • pp.1215-1224
    • /
    • 2017
  • 현재까지 다양한 암의 발병 원인이 밝혀졌는데, 그 중 하나로써 DNA에 돌연변이가 축적되어 유전체가 불안정 해짐에 따라 암이 발생될 수 있는 기작들이 주목받고 있다. 생물정보학과 유전체학의 발달에 따라 질병 연구에 있어서 보다 더 정확하고 신뢰성 있는 바이오마커를 찾는 것이 가능해졌다. 따라서, 생물정보학과 유전체학의 연구 기반을 바탕으로 한 암의 바이오마커는 암의 조기진단뿐만 아니라, 더 나아가 암 발생 예측과 암환자의 예후 진단에 적용될 수 있다. 최근 들어 인간 유전체에서 약 45%를 차지하는 이동성 유전인자(transposable elements, TEs)가 유전자의 발현 조절과 DNA의 돌연변이를 유도함으로써 다양한 질병에 영향을 미친다는 사실이 밝혀짐에 따라, 이러한 이동성 유전인자들이 암의 발생과 어떤 연관이 있는지에 대한 연구 또한 활발히 진행되고 있다. 따라서 우리는 이동성 유전인자가 대장암과 어떤 연관성이 있는지에 대해 조사를 하였으며, 이를 어떻게 바이오마커로 활용할 수 있는지 알아보았다. 우선, 이동성 유전인자 중 인간 유전체에 많이 존재하면서 유전체에 많은 영향을 미치는 LINE-1 (long interspersed nuclear element-1, L1)과 Alu, LTR (long terminal repeat) 위주로 확인하였다. 흥미롭게도, 대장암 세포에서 LINE-1의 저메틸화, APC 유전자 내에 LINE-1 삽입, Alu의 저메틸화와 과메틸화, LTR 삽입에 따른 isoform 발생 등이 특징적으로 나타나는 것을 알 수 있었다. 또한 원발암유전자에서의 L1 저메틸화가 대장암 전이의 바이오마커로 쓰일 수 있다는 것과 Alu에 의한 MLH1 돌연변이가 가족성 및 유전성 대장암에서 흔히 발견된다는 것을 알 수 있었다. 이 때 이동성 유전인자에 의하여 영향 받는 유전자들의 발현을 in silico 발현 분석을 통하여 분석하였으며, 조직별, 성별 특이적 발현 양상을 제시하였다. 이들을 토대로 대장암 바이오마커를 개발하여 유전성 대장암의 예측 및 대장암 진단 또는 대장암 예후 예측을 통한 개인 맞춤형 치료에 활용할 수 있을 것으로 예상된다.

두경부암의 종격동 림프절 전이: 예측인자 및 영상 소견 (Mediastinal Lymph Node Metastasis from Head and Neck Cancer: Predictive Factors and Imaging Features)

  • 고일권;윤대영;백소라;홍지현;윤은주;이인재
    • 대한영상의학회지
    • /
    • 제82권5호
    • /
    • pp.1246-1257
    • /
    • 2021
  • 목적 본 연구의 목적은 두경부암의 종격동 림프절 전이의 예측인자와 영상 소견을 알아보고자 함이다. 대상과 방법 이 연구에서 저자들은 두경부암 환자 중에서 종격동 림프절 전이그룹과 비전이 그룹 사이의 임상 소견 및 질병의 특성(성별, 연령, 원발성 종양 부위, 조직학적 유형, 악성종양에 대한 이전 치료이력, T-, N- 및 M- 단계, 경부 림프절 전이) 들을 비교하였다. 또한 저자들은 전이그룹에서 종격동 림프절 분류에 따라 림프절 전이의 흉부 전산화단층촬영(전이분포와 림프절 최대직경) 및 양전자방출단층촬영/전산화단층촬영(최대 표준섭취계수)의 소견을 평가하였다. 결과 두경부암 환자 470명 중 55명(11.7%)에서 150개의 종격동 station을 포함하는 종격동 림프절 전이가 발견되었다. 하인두암, 재발한 종양, T4, N2/N3, 및 M1 단계는 종격동 림프절 전이의 의미 있는 예측인자로 평가되었다. 종격동 림프절 전이의 가장 흔한 위치는 일측 station 2 (상부기관주위 림프절, 36.4%), 일측 station 11 (엽간 림프절, 27.3%), 일측 station 10(폐문 림프절, 25.5%) 순이었다. 결론 하인두암, 재발성 종양 및 높은 TNM 단계인 경우, 두경부암의 종격동 림프절 전이 가능성을 고려하여야 한다.

랜덤포레스트기법을 이용한 분변성대장균 예측모델 개발 (Development of fecal coliform prediction model using random forest method)

  • 서일원;최수연
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.124-124
    • /
    • 2016
  • 하천에서의 분변성대장균은 분변성 오염 정도를 나타내는 지표로서, 이 농도가 높을수록 오염된 하천수와의 접촉을 통한 호흡기, 소화기 및 피부 관련 질병의 발발 확률이 높다고 알려져 있다. 따라서 하천에서의 수영, 수상스키 등과 같은 입수형 친수활동을 할 때, 분변성대장균 농도가 농도 기준 이하인지를 확인하고 이러한 정보를 친수활동에 이용할 필요가 있다. 그러나 분변성대장균의 경우, 현재 자동수질측정망에서 측정되고 있는 다른 수질인자들과는 달리 실시간 측정이 불가능하다고 알려져 있다. 분변성대장균을 측정하는데 있어 최소 18시간 이상이 필요하며, 이러한 분변성대장균 측정 방식은 하천 이용자들이 안전한 친수활동을 영위하는데 있어 적절한 수질 정보를 제공하지 못한다. 그러므로 분변성대장균을 예측하는 모델을 개발하고, 이를 이용하여 실시간 분변성대장균 정보를 생성하여 하천 이용자들에게 제공할 필요가 있다. 본 연구에서는 친수활동이 활발하게 이루어지는 곳 중 하나인 북한강의 대성리 지점에 대해 데이터 기반 모델을 이용하여 분변성대장균을 예측하였다. 데이터 기반 모델은 물리 기반 모델에서 필요한 지형데이터나 비점오염원 등의 초기 오염물의 양에 대한 데이터를 필요로 하지 않고, 대신 독립변수로 사용되는 기상 및 수질데이터를 필요로 한다. 이러한 기상 및 수질데이터는 기존 기상관측소, 수질관측소에서 매일 자동으로 측정되기 때문에 데이터 기반 모델은 물리 기반 모델에 비해 입력데이터를 구성하기가 쉽다는 장점을 지닌다. 이러한 데이터 기반 모델 중 분류 모델은 회귀 모델과 달리 분변성대장균 농도가 일정 수질기준 이상을 넘는지를 바로 예측할 수 있다. 본 연구에서는 분류 모델 중 높은 예측력을 가진다고 알려진 랜덤포레스트(random forest) 기법을 이용하여 분변성대장균 예측 모델을 개발하였다. 분변성대장균 예측 모델은 주어진 기상 및 수질 조건에 대해 분변성대장균이 200 CFU/100ml가 넘는지를 예측하였다. 예측된 분변성대장균이 기준을 넘는 경우를 2등급, 넘지 않는 경우를 1등급으로 명명하였다. 모델을 개발하기 위하여 북한강 대성리 인근 측정소에서 2010년부터 2015년까지 측정된 기상 및 수질데이터를 수집하였다. 수집한 데이터를 훈련 및 검증데이터로 샘플링하였으며, 이 때 샘플링한 데이터가 기존 데이터가 가지고 있던 등급별 비율을 유지하기 위하여 층화샘플링을 하였다. 본 연구에서는 샘플링에 의한 불확실성을 줄이기 위하여 랜덤하게 50번 샘플링된 각각의 훈련데이터에 대해 모델을 개발하였다. 50개의 모델의 검증 결과를 종합한 결과, 전체 예측률은 0.139로 나타났다.

  • PDF

비만율 자료에 대한 베이지안 공간 분석 (Bayesian spatial analysis of obesity proportion data)

  • 최정순
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1203-1214
    • /
    • 2016
  • 비만은 그 자체가 질병이면서 다른 질병의 위험인자로 사회경제학적 요인과 관련성이 높다. 급증한 국내 비만인구에 대한 사회적 차원에서의 예방을 위하여 비만과 연관성이 있는 사회경제적 요인을 파악하는 것이 중요하다. 특히, 비만과 사회경제학적 요인간의 연관성은 성별에 따라 상이할 수 있으며 지역적 변동성 역시 존재한다. 본 논문에서는 공간적 상관성을 고려하여 비만율에 영향을 미치는 사회경제적 요인의 효과를 성별에 따라 추정하고자 한다. 공간적 상관성을 설명하기 위하여 베이지안 접근법을 기반으로 한 조건부 자기회귀모형을 고려하였다. 실증예제로 2010년 서울시 25개 자치구별 비만율 자료에 대하여 제안한 공간 모형과 공간적 상관성을 고려하지 않은 모형을 적합시켜본 결과, 공간적 상관성을 고려한 모형이 모형의 적합도와 예측력 측면에서 더 우수함을 알 수 있었다.

진행성 비소세포폐암 환자에서 Gefitinib와 Erlotinib의 비교 (Comparison of Gefitinib and Erlotinib for Patients with Advanced Non-Small-Cell Lung Cancer)

  • 이진화;이경은;류연주;천은미;장중현
    • Tuberculosis and Respiratory Diseases
    • /
    • 제66권4호
    • /
    • pp.280-287
    • /
    • 2009
  • 연구배경: 표피성장인자수용체(epidermal growth factor receptor, EGFR) 티로신 활성효소 억제제(tyrosine kinase inhibitor, TKI)는 진행성 비소세포폐암의 새로운 치료제이다. 몇몇 연구 결과 gefitinib와 erlotinib에 대한 반응률과 반응 예측인자에 차이가 있을 가능성을 제시하였다. 저자들은 한국인 진행성 비소세포폐암에서 gefitinib와 erlotinib의 효과 및 독성을 비교하고 각 약제에 대해 서로 다른 반응 예측인자가 있는지 평가하였다. 방 법: 2003년 7월부터 2009년 2월까지 이화여자대학 교부속병원에서 진행성 비소세포폐암으로 gefitinib 또는 erlotinib로 치료 받은 환자들의 임상정보를 수집하였다. 중앙 생존기간은 Kaplan-Meier법으로 계산하였다. 결 과: 대상 환자는 총 86명이었다(gefitinib군 52명 대 erlotinib군 34명). 나이의 중앙값은 64세였고 53명(62%)이 남자였다. 86명 중 83명에서 반응평가가 가능했으며, 83명 중 35명이 반응을 보였고 12명이 안정성 질환이었으며 36명이 진행성 질환으로, 치료 반응률이 42%였고 질병 조절률이 57%였다. 중앙 추적관찰기간 502일 동안, 진행까지의 중앙기간은 129일이었으며 중앙 생존기간은 259일이었다. 치료 반응률(gefitinib 44% 대 erlotinib 39%, p=0.678), 중앙 생존기간(gefitinib 301일 대 erlotinib 202일, p=0.151) 및 병의 진행까지 기간의 중앙값(gefitinib 136일 대 erlotinib 92일, p=0.672)은 두 군 사이에 차이가 없었다. 두 약제는 비슷한 독성을 보였다. Cox 회귀모형을 이용한 다변수분석에서 선암이 생존과 관련된 독립적인 예후인자였다(상대위험도: 0.487, 95% 신뢰구간: 0.292~0.811, p=0.006). 아집단 분석 결과 두 약제에 대한 서로 다른 반응 예측인자는 없었다. 결 론: Gefitinib와 erlotinib 사이에 반응률, 생존기간, 진행까지의 기간 및 독성에 차이는 없었다. 각 약제에 대한 특이적인 반응 예측인자도 없었다.

딥러닝 알고리즘을 활용한 천식 환자 발생 예측에 대한 연구 (A Study on Asthmatic Occurrence Using Deep Learning Algorithm)

  • 성태응
    • 한국콘텐츠학회논문지
    • /
    • 제20권7호
    • /
    • pp.674-682
    • /
    • 2020
  • 최근 산업화 및 인구과밀화로 인해 대기오염에 대한 문제가 세계적 관심사로 대두되고 있다. 대기 오염은 인간의 건강에 다양한 악영향을 초래할 수 있는데, 그 중 본 연구에서 관심을 둔 천식과 같은 호흡계 질환은 직접적 영향을 받을 수 있다. 기존의 연구에서는 임상 데이터를 활용하여 상대적으로 적은 표본을 기반으로 천식과 같은 질환에 대기 오염 인자가 어떠한 영향을 미치는지를 파악하였다. 이는 수집 표본 별 일관성이 없는 결과를 초래할 소지가 다분하며, 의료계 종사자 이외에는 연구의 시도가 어렵다는 점에서 큰 한계를 가지고 있다. 본 연구에서는 정부에서 공개하는 대기 환경 데이터와 천식 발병 빈도 수에 대한 데이터를 기반으로, 실제 천식 발병 빈도를 예측하는 것에 연구의 주안점을 두었다. 본 연구는 시차를 적용한 피어슨 상관계수를 통해 각 대기오염 인자가 천식 발병에 어느 정도의 시차를 가지고 유의한 영향을 주는지를 검증하였다. 검증결과를 기반으로 구축된 학습데이터는 딥러닝 알고리즘에 활용되며, 천식 발병 빈도의 예측에 최적화 된 모델을 설계하였다. 모델의 평균 대비 오차율은 약 11.86%로 타 머신러닝 기반의 알고리즘 대비 우수한 성능을 나타냄을 확인하였다. 제안한 모델은 국가 보험 체계 및 보건 예산 관리에서의 효율화 및 병원에서의 의료 인력 배치 및 수급에의 효율성 또한 제공할 수 있다. 또한 만성 천식 질환자에 대한 대기 환경별 발병 위험에 대한 조기 경보를 통해 국민 건강 증진에 기여할 수 있다.