• 제목/요약/키워드: Models, statistical

검색결과 3,012건 처리시간 0.029초

Random Forests 기법을 이용한 백내장 예측모형 - 일개 대학병원 건강검진 수검자료에서 - (A Prediction Model for the Development of Cataract Using Random Forests)

  • 한은정;송기준;김동건
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.771-780
    • /
    • 2009
  • 백내장 질환은 노령인구가 증가하고 있는 시점에서 사회, 경제적으로 심각한 문제로 부각되고 있는 질병으로 조기 진단이 이루어진다면 발병률을 크게 줄일 수 있는 질병이다. 본 연구에서는 백내장을 조기 진단하기 위한 예측 모형을 구축하고자 1994년부터 2001년까지 연세대학병원에서 2회 이상 건강검진을 받고 의사진단을 통해 백내장 여부를 확인할 수 있는 30세 이상 남 녀 3,237명에 대한 건강검진 수검 자료를 활용하여 백내장 발생 위험 예측모형을 개발하였다. 모형개발에는 데이터마이닝 기법인 Random Forests를 사용하였고, 기존의 로지스틱 회귀분석, 판별분석, 의사결정나무 모형(Decision tree), 나이브베이즈(Naive Bayes), 앙상블 모형인 배깅(Bagging)과 아킹(Arcing)을 이용하여 그 성능을 비교 분석하였다. Random Forests를 통해 개발한 백내장 발생 예측모형은 정확도가 67.16%, 민감도가 72.28%였고, 주요 영향요인은 연령, 혈당, 백혈구수치(WBC), 혈소판수치(platelet), 중성지질(triglyceride), BMI였다. 이 결과는 의사의 안과검진 정보 없이 건강검진 수검 자료만으로 백내장 질환 유 무에 관한 정보를 70% 정도 예측할 수 있음을 보여주는 것으로, 백내장의 조기 진단에 많은 기여를 할 것으로 판단된다.

주의력 결핍 과잉 행동장애를 종점으로 하는 혈중 납의 벤치마크 용량 하한 도출: 두 동집단 자료의 병합 (BMDL of blood lead for ADHD based on two longitudinal data sets)

  • 김시연;하미나;권호장;김병수
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.13-28
    • /
    • 2018
  • 우리나라 환경부에서는 지난 2005년과 2006년, 매 2년마다 세 번에 걸친 추적 조사를 하여 두 개의 독립적인 자료를 구축하였고, 2010년에 두 자료를 병합하여 Children's Health and Environmental Research (CHEER) 자료라 명명하였다. 본 연구는 CHEER 자료를 이용한 Kim 등 (Journal of the Korean Data and Information Science Society, 25, 987-998, 2014)과 Lee 등 (The Korean Journal of Applied Statistics, 29, 1295-1310, 2016)의 후속 연구로서, 두 동집단을 병합한 자료에서도 기존 연구에서 보고되었던 결과가 재현되는지 확인하고 ADHD를 종점으로 한 혈중 납 농도의 95% 신뢰 하한 (BMDL) 도출하였다. Lee 등 (2016)에서 제시한 벌점화 스플라인 모형을 이용하여 모든 년도의 ADHD 척도를 통일하였고, 경시적 자료의 특성과 아동의 나이에 대한 평균으로의 회귀 현상을 반영하여 임의 기울기 모형과 AR(1) 모형을 구축하였다. 두 모형을 바탕으로 혈중 납 농도의 벤치마크 용량 하한을 공식과 모의실험을 이용하여 도출한 결과, 종전의 연구보다 작은 벤치마크 용량의 분산 값으로 인하여 벤치마크 용량 하한 값이 증가한다는 사실을 확인할 수 있었다.

비선형 혼합효과모형에서의 로버스트 능형회귀 방법과 정량적 고속 대량 스크리닝 자료에의 응용 (Robust ridge regression for nonlinear mixed effects models with applications to quantitative high throughput screening assay data)

  • 유지선;임창원
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.123-137
    • /
    • 2018
  • 비선형 혼합효과 모형은 다양한 분야에서 반복 측정 자료를 분석할 때 주로 사용된다. 비선형 혼합효과 모형은 개체 내 변동(intra-individual variation)에 대해 고려하는 제 1단계 개별수준모델(individual-level model)과 개체간 변동(inter-individual variation)에 대해 고려하는 제 2단계 개체군모델(population model)의 두 단계로 구성되어 있다. 비선형 혼합효과 모형의 첫 번째 단계인 개별수준모델은 비선형 회귀모형의 모수를 추정하는 것으로 일반적인 비선형 회귀모형과 같고, 주로 보통최소제곱추정 방법을 사용하여 모수를 추정한다. 그러나 최소제곱추정방법은 가정된 비선형 함수가 자료에 의해 명시적으로 드러나지 않는 경우 모수의 추정값과 그 표준오차가 극단적으로 커지는 문제가 발생할 수 있다. 본 논문에서는 최근에 비선형 회귀모형에서 제안된 능형회귀(ridge regression) 방법을 비선형 혼합효과 모형의 제 1단계 개별수준모델에 도입함으로써 이러한 문제를 해결할 수 있는 새로운 추정방법을 제안하였다. 제안된 추정량은 모의실험 연구를 통하여 기존의 표준적인 추정량과 그 성능을 비교하였다. 또한 미국의 National Toxicology Program으로부터 얻어진 정량적 대량고속 스크리닝(quantitative high throughput screening) 실제 자료를 사용하여 추정 방법들을 비교하였다.

하천수위표지점에서 신경망기법을 이용한 홍수위의 예측 (The Flood Water Stage Prediction based on Neural Networks Method in Stream Gauge Station)

  • 김성원;호세살라스
    • 한국수자원학회논문집
    • /
    • 제33권2호
    • /
    • pp.247-262
    • /
    • 2000
  • 본 연구에서는 낙동강유역의 주요 수위표지점중 진동수위표지점에서 홍수위를 예측하기위한 신경망모형인 WSANN모형이 제시되었다. WSANN모형은 모멘트방법, 초기조건의 개선 및 적응학습속도에 의해 보완되어진 개선된 역전파훈련 알고리즘을 이용하였고, 본 연구에 사용된 자료는 훈련자료와 테스팅자료로 분할하였으며, 최적 은닉층 노드수를 결정하기 위하여 은닉층노드와 임계학습횟수로부터 경험식이 유도되었다. 그리고 WSANN모형의 보정은 4개의 훈련자료에 의해 실시되었으며, WSANN22와 WSANN32모형이 모델의 검증에 사용될 최적모형으로 결정되었다. 모형의 검증은 훈련되지 않은 2개의 테스팅자료를 이용하여 모형의 적합성을 평가하기 위하여 이루어 졌으며, 통계분석의 결과를 통하여 홍수위를 합리적으로 예측하는 것으로 나타났다. 따라서 본 연구의 결과를 기본으로 신경망기법을 이용한 실시간 홍수예경보 시스템의 구축 및 홍수위의 제어에 관한 지속적인 연구가 필요것으로 사료된다.

  • PDF

강우-유출 모형 적용을 위한 강우 내삽법 비교 및 2단계 일강우 내삽법의 개발 (Comparison of Daily Rainfall Interpolation Techniques and Development of Two Step Technique for Rainfall-Runoff Modeling)

  • 황연상;정영훈;임광섭;허준행
    • 한국수자원학회논문집
    • /
    • 제43권12호
    • /
    • pp.1083-1091
    • /
    • 2010
  • 분포형 수문 모형의 일강우 입력 자료는 불가피하게 불규칙하고 밀도가 낮은 관측망에서 기록된 값을 내삽해 사용하게 되나, 흔히 사용되는 대부분의 내삽법들은 실제 일강우의 다양한 공간적 분포를 잘 재현하지 못하는 문제가 있다. 본 연구에서는 널리 사용되는 다섯 가지의 강우 내삽 방법을 두개의 유역에 사용하여 비교하고 실제 공간적 분포를 보다 잘 나타낼 수 있는 2단계 내삽법을 제안하였다. 비교에 사용된 내삽법은 (1) 역가중치 방법(IDW), (2) 다중회귀분석 (MLR), (3) 월강우를 이용한 다중회귀분석법(CMLR), (4) 국지가중치 다중회귀분석(LWP) 등이다. 보다 향상된 내삽을 위한 2단계 내삽법은 먼저 로지스틱 회귀분석으로 강우-비강우 지역을 구분하고 강우 지역에서만 기존의 내삽법을 적용하여 강우량을 구하는 방법이다. 기존 방법과의 비교결과 공간적인 편차가 심한 일강우의 특성을 2단계 내삽법에서 잘 표현하고 있는 것으로 나타났다. 제안된 방법은 수문모형에의 적용뿐만 아니라 유출량의 예보 및 대기 순환 모형의 다운 스케일링에도 효과적으로 사용될 수 있을 것으로 기대된다.

모의 담금질 기법을 이용한 지반 조건 추정 및 불확실성 평가에 관한 연구 (Prediction of Ground Condition and Evaluation of its Uncertainty by Simulated Annealing)

  • 류동우
    • 터널과지하공간
    • /
    • 제15권4호
    • /
    • pp.275-287
    • /
    • 2005
  • 지하공간 및 터널의 계획과 설계 단계에서 지반 조건과 관련한 정보는 경제성과 안정성 강화측면에서 매우 중요하다. 일반적으로 지반 조건은 RMR혹은 Q-system과 같은 공학적 암반 분류값을 이용하거나 지구물리 탐사의 결과 영상으로 표현할 수 있다. RMR이나 Q값은 설계를 위한 직접적 정보를 제공하나 그 대표 영역은 제한적이다. 반면 지구물리탐사 결과 영상은 전체 영역을 표현할 수 있는 반면 간접적인 정보만을 제공할 수 있다. 이와 같은 지반 정보들은 근본적으로 불확실성을 내포하고 있고, 서로 다른 공학적 단위로 표현되며 그 물리적 의미에서도 차이가 있다. 최근 크리깅이나 조건부 시뮬레이션과 같은 지구통계학적 방법들을 이용하여 전체 노선에 대한 RMR의 공간 분포를 추정해 왔었다. 본 연구에서는 주된 RMR 변량만을 이용하는 크리깅이나 조건부 시뮬레이션의 단점을 극복하기 위해 모의 담금질 기법을 적용하였다. 지구물리탐사 결과 영상을 참조영상으로 하여 RMR의 공간 분포를 추정하고 이와 결합된 불확실성을 평가하였다. 모의 담금질 기법은 주어진 제약조건을 만족시키도록 설계된 최적화 기법의 일종이다 RMR공간 분포 추정과 불확실성 평가를 위한모의 담금질 기법의 적용 과정을 제안하였다. 지반공학적 적용을 위해 RMR의 통계 모델과 지구물리탐사 결과 영상과의 상관성을 이용한 목적함수들을 정의하였다.

기상자료를 이용한 남한지역 도별 쌀 생산량 추정 (Estimation of Rice Yield by Province in South Korea based on Meteorological Variables)

  • 허지나;심교문;김용석;강기경
    • 한국지구과학회지
    • /
    • 제40권6호
    • /
    • pp.599-605
    • /
    • 2019
  • 작물 생육에 영향 요소인 기상 변수들을 이용하여 우리나라 쌀 생산량(kg 10a-1)을 추정하였다. 이 연구는 기상 변수의 연 변동성을 기반으로 간단하지만 효과적인 통계 방법인 다중회귀모형을 이용하여 쌀 생산량에 대한 예측 가능성을 살펴보았다. 비균질적인 환경 조건의 특성을 고려하여, 연 쌀 생산량을 우리나라 도별로 추정하고 검증하였다. 기상청에서 제공하는 1986년부터 2018년까지 33년간 관측된 61개지점의 월 평균 기상 자료를 설명자료로 사용하였다. 11겹 교차검증(11-fold cross-validation)을 이용하여 추정된 쌀 생산량의 정확도를 추정하였다. 분석한 결과, 상관계수(0.7) 측면에서 간단한 과정으로도 도별 쌀 생산량의 시간적 변화를 잘 모의하였다. 또한 추정된 쌀 생산량은 0.7 kg 10a-1 (0.15%)의 평균 오차를 가지며, 관측의 공간적 특성을 잘 모의하였다. 이 방법은 적시에 농업기상 예측 정보를 얻는다면 쌀 생산량에 대한 유용한 정보를 사전에 얻을 수 있을 것으로 생각된다.

시공간 정보기반 산림 생태계의 기후변화 취약성 평가 (Vulnerability Assessment for Forest Ecosystem to Climate Change Based on Spatio-temporal Information)

  • 변정연;이우균;최성호;오수현;유성진;권태성;성주한;우재욱
    • 대한원격탐사학회지
    • /
    • 제28권1호
    • /
    • pp.159-169
    • /
    • 2012
  • 본 연구의 목적은 산림생태계 분포 모델인 HyTAG모델(Hydrological and Thermal Analogy Group)과 기능 모델인 MC1 모델(MAPSS-CENTURY 1) 그리고 사회 환경적 지표를 이용하여 기후변화가 한반도 산림생태계에 미치는 영향을 파악하는 것이다. HyTAG의 식생유형분포 변화 빈도와 방향으로부터 산림식생의 민감성과 적응성을 정량화하였다. 또한 MC1으로부터 추정되는 순일차생산량 및 토양탄소저장량의 변이 및 경향으로부터 산림기능의 민감성과 적응성을 정량화하였다. 사회 환경적 지표로는 재정자주도 또는 산림관련 공무원 수 등과 같은 통계자료를 포함하였다. 모든 지표들을 정규화하고 취약성 평가식에 적용하여 취약성 결과를 도출하였다. 취약성 평가의 시간적 범위는 현재(1971-2000)와 미래(2021-2050)로 구분하였다. 국가 기후변화 정책의 우선순위를 판단하기 위해 지표 별 공간 분포 지도를 작성하고 행정구역간의 취약성을 비교한 결과, 지역별로 취약성의 차이가 있는 것으로 나타났다. 이러한 취약성 차이는 적응능력에 따라 가장 크게 좌우되는 것으로 판단되었다. 본 연구의 취약성 평가 방법 및 결과는 산림 경영적 측면에서 의사결정 시스템 개발과 기후변화에 대한 적응정책 수립의 판단 자료로 활용될 것이다.

ADL에 의한 도움필요 노인의 건강과 식생활관리 -경기지역 농촌노인을 중심으로- (The Health and Dietary management of Impaired elderly by ADL in Gyeonggi, Korea)

  • 이승교;최미용;원향례
    • 한국지역사회생활과학회지
    • /
    • 제17권3호
    • /
    • pp.159-174
    • /
    • 2006
  • The purpose of this study is to provide information searching for health promotion, nutrition improvement, and health care of the impaired elderly by ADL(Activity of Daily Living) and IADL(Instrumental Activity of Daily Living). The subjects were divided into the Assistant Needed Group and No Assistant Needed Group for living in line with the responses of ADL(10 items like dressing, washing, move etc.) and IADL(10 items like housekeeping, using transportation, shopping, Phone call etc.). Survey was made for health behavior, health risk habit, dietary management status and diet intake by 24 hr-recall and questionnaire method. 242 subjects were collected in 12 cities or Gun districts in Gyeonggi Province, S. Korea. Survey was carried out by regional home extension workers using interview method. Statistical analyses were made using SAS (Version 8.1). Chi-Square Tests and General Linear Models. The subjects of impaired ADL elderly was 26.5% and it composed 30% of the total male and 22.2% of the total female. The demographic status of the impaired ADL elderly showed no difference from that of the normal elders, elementary school educated (73.4%), with spouse (43.8%) or with adult children(37.5%), using monthly living cost of 500-1,000 thousand won(35.9%). Mean age was 74.05 years compared to 72.25 years of normal elders. However, there was no significant difference from the normal and impaired ADL group, regular exercise(60.0%), with walking (90.0%), no-smoke(54.7%) and no-drink(48.4%). Kind of disease was not different from the one in impaired and normal group, with cardiovascular disease(32.3%), with diabetes mellitus(8.1%), joint lumbago neuralgia(32.3%) and osteoporosis(9.7%). Gastrointestinal complaints of the impaired ADL group were nausea(57.8%), chronic indigestion (23.4%), constipation (14,0%) and vomiting(3.7%). Sleeping time required for the impaired was longer than that for the normal group by 10hours(4.7%) or 8-10hours(20.3%), which consisted 1.7% and 16.6% respectively. Nutrient intake of the impaired ADL group was low compared to normal range elders: Energy(1260kca1), Protein(52.75g). There was gender difference in nutrient intake; the male impaired group showed no significant difference from the normal group but it was significantly lower in female impaired group. These results suggest that low quality of life and low economic status of the impaired ADL elderly require congregate meal in village hall to cover the lack of side dishe variety. And nutrition education program including community assistance would be required for the impaired ADL elderly together with the sufficient food and exercise practice. By operating nutrition education program, the impaired ADL elderly would maintain more enhanced quality of life and ameliorate the ADL capability.

  • PDF

고장력 볼트 이음부의 3차원 유한요소 해석 (3D Finite Element Analysis of High Tension Bolted Joints)

  • 심재수;김춘호;김동조
    • 한국강구조학회 논문집
    • /
    • 제16권4호통권71호
    • /
    • pp.407-414
    • /
    • 2004
  • 공용중인 교량은 시공시에 비해 이음부재 및 볼트에 각종 하중이 작용하는 상태이고, 시공중에 결함이 발생하였거나 시간이 지남에 따른 각종 결함이 발생되고 있다. 실험적인 연구에 의해 이러한 결함들이 있는 고장력볼트 이음부의 역학적 성질을 규명하기 위해서는 많은 재비용이 필요한 실정이므로 실험적으로 밝혀내기 어려운 결함이 있는 고장력볼트 이음부의 거동과 구조적 특성을 유한요소 해석을 통하여 규명하고 차후 실험에 의한 연구시 충분한 실험결과의 예측, 시험체의 설계 및 경제적인 실험적 연구의 수행을 위한 자료를 제공하는데 본 연구의 목적이 있다. 각종 결함이 발생하고 있는 교량을 대상으로 현장조사를 하여 결함의 발생위치 및 유형을 분석하고 가장 많이 발생하는 결함을 중심으로 표준모델에 결함을 주어 내부응력 분포 및 미끄러짐 거동에 대한 해석을 수행하였다. 정상체결된 고장력 볼트 이음부 및 볼트간격, 모재두께, 연단거리, 볼트 구멍 크기, 확공에 따른 결함을 가정하여 내부응력분포에 대한 구조해석을 수행하였다. 또한 고장력볼트 이음부의 미끄러짐 거동에 대해 해석하였는데 이 해석은 대변형을 고려한 기하학적 비선형, 접촉면의 비선형을 고려한 경계 비선형, 미끄러짐에 의해 항복강도를 초과하는 부분이 생길 수 있으므로 재료적 비선형 문제를 고려하여 해석하였다. 정상적으로 체결된 고장력볼트 이음부 및 볼트 축력의 감소에 따른 미끄러짐 해석을 수행하였다.