• 제목/요약/키워드: 다중 회귀 분석

검색결과 3,761건 처리시간 0.04초

Bayesian 다중회귀분석을 이용한 저수량(Low flow) 지역빈도분석 (Regional Low Flow Frequency Analysis Using Bayesian Multiple Regression)

  • 김상욱;이길성;성진영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.169-173
    • /
    • 2008
  • 본 연구는 저수량 지역 빈도분석(regional low flow frequency analysis)을 수행하기 위하여 일반최소자승법(ordinary least squares method)을 이용한 Bayesian 다중회귀분석을 적용하였으며, 불확실성측면에서의 효과를 탐색하기 위하여 Bayesian 다중회귀분석에 의한 추정치와 t 분포를 이용하여 산정한 일반 다중회귀분석의 추정치의 신뢰구간을 비교분석하였다. 각 재현기간별 비교결과를 보면 t 분포를 이용하여 산정된 평균 추정치와 Bayesian 다중회귀분석에 의한 평균 추정치는 크게 다르지 않았다. 그러나 불확실성 측면에서 평가해볼 때 신뢰구간의 상한추정치와 하한추정치의 차이는 Bayesian 다중회귀분석을 사용한 경우가 기존 방법을 사용한 경우보다 훨씬 작은 것으로 나타났으며, 이로부터 저수량(low flow) 지역 빈도분석을 수행하는 경우 Bayesian 다중회귀분석이 일반 회귀분석보다 불확실성을 표현하는데 있어서 우수하다는 결과를 얻을 수 있었다. 또한 낙동강 유역에 2개의 미계측 유역을 선정하고 구축된 Bayesian 다중회귀모형을 적용하여 불확실성을 포함한 미계측 유역에서의 저수량(low flow)을 추정하였으며 이와 같은 방법이 미계측 유역에서의 저수(low flow) 특성을 나타내는 데 있어서 효과적일 수 있음을 입증하였다.

  • PDF

임상의를 위한 다변량 분석의 실제 (Multivariate Analysis for Clinicians)

  • 오주한;정석원
    • Clinics in Shoulder and Elbow
    • /
    • 제16권1호
    • /
    • pp.63-72
    • /
    • 2013
  • 임상 의학의 연구에 사용되는 대표적 다변량 분석 방법은 다중 회귀 분석 방법인데, 이는 인과 관계를 토대로 여러 개의 변수에 의한 한꺼번에의 영향력을 분석하기 위한 방법이다. 다중 회귀 분석은 기본적으로 회귀 분석의 기본 가정을 만족해야 함은 물론, 여러 개의 독립 변수들이 포함되기 때문에 변수들을 모형에 포함시키는 방법 및 다중 공선성 문제에 대한 고려가 필요하다. 다중 회귀 분석 모형의 설명력은 결정 계수 $R^2$으로 표현되어 1에 가까울수록 설명력이 크며, 각 독립 변수들의 결과에의 영향력은 회귀 계수인 ${\beta}$값으로 표현된다. 다중 회귀 분석은 종속 변수의 형태에 따라 다중 선형 회귀 분석, 다중 로지스틱 회귀 분석, 콕스 회귀 분석으로 나눌 수 있다. 종속 변수가 연속 변수인 경우 다중 선형 회귀 분석, 범주형 변수인 경우 다중 로지스틱 회귀 분석, 시간의 영향을 고려한 상태 변수인 경우는 콕스 회귀 분석을 시행해야 하며, 각각 결과에의 영향력은 회귀 계수 ${\beta}$, 교차비, 위험비로 평가한다. 이러한 다변량 분석에 대한 이해는 연구를 계획하고 결과를 분석하고자 하는 임상 의사에게 있어 보다 효율적인 연구를 위해 필수적인 소양이라고 할 수 있다.

건강검진 빅데이터를 이용한 선형 및 다중회귀분석 기반 헤모글로빈 추정 방법에 관한 연구 (A Study on the Estimation Method of Hemoglobin Based on Linear and Multiple Regression Analysis Using Health Examination Big Data)

  • 홍상훈;홍광석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.553-555
    • /
    • 2021
  • 빈혈의 유병률은 매년 증가하고 있으나 이를 가벼운 질병으로 인식해 치료 시기를 놓치는 환자들이 존재한다. 빈혈의 발생원인으로 혈액 내 헤모글로빈 및 헤모글로빈 내 철 부족이 있으며, 헤모글로빈 측정기술의 경우 채혈 이외에 사람의 신체 및 건강 정보를 적용한 사례는 찾아보기 어렵다. 본 논문에서는 신체(키, 몸무게 및 허리둘레) 및 건강 정보(혈청지오티, 이완기 혈압 및 감마지티피 등)가 포함된 건강검진 빅데이터를 이용하여 단일 특징에 대해 선형회귀분석을 수행하고, 다중 특징에 대해 다중회귀분석을 수행하여 회귀분석 식을 산출, 산출된 회귀분석 식을 통해 헤모글로빈을 추정하여 실제 헤모글로빈값과 오차율을 계산하고 비교한다. 실험 결과, 선형회귀분석 식을 통해 헤모글로빈을 추정하였을 때 평균 8.124%의 오차율이 계산되었으며, 다중회귀분석의 경우 선형회귀분석보다 낮은 6.767%의 오차율이 계산되었다.

다중회귀분석을 이용한 강우량 결측치 보정 (Completion of the Missing Rainfall Data by a Multi-regression method)

  • 이명우;이봉희;김형수;심명필
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.775-779
    • /
    • 2006
  • 강우자료의 구축은 수문해석에 있어 가장 기본적이며 중요한 단계라 할 수 있다. 하지만 수문 관측 자료의 경우 결측치가 존재하여 그에 대한 보정이 필요한 경우가 종종 발생하게 된다. 따라서 수문자료의 분석을 수행하기에 앞서 우선 자료에 대한 검정을 실시하고, 결측치가 존재할 경우는 이를 보정하여 분석을 수행하여야 한다. 본 연구에서는 다변량통계기법의 하나인 다중회귀분석을 이용하여 강우 결측치를 보정하였다. 본 연구에서는 다중공선성과 자기상관에 대하여 고려한 다중회귀모형을 구성하였다. 모형의 구성시 모든 결측지점에 적용이 가능하지 않아 일반성이 떨어짐을 확인 할 수 있었지만, 모형이 구성될 경우 통계적 적합도와 유의수준을 확인 할 수 있는 장점이 있었으며, 다중회귀모형이 구성되는 경우 좋은 보정 결과를 주는 것을 확인 할 수 있었다.

  • PDF

다중회귀와 회귀나무를 활용한 군인 우울 요인 분석 (Identifying Influencing Factors of Soldiers' Depression using Multiple Regression and CART)

  • 우정희;박주영;이유정
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2013년도 춘계 종합학술대회 논문집
    • /
    • pp.171-172
    • /
    • 2013
  • 우울은 군대 내 발생되는 극단적인 사고 중 하나인 자살의 주요 원인으로 제시되어 왔다. 본 연구는 군인들의 우울, 불안 및 자아존중감의 수준을 파악하고, 우울의 영향요인을 탐색하고 이들을 예측하는데 주로 사용해 왔던 다중회귀분석 방법과 효과적인 의사결정방법으로 알려진 회귀나무모형의 효과성을 비교해보고자 하였다. 방법: 횡단적 조사연구이며, 우울측정에는 CES-D, 불안측정은 SAI, 자아존중감은 Rosenberg(1965)의 도구를 사용하였다. 연구대상자는 강원도 전방 부대 근무 중인 군인이며, 534부가 회수되었다. SPSS/WIN 18.0을 이용하여 위계적 다중회귀분석과 회귀나무모형을 실시하였다. 결과: 대상자들의 우울, 불안 및 자아존중감의 정도는 각각 $10.7({\pm}9.8)$, $38.5({\pm}10.2)$$31.7({\pm}5.2)$이었다. 대상자의 23.6%(126명)가 경한 우울을 나타내었다. 다중회귀분석에 의한 우울 영향요인은 불안, 자아존중감과 복무기간이었으며, 우울에 대하여 62.0%의 설명력을 가지고 있었다. 또한 회귀나무모형에서는 높은 불안과 불안이 다소 낮더라도 전역 후 진로가 불확실한 집단이 우울 위험군일 것으로 예측되었다. 결론: 본 연구 대상자들의 우울의 주요 영향요인은 불안으로 나타났다. 군대 내에서 적용할 수 있는 불안 조절 방법 개발이 필요할 것으로 보인다. 또한 일부 요인에서 차이가 있어, 반복 연구가 필요하지만, 주요 변인인 불안을 예측했다는 점에서 보면 다중회귀분석과 회귀나무모형은 군인들의 우울을 예측에 유용한 방법으로 보인다.

  • PDF

조건부 합성기법과 MODIS LST를 활용한 토양수분 다중분위회귀모형 산정 연구 (A Study on Estimation of Soil Moisture Multiple Quantile Regression Model Using Conditional Merging and MODIS Land Surface Temperature Data)

  • 정충길;이지완;이용관;김세훈;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.23-23
    • /
    • 2018
  • 본 연구에서는 다중분위회귀분석모형(Multiple Quantile Regression Model, MQRM)과 MODIS(MODerate resolution Imaging Spectroradiometer) LST (Land Surface Temperature) 자료를 이용하여 전국 공간토양수분을 산정하였다. 공간토양수분을 산정하기 위한 과정은 크게 두가지로 구분된다. 첫 번째로 기존의 MODIS LST 자료를 조건부 합성 보정기법을 적용하여 실측 LST 자료와 비교하여 위성 LST 자료가 갖고 있는 오차를 보정하였다. 그 결과, 조건부 합성 보정기법을 적용하기전 전국 71개 지상관측지점에서 관측한 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.70으로 어는정도 유의성 있는 상관관계를 나타냈으나 조건부 합성 보정기법을 적용한 후 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.92로 상당히 크게 향상됨을 알 수 있었다. 두 번째로 보정된 MODIS LST를 이용하여 다중분위회귀분석 모형을 개발하고 토양수분을 예측하는 단계로 입력자료로 위성영상 자료와 관측자료를 융합하여 사용하였다. 위성영상 자료로는 보정된 MODIS LST와 MODIS NDV를 구축하였고 일단위 강수량 및 일조시간의 기상자료는 기상청으로부터 전국 71개 지점에 대해 구축하여 IDW 공간보간기법을 이용한 공간자료로 구축하였다. 토양수분 결과를 비교하기 위한 관측 토양수분은 자동농업기상관측(Automated Agriculture Observing System, AAOS)지점에서 2013년 1월부터 2015년 12월까지의 실측 일단위 토양수분 자료를 구축하여 사용하였다. 다중분위회귀분석 모형은 LST 인자를 중심으로 각각의 분위(0.05, 0.25, 0.5, 0.75, 0.95)에 해당되는 값의 회귀식을 NDVI, 강수 입력자료를 독립인자로서 조합하여 계절 및 토성에 따른 총 80개의 회귀식을 산정하였다. 관측 토양수분과 모의 토양수분을 비교한 결과 $R^2$가 0.70 (철원), 0.90 (춘천), 0.85 (수원), 0.65 (서산), 0.78 (청주), 0.82 (전주), 0.62 (순천), 0.63 (진주), 0.78 (보성)로 높은 상관성을 보였다. 본 연구에서는 다중분위회귀 모형의 성능을 검증하기 위해 기존의 다중선형회귀모형의 결과와 비교하여 크게 개선됨을 나타냈다.

  • PDF

특허분석을 활용한 항해 시스템 기술예측

  • 박은주;정중식
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2015년도 춘계학술대회
    • /
    • pp.50-52
    • /
    • 2015
  • 특허는 기술에 대한 광범위한 정보를 포함하고 있다. 기존의 기술예측은 정량적분석으로 시도되었지만 특허분석을 활용하여 정성적분석을 실시하였다. 특허분석을 시행하기 위하여 R 프로그램을 이용하여 주성분분석과 다중선형회귀분석을 실행하였다. 주성분분석과 다중선형회귀분석을 통하여 키워드를 추출하고 추출된 키워드를 통해 기술예측을 실시한다.

  • PDF

Bayesian 다중회귀분석을 이용한 저수량(Low flow) 지역 빈도분석 (Regional Low Flow Frequency Analysis Using Bayesian Multiple Regression)

  • 김상욱;이길성
    • 한국수자원학회논문집
    • /
    • 제41권3호
    • /
    • pp.325-340
    • /
    • 2008
  • 본 연구는 저수량 지역 빈도분석(regional low flow frequency analysis)을 수행하기 위하여 일반최소자승법(ordinary least squares method)을 이용한 Bayesian 다중회귀분석을 적용하였으며, 불확실성측면에서의 효과를 탐색하기 위하여 Bayesian 다중회귀분석에 의한 추정치와 t 분포를 이용하여 산정한 일반 다중회귀분석의 추정치의 신뢰구간을 비교분석하였다. 각 재현기간별 비교결과를 보면 t 분포를 이용하여 산정된 평균 추정치와 Bayesian 다중회귀분석에 의한 평균 추정치는 크게 다르지 않았다. 그러나 불확실성 측면에서 평가해볼 때 신뢰구간의 상한추정치와 하한추정치의 차이는 Bayesian 다중회귀분석을 사용한 경우가 기존 방법을 사용한 경우보다 훨씬 작은 것으로 나타났으며, 이로부터 저수량(low flow) 지역 빈도분석을 수행하는 경우 Bayesian 다중회귀분석이 일반 회귀분석보다 불확실성을 표현하는데 있어서 우수하다는 결과를 얻을 수 있었다. 또한 낙동강 유역에 2개의 미계측 유역을 선정하고 구축된 Bayesian 다중회귀모형을 적용하여 불확실성을 포함한 미계측 유역에서의 저수량(low flow)을 추정하였으며 이와 같은 방법이 미계측 유역에서의 저수(low flow) 특성을 나타내는 데 있어서 효과적일 수 있음을 입증하였다.

시강우량 자료 다중회귀분석에 의한 홍수위험 평가 (Flood risk assessment by multiple regression using hourly precipitation)

  • 박창언;김찬우
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.264-264
    • /
    • 2016
  • 홍수위험의 정도를 표시하기 위한 연구는 다양한 방법으로 진행되어 왔으나, 많은 지역에 수리 및 수문모형을 적용하여 홍수위험을 평가하기에는 매개변수 보정이나 모형의 검정에 한계가 있을 수밖에 없다. 특히, 많은 지역에 대하여 행정구역별로 홍수위험을 평가한다던지, 기후변화에 따른 홍수위험 변화양상을 평가하기 위하여는 더욱 그러하다. 이에 본 연구에서는 기존의 수위관측소에서 관측되어진 유량 자료를 적극 활용하여 시강우량과의 다중회귀분석을 통하여 첨두유량을 예측할 수 있는 회귀방정식을 구축하고 홍수위험을 평가할 수 있도록 시도하였다. 홍수피해는 하천의 유량 증가가 가장 직접적인 원인이 될 수 있으며, 비교적 하천정비가 잘 이루어진 우리나라의 경우는 하천정비 시 설정한 계획홍수량과 호우에 따라 발생되는 첨두유량을 비교하여 홍수피해 발생여부를 판단할 수 있을 것이다. 하천의 첨두유량 값은 복잡한 유역특성이나 수문특성에 의하여 결정되지만, 결국은 시간별 순간 최대강우량의 조합에 의하여 크게 좌우 되는 것으로 판단된다. 본 연구에서는 수도권의 일부 행정구역별 대표 수위관측소를 정하고, 각 지점의 최근 10년 동안의 하천유량 관측자료를 이용하여 단일 호우사상의 1시간, 2시간, 3시간, 5시간, 10시간, 1일, 2일, 3일, 5일, 10일 순간최대강우량과 첨두유량 사이의 다중회귀분석을 실시하여 유의한 통계값을 보이는 자료끼리 회귀방정식을 구성하도록 하였다. 다중회귀분석은 각 하천 지점별로 해당 하천의 수리특성이 일정하게 유지되어진 기간 동안만을 선정하여 분석하였으며, 유량자료 가운데 각 지점에서 관심수위 이상으로 유량이 크게 증가하였던 호우사상만을 사용하였다. 회귀분석 결과, 매우 의미 있는 회귀방정식의 도출이 가능하였는데, 의정부시 신곡교의 경우는 1시간, 10시간, 1일 강우량으로부터, 광주시 경안교 지점의 경우는 3시간, 1일, 10일 강우량으로부터, 양평군 흑천교 지점의 경우는 10시간, 3일 강우량으로부터 각각 첨두유량을 예측할 수 있는 회귀방정식이 높은 유의성을 보이는 것으로 나타나, 유역면적이나 도달시간 등의 유역특성을 어느 정도 반영하고 있는 회귀방정식이 도출된 것으로 판단되었다. 이와 같은 회귀방정식에 의하여 예상되어지는 시간별 강우량 자료를 적용하면 첨두유량을 예측할 수 있으며, 이를 기존 계획홍수량과 비교하여 홍수위험 정도를 적절하게 평가할 수 있을 것으로 판단된다.

  • PDF

주성분 회귀모형을 이용한 과학기술 지식생산함수 추정 (Estimation of S&T Knowledge Production Function Using Principal Component Regression Model)

  • 박수동;성웅현
    • 기술혁신학회지
    • /
    • 제13권2호
    • /
    • pp.231-251
    • /
    • 2010
  • 과학기술 R&D 활동의 대표적 성과인 SCI 논문과 특허의 생산에 영향을 미치는 요인은 연구비, 연구원수, 지식스톡(R&D스톡, 논문스톡, 특허스톡 등), 연구환경, 개방화 정도, 인적자본, GDP 등 다양하다. 일반적인 회귀모형을 이용하여 논문 또는 특허의 생산에 영향을 미치는 요인을 추정하면 생산요인들 간에 다중공선성 문제가 발생하여 추정의 오류가 발생한다. 본 논문에서는 과학기술 지식생산에 영향을 미치는 요인들 간의 다중공선성 문제를 해결하기 위해 주성분 회귀모형을 이용하였다. SCI 논문을 산출로 가정한 과학생산성과와 특허를 산출로 가정한 기술생산성과에 영향을 미치는 요인을 회귀모형과 주성분 회귀모형을 이용하여 3가지 사례를 대상으로 비교 분석하였다. 일반 회귀모형을 이용하여 SCI 논문과 특허의 생산에 영향을 미치는 요인들을 분석한 결과, 요인들간에 다중공선성이 매우 높게 나타났고, 그 결과 회귀계수와 추정과 검정에 오류가 발생되었다. 반면 주성분 회귀모형을 이용하여 분석한 결과 다중공선성문제가 해결되어, 개별 생산요인에 대한 효과를 적절하게 추정할 수 있었다. 본 논문에서 제안한 주성분 회귀모형을 이용한 과학기술 지식생산함수 추정방법은 다중공선성이 강한 소수의 생산요소를 포함한 회귀분석에서 유용하게 적용될 수 있을 것이다.

  • PDF