• 제목/요약/키워드: 다변수 선형회귀분석

검색결과 20건 처리시간 0.025초

임상의를 위한 다변량 분석의 실제 (Multivariate Analysis for Clinicians)

  • 오주한;정석원
    • Clinics in Shoulder and Elbow
    • /
    • 제16권1호
    • /
    • pp.63-72
    • /
    • 2013
  • 임상 의학의 연구에 사용되는 대표적 다변량 분석 방법은 다중 회귀 분석 방법인데, 이는 인과 관계를 토대로 여러 개의 변수에 의한 한꺼번에의 영향력을 분석하기 위한 방법이다. 다중 회귀 분석은 기본적으로 회귀 분석의 기본 가정을 만족해야 함은 물론, 여러 개의 독립 변수들이 포함되기 때문에 변수들을 모형에 포함시키는 방법 및 다중 공선성 문제에 대한 고려가 필요하다. 다중 회귀 분석 모형의 설명력은 결정 계수 $R^2$으로 표현되어 1에 가까울수록 설명력이 크며, 각 독립 변수들의 결과에의 영향력은 회귀 계수인 ${\beta}$값으로 표현된다. 다중 회귀 분석은 종속 변수의 형태에 따라 다중 선형 회귀 분석, 다중 로지스틱 회귀 분석, 콕스 회귀 분석으로 나눌 수 있다. 종속 변수가 연속 변수인 경우 다중 선형 회귀 분석, 범주형 변수인 경우 다중 로지스틱 회귀 분석, 시간의 영향을 고려한 상태 변수인 경우는 콕스 회귀 분석을 시행해야 하며, 각각 결과에의 영향력은 회귀 계수 ${\beta}$, 교차비, 위험비로 평가한다. 이러한 다변량 분석에 대한 이해는 연구를 계획하고 결과를 분석하고자 하는 임상 의사에게 있어 보다 효율적인 연구를 위해 필수적인 소양이라고 할 수 있다.

기체크로마토그래피에서 QSRR을 통한 PAH 용리시간 예측 (Prediction of Gas Chromatographic Retention Times of PAH Using QSRR)

  • 김영구
    • 대한화학회지
    • /
    • 제45권5호
    • /
    • pp.422-428
    • /
    • 2001
  • 기체 크로마토그래피에서 PAH와 그것의 유도체들의 상대적 용리시간을 인공신경망분석과 다변량 선형 회귀분석을 사용하여 학습한 후, 시험세트들의 상대적 용리시간을 예측하였다. QSRR에서 PAH와 그것의 유도체의 주요한 설명인자는 분자량의 제곱근, 분자의 연결지수($^1{\chi}_v$), 분자 쌍극자모멘트 및 분자의 길이와 폭의 비율(L/B)이었다. 다변량선형회귀분석에 의하면 큰 분자일수록 용리시간은 길어지며 또한 L/B의 값이 커지면 용리시간이 증가하는 것으로 보아 슬롯이론을 따르고 있음을 알 수 있었다. 반면에 설명인자 사이의 선형 독립성에 영향을 받지 않는 인공신경망 분석결과에 의하면 분자량과 분자 쌍극자 모멘트가 주요한 인자로 작용하고 있었다. 시험세트의 예측 정확도를 나타내는 분산은 선형회귀분석에서는 1.860, 인공신경망분석법에서 0.206으로서 인공신경망 분석법이 다변량회귀분석보다 더 좋은 예측방법임을 알 수 있었다.

  • PDF

다변량 선형회귀분석을 이용한 증발접시계수 산정방법 적용성 검토 (Evaluation of applicability of pan coefficient estimation method by multiple linear regression analysis)

  • 임창수
    • 한국수자원학회논문집
    • /
    • 제55권3호
    • /
    • pp.229-243
    • /
    • 2022
  • 우리나라 11개 기상관측지역의 월별 기상자료가 증발접시계수에 미치는 영향을 분석하고, 증발접시계수 산정을 위한 4가지 형태의 다변량 선형회귀모형의 적용성을 검토하였다. 개발된 증발접시계수 산정모형의 적용성을 평가하기 위해서 기존에 다른 연구자들에 의해서 제안된 6가지의 모형과 비교 평가하였다. 우리나라 11개 기상관측지역에서 증발접시계수는 1, 2, 3, 7, 11, 12월은 기온에 가장 큰 영향을 받고, 다른 월들은 일사량에 가장 큰 영향을 받는 것으로 나타났다. 전반적으로 모든 월에서 풍속과 상대습도는 기온이나 일사량과 비교해서 증발접시계수에 큰 영향을 미치지 않는 것으로 나타났다. 모든 지역과 월에서 각 지역별로 5개의 독립변수(풍속, 상대습도, 기온, 일조시간과 가조시간의 비, 일사량)를 적용하여 유도된 모형이 가장 양호한 증발량 산정 결과를 보였다. 모형 검증결과에 의하면 다변량 선형회귀분석을 적용하여 증발접시계수를 산정하는 경우 일부 지역과 월에서 제한적으로 적용할 수 있을 것으로 판단된다.

다변량 분위수 회귀나무 모형에 대한 연구 (Multivariate quantile regression tree)

  • 김재오;조형준;방성완
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권3호
    • /
    • pp.533-545
    • /
    • 2017
  • 분위수 회귀모형은 반응변수의 조건부 분포에 대하여 포괄적이고 유용한 통계적 정보를 제공한다. 그러나 많은 실제 자료는 설명변수와 반응변수가 비선형의 관계를 갖고 있어 전통적인 선형 분위수 회귀모형은 왜곡되고 잘못된 결과를 초래할 수 있다. 또한 자료의 복잡성이 증가하여 반응변수가 여러개인 다변량 자료의 분석에 대한 보다 정확한 예측과 더불어 풍부한 해석에 대한 요구가 증가하고 있다. 이러한 이유로 본 연구에서는 다변량 분위수 회귀나무 모형을 제안하였다. 본 연구에서는 기존의 다변량 회귀나무 모형의 분할변수 선택 알고리즘의 문제점을 지적하고 향상된 분할변수 선택 알고리즘을 제안하였다. 제안한 알고리즘은 합리적인 계산시간으로 적용 가능하며 분할변수 선택에서 편향 발생의 문제를 갖지 않는 동시에 기존 방법보다 더 정확하게 분할변수를 선택할 수 있있다. 본 연구에서는 모의실험과 실증 예제를 통해 제안한 방법의 우수한 성능과 유용성을 확인하였다.

시계열 수문자료의 비선형 상관관계 (How to Measure Nonlinear Dependence in Hydrologic Time Series)

  • 문영일
    • 한국수자원학회논문집
    • /
    • 제30권6호
    • /
    • pp.641-648
    • /
    • 1997
  • 상관계수가 변수간의 선형 상관관계를 나타내듯이 mutual information은 변수간의비선형 상관관계를 나타내준다. 본 논문에서는 mutual information 추정법으로 다변수 핵 미도함수(multivariate kernel density estimator)를 이용한 방법이 여러 time lags값에 대하여 산정 되었다. 많은 수문자료에서 보여지는 비선형 관계를 Mutual Information으로 확인하여 보았고, 또한 Mutual Information값이 거의 0인 점에서 optimal delay time을 구하여, 하나의 자료로부터 다변수 회귀분석 모델을 만들 때 이용할 수 있다.

  • PDF

다변량 선형회귀모형의 벌점화 최소거리추정에 관한 연구 (Penalized least distance estimator in the multivariate regression model)

  • 신정민;강종경;방성완
    • 응용통계연구
    • /
    • 제37권1호
    • /
    • pp.1-12
    • /
    • 2024
  • 동일한 설명변수 집합에 여러 개의 반응 변수들이 종속되어 있는 경우를 많은 실제 자료에서 볼 수 있다. 특히, 여러 개의 반응변수가 서로 상관관계를 가지고 있으면 각각의 반응변수에 대한 개별적인 분석보다는 반응변수들 사이의 상관관계를 고려한 동시 추정(simultaneous estimation)이 매우 효과적이다. 이러한 다변량 회귀분석에서 최소거리추정량(least distance estimator; LDE)은 반응변수들간의 상관관계를 모형 적합 과정에 반영하여 다차원 유클리드 공간에서 각 훈련 개체와 추정값 사이의 거리를 최소화하도록 회귀계수들을 동시에 추정한다. 뿐만 아니라 최소거리추정량은 이상치에 대한 강건성을 제공한다. 본 논문에서는 다변량 선형 회귀분석에서의 최소거리추정법에 대해 살펴보고, 나아가 효율적인 변수선택을 위한 벌점화 최소거리추정량을 제시하였다. 본 연구에서 제안하는 adaptive group LASSO 벌점항을 적용한 AGLDE 기법은 반응변수들간의 상관관계를 모형 적합에 반영함과 동시에 설명변수의 중요도에 따라 효율적으로 변수선택을 수행할 수 있다. 제안 방법의 유용성은 모의실험과 실제 자료 분석을 통해 확인하였다.

지역가중다항식을 이용한 예측모형 (Locally Weighted Polynomial Forecasting Model)

  • 문영일
    • 한국수자원학회논문집
    • /
    • 제33권1호
    • /
    • pp.31-38
    • /
    • 2000
  • 수문변량 사이의 관계는 대부분 비선형 관계를 보이고 있다. 일반적으로 이런 비선형 관계는 어떤 선행하는 명백한 하나의 함수적인 형태로 표현할 수 없는 것이 일반적이다. 본 논문에서는, 비매개변수적 다변량 회귀분석 방법을 지역적으로 가중된 다항식을 이용하여 비선형 예상 함수를 추정하였다. 지역적으로 가중된 다항식은 추정치 각 점에서의 인접한 이웃자료를 가지고 목적 함수를 테일러 급수 확장을 통하여 고려하였다. 이런 비매개변수적 회귀분석을 실용성을 Great Salt Lake의 격주 체적자료에 대한 단기간 예측을 통하여 보여주었다.

  • PDF

다변량 형질의 유전연관성에 대한 주성분을 이용한 회귀방법와 다변량 비모수 추세검정법의 비교 (Comparison of Principal Component Regression and Nonparametric Multivariate Trend Test for Multivariate Linkage)

  • 김수영;송혜향
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.19-33
    • /
    • 2008
  • 연속 형질(quantitative trait)에 영향을 미치는 유전자를 알아내기 위해 형제 쌍의 자료를 수집하여, 주로 이용되는 Haseman과 Elston (1972)의 최소제곱 회귀검정법으로 분석하는데 이는 단일 형질에 대한 분석법이다. 현실적으로 여러 형질들이 복잡하게 단일유전자 좌위(single locus)와 연관되어 있어 함께 수집하게 되는 경우에는, 이러한 연관된 여러 형질을 동시에 분석하는 유전연관성 검정법(linkage test)이 절실히 필요한 실정이다. Amos 등 (1990)은 주성분(principal component) 선형모형을 이용하여 Haseman과 Elston (1972)방법을 둘 이상의 형질의 다변량 분석법으로 확장시켰다. 그러나 이 검정방법은 통계량의 분포를 알 수 없기에 아직 제 1종 오류가 제대로 통제되지 못하는 문제를 가지고 있다. 본 논문에서는 이러한 다변량 형질 자료의 연관성검정에 있어 단일변량에 대한 비모수 추세검정법을 다변량 자료에 대한 분석법으로 확장시킨 통계량을 사용할 것을 제안한다. Amos 등 (1990)이 제안한 방법과 다변량 추세검정 통계량을 모의실험으로 생성한 연속형 형질자료에 적용하였을 때, 다변량 추세검정 통계량은 Amos 등 (1990) 방법에서의 여러 문제점이 발생되지 않을 뿐만 아니라 모의실험에서 제 1종 오류가 정해진 유의수준에 가까운 것을 확인하였고, 검정적이 더 높음을 볼 수 있었다.

드론과 광학원격탐사 기법을 이용한 천해 수심측량 (Coastal Shallow-Water Bathymetry Survey through a Drone and Optical Remote Sensors)

  • 오찬영;안경모;박재성;박성우
    • 한국해안·해양공학회논문집
    • /
    • 제29권3호
    • /
    • pp.162-168
    • /
    • 2017
  • 드론을 이용하여 고도 100 m에서 촬영한 고해상도 카메라 이미지를 분석하여 천해 해저지형 측량을 시도하였다. 쇄파대 내의 수심측량은 해안침식의 원인분석 등 관련 연구를 위해 가장 중요한 입력자료 중의 하나이다. 특히 이동한계수심 이내의 천해 수심자료는 연안 침퇴적 수치모델링을 위한 가장 중요한 입력자료 임에도 불구하고 정확한 해저지형측량 자료를 얻을 수 없었다. 그 이유는 선박을 이용한 상세 수심측량이 흘수 등을 고려할 때 수심 2 m 이내에서는 거의 불가능하며, 또한 쇄파와 연안류로 인해 선박 또는 사람이 직접 충분한 해상도로 측량하기에 매우 어렵기 때문이다. 따라서 소형 드론과 고해상도 카메라 이미지를 이용한 광학원격탐사는 매우 효과적인 천해수심측량 수단이 될 수 있다. 본 연구에서는 경북 월포해수욕장에서 드론으로 촬영한 고해상도 카메라 이미지의 적색, 녹색, 청색 그리고 회색 밴드 이미지를 다변수 선형회귀분석법으로 분석하여 천해 수심을 추정하고 실측한 수심자료와 비교하여 천해수심측량의 가능성과 정확도를 검토하였다. 드론에서 촬영한 이미지를 해저 지질, 바닷물의 색상, 부유사의 농도 등의 영향을 고려하지 않고 수심추정 알고리즘을 이용하여 분석한 결과 수심 5 m 이내에서 상관계수 0.99 이상, 절대오차 0.2 m 이하로 수심을 정확하게 추정할 수 있음을 확인하였다.

CART 분석을 이용한 지하철 마모 영향인자 분석 (Analysis of Factors Influencing upon the Metro Wear Using the Classification and Regression Trees)

  • 정민철;이원우;김정훈;공정식
    • 한국방재학회:학술대회논문집
    • /
    • 한국방재학회 2011년도 정기 학술발표대회
    • /
    • pp.38-38
    • /
    • 2011
  • 일반적으로 레일마모는 열차의 주행안전 및 승차감에 미치는 영향이 크고, 소음 진동의 주요원인으로 작용한다. 또한 레일마모가 발생할 경우 궤도구조의 파괴를 촉진시킴으로써 차량 및 궤도유지보수비를 크게 증가시킨다. 따라서 구간 특성 및 환경 영향 인자 등 현장에서 발생하는 마모 원인을 체계적으로 분석함으로써 마모를 저감할 수 있도록 차량운행 조건과 선로선형 및 궤도구조를 설계하는 것은 중요한 과제이다. CART(Classification And Regression Tree; 분류와 회귀나무) 분석은 패키지화된 좋은 분류 및 예측도구 기법으로 나무의 상위 분리수준에서 일반적으로 나타나는 가장 중요한 입력변수들을 사용하는 등의 입력변수를 선정하는 경우 매우 유용하다. 본 연구에서는 다변수 구간특성 및 환경인자를 고려한 검측 자료 상관관계 분석을 위한 회귀 나무기반 모델(TBM: Tree Based Model) 분석 수행을 위해 지하철 2호선 마모 데이터와 마모 데이터에 영향을 미치는 각종 다변수 구간특성 및 환경인자를 사용하였다. 2호선 지하철의 구간특성 인자 및 환경인자는 레일의 종류, 레일의 위치, 도상, 곡률반경, 캔트 슬랙 및 운행 일수 등으로 구분하였다. 레일의 종류는 ks-50kg과 ks-60kg 두 종류의 레일이 있으며, 레일의 위치는 지상과 지하로 크게 구분할 수 있다. 도상은 콘크리트 도상, 자갈 도상과 일부 구간의 방진상 콘크리트 도상으로 구분할 수 있으며, 곡률반경은 직선구간과 완화곡선 구간 및 최소 250m부터 627m까지 분포된 원 곡선 구간으로 구분할 수 있다. 캔트 간격은 최소 96cm 부터 120cm 간격으로 구분하며, 슬랙은 5~9cm에 분포하고, 운행 기간은 해당 기간 동안 유지보수 이력이 없는 구간을 선정하여 2005년부터 2006년까지 4번에 걸쳐 검측된 지하철 2호선 내선 마모데이터를 사용하였다. 총 X1부터 X7까지 총 7개의 구간특성 또는 환경특성을 영향인자로 선정하였으며, 이러한 영향인자에 의해 결정되는 종속 인자로 Y1인 직마모와 Y2인 측마모를 선정하여 이 중 실질적으로 지하철 궤도의 성능 평가에 주요 판단인자로 사용되는 측마모와 구간특성 및 환경영향인자와의 상관관계 분석을 수행하였다. 해당 마모 데이터가 검측되는 기간 동안 유지보수 이력이 없는 12272 point의 데이터를 검출하였고 CART 프로그램을 이용하여 데이터를 분석하였으며, CART 프로그램의 해석을 위해 종속변수인 직마모량은 각 검측 지점의 마모량에 해당하는 등급으로 변환하여 분석을 수행하였다. 레일의 마모에 영향을 미치는 구간특성 및 환경인자와 종속 변수로 사용된 레일의 마모량 사이의 CART를 이용한 상관관계 분석은 실제 구조물에서 영향인자간의 상관 관계와 유사하며, 추후 연구에서는 이를 바탕으로 하여 정량화된 검측 데이터를 종속변수로 하여 구간특성 또는 환경인자 등 외부 영향인자를 고려한 궤도 검측데이터와의 상관관계 분석을 수행할 계획이다.

  • PDF