• 제목/요약/키워드: 다변수 선형 회귀

검색결과 27건 처리시간 0.018초

시계열 수문자료의 비선형 상관관계 (How to Measure Nonlinear Dependence in Hydrologic Time Series)

  • 문영일
    • 한국수자원학회논문집
    • /
    • 제30권6호
    • /
    • pp.641-648
    • /
    • 1997
  • 상관계수가 변수간의 선형 상관관계를 나타내듯이 mutual information은 변수간의비선형 상관관계를 나타내준다. 본 논문에서는 mutual information 추정법으로 다변수 핵 미도함수(multivariate kernel density estimator)를 이용한 방법이 여러 time lags값에 대하여 산정 되었다. 많은 수문자료에서 보여지는 비선형 관계를 Mutual Information으로 확인하여 보았고, 또한 Mutual Information값이 거의 0인 점에서 optimal delay time을 구하여, 하나의 자료로부터 다변수 회귀분석 모델을 만들 때 이용할 수 있다.

  • PDF

다변량 분위수 회귀나무 모형에 대한 연구 (Multivariate quantile regression tree)

  • 김재오;조형준;방성완
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권3호
    • /
    • pp.533-545
    • /
    • 2017
  • 분위수 회귀모형은 반응변수의 조건부 분포에 대하여 포괄적이고 유용한 통계적 정보를 제공한다. 그러나 많은 실제 자료는 설명변수와 반응변수가 비선형의 관계를 갖고 있어 전통적인 선형 분위수 회귀모형은 왜곡되고 잘못된 결과를 초래할 수 있다. 또한 자료의 복잡성이 증가하여 반응변수가 여러개인 다변량 자료의 분석에 대한 보다 정확한 예측과 더불어 풍부한 해석에 대한 요구가 증가하고 있다. 이러한 이유로 본 연구에서는 다변량 분위수 회귀나무 모형을 제안하였다. 본 연구에서는 기존의 다변량 회귀나무 모형의 분할변수 선택 알고리즘의 문제점을 지적하고 향상된 분할변수 선택 알고리즘을 제안하였다. 제안한 알고리즘은 합리적인 계산시간으로 적용 가능하며 분할변수 선택에서 편향 발생의 문제를 갖지 않는 동시에 기존 방법보다 더 정확하게 분할변수를 선택할 수 있있다. 본 연구에서는 모의실험과 실증 예제를 통해 제안한 방법의 우수한 성능과 유용성을 확인하였다.

다변량 선형회귀분석을 이용한 증발접시계수 산정방법 적용성 검토 (Evaluation of applicability of pan coefficient estimation method by multiple linear regression analysis)

  • 임창수
    • 한국수자원학회논문집
    • /
    • 제55권3호
    • /
    • pp.229-243
    • /
    • 2022
  • 우리나라 11개 기상관측지역의 월별 기상자료가 증발접시계수에 미치는 영향을 분석하고, 증발접시계수 산정을 위한 4가지 형태의 다변량 선형회귀모형의 적용성을 검토하였다. 개발된 증발접시계수 산정모형의 적용성을 평가하기 위해서 기존에 다른 연구자들에 의해서 제안된 6가지의 모형과 비교 평가하였다. 우리나라 11개 기상관측지역에서 증발접시계수는 1, 2, 3, 7, 11, 12월은 기온에 가장 큰 영향을 받고, 다른 월들은 일사량에 가장 큰 영향을 받는 것으로 나타났다. 전반적으로 모든 월에서 풍속과 상대습도는 기온이나 일사량과 비교해서 증발접시계수에 큰 영향을 미치지 않는 것으로 나타났다. 모든 지역과 월에서 각 지역별로 5개의 독립변수(풍속, 상대습도, 기온, 일조시간과 가조시간의 비, 일사량)를 적용하여 유도된 모형이 가장 양호한 증발량 산정 결과를 보였다. 모형 검증결과에 의하면 다변량 선형회귀분석을 적용하여 증발접시계수를 산정하는 경우 일부 지역과 월에서 제한적으로 적용할 수 있을 것으로 판단된다.

임상의를 위한 다변량 분석의 실제 (Multivariate Analysis for Clinicians)

  • 오주한;정석원
    • Clinics in Shoulder and Elbow
    • /
    • 제16권1호
    • /
    • pp.63-72
    • /
    • 2013
  • 임상 의학의 연구에 사용되는 대표적 다변량 분석 방법은 다중 회귀 분석 방법인데, 이는 인과 관계를 토대로 여러 개의 변수에 의한 한꺼번에의 영향력을 분석하기 위한 방법이다. 다중 회귀 분석은 기본적으로 회귀 분석의 기본 가정을 만족해야 함은 물론, 여러 개의 독립 변수들이 포함되기 때문에 변수들을 모형에 포함시키는 방법 및 다중 공선성 문제에 대한 고려가 필요하다. 다중 회귀 분석 모형의 설명력은 결정 계수 $R^2$으로 표현되어 1에 가까울수록 설명력이 크며, 각 독립 변수들의 결과에의 영향력은 회귀 계수인 ${\beta}$값으로 표현된다. 다중 회귀 분석은 종속 변수의 형태에 따라 다중 선형 회귀 분석, 다중 로지스틱 회귀 분석, 콕스 회귀 분석으로 나눌 수 있다. 종속 변수가 연속 변수인 경우 다중 선형 회귀 분석, 범주형 변수인 경우 다중 로지스틱 회귀 분석, 시간의 영향을 고려한 상태 변수인 경우는 콕스 회귀 분석을 시행해야 하며, 각각 결과에의 영향력은 회귀 계수 ${\beta}$, 교차비, 위험비로 평가한다. 이러한 다변량 분석에 대한 이해는 연구를 계획하고 결과를 분석하고자 하는 임상 의사에게 있어 보다 효율적인 연구를 위해 필수적인 소양이라고 할 수 있다.

기체크로마토그래피에서 QSRR을 통한 PAH 용리시간 예측 (Prediction of Gas Chromatographic Retention Times of PAH Using QSRR)

  • 김영구
    • 대한화학회지
    • /
    • 제45권5호
    • /
    • pp.422-428
    • /
    • 2001
  • 기체 크로마토그래피에서 PAH와 그것의 유도체들의 상대적 용리시간을 인공신경망분석과 다변량 선형 회귀분석을 사용하여 학습한 후, 시험세트들의 상대적 용리시간을 예측하였다. QSRR에서 PAH와 그것의 유도체의 주요한 설명인자는 분자량의 제곱근, 분자의 연결지수($^1{\chi}_v$), 분자 쌍극자모멘트 및 분자의 길이와 폭의 비율(L/B)이었다. 다변량선형회귀분석에 의하면 큰 분자일수록 용리시간은 길어지며 또한 L/B의 값이 커지면 용리시간이 증가하는 것으로 보아 슬롯이론을 따르고 있음을 알 수 있었다. 반면에 설명인자 사이의 선형 독립성에 영향을 받지 않는 인공신경망 분석결과에 의하면 분자량과 분자 쌍극자 모멘트가 주요한 인자로 작용하고 있었다. 시험세트의 예측 정확도를 나타내는 분산은 선형회귀분석에서는 1.860, 인공신경망분석법에서 0.206으로서 인공신경망 분석법이 다변량회귀분석보다 더 좋은 예측방법임을 알 수 있었다.

  • PDF

다변량회귀 조건부 평균모형에 대한 최적 차원축소 방법에서 차원수가 결과에 미치는 영향 (Effect of Dimension in Optimal Dimension Reduction Estimation for Conditional Mean Multivariate Regression)

  • 서은경;박종선
    • Communications for Statistical Applications and Methods
    • /
    • 제19권1호
    • /
    • pp.107-115
    • /
    • 2012
  • 본 논문에서는 Yoo와 Cook (2007)에 의하여 제시된 다변량 회귀의 조건부 평균에 대한 최소 불일치 함수 접근법을 통한 최적 차원축소 부분공간의 추정에서 차원의 수가 추정된 선형결합들과 설명력 등에 어떤 영향을 미치는 지를 시뮬레이션 자료를 통하여 알아보았다. 그 결과 추정에 사용된 차원수에 따른 여러 결과들을 차원결정을 위한 검정과 함께 활용하면 모형에 필요한 차원수를 탐색하는데 매우 효과적임을 알 수 있었다.

머신러닝 앙상블을 사용한 항공기 동력 전달 체계의 물림 강성 예측 모델 (Mesh Stiffness Prediction Models for Aircraft Power Train Systems Using Machine Learning Ensemble )

  • 강연준;김연희;박정선
    • 항공우주시스템공학회지
    • /
    • 제18권5호
    • /
    • pp.1-14
    • /
    • 2024
  • 본 논문에서는 앙상블 기법을 통해 스퍼 기어의 설계 변수들을 입력 변수로 갖는 물림 강성 예측 모델을 제시하였다. 기존 연구들에서 제시된 계산 방식을 통해 개별 강성을 계산하고 총 물림 강성값의 최소 및 최대값을 도출하여 데이터셋을 생성하였다. 다변량 선형 회귀, 서포트 벡터 회귀, 의사결정 트리 회귀를 사용하여 물림 강성 최소 및 최대값을 예측하는 모델을 생성하였다. 스태킹 앙상블 기법을 사용하여 해당 예측 모델들을 기반 모델로 갖는 메타 모델을 생성하였다. 실제 항공기 엔진 시동기에 사용되는 기어의 제원을 통해 앙상블 메타 모델의 검증을 수행하였으며, 매우 높은 예측 성능을 보이는 것을 통해 실제 기어 시스템에 대한 적용 타당성 및 유효성을 확인하였다.

다변량 선형회귀모형의 벌점화 최소거리추정에 관한 연구 (Penalized least distance estimator in the multivariate regression model)

  • 신정민;강종경;방성완
    • 응용통계연구
    • /
    • 제37권1호
    • /
    • pp.1-12
    • /
    • 2024
  • 동일한 설명변수 집합에 여러 개의 반응 변수들이 종속되어 있는 경우를 많은 실제 자료에서 볼 수 있다. 특히, 여러 개의 반응변수가 서로 상관관계를 가지고 있으면 각각의 반응변수에 대한 개별적인 분석보다는 반응변수들 사이의 상관관계를 고려한 동시 추정(simultaneous estimation)이 매우 효과적이다. 이러한 다변량 회귀분석에서 최소거리추정량(least distance estimator; LDE)은 반응변수들간의 상관관계를 모형 적합 과정에 반영하여 다차원 유클리드 공간에서 각 훈련 개체와 추정값 사이의 거리를 최소화하도록 회귀계수들을 동시에 추정한다. 뿐만 아니라 최소거리추정량은 이상치에 대한 강건성을 제공한다. 본 논문에서는 다변량 선형 회귀분석에서의 최소거리추정법에 대해 살펴보고, 나아가 효율적인 변수선택을 위한 벌점화 최소거리추정량을 제시하였다. 본 연구에서 제안하는 adaptive group LASSO 벌점항을 적용한 AGLDE 기법은 반응변수들간의 상관관계를 모형 적합에 반영함과 동시에 설명변수의 중요도에 따라 효율적으로 변수선택을 수행할 수 있다. 제안 방법의 유용성은 모의실험과 실제 자료 분석을 통해 확인하였다.

지역가중다항식을 이용한 예측모형 (Locally Weighted Polynomial Forecasting Model)

  • 문영일
    • 한국수자원학회논문집
    • /
    • 제33권1호
    • /
    • pp.31-38
    • /
    • 2000
  • 수문변량 사이의 관계는 대부분 비선형 관계를 보이고 있다. 일반적으로 이런 비선형 관계는 어떤 선행하는 명백한 하나의 함수적인 형태로 표현할 수 없는 것이 일반적이다. 본 논문에서는, 비매개변수적 다변량 회귀분석 방법을 지역적으로 가중된 다항식을 이용하여 비선형 예상 함수를 추정하였다. 지역적으로 가중된 다항식은 추정치 각 점에서의 인접한 이웃자료를 가지고 목적 함수를 테일러 급수 확장을 통하여 고려하였다. 이런 비매개변수적 회귀분석을 실용성을 Great Salt Lake의 격주 체적자료에 대한 단기간 예측을 통하여 보여주었다.

  • PDF

다변량 형질의 유전연관성에 대한 주성분을 이용한 회귀방법와 다변량 비모수 추세검정법의 비교 (Comparison of Principal Component Regression and Nonparametric Multivariate Trend Test for Multivariate Linkage)

  • 김수영;송혜향
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.19-33
    • /
    • 2008
  • 연속 형질(quantitative trait)에 영향을 미치는 유전자를 알아내기 위해 형제 쌍의 자료를 수집하여, 주로 이용되는 Haseman과 Elston (1972)의 최소제곱 회귀검정법으로 분석하는데 이는 단일 형질에 대한 분석법이다. 현실적으로 여러 형질들이 복잡하게 단일유전자 좌위(single locus)와 연관되어 있어 함께 수집하게 되는 경우에는, 이러한 연관된 여러 형질을 동시에 분석하는 유전연관성 검정법(linkage test)이 절실히 필요한 실정이다. Amos 등 (1990)은 주성분(principal component) 선형모형을 이용하여 Haseman과 Elston (1972)방법을 둘 이상의 형질의 다변량 분석법으로 확장시켰다. 그러나 이 검정방법은 통계량의 분포를 알 수 없기에 아직 제 1종 오류가 제대로 통제되지 못하는 문제를 가지고 있다. 본 논문에서는 이러한 다변량 형질 자료의 연관성검정에 있어 단일변량에 대한 비모수 추세검정법을 다변량 자료에 대한 분석법으로 확장시킨 통계량을 사용할 것을 제안한다. Amos 등 (1990)이 제안한 방법과 다변량 추세검정 통계량을 모의실험으로 생성한 연속형 형질자료에 적용하였을 때, 다변량 추세검정 통계량은 Amos 등 (1990) 방법에서의 여러 문제점이 발생되지 않을 뿐만 아니라 모의실험에서 제 1종 오류가 정해진 유의수준에 가까운 것을 확인하였고, 검정적이 더 높음을 볼 수 있었다.