• Title/Summary/Keyword: 회귀추정법

Search Result 386, Processing Time 0.027 seconds

베이지안 회귀분석을 이용한 수위-유량 관계곡선의 불확실성 분석 (Identification of Uncertainty in Fitting Rating Curve with Bayesian Regression)

  • 김상욱;이길성
    • 한국수자원학회논문집
    • /
    • 제41권9호
    • /
    • pp.943-958
    • /
    • 2008
  • 본 연구는 수위-유량 관계곡선식의 매개변수 추정을 수행하기 위하여 Bayesian 회귀분석을 적용하였다. 또한 불확실성측면에서의 효과를 탐색하기 위하여 Bayesian 회귀분석에 의한 추정치와 t 분포를 이용하여 산정한 일반 최소자승법(ordinary least square, OLS)에 의한 회귀분석의 추정치를 각각 산정하여 산정결과의 신뢰구간을 비교분석 하였다. 등분산케이스의 통계적 실험결과 t 분포를 이용하여 산정된 평균 추정치와 Bayesian 회귀분석에 의한 평균 추정치는 크게 다르지 않았으나, 비등분산 케이스의 경우에는 Bayesian 회귀분석이 참값에 가까운 추정치를 산정함을 알 수 있었다. 또한 불확실성 측면에서 평가해 볼 때 신뢰구간의 상한추정치와 하한추정치의 차이는 Bayesian 회귀분석을 사용한 경우가 기존 방법을 사용한 경우보다 작은 것으로 나타났으며, 이로부터 수위-유량 관계곡선식의 매개변수를 추정하는 경우 Bayesian 회귀분석이 일반 회귀분석보다 불확실성을 표현하는데 있어서 우수하다는 결과를 얻을 수 있었다. 적용된 두 가지의 추정방법은 비등분산성을 고려한 통계적 실험을 통하여 장점과 단점이 비교되었으며, 안양천 유역의 5개 지점으로부터 얻어진 유량측정성과를 이용하여 적용성을 알아보았다. 현장 적용결과는 참값을 알지 못하므로 정량적 우수성은 평가할 수 없었으나, 기존에 사용되는 불확실성 산정방법보다 Bayesian 회귀 분석 불확실성은 감소시켜 나타냄을 알 수 있었다.

유량측정시 불확실성의 검토와 수위-유량곡선식의 개발 (Investigating Uncertainty in Flow Measurement and Developing Rating Curves)

  • 이길성;이경호
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2004년도 학술발표회
    • /
    • pp.1242-1246
    • /
    • 2004
  • 본 연구에서는 유속계와 봉부자를 동한 측정값의 불확실성를 검토한 후, 한강의 7개 지류의 실측 자료들의 불확실성을 ISO 규정을 통하여 추정하였다. Simulated Annealing 기법과 황금비 분할법을 이용한 비선형회귀식을 적용하여 기존의 수위-유량 곡선식자 비교해보았다. 불확실성 추정결과 유량 측정치들의 불확실성이 ISO 규정의 기준에 비해 높게 추정되었으며, 특히 무작위 오차와 계통 오차 중에 무작위 오차의 불착실성이 높게 나타났다. 또한, 기존 수위-유량곡선식과 Simulated Annealing 기법과 황금비 분할법을 이용한 방법을 비교해본 결과 황금비 분할법이 가장 좋은 결과를 얻었다. 이때 수위-유량곡선식의 영수위값을 황금비 분할법을 이용해 구한 후 비교해 본 결과는 기존의 선형회귀방법과 비선형방법에서 큰 차이를 보이지 않았다. 또한 곡선 분리시에는 하나의 수위-유량곡선일때보다 오차가 줄어드는 경향을 보였다.

  • PDF

대형 데이터에서 VIF회귀를 이용한 신속 강건 변수선택법 (Fast robust variable selection using VIF regression in large datasets)

  • 서한손
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.463-473
    • /
    • 2018
  • 연구에서는 선형회귀모형을 가정한 대형 데이터에서의 변수선택 알고리즘을 다룬다. 방법의 속도와 강건성에 주안점을 둔 여러 알고리즘들이 제안되었다. 그 중에서 streamwise 회귀 접근법을 사용한 VIF회귀는 신속하고 정확하게 수행된다. 그러나 VIF회귀는 최소제곱방법에 의해 모형이 추정되므로 이상치에 민감하다. 변수선택방법의 강건성을 높이기 위해 가중 추정치를 사용한 강건측도가 제안되었으며 강건 VIF회귀도 제안되었다. 본 연구에서는 잠재적 이상치를 탐지하여 제거한 후 VIF회귀를 수행하는, 빠르고 강건한 변수선택 방법을 제안한다. 제안된 방법은 모의실험과 데이터 분석 통해 다른 방법들과 비교된다.

잔차 수정을 이용한 불연속 분산함수의 비모수적 추정 (Nonparametric estimation of the discontinuous variance function using adjusted residuals)

  • 허집
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권1호
    • /
    • pp.111-120
    • /
    • 2016
  • 대부분의 불연속 회귀함수의 커널추정량은 알고 있거나 추정된 불연속점을 기준으로 자료를 분리하여 각각을 독립적으로 회귀함수를 적합하고 있다. 회귀모형에서 분산함수가 불연속점을 가지고 있을 때에도 잔차제곱들을 이용하여 위와 같은 불연속 회귀함수의 커널추정법을 활용하고 있다. Kang 등 (2000)은 $M{\ddot{u}}ller$ (1992)의 불연속점과 점프크기 커널추정량을 이용하여 반응변수의 표본을 연속인 회귀함수로부터 표본인 것처럼 수정하여 불연속 회귀함수를 추정하였다. 본 연구에서는 불연속 분산함수를 추정하기 위하여 Kang 등 (2000)의 방법을 이용한다. Kang과 Huh (2006)의 분산함수의 불연속점과 점프크기 추정량으로 잔차제곱들을 수정하고, 수정된 잔차제곱들을 이용하여 불연속 분산함수 커널추정량을 제안할 것이다. 제안된 추정량의 적분제곱오차의 수렴속도를 보여주고 모의실험을 통하여 기존의 추정량과 제안된 추정량을 비교하고자 한다.

지표피복 데이터와 지리가중회귀모형을 이용한 인구분포 추정에 관한 연구 (Locally adaptive intelligent interpolation for population distribution modeling using pre-classified land cover data and geographically weighted regression)

  • 김화환
    • 한국지역지리학회지
    • /
    • 제22권1호
    • /
    • pp.251-266
    • /
    • 2016
  • 데시메트릭 매핑은 행정구역 단위로 집계된 인구자료를 행정구역 내부의 공간적 변이에 따라 재집계하여 고해상도의 인구분포 자료를 작성하는 가장 보편적인 기법이다. 본 연구에서는 데시메트릭 매핑을 이용한 인구분포 추정의 장단점을 검토하고, 그 개선방안으로서 지리가중회귀모형을 이용한 다변량 데시메트릭 매핑 기법을 제안하였다. 기존의 지표피복 데이터와 인구센서스 자료를 기반으로 지리가중회귀모형을 적용하여 각 집계단위별로 지표피복 유형과 인구밀도의 상관관계를 분석하고, 모형에서 산출된 회귀계수를 이용해 하위 공간구획의 인구 총수를 산정하였다. 그 결과 지리가중회귀모형 기반 다변량 데시메트릭 매핑 기법을 이용했을 때, 면적가중 보간법, 이진 데시메트릭 매핑, 피크노필렉틱 보간법, 최소자승회귀모형 기반 데시메트릭 매핑 기법 등 다른 지능형 보간법에 비해 정확한 인구분포 추정이 가능하다는 것을 확인하였다. 이는 지리가중회귀모형을 통해서 인구센서스 집계 단위별로 상이한 구역 내 공간적 이질성이 인구분포 추정에 적절히 반영되었기 때문인 것으로 평가할 수 있다.

  • PDF

시간의 흐름에 따른 무조건부 주가분산과 주가형성

  • 이일균
    • 재무관리논총
    • /
    • 제14권1호
    • /
    • pp.41-56
    • /
    • 2008
  • 주식 수익률이 정상적 과정이 아니라 비정상적 과정에 의해서 생성되고 있다는 사실이 여러 실증 분석에서 제시되고 있다. 시계열의 평균이 시간의 흐름에 따라 변하면 이 시계열은 비정상적 과정에 의하여 생성된다. 시간의 흐름에 따라 평균이 변하는 비정상 시계열은 단위근과 공적분에 의하여 시계열의 운동을 모형화하고 있다. 한편 시계열의 비정상성은 분산이 시간의 흐름에 따라 변할 때에도 발생한다. 시간의 흐름에 따라 무조건부 분산은 변하지 않고 있지만 이용 가능한 정보 집합을 조건으로 하는 조건부 분산이 변하는 경우도 있다. 이 같은 성질을 가진 주가 시계열은 자기회귀 조건부 이분산(ARCH) 계통의 과정으로 모형화하고 있다. 그러나 무조건부 분산이 시간의 흐름에 따라 변하면 ARCH 계통은 중대한 모형정립과오(misspecification)에 직면하게 된다. 따라서 본 논문은 무조건부 분산이 시간의 흐름에 따라 변할 때 자기 회귀 과정의 모수를 추정하는 방법을 검토하고, 이 방법을 한국 종합주가 지수에 적용하여 자기회귀 과정의 모수를 추정하였다. 이 방법에 의하여 추정된 2계 자기회귀 과정의 모수값 중 상수항과 제1계 항의 계수는 통상 최소자승법에 의한 값과 유사하다. 그러나 제2계 항 모수의 값은 양자가 상당히 다르다. 최소자승에 의한 제2계 값이 과대 추정되고 있다.

  • PDF

가능도함수를 이용한 불연속점 수의 추정 (Estimation of the number of discontinuity points based on likelihood)

  • 허집
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.51-59
    • /
    • 2010
  • 일반화선형모형에서 회귀함수가 하나의 불연속점을 가질 때, Huh (2009)는 하나의 모수를 가지는 지수족의 가능도함수를 한쪽방향커널을 이용하여 그 불연속점의 위치와 점프크기를 추정하였다. 이 논문에서는 미지의 불연속점 수 q개를 가지는 회귀함수인 경우에, Huh (2009)가 제안한 점프크기 추정량의 점근분포를 이용한 가설검정법을 소개하고, 그 가설검정법을 이용한 불연속점 수를 추정하는 알고리듬을 제안하고, 모의실험을 통하여 추정의 정도를 알아보고자 한다.

Nonparametric Detection of a Discontinuity Point in the Variance Function with the Second Moment Function

  • Huh, Jib
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권3호
    • /
    • pp.591-601
    • /
    • 2005
  • 지금까지 회귀모형에서 불연속점의 추정은 주로 평균함수에 대해 연구되어져 왔다. 분산함수는 평균함수와 더불어 회귀모형의 연구에 매우 중요한 함수이며 이 함수가 불연속일 때의 연구는 활발히 이루어지지 않았다. Delgado와 Hidalgo (2000)와 Perron(2001)은 시계열모형에서는 비모수적 추정법에 의해 분산함수의 추정을 연구하였다. Huh와 Kang (2004)은 Perron의 추정법을 회귀모형에 적용하여 분산함수의 불연속점의 추정에 대하여 연구하였고, Perron의 추정량보다 수렴속도가 개선된 불연속점 추정량을 제안하였다 이러한 분산함수의 추정들은 잔차의 제곱을 이용한 것으로 평균함수의 추정이 필수적이다. 결국, 전체적인 계산량이 늘어나게 되고, 늘어난 만큼 불연속점 추정의 정도가 벌어지게 될 것이다. 만약, 평균함수가 연속이고 분산함수만 불연속이라면 굳이 잔차를 이용하여 분산함수의 불연속점을 추정할 필요 없다. 분산함수만 불연속점을 가지므로 이차적률함수의 불연속점이 곧 분산함수의 불연속점이므로 이차함수의 불연속점을 추정하는 것으로 충분하다. 평균함수와 분산함수 모두 불연속이라면 불연속점의 위치가 같으므로 평균함수의 불연속점의 위치를 추정하면 분산함수의 불연속점의 위치를 추정하게 되는 것이다. 따라서 이 논문에서는 이차적률함수의 불연속점을 추정하는 방법을 제안하였고 이 제안된 추정량들의 수렴속도가 잔차를 이용한 Huh와 Kang의 분산함수의 불연속점 추정량의 수렴속도와 같음을 보였고, 모의실험 결과에서는 우수함을 보여주었다.

  • PDF

복합표본조사 데이터 분석을 위한 회귀모형 접근법의 비교 - 소규모사업체조사 데이터 분석을 중심으로 - (Comparison of regression model approaches fitted to complex survey data)

  • 이기재
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2001년도 춘계학술논문발표대회 발표논문집
    • /
    • pp.45-56
    • /
    • 2001
  • 복합표본조사 데이터 분석에서 회귀모형 접근법은 크게 표본설계 기반 접근법(design-based approach)과 일반화 추정 방정식 접근법(generalized estimating equations approach)으로 구분된다. 본 논문은 이들 접근법과 모형기반 접근법을 비교하여 설명하고, 각 접근법에서 표본설계가 모수 추정에 미치는 영향을 설계 효과와 가중치 효과 분석을 통해서 살펴보았다.

  • PDF

대용량 자료의 분석을 위한 분할정복 커널 분위수 회귀모형 (Divide and conquer kernel quantile regression for massive dataset)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제33권5호
    • /
    • pp.569-578
    • /
    • 2020
  • 분위수 회귀모형은 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 특히 커널 분위수 회귀모형은 비선형 관계식을 고려하기 위하여 양정치 커널함수(kernel function)에 의해 만들어지는 재생 커널 힐버트 공간(reproducing kernel Hilbert space)에서 비선형 조건부 분위수 함수를 추정한다. 그러나 KQR은 이차계획법으로 공식화되어 많은 계산비용을 필요로 하므로 컴퓨터 메모리 능력의 제한으로 대용량 자료의 분석은 불가능하다. 이러한 문제점을 해결하기 위하여 본 논문에서는 분할정복(divide and conquer) 알고리즘을 활용한 KQR 추정법(DC-KQR)을 제안한다. DC-KQR은 먼저 전체 훈련자료를 몇 개의 부분집합으로 무작위로 분할(divide)한 후, 각각의 부분집합에 대하여 KQR 분위수 함수를 추정하고 이들의 산술 평균을 이용하여 최종적인 추정량으로 통합(conquer)하는 기법이다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DC-KQR의 효율적인 성능과 활용 가능성을 확인하였다.