• 제목/요약/키워드: 회귀수

검색결과 7,896건 처리시간 0.03초

안성지역 마둔저수지의 농업용수 회귀수량 산정 (Estimation of Irrigation Return Flow from Paddy Fields in Madun Reservoir)

  • 김하영;남원호;문영식;안현욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.180-180
    • /
    • 2020
  • 최근 인구 증가, 도시화 및 산업의 발달로 인해 생활·공업용수의 수요가 증가하면서, 상대적으로 농업용수의 비율은 감소하고 있는 추세이다. 하지만 수자원이용 현황 중 농업용수는 전체 물 사용량의 48%로 여전히 가장 큰 비중을 차지하고 있다. 환경부 중심의 물관리 일원화 관련법 시행으로 국가 통합물관리 정책이 본격 추진됨에 따라 농업용수 가치의 재평가가 요구되고 있으며, 현재 수원공 확대의 경우 환경보호와 같은 이유로 농업용수 확보에 대한 많은 제약이 발생하고 있다. 공급된 농업용수 중 작물에 의해 소비되지 않고 하천으로 회귀되는 회귀수량은 하천 건천화 방지, 용수공급계획, 하천 유황예측 등 기여하는 바가 크다. 하지만 관개량과 회귀수량의 비로 나타내는 회귀율의 경우 지역에 따라 38.1%에서 70.5%로 큰 차이를 보이고 있으며, 지역별 회귀율 정량화에도 한계가 있다. 본 연구에서는 경기도 안성에 위치한 관개면적 429ha인 마둔 저수지를 대상으로 회귀율을 산정하고 농촌용수종합정보시스템 (Rural Agricultural Water Resource Information System, RAWRIS)에서 제공하는 저수지 수위 자료를 활용하여 마둔 저수지의 4월부터 9월 관개기 강수량, 저수율, 증발산량을 구축하였다. 물수지 분석 기반 회귀수량 산정모형으로부터 회귀율을 추정하였으며, 수로 네트워크 기반의 SWMM (Storm Water Management Model)과 비교를 통해 정량적인 회귀수량 및 회귀율을 산정하고자 한다. 본 연구의 결과를 통해 정량적인 회귀수량 및 회귀율 자료가 구축된다면, 농업용수의 재이용, 환경용수 및 하천유지용수, 용수공급계획 등 효율적인 농업 수자원관리에 기초자로로써 활용 가능할 것이라 판단된다.

  • PDF

안정적 유전자 특징 선택을 위한 유전자 발현량 데이터의 부트스트랩 기반 Lasso 회귀 분석 (Lasso Regression of RNA-Seq Data based on Bootstrapping for Robust Feature Selection)

  • 조정희;윤성로
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권9호
    • /
    • pp.557-563
    • /
    • 2017
  • 많은 수의 유전자 데이터를 이용해서 Lasso 회귀 분석을 할 때, 유전자 발현량 값들 사이의 높은 상관성으로 인하여 회귀 계수의 추정값이 회귀 분석의 반복 시행마다 달라질 수 있다. L1 정규화에 의해 축소되는 회귀 계수의 불안정성은 변수 선택을 어렵게 하는 요인이 된다. 본 연구에서는 이러한 문제를 해결하기 위하여 부트스트랩 단계를 반복 시행하여 높은 빈도로 선택된 유전자들을 이용한 회귀 모형들을 만들고, 각 모형들에서 안정적으로 선택되는 특징 유전자들을 찾고, 그 유전자들이 위양성 결과가 아님을 입증하였다. 또한, 회귀모형 별 예측지수의 정확도를 실제지수와의 상관관계를 이용해 측정하였는데, 선택된 특징 유전자들의 회귀계수 부호의 분포가 정확도와 관련성을 보임을 확인하였다.

모형 선택 기준들에 대한 LASSO 회귀 모형 편의의 영향 연구 (A study on bias effect of LASSO regression for model selection criteria)

  • 유동현
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.643-656
    • /
    • 2016
  • 고차원 자료(high dimensional data)는 변수의 수가 표본의 수보다 많은 자료로 다양한 분야에서 관측 또는 생성되고 있다. 일반적으로, 고차원 자료에 대한 회귀 모형에서는 모수의 추정과 과적합을 피하기 위하여 변수 선택이 이루어진다. 벌점화 회귀 모형(penalized regression model)은 변수 선택과 회귀 계수의 추정을 동시에 수행하는 장점으로 인하여 고차원 자료에 빈번하게 적용되고 있다. 하지만, 벌점화 회귀 모형에서도 여전히 조율 모수 선택(tuning parameter selection)을 통한 최적의 모형 선택이 요구된다. 본 논문에서는 벌점화 회귀 모형 중에서 대표적인 LASSO 회귀 모형을 기반으로 모형 선택의 기준들에 대한 LASSO 회귀 추정량의 편의가 어떠한 영향을 미치는지 모의실험을 통하여 수치적으로 연구하였고 편의의 보정의 필요성에 대하여 나타내었다. 실제 자료 분석에서의 영향을 나타내기 위하여, 폐암 환자의 유전자 발현량(gene expression) 자료를 기반으로 바이오마커 식별(biomarker identification) 문제에 적용하였다.

분포무관추정량을 이용한 퍼지회귀모형 (Fuzzy Linear Regression Using Distribution Free Method)

  • 윤진희;최승회
    • Communications for Statistical Applications and Methods
    • /
    • 제16권5호
    • /
    • pp.781-790
    • /
    • 2009
  • 본 논문에서는 퍼지수를 포함한 모수적 회귀모형을 추정하기 위하여 분포무관추정량으로 알려진 순위 변환방법과 Theil 방법을 소개한다. 순위 변환방법은 퍼지수의 ${\alpha}$-수준집합의 중심과 폭에 대한 순위를 이용하고 Theil 방법은 ${\alpha}$-수준집합의 중심과 폭에 대한 추정한 값들의 중위수를 이용한다. 예제를 이용하여 분포무관추정량으로 추정된 퍼지회귀모형의 효율성을 최소자승법과 여러 가지 방법으로 추정된 퍼지회귀모형과 비교한다.

변수평활량을 이용한 커널회귀함수 추정 (On variable bandwidth Kernel Regression Estimation)

  • 석정하;정성석;김대학
    • Journal of the Korean Data and Information Science Society
    • /
    • 제9권2호
    • /
    • pp.179-188
    • /
    • 1998
  • 커널형 회귀함수의 추정법 중에서 국소 다항회귀 추정법이 가장 우수한 것으로 알려져 있다. 국소다항회귀 추정법에서도 다른 종류의 커널추정량과 마찬가지로 평활량이 중요한 역할을 한다. 특히 회귀함수가 복잡한 구조를 가질 때 변수평활량(variable band-width)을 사용하는 것이 타당할 것이다. 본 연구에서는 완전자료기저(fully automatic, fully data-driven) 변수평활량 선택법을 제안한다. 이 선택법은 편향과 분산의 예비추정에 필요한 평활량을 교차타당성 방법으로 선택하여 MSE를 추정하고 그 값을 최소화하는 평활량을 택하는 것이다. 제안된 방법의 우수성을 모의실험을 통하여 확인하였다. 그리고 제안된 방법은 자료점이 성긴(sparse)부분에서 생길 수 있는 문제점 즉 X'X의 비정칙성(non-singularity)을 해결할 수 있는 방법이라는 데에도 큰 의미가 있다.

  • PDF

Theil방법을 이용한 퍼지회귀모형 (Fuzzy Theil regression Model)

  • 윤진희;이우주;최승회
    • 한국지능시스템학회논문지
    • /
    • 제23권4호
    • /
    • pp.366-370
    • /
    • 2013
  • 설명변수와 반응변수 사이의 통계적 관계를 설명하기 위해 사용되는 회귀모형을 분석하는 방법을 회귀분석이라 한다. 본 논문에서는 독립변수와 종속변수에 대한 퍼지관계를 표현하는 퍼지회귀모형를 추정하기 위하여 이상치에 민감하지 않은 로버스트한 추정량인 Theil방법을 소개한다. Theil방법은 설명변수와 반응변수의 ${\alpha}$-수준집합의 각 성분으로 구성된 집합에서 선택한 임의의 두 쌍 자료로부터 계산된 변화율의 중위수를 두 변수에 대한 변화량의 추정량으로 간주한다. 본 논문에서 제안된 Theil방법이 최소자승법을 이용하여 추정된 퍼지회귀모형보다 더 정확할 수 있음을 예제를 통하여 확인한다.

로지스틱 회귀모형에서 이변량 정규분포에 근거한 로그-밀도비 (Log-density Ratio with Two Predictors in a Logistic Regression Model)

  • 강명욱;윤재은
    • 응용통계연구
    • /
    • 제26권1호
    • /
    • pp.141-149
    • /
    • 2013
  • 로지스틱회귀모형에서 두 설명변수의 조건부 분포가 모두 이변량 정규분포라고 할 수 있다면 설명변수들의 함수로 표현되는 로그-밀도비를 통해 모형에 포함시켜야하는 항을 알 수 있다. 두개의 이변량 정규분포에서 분산-공분산행렬이 같은 경우에는 이차항과 교차항 없이 일차항만으로 충분하다. 상관계수가 모두 0이면 교차항은 설명변수의 분산과 관계없이 필요하지 않다. 또한 로지스틱회귀모형에서 로그-밀도비를 통해 이차항과 교차항이 필요하지 않게 되는 다른 조건들도 알아본다.

Adaptive lasso를 이용한 희박벡터자기회귀모형에서의 변수 선택 (Adaptive lasso in sparse vector autoregressive models)

  • 이슬기;백창룡
    • 응용통계연구
    • /
    • 제29권1호
    • /
    • pp.27-39
    • /
    • 2016
  • 본 논문은 다차원의 시계열 자료 분석에서 효율적인 희박벡터자기회귀모형에서의 모수 추정에 대해서 연구한다. 희박벡터자기회귀모형은 영에 가까운 계수를 정확이 영으로 둠으로써 희박성을 확보한다. 따라서 변수 선택과 모수 추정을 한꺼번에 할 수 있는 lasso를 이용한 방법론을 희박벡터자기회귀모형의 추정에 쓸 수 있다. 하지만 Davis 등(2015)에서는 모의실험을 통해 일반적인 lasso의 경우 영이아닌 계수를 참값보다 훨씬 더 많이 찾아 희박성에 약점이 있음을 보고하였다. 이에 따라 본 연구는 희박벡터자기회귀모형에 adaptive lasso를 이용하면 일반 lasso보다 희박성을 비롯한 전반적인 모수의 추정이 매우 유의하게 개선됨을 보인다. 또한 adaptive lasso에서 쓰이는 튜닝 모수들에 대한 선택도 아울러 논의한다.

비대칭 오차모형하에서의 회귀기울기에 대한 적합된 L-추정법 (Adaptive L-estimation for regression slope under asymmetric error distributions)

  • 한상문
    • 응용통계연구
    • /
    • 제6권1호
    • /
    • pp.79-93
    • /
    • 1993
  • 회귀모형에 있어서의 Ruppert와 Carroll의 절사 회귀 추정법을 확장하여 회귀 분위수에 의 한 두 개의 두분으로 관측치를 분할하여 각 부분마다 가중치를 달리 부여하는 방법으로 적 합된 L-추정법을 제안하였다. 이 제안된 L-추정법은 특히 비대칭인 오차분포하에서 좋은 효율을 가지고 있었다.

  • PDF