• 제목/요약/키워드: 회귀수

검색결과 7,896건 처리시간 0.037초

로버스트주성분회귀에서 최적의 주성분선정을 위한 기준 (A Criterion for the Selection of Principal Components in the Robust Principal Component Regression)

  • 김부용
    • Communications for Statistical Applications and Methods
    • /
    • 제18권6호
    • /
    • pp.761-770
    • /
    • 2011
  • 회귀모형에 연관성이 높은 설명변수들이 포함되면 다중공선성의 문제가 야기되며, 동시에 자료에 회귀 이상점들이 포함되면 최소자승추정량에 바탕을 둔 제반 통계적 추론은 심각한 결함을 갖게 된다. 이러한 현상들은 데이터마이닝 분야에서 많이 볼 수 있는데, 본 논문에서는 두 가지 문제를 동시에 해결하기 위한 방안으로서 로버스트주성분회귀를 제안하였다. 특히 최적의 주성분을 선정하기 위한 새로운 기준을 개발하였는데, 설명변수들의 표본공분산 대신에 MVE-추정량을 기반으로 하였으며, 고유치가 아니라 상태지수의 크기에 바탕을 둔 선정기준을 제안하였다. 그리고 주성분모형에서의 추정을 위하여 회귀이상점에 대해 로버스트한 LTS-추정을 도입하였다. 제안된 선정기준이 기존의 기준들보다 다중공선성과 이상점이 유발하는 문제들을 잘 해결할 수 있음을 모의실험을 통하여 확인하였다.

미계측 유역의 기후변화 영향평가를 위한 수문모형 매개변수의 지역회귀분석 적용 (Applying regional regression analysis of the hydrologic model parameters for assessing climate change impacts in the ungaged watershed)

  • 김영일;서승범;김성진;김영오
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.219-219
    • /
    • 2017
  • 상대적으로 유역의 관측 자료가 충분하지 못하거나 검증되지 않았을 경우 미계측 유역으로 정의되며 수문모형의 매개변수 검정을 할 수 없으므로 다른 방법을 고안해야 한다. 이를 위해 기존 연구에서는 지역적 특성을 고려한 지역회기분석을 통해 미계측 유역의 유량을 산정하였는데, 대부분 유역의 특성과 연 평균 유출량 자료의 관계를 이용한 회귀식으로 실시간 유량의 변화를 고려하기 어려웠다. 본 연구에서는 개념적 강우-유출모형으로 많이 사용되고 있는 개념적 수문모형인 GR4J의 매개변수에 대해 미계측 유역의 특성을 고려한 변수들을 이용하여 회귀식을 구하고 그 적용성을 평가하였다. 이를 통해 미계측 유역의 유량 시계열 자료를 생성할 수 있었다. 또한 IPCC에서 발간한 AR5의 RCP 4.5 시나리오를 적용하여 미래 유출량을 산정하였다. 우선 지역회귀분석을 적용하기 위해 수문모형을 이용한 계측 유역의 유출량을 구하였으며 22개의 전국 댐 상류 지점을 기준으로 SCE 알고리즘을 이용하여 GR4J의 최적 매개변수를 구하고 각 유역별로 물리적, 지형적, 기상학적 특성을 고려하여 11개의 변수를 선택하였다. 각 변수간 다중공선성(Multicollinearity)를 고려하기 위해 VIF(Variation Inflation Factor) test를 적용하여 최종 7개의 변수를 선정하고 단계별 회귀방법(Stepwise regression)을 이용하여 GR4J의 매개변수별 회귀식을 생성하였다.

  • PDF

다중회귀분석을 이용한 미계측 유역의 갈수유량 산정에 관한 연구 (A Study on Estimation of Lowflow Ungauged Basin Using Multiple Regression Analysis)

  • 임가균;정세진;김병식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.133-133
    • /
    • 2020
  • 갈수량이란 1년 중 355일은 유지되는 유량을 말하며 물 공급 계획 및 관리, 저수지 설계, 관개용수의 수량과 수질 관리, 생태계 보존 등에 있어서 갈수량의 크기와 빈도를 파악하는 것은 매우 중요한 과정이다. 갈수량 산정을 위해서는 오랜 기간의 관측 일유량 자료가 필요하지만 우리나라의 경우 관측 유량 자료의 결측자료가 많아 갈수량 산정에 필요한 장기간의 자료가 부족하다. 따라서 본 연구에서는 전국 40개 중권역 유역을 대상으로 갈수 빈도별 갈수량 산정 회귀식 개발을 수행하였다. 갈수량 산정에 적용할 수 있는 18개의 유역인자와 4개의 수문 인자를 상관분석을 통해 다중공선성을 고려하였으며 상관분석 결과를 토대로 미계측 유역에 적용 가능한 인자를 선정하였다. 갈수 빈도 분석과 단계적 회귀분석을 통하여 미계측 유역에 적용할 수 있는 갈수 빈도별 갈수량 산정 회귀식을 개발하였다. 또한 계측 유역을 미계측 유역으로 가정하여 개발된 갈수량 산정 회귀식을 이용하여 갈수량을 산정하고 분석 결과와 실제 갈수량을 비교하여 개발된 회귀식의 적정성을 검토하였다.

  • PDF

선형 회귀분석 기반 합산영역테이블 정밀도 향상 기법 (Linear Regression-Based Precision Enhancement of Summed Area Table)

  • 정주현;이성길
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권11호
    • /
    • pp.809-814
    • /
    • 2013
  • 합산영역테이블은 이미지 픽셀 주변 임의의 사각 영역 내 픽셀 값의 합을 4개 픽셀의 합차로 표현할 수 있는 자료구조이다. 그러나 합산영역테이블은 픽셀의 값을 한쪽 모서리에서 다른 쪽 모서리로 순차 누적하므로, 이미지의 크기가 큰 경우에 부동소수점 방식의 표현 범위를 초과하는 문제가 일어날 수 있다. 이를 해결하기 위해 본 논문은 선형 회귀분석을 이용하여 이미지를 근사하고, 회귀분석식과의 차이만을 누적하여 정밀도 누적 오차를 감소시킬 수 있는 제안한다. 또한, 이미지의 복원 시 회귀분석식의 합을 2중 적분을 이용하여 상수시간에 구할 수 있는 방법을 함께 제안 한다. 이미지의 복원에 대한 실험을 수행하였고, 결과는 제안하는 방식이 일반적인 고정오프셋 방식보다 누적 오차를 감소시킴을 보였다.

하수처리장 방류수 수질예측을 위한 다중회귀분석 모델 개발 및 검증 (Development and Validation of Multiple Regression Models for the Prediction of Effluent Concentration in a Sewage Treatment Process)

  • 민상윤;이승필;김진식;박종운;김만수
    • 대한환경공학회지
    • /
    • 제34권5호
    • /
    • pp.312-315
    • /
    • 2012
  • 본 연구는 Media공법을 적용하고 있는 하수처리장의 실데이터를 활용하여 다중회귀분석을 통해 유출수질을 예측하는 모형을 구현하였다. 다중회귀분석은 2011년 1년간 데이터를 사용하였으며, 변수선택법 적용, 이상치와 영향치 제거, 변수의 로그변환에 따른 CASE별 연구를 수행하였다. 다중회귀분석으로 구축된 예측 모형으로 예측정확도를 검토한 결과, 2차침전지 유출수 $COD_{Mn}$는 0.87 이상, T-N은 0.81 이상으로 검토되었으며, 구축된 다중회귀모형을 이용하여 유출수가 방류수질기준을 초과하지 않는 운전조건의 범위를 설정할 수 있을 것으로 판단된다. 결론적으로 설정된 운전조건 범위 안에서 수질측면과 에너지 비용측면으로 하수처리장 운영시 운전자에게 적절한 운전 가이드를 제공할 수 있을 것으로 판단된다.

다층회귀신경망을 이용한 음성인식 (Speech Recognitioin Using Multilayered Recurrent Neural Networks)

  • 어태경
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.267-271
    • /
    • 1998
  • 신경망에 의한 음절과 연속음성 인식시 동특성처리의 한방법으로 회귀신경망을 이용한다. 본 연구는 비회귀형 상위은닉층과 회귀형 하위은닉층을 가진 4층 구조의 다층회귀신경망으로 예측기를 반들어 나성화자 5명이 CV형 음절 14개, CVC형 음절 14개를 각각 5회씩 발음한 총 700개의 음성중 3회분인 420개 음성으로 학습한 후 나머지 2회분인 280개 음성으로 인식을 평가한다. 입력신호의 예측차수와 상, 하위 은닉층으 뉴런수를 변경시키면서 각각의 인식률을 조사해 본 결과 상위 은닉층의 뉴런이 10개이고 하위 은닉층의 뉴런이 10개와 15개 그리고 예측차수가 3,4차일 때 가장 양호한 인식기로 동작한다는 것을 알 수 있었다. 이 때 나타난 인식률은 Elman 망보다 다소 우세하다.

  • PDF

변수학습 선형회귀와 그 활용 (Variable Learning Linear Regression and its Application)

  • 김재윤;강석원;송왕철;이상준
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.23-24
    • /
    • 2017
  • 선형회귀는 여러 학문에서 변수들 사이의 관계를 설명하고자 할 때 쓰는 방법이다. 하지만 선형 회귀는 입력에 따른 출력이 무조건 선형 구조를 이룰 수밖에 없기 때문에 데이터셋이 곡선형을 이루거나 출력간의 차이가 지속적으로 증가하거나 감소하지 않는 경우 오차가 커질 수밖에 없다. 이를 보완하기 위해 변수를 학습시켜 선형 구조를 이루기 위해 변수가 어느 위치로 가야 하는지를 다시 학습시키는 방법을 사용하여 같은 데이터셋을 가지고 일반 선형회귀와 변수학습 선형회귀 간의 차이를 비교했고, cost가 줄어들며 데이터셋에 좀 더 근접한 모델이 나왔다.

  • PDF

관측 수위자료를 이용한 하류 홍수위 예측기법 (Forecasting Technique of Downstream Water Level using the Observed Water Level)

  • 김상문;최흥식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.354-354
    • /
    • 2017
  • 홍수예경보는 발생되는 홍수의 규모와 시간을 가능한 정확하고 빠르게 예측하여 홍수에 대한 위험성을 사전에 알리고자 하는데 목적이 있다. 따라서 하천범람에 따른 피해를 최소화하기 위한 홍수예경보는 일정시간의 선행시간을 확보하는 것이 매우 중요하다. 본 연구에서는 현재 하천에서 측정되고 있는 수위 관측 자료를 이용하여 하류의 수위를 예측하였다. 수위 예측을 위해 다중회귀모형 및 신경망 모형을 한강의 제1지류인 횡성댐 상류 섬강 시험유역에 적용하였다. 다중회귀모형 및 신경망 모형의 학습에는 섬강 시험유역의 2002년부터 2010년까지의 수위 관측 자료를 이용하였으며, 학습된 모형을 이용하여 30분 이내에 발생 가능한 수위를 예측하였다. 모의 결과 신경망 수위예측모형의 결정계수는 0.967으로 나타났으며, 다중회귀수위예측 모형의 결정계수는 0.815로 나타나 신경망을 이용한 수위예측모형이 다중회귀모형보다 좀 더 나은 예측 결과를 나타내는 것을 확인할 수 있었다. 본 연구결과는 향후 중소하천에서 선행시간을 확보한 홍수 예경보 구축에 활용할 수 있을 것으로 판단된다.

  • PDF

퍼지의사결정을 이용한 교량 구조물의 건전성평가 모델 (Integrity Assessment Models for Bridge Structures Using Fuzzy Decision-Making)

  • 안영기;김성칠
    • 콘크리트학회논문집
    • /
    • 제14권6호
    • /
    • pp.1022-1031
    • /
    • 2002
  • 본 연구에서는 분규ㆍ회귀목-적응 뉴고 퍼지추론 시스템을 사용하여 교량 구조물에 대한 유용한 모델을 제시하였다. 퍼지결정목은 데이터집합의 입력영역이 서로 다른 영역으로 분류되고 하나의 부호나 값으로 나타내지며 데이터 정점에서 특정화시키기 위한 활동영역으로 할당되기도 한다. 분류문제로 사용되는 결정목은 가끔 퍼지결정목이라고 불려지는데, 각 최종점은 주어진 특정백터의 예측등급을 나타낸다. 회귀문제에 사용되는 결정목을 가끔 퍼지회귀목이라고 하는데, 이 때 최종점 영역은 주어진 입력백터의 예측 출력 값을 상수나 방정식으로 나타낼 수 있다. 분류ㆍ회귀목은 관련된 입력값을 선택하여 입력구역에서 분류 할 수 있는 반면에 적응 뉴로 퍼지추론 시스템은 회귀문제를 수정하고 이틀의 회귀문제를 보다 연속적이면서 간략하게 만들 수 있음을 주목해야 한다. 따라서 분류ㆍ회귀목과 적응 뉴로 퍼지추론 시스템은 서로 상보적인 것이며, 이들의 조합은 퍼지모델링을 위해 실직적인 근사식으로 구성된다.

메타회귀분석 편익이전 기법을 이용한 하천 복원 가치 추정 (Estimating River Spatial Restoration Values Using the Meta-regression Benefit Transfer Method)

  • 이희찬;유윤희;노수향
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.6-6
    • /
    • 2017
  • 본 연구의 목적은 독립적으로 수행되어진 하천 복원 가치추정 선행연구들을 대상으로 메타회귀분석을 활용한 편익이전을 제시함으로써, 편익이전의 타당성 및 적용 가능성을 검토하는 데 있다. 문헌검색을 통해 '하천 가치평가', '하천 가치', '물 환경 가치추정', '하천 편익' 등에 관한 자료를 수집하였으며, 총 60편의 연구를 수집했다. 그 중 중복된 연구를 제외하고 가치추정 단위를 '원/년/가구'로 통일함으로써 51편의 연구를 분석에 사용했으며, 90개의 가치 추정치가 실증분석에 사용되었다. 본 연구는 국내에서 수행된 하천 복원 가치 추정연구를 집대성하여 DB를 구축하고 요약통계량을 중심으로 선행연구 결과를 기술하였으며, 메타회귀분석을 실시한 후, policy site의 특성과 조건에 맞게 함수를 조정하고, 조정된 함수를 사용하여 policy site의 가치를 예측하였다. 종속변수로는 총 가치(원/년/가구, 2015년 불변가격)가, 독립변수로는 하천유형, 위치, 규모, 환경 서비스특성, 그리고 방법론 특성, 지불형태, 대상지 사회경제적 특성 변수들이 포함되었다. 모형의 추정결과 조정된 값은.420으로써 종속변수 총변이의 42.0%를 모형이 설명하는 것으로 나타났다. 메타회귀분석을 통해 본류에서 멀어지는 소규모하천일수록 하천의 경제적 가치를 더 크게 느끼는 것으로 나타났으며, 전체적인 영향력 크기를 고려해 본다면 하천을 복원할 때 수질정화기능, 서식지기능, 이수기능, 치수기능, 여가 및 수변공간으로의 기능 순으로 고려하는 것이 하천의 가치를 보다 높일 수 있을 것으로 보였다. 또한 지불방법은 매월, 인당 지불하는 것으로 제시할 때 경제적 가치 추정치를 높일 수 있는 것으로 해석되었다. 모델추정 결과를 활용한 함수이전에서는 만경강의 특성을 반영하고 조정함으로써 만경강의 가치를 추정하였으며, 모형으로부터 얻은 만경강 가치 예측치는 가구당 매년 41,214원으로 추정되었다. 본 연구의 메타회귀분석은 선행연구를 객관적으로 종합할 수 있는 분석의 틀로서 충분한 활용 타당성이 인정되는 것으로 보이며, 편익이전 시에 policy site의 자원특성과 조건에 맞춰 함수를 조정하여 예측치를 제시함으로써 메타회귀분석 함수이전의 융통성을 보여주었다. 이에 메타회귀분석을 통한 편익이전은 타당성 및 적용 가능성 측면에서 긍정적으로 판단된다.

  • PDF