• 제목/요약/키워드: 선형 회귀식

검색결과 411건 처리시간 0.03초

뉴럴 네트워크 및 선형 회귀식을 이용한 줄눈 콘크리트 포장의 한계 응력 계산 (Calculation Of Critical Stress On Jointed Concrete Pavement By Using Neural Networks & Linear Regression Models)

  • 강태욱;류성우;김성민;조윤호
    • 한국도로학회논문집
    • /
    • 제10권3호
    • /
    • pp.129-138
    • /
    • 2008
  • 기존 콘크리트 포장의 단면 설계 시 발생하는 문제점을 해결하기 위해 유한 요소법(FEM)을 이용하여 것이 하나의 방법론으로 부각되었으며 현재 한국형 포장 설계법 개발 연구에서도 적용 중에 있다. 본 연구에서는 ABAQUS와 포트란 해석 프로그램을 이용하여 콘크리트 포장의 한계 응력을 계산하였고, 그 결과를 뉴럴 네트워크와 선형 회귀식을 이용하여 비교 분석하였다. 입력 변수가 많지만 다양한 해석을 하지 못하는 경우(입력변수 6개에 대해 81 경우 수 해석)에 대해 구조해석 결과를 뉴럴 네트워크(이하 NN: Neural Networks)와 선형 회귀식으로 비교한 결과, 구조해석 결과와 다소 차이가 있음을 확인하였다. 반면 입력 변수를 줄이되 다양한 경우에 해석한 경우(입력 변수 3개에 대해 343 경우의 수)의 분석 결과, NN과 선형 회귀식이 구조해석 결과와 매우 유사한 결과가 나타나는 것을 알 수 있었다. 하지만 그래프의 (0,0), (1,1) 부분에서 NN이 선형 회귀식에 비해 더 정확한 것을 확인하였다. 이와 같은 연구 결과를 통해서 한국형 포장 설계법의 핵심인 응력 계산 모듈을 선형 회귀식보다 좀 더 정확한 NN으로 해석하는 것을 제안하였다.

  • PDF

다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가 (Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient)

  • 이선미;박인환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

건강검진 빅데이터를 이용한 선형 및 다중회귀분석 기반 헤모글로빈 추정 방법에 관한 연구 (A Study on the Estimation Method of Hemoglobin Based on Linear and Multiple Regression Analysis Using Health Examination Big Data)

  • 홍상훈;홍광석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.553-555
    • /
    • 2021
  • 빈혈의 유병률은 매년 증가하고 있으나 이를 가벼운 질병으로 인식해 치료 시기를 놓치는 환자들이 존재한다. 빈혈의 발생원인으로 혈액 내 헤모글로빈 및 헤모글로빈 내 철 부족이 있으며, 헤모글로빈 측정기술의 경우 채혈 이외에 사람의 신체 및 건강 정보를 적용한 사례는 찾아보기 어렵다. 본 논문에서는 신체(키, 몸무게 및 허리둘레) 및 건강 정보(혈청지오티, 이완기 혈압 및 감마지티피 등)가 포함된 건강검진 빅데이터를 이용하여 단일 특징에 대해 선형회귀분석을 수행하고, 다중 특징에 대해 다중회귀분석을 수행하여 회귀분석 식을 산출, 산출된 회귀분석 식을 통해 헤모글로빈을 추정하여 실제 헤모글로빈값과 오차율을 계산하고 비교한다. 실험 결과, 선형회귀분석 식을 통해 헤모글로빈을 추정하였을 때 평균 8.124%의 오차율이 계산되었으며, 다중회귀분석의 경우 선형회귀분석보다 낮은 6.767%의 오차율이 계산되었다.

나이브 베이즈 분류와 기상예보자료 기반의 농업용 저수지 저수율 전망을 위한 저수율 예측 다중선형 회귀모형 개발 (Development of Multiple Linear Regression Model to Predict Agricultural Reservoir Storage based on Naive Bayes Classification and Weather Forecast Data)

  • 김진욱;정충길;이지완;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.112-112
    • /
    • 2018
  • 최근 이상기후로 인한 국부적인 혹은 광역적인 가뭄이 빈번하게 발생하고 있는 추세이며 발생횟수 뿐 아니라 가뭄 심도 및 지속기간이 과거보다 크게 증가하여 그에 따른 피해가 커질 것으로 예측되고 있다. 특히, 2014~2015년도의 유례없는 가뭄으로 인해 저수지 용수공급이 제한되면서 많은 농가들이 피해를 입었다. 본 연구의 목적은 전국 농업용 저수지를 대상으로 기상청 3개월 예보자료를 활용 할 수 있는 농업용 저수지 저수율 다중선형 회귀 모형을 개발하여 저수율 전망정보를 생산하는 것이다. 본 연구에서는 전국에 적용 가능한 저수율 다중선형 회귀 모형개발을 위해 5개의 기상요소(강수량, 최고기온, 최저기온, 평균기온, 평균풍속)와 관측 저수지 저수율을 활용했다. 기상자료는 2002년부터 2017년까지의 기상청 63개 지상관측소로부터 기상관측자료를 수집하였다. 본 연구에서는 저수율 전망 단계를 세 단계로 나누었다. 첫 번째 단계로 농어촌공사에서 전국 511개 용수구역을 대상으로 군집분석 및 의사결정나무 분석을 통해 제시한 65개 대표저수지를 대상으로 기상자료 및 관측 저수율 자료를 이용하여 다중선형 회귀분석을 실시하였다. 수집한 기상요소와 저수율을 독립변수로 하여 월별 회귀식을 산정한 결과 결정계수($R^2$)는 0.51~0.95로 나타났다. 두 번째 단계로 대표저수지의 회귀분석 결과를 전국의 저수지로 확대하기 위해 나이브 베이즈 분류법을 적용하여 전국 3098개의 저수지를 65의 군집으로 분류하고 각각의 군집에 해당되는 월별 회귀식을 산정하였다. 마지막으로 전국 저수지로 산정된 회귀식과 농업 가뭄 예측을 위해 기상청의 GS5(Global Seasonal Forecasting System 5) 3개월 예보자료를 수집하여 회귀식에 적용해 2017년 전국 저수지의 3개월 저수율 전망정보를 생산하였다. 본 연구의 전국 저수지 군집결과 기반의 저수율 전망기술은 2017년도 관측 저수율과 비교한 결과 유의한 상관성을 나타냈으며 이 결과는 추후 농업용 저수지의 물 공급 및 농업가뭄 전망 자료로서 이용이 가능할 것으로 판단된다.

  • PDF

엔트로피 방법과 선형회귀식을 이용한 모니터링 지점선정 (Determing the Monitoring Point using Entropy Method and Linear Regression)

  • 류승현;송양호;이정호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.111-112
    • /
    • 2012
  • 하수관거시스템(sewer system)의 효율적인 관리를 위해서는 관거 내의 유출, 수질, 불명수 및 CSOs(Combine Sewer Overflows)등에 대한 지속적인 모니터링이 필요하다. 그런데 하나의 유역 하수관거시스템에서 모든 지점에 대한 모니터링은 예산의 제약으로 인하여 불가능하다. 따라서 모니터링 지점들은 주어진 예산 내에서 최대의 효율적인 자료의 획득이 가능한 지점들로 선정되어야한다. 그럼에도 불구하고 모니터링의 지점의 선정에 대한 명확한 기준 및 선정된 모니터링 지점에서 획득된 자료에 대한 정량화된 평가방법에 대한 연구는 미흡한 실정이다. 따라서 본 연구에서는 엔트로피 방법과 선형회귀식을 이용하여 상류 유출을 통한 하류 유출을 예측할 수 있는 모니터링 지점을 선정하는 방법을 제시하였다. 검증결과 제시된 회귀식은 안정적으로 하류 유출을 예측할 수 있는 것으로 나타났다. 본 연구에서 산정한 회귀식을 사용하여 하류 유출의 사전 예측이 가능할 것으로 판단된다.

  • PDF

비선형회귀분석을 위한 통계소프트웨어 NLIN2000 (Introduction of a Nonlinear Regression Analysis System NLIN2000)

  • 강근석;심규호
    • 응용통계연구
    • /
    • 제17권1호
    • /
    • pp.173-184
    • /
    • 2004
  • Window환경 하에서 사용이 간편하면서도 다양한 통계량을 제공하는 비선형회귀분석을 위 한 통계소프트웨어 NLIN2000을 소개한다. 기존의 DOS용 프로그램을 업그레이드한 것으로 다른 통계 팩키지들에 비하여 모형식의 설정 및 적합과정이 간편하고, 모형식 저장 및 삭제, 모형식 형태 보기 등의 기능을 제공한다. NLIN2000은 비선형회귀분석에 대한 통계적 이론을 연구하는 통계전공자들에게 필수적인 각종 통계량을 제공해줄 뿐만 아니라, 실제 현장에서 비선형모형을 사용하여 분석하는 다른 학문분야의 연구자들에게도 유용하게 사용될 수 있다.

추세 제거된 시계열을 이용한 단위근 식별 (Determining the existence of unit roots based on detrended data)

  • 나옥경
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.205-223
    • /
    • 2021
  • 본 논문에서는 adaptive lasso 방법을 이용하여 단위근의 존재 여부를 판단하는 방법에 대해 연구하였다. 최근 원 시계열에 상수항과 선형 추세가 포함된 ADF-회귀모형식을 adaptive lasso로 추정하여 단위근을 식별하는 방법이 제안되었으나, 미지의 선형 추세가 존재할 때 검정력이 떨어지는 것으로 나타났다. 이 문제를 해결하기 위해 본 논문에서는 ADF-회귀모형식을 적합시킬 때 원 시계열 대신 선형 추세가 제거된 시계열을 사용하는 수정안을 제안하였다. 그리고 수정안에서는 일차적으로 선형 추세를 제거한 후 모형식을 적합시키기 때문에 ADF-회귀모형식 중 상수항과 선형 추세를 모두 포함하지 않는 모형식을 사용하였다. 기존의 방법보다 수정안을 사용할 때 단위근의 존재를 판단하는 검정력이 향상되는지 모의실험을 통해 검토하였으며, ADF 검정과 DF-GLS 검정과의 비교 실험도 진행하였다. 모의실험 결과 adaptive lasso를 이용하여 단위근의 존재를 판단할 때 원 시계열보다 추세가 제거된 시계열을 사용하는 경우가 높은 정확도를 가지며, 자료의 개수가 충분히 많을 때 단위근을 잘 판단함을 확인할 수 있었다.

Shrinkage Structure of Ridge Partial Least Squares Regression

  • Kim, Jong-Duk
    • Journal of the Korean Data and Information Science Society
    • /
    • 제18권2호
    • /
    • pp.327-344
    • /
    • 2007
  • 다중공선성의 데이터에 사용되는 대표적인 편향회귀방법은 능형회귀(RR), 주성분회귀(PCR), 부분최소제곱회귀(PLS) 등이다. 이 회귀방법들은 계수베거 추정량의 놈(norm)이 모두 보통 최소제곱회귀(OLS)의 추정량의 놈보다 작아진다는 의미에서 축소회귀라 부른다. 새로운 회귀방법으로 RR과 PCR을 결합한 능형주성분회귀(RPCR)가 있고 RR과 PLS를 결합한 능형부분최소제곱회귀(RPLS)가 있으며 이들도 또한 축소회귀이다. 이들 추정량은 X'X의 고유벡터들의 선형결합으로 나타낼 수 있고 따라서 각 고유방향에서 OLS에 비해 얼마나 축소되는지를 연구할 수 있다. 본 논문에서는 먼저 이들 추정량을 일반적인 축소인자의 식으로 나타내고 이를 이용하여 MSE의 일반식을 구하였으며 PLS 추정량의 MSE 식도 구하였다. 그리고 RPLS의 축소인자 식을 두 가지 다른 형태로 유도하였다. RPLS의 경우도 이 축소인자 식을 MSE의 일반식에 대입하면 MSE 식이 바로 얻어진다. 그러나 PLS나 RPLS의 축소인자는 y의 복잡한 비선형이 되어 결정적이 아니므로 이들 추정량의 MSE는 근사적인 식이라 할 수 있다. 따라서 PLS나 RPLS를 평가하기 위해 이 MSE를 사용하는 것은 제한적이며, 경험적인 방법으로 이들 회귀의 수행성을 평가하는 것이 필요하다. 다중공선성의 대표적인 데이터인 근적외선 분광 데이터를 이용하여 이 유도된 회귀의 축소인자 값이 인자수에 따라 어떻게 변화하는지와 전체적인 축소 비율도 살펴보았다. 이들의 축소 형태를 잘 이해하면 회귀방법들의 예측력과 안정성을 파악하는데 많은 도움이 되리라 판단된다.

  • PDF

Gumbel 분포를 이용한 전국의 비정상성 빈도 해석 (National Nonstationary Frequence Analysis Using for Gumbel Distribution)

  • 김광섭;이기춘
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.379-379
    • /
    • 2011
  • 본 연구는 우리나라 전국 기상관측소 중 1973년부터 2009년까지의 시 강수자료가 구축되어 있는 기상관측소 55개 지점에 대하여 비정상성 빈도해석을 수행하였다. 각 지점에 대하여 지속시간 1시간, 24시간에 대한 연 최대 강수량 자료를 구축하여 초기 20년을 기준으로 1년씩 추가한 연 최대 강수량 누적 자료를 생성하고, 생성된 기간별 자료의 평균, 위치매개변수, 축척매개변수를 산정하였으며, 위치매개변수와 축척매개변수는 확률가중모멘트법을 사용하여 산정하였다. 산정된 연 최대 평균 누적 강수량과 연도와의 선형 회귀식을 산정하여 목표연도별(2040, 2070, 2100년) 평균 강수량을 산정하였고, 위치매개변수와 축척매개변수도 평균 누적 강수량과의 선형 회귀식을 산정함으로써, 목표연도에 해당하는 각 매개변수를 산정하였다. 또한 산정된 목표연도별 평균 강수량, 위치매개변수와 축척매개변수를 이용해 확률강수량을 산정하였다. 비정상성 빈도해석을 수행하여 산정된 55개 지점에 대한 목표연도별 확률강수량을 Inverse Distance Weighted(IDW) 보간법을 사용하여 전국의 확률강수량을 공간적으로 표현하였다. 전국단위의 비정상성 빈도해석을 실시한 결과, 전체적으로 각 목표연도별 확률강수량이 증가하는 것으로 나타났으나, 일부 감소하는 지역도 나타났다. 경기도와 강원도 등 중부지역에서 확률강수량의 증가가 큰 것으로 나타났으며, 특히 강원도(강릉, 인재 등) 지역에서 확률강수량의 증가폭이 가장 크게 나타났다. 또한 남해지역에서는 대부분 확률강수량이 감소하는 것으로 나타났고, 그중에서 전라남도 남해안 부근(장흥 등)에 확률강수량의 감소가 가장 크게 나타났으며, 경북지역과 전북지역 부근에서는 증가 또는 감소의 차이가 미비하게 나타났다. 하지만 목표연도 2070년과 2100년에 대하여 산정된 확률강수량으로부터 선형 회귀식을 통해 목표연도별 평균 강수량, 위치매개변수, 축척매개변수를 추정하여 확률강수량을 산정하는 것에 한계가 있음을 보여주었다.

  • PDF

기상자료기반 다중선형회귀분석에 의한 농업용 저수지 월단위 저수율 예측 및 저수지 가뭄지수(RDI) 추정 (Forecasting Monthly Agricultural Reservoir Storage and Estimation of Reservoir Drought Index (RDI) Using Meteorological Data Based Multiple Linear Regression Analysis)

  • 이지완;김진욱;정충길;김성준
    • 한국지리정보학회지
    • /
    • 제21권3호
    • /
    • pp.19-34
    • /
    • 2018
  • 본 논문의 목적은 농업용 저수지 저수율 계측자료와 기상인자와의 다중선형회귀분석을 통해 저수율 예측 월단위 회귀식을 산정하는데 있다. 2002년부터 2016년까지의 한국농어촌공사 저수지 3,067개에 대한 저수율 관측자료와 기상청 63개 지점 관측자료를 수집하여 저수율 예측 다중선형 회귀식을 도출하였으며, 개발된 월별 회귀식에 대한 $R^2$는 0.51~0.95로 분석되었다. 또한 회귀식의 적용성 평가를 위해 9개 대표저수지에 대해 관측값과 비교한 $R^2$는 0.44~0.81로 나타났다. 회귀식을 이용하여 평년(1976-2005) 대비 저수지 가뭄지수(Reservoir Drought Index, RDI)를 산정하여 ROC 분석을 수행한 결과, 극심한 가뭄의 경우 2년(2015~2016) 평균 적중률은 0.64로 겨울의 적중률이 0.70으로 가장 높았고, 여름의 적중률이 0.58로 가장 낮게 나타났으며, 봄과 가을의 적중률은 각각 0.59, 0.68로 분석되었다. 본 연구에서 도출한 회귀식은 가용한 관측자료 및 1~3개월의 장기 기상전망자료 기반의 월단위 저수율 전망자료 생산이 가능하므로, 이를 기반으로 농업가뭄 전망정보의 생산이 가능할 것으로 판단된다.