• 제목/요약/키워드: 선형회귀식

검색결과 411건 처리시간 0.035초

다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가 (Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient)

  • 이선미;박인환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

건강검진 빅데이터를 이용한 선형 및 다중회귀분석 기반 헤모글로빈 추정 방법에 관한 연구 (A Study on the Estimation Method of Hemoglobin Based on Linear and Multiple Regression Analysis Using Health Examination Big Data)

  • 홍상훈;홍광석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.553-555
    • /
    • 2021
  • 빈혈의 유병률은 매년 증가하고 있으나 이를 가벼운 질병으로 인식해 치료 시기를 놓치는 환자들이 존재한다. 빈혈의 발생원인으로 혈액 내 헤모글로빈 및 헤모글로빈 내 철 부족이 있으며, 헤모글로빈 측정기술의 경우 채혈 이외에 사람의 신체 및 건강 정보를 적용한 사례는 찾아보기 어렵다. 본 논문에서는 신체(키, 몸무게 및 허리둘레) 및 건강 정보(혈청지오티, 이완기 혈압 및 감마지티피 등)가 포함된 건강검진 빅데이터를 이용하여 단일 특징에 대해 선형회귀분석을 수행하고, 다중 특징에 대해 다중회귀분석을 수행하여 회귀분석 식을 산출, 산출된 회귀분석 식을 통해 헤모글로빈을 추정하여 실제 헤모글로빈값과 오차율을 계산하고 비교한다. 실험 결과, 선형회귀분석 식을 통해 헤모글로빈을 추정하였을 때 평균 8.124%의 오차율이 계산되었으며, 다중회귀분석의 경우 선형회귀분석보다 낮은 6.767%의 오차율이 계산되었다.

뉴럴 네트워크 및 선형 회귀식을 이용한 줄눈 콘크리트 포장의 한계 응력 계산 (Calculation Of Critical Stress On Jointed Concrete Pavement By Using Neural Networks & Linear Regression Models)

  • 강태욱;류성우;김성민;조윤호
    • 한국도로학회논문집
    • /
    • 제10권3호
    • /
    • pp.129-138
    • /
    • 2008
  • 기존 콘크리트 포장의 단면 설계 시 발생하는 문제점을 해결하기 위해 유한 요소법(FEM)을 이용하여 것이 하나의 방법론으로 부각되었으며 현재 한국형 포장 설계법 개발 연구에서도 적용 중에 있다. 본 연구에서는 ABAQUS와 포트란 해석 프로그램을 이용하여 콘크리트 포장의 한계 응력을 계산하였고, 그 결과를 뉴럴 네트워크와 선형 회귀식을 이용하여 비교 분석하였다. 입력 변수가 많지만 다양한 해석을 하지 못하는 경우(입력변수 6개에 대해 81 경우 수 해석)에 대해 구조해석 결과를 뉴럴 네트워크(이하 NN: Neural Networks)와 선형 회귀식으로 비교한 결과, 구조해석 결과와 다소 차이가 있음을 확인하였다. 반면 입력 변수를 줄이되 다양한 경우에 해석한 경우(입력 변수 3개에 대해 343 경우의 수)의 분석 결과, NN과 선형 회귀식이 구조해석 결과와 매우 유사한 결과가 나타나는 것을 알 수 있었다. 하지만 그래프의 (0,0), (1,1) 부분에서 NN이 선형 회귀식에 비해 더 정확한 것을 확인하였다. 이와 같은 연구 결과를 통해서 한국형 포장 설계법의 핵심인 응력 계산 모듈을 선형 회귀식보다 좀 더 정확한 NN으로 해석하는 것을 제안하였다.

  • PDF

엔트로피 방법과 선형회귀식을 이용한 모니터링 지점선정 (Determing the Monitoring Point using Entropy Method and Linear Regression)

  • 류승현;송양호;이정호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.111-112
    • /
    • 2012
  • 하수관거시스템(sewer system)의 효율적인 관리를 위해서는 관거 내의 유출, 수질, 불명수 및 CSOs(Combine Sewer Overflows)등에 대한 지속적인 모니터링이 필요하다. 그런데 하나의 유역 하수관거시스템에서 모든 지점에 대한 모니터링은 예산의 제약으로 인하여 불가능하다. 따라서 모니터링 지점들은 주어진 예산 내에서 최대의 효율적인 자료의 획득이 가능한 지점들로 선정되어야한다. 그럼에도 불구하고 모니터링의 지점의 선정에 대한 명확한 기준 및 선정된 모니터링 지점에서 획득된 자료에 대한 정량화된 평가방법에 대한 연구는 미흡한 실정이다. 따라서 본 연구에서는 엔트로피 방법과 선형회귀식을 이용하여 상류 유출을 통한 하류 유출을 예측할 수 있는 모니터링 지점을 선정하는 방법을 제시하였다. 검증결과 제시된 회귀식은 안정적으로 하류 유출을 예측할 수 있는 것으로 나타났다. 본 연구에서 산정한 회귀식을 사용하여 하류 유출의 사전 예측이 가능할 것으로 판단된다.

  • PDF

나이브 베이즈 분류와 기상예보자료 기반의 농업용 저수지 저수율 전망을 위한 저수율 예측 다중선형 회귀모형 개발 (Development of Multiple Linear Regression Model to Predict Agricultural Reservoir Storage based on Naive Bayes Classification and Weather Forecast Data)

  • 김진욱;정충길;이지완;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.112-112
    • /
    • 2018
  • 최근 이상기후로 인한 국부적인 혹은 광역적인 가뭄이 빈번하게 발생하고 있는 추세이며 발생횟수 뿐 아니라 가뭄 심도 및 지속기간이 과거보다 크게 증가하여 그에 따른 피해가 커질 것으로 예측되고 있다. 특히, 2014~2015년도의 유례없는 가뭄으로 인해 저수지 용수공급이 제한되면서 많은 농가들이 피해를 입었다. 본 연구의 목적은 전국 농업용 저수지를 대상으로 기상청 3개월 예보자료를 활용 할 수 있는 농업용 저수지 저수율 다중선형 회귀 모형을 개발하여 저수율 전망정보를 생산하는 것이다. 본 연구에서는 전국에 적용 가능한 저수율 다중선형 회귀 모형개발을 위해 5개의 기상요소(강수량, 최고기온, 최저기온, 평균기온, 평균풍속)와 관측 저수지 저수율을 활용했다. 기상자료는 2002년부터 2017년까지의 기상청 63개 지상관측소로부터 기상관측자료를 수집하였다. 본 연구에서는 저수율 전망 단계를 세 단계로 나누었다. 첫 번째 단계로 농어촌공사에서 전국 511개 용수구역을 대상으로 군집분석 및 의사결정나무 분석을 통해 제시한 65개 대표저수지를 대상으로 기상자료 및 관측 저수율 자료를 이용하여 다중선형 회귀분석을 실시하였다. 수집한 기상요소와 저수율을 독립변수로 하여 월별 회귀식을 산정한 결과 결정계수($R^2$)는 0.51~0.95로 나타났다. 두 번째 단계로 대표저수지의 회귀분석 결과를 전국의 저수지로 확대하기 위해 나이브 베이즈 분류법을 적용하여 전국 3098개의 저수지를 65의 군집으로 분류하고 각각의 군집에 해당되는 월별 회귀식을 산정하였다. 마지막으로 전국 저수지로 산정된 회귀식과 농업 가뭄 예측을 위해 기상청의 GS5(Global Seasonal Forecasting System 5) 3개월 예보자료를 수집하여 회귀식에 적용해 2017년 전국 저수지의 3개월 저수율 전망정보를 생산하였다. 본 연구의 전국 저수지 군집결과 기반의 저수율 전망기술은 2017년도 관측 저수율과 비교한 결과 유의한 상관성을 나타냈으며 이 결과는 추후 농업용 저수지의 물 공급 및 농업가뭄 전망 자료로서 이용이 가능할 것으로 판단된다.

  • PDF

비선형회귀분석을 위한 통계소프트웨어 NLIN2000 (Introduction of a Nonlinear Regression Analysis System NLIN2000)

  • 강근석;심규호
    • 응용통계연구
    • /
    • 제17권1호
    • /
    • pp.173-184
    • /
    • 2004
  • Window환경 하에서 사용이 간편하면서도 다양한 통계량을 제공하는 비선형회귀분석을 위 한 통계소프트웨어 NLIN2000을 소개한다. 기존의 DOS용 프로그램을 업그레이드한 것으로 다른 통계 팩키지들에 비하여 모형식의 설정 및 적합과정이 간편하고, 모형식 저장 및 삭제, 모형식 형태 보기 등의 기능을 제공한다. NLIN2000은 비선형회귀분석에 대한 통계적 이론을 연구하는 통계전공자들에게 필수적인 각종 통계량을 제공해줄 뿐만 아니라, 실제 현장에서 비선형모형을 사용하여 분석하는 다른 학문분야의 연구자들에게도 유용하게 사용될 수 있다.

추세 제거된 시계열을 이용한 단위근 식별 (Determining the existence of unit roots based on detrended data)

  • 나옥경
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.205-223
    • /
    • 2021
  • 본 논문에서는 adaptive lasso 방법을 이용하여 단위근의 존재 여부를 판단하는 방법에 대해 연구하였다. 최근 원 시계열에 상수항과 선형 추세가 포함된 ADF-회귀모형식을 adaptive lasso로 추정하여 단위근을 식별하는 방법이 제안되었으나, 미지의 선형 추세가 존재할 때 검정력이 떨어지는 것으로 나타났다. 이 문제를 해결하기 위해 본 논문에서는 ADF-회귀모형식을 적합시킬 때 원 시계열 대신 선형 추세가 제거된 시계열을 사용하는 수정안을 제안하였다. 그리고 수정안에서는 일차적으로 선형 추세를 제거한 후 모형식을 적합시키기 때문에 ADF-회귀모형식 중 상수항과 선형 추세를 모두 포함하지 않는 모형식을 사용하였다. 기존의 방법보다 수정안을 사용할 때 단위근의 존재를 판단하는 검정력이 향상되는지 모의실험을 통해 검토하였으며, ADF 검정과 DF-GLS 검정과의 비교 실험도 진행하였다. 모의실험 결과 adaptive lasso를 이용하여 단위근의 존재를 판단할 때 원 시계열보다 추세가 제거된 시계열을 사용하는 경우가 높은 정확도를 가지며, 자료의 개수가 충분히 많을 때 단위근을 잘 판단함을 확인할 수 있었다.

지질조건에 따른 자연사면 토층의 투수계수 산정모델 제안 (Proposal of Models to Estimate the Coefficient of Permeability of Soils on the Natural Terrain considering Geological Conditions)

  • 전덕찬;송영석;한신인
    • 지질공학
    • /
    • 제20권1호
    • /
    • pp.35-45
    • /
    • 2010
  • 본 연구에서는 10여년 동안 국내 산사태 발생지역 및 인근 미발생지역에서 채취된 자연사면에서의 토층을 대상으로 획득된 약 1,150여개소의 토질시험결과를 토대로 지질조건에 따른 토층의 평균 물성치를 산정하고, 통계적인 분석을 실시하여 지질조건별 투수계수에 대한 간편식을 제안하였다. 투수계수는 화강암지역과 이암지역에서 큰 것으로 나타났으며, 세립토함유량은 이암지역과 편마암지역에서 큰 것으로 나타났다. 지질조건에 따른 토층의 투수계수를 산정하기 위해서 상관성 분석을 실시한 결과 종속변수를 투수계수로 하고 독립변수를 세립토함유량, 함수비, 건조단위중량 및 간극비로 선정하였다. 회귀분석결과 지질조건별 제안된 선형회귀식에서는 공통적으로 세립토함유량 및 간극비가 가장 많이 포함되었다. 제안된 선형회귀식을 검증하기 위하여 타 지역의 토층을 대상으로 수행된 투수계수 측정결과와 선형회귀식으로 예측된 결과를 서로 비교하였다. 비교결과 일부 측정된 결과와 예측된 결과가 차이가 있는 것으로 나타났으나, 그 차이는 비교적 작은 것으로 나타났다. 본 연구에서 제안된 지질조건별 투수계수 산정을 위한 선형회귀식은 국내 지반을 대상으로 적용이 가능할 것으로 판단되나, 추후 지속적인 검증 및 수정이 필요할 것으로 판단된다.

Shrinkage Structure of Ridge Partial Least Squares Regression

  • Kim, Jong-Duk
    • Journal of the Korean Data and Information Science Society
    • /
    • 제18권2호
    • /
    • pp.327-344
    • /
    • 2007
  • 다중공선성의 데이터에 사용되는 대표적인 편향회귀방법은 능형회귀(RR), 주성분회귀(PCR), 부분최소제곱회귀(PLS) 등이다. 이 회귀방법들은 계수베거 추정량의 놈(norm)이 모두 보통 최소제곱회귀(OLS)의 추정량의 놈보다 작아진다는 의미에서 축소회귀라 부른다. 새로운 회귀방법으로 RR과 PCR을 결합한 능형주성분회귀(RPCR)가 있고 RR과 PLS를 결합한 능형부분최소제곱회귀(RPLS)가 있으며 이들도 또한 축소회귀이다. 이들 추정량은 X'X의 고유벡터들의 선형결합으로 나타낼 수 있고 따라서 각 고유방향에서 OLS에 비해 얼마나 축소되는지를 연구할 수 있다. 본 논문에서는 먼저 이들 추정량을 일반적인 축소인자의 식으로 나타내고 이를 이용하여 MSE의 일반식을 구하였으며 PLS 추정량의 MSE 식도 구하였다. 그리고 RPLS의 축소인자 식을 두 가지 다른 형태로 유도하였다. RPLS의 경우도 이 축소인자 식을 MSE의 일반식에 대입하면 MSE 식이 바로 얻어진다. 그러나 PLS나 RPLS의 축소인자는 y의 복잡한 비선형이 되어 결정적이 아니므로 이들 추정량의 MSE는 근사적인 식이라 할 수 있다. 따라서 PLS나 RPLS를 평가하기 위해 이 MSE를 사용하는 것은 제한적이며, 경험적인 방법으로 이들 회귀의 수행성을 평가하는 것이 필요하다. 다중공선성의 대표적인 데이터인 근적외선 분광 데이터를 이용하여 이 유도된 회귀의 축소인자 값이 인자수에 따라 어떻게 변화하는지와 전체적인 축소 비율도 살펴보았다. 이들의 축소 형태를 잘 이해하면 회귀방법들의 예측력과 안정성을 파악하는데 많은 도움이 되리라 판단된다.

  • PDF

반복선형회귀를 이용한 수신 신호 세기와 이동성 정보에 기반한 1차원 위치 추정 (One-dimensional Positioning using Iterative Linear Regression Based on Received Signal Strength and Mobility Information)

  • 이동준;김다영;이은혜
    • 한국항행학회논문지
    • /
    • 제24권2호
    • /
    • pp.128-133
    • /
    • 2020
  • 본 연구에서는 위치추정을 하는 경우 선형회귀법을 반복적으로 적용하여 신호의 경로 손실을 추정하는 방법을 제안한다. 제안한 방식에서는 단말이 이동하면서 여러 위치에서 측정한 수신신호세기와 가속도계로 구한 측정 위치들 사이의 거리 정보를 이용하여 전송 비콘부터의 경로 손실을 선형회귀를 이용하여 추정한다. 전송 비콘과 특정 위치사이의 거리에 대하여 여러 잠정값들을 가정하고, 각 잠정값에 대하여 선형회귀식을 구한다. 이 선형회귀식들 중에서, 기준 수신 세기에 가장 가까운 식을 이용하여 송신 비콘와 목표 위치사이 거리를 구한다. 테스트 결과, 제안 방식은 단순 경로 손실 모델보다 훨씬 더 높은 정확도를 보인다.