• 제목/요약/키워드: 비선형 다중회귀분석

검색결과 130건 처리시간 0.027초

풍속 예측을 위한 선형회귀분석과 비선형회귀분석 기법의 비교 및 인자분석 (Comparison of Linear and Nonlinear Regressions and Elements Analysis for Wind Speed Prediction)

  • 김동연;서기성
    • 한국지능시스템학회논문지
    • /
    • 제25권5호
    • /
    • pp.477-482
    • /
    • 2015
  • 단기풍속 예측을 위한 진화적 선형 및 비선형 회귀분석 기반의 보정 기법을 비교한다. 모델의 체계적 오류를 교정하기 위한 효율적인 MOS(Model Output Statistics)의 개발이 필요하나, 기존의 선형회귀분석 기반의 보정기법은 다양한 기상요소의 복잡한 비선형 특성을 반영하기 힘들다. 이를 개선하기 위해서 유전 프로그래밍을 사용하여 풍속 예측에 대한 비선형 보정 수식을 생성하는 기법을 제안하고 기본 다중선형회귀분석법 및 Ridge, Lasso 회귀분석법과 비교한다. 더불어, 선형회귀분석법과 진화적 비선형회귀분석 기법의 인자 선택의 차이와 유사성을 비교하고 분석한다. 2007년~2013년의 KLAPS(Korea Local Analysis and Prediction System) 재분석자료를 사용하여 제주도와 부산지역의 격자점에 대한 실험을 수행한다.

다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가 (Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient)

  • 이선미;박인환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

임상의를 위한 다변량 분석의 실제 (Multivariate Analysis for Clinicians)

  • 오주한;정석원
    • Clinics in Shoulder and Elbow
    • /
    • 제16권1호
    • /
    • pp.63-72
    • /
    • 2013
  • 임상 의학의 연구에 사용되는 대표적 다변량 분석 방법은 다중 회귀 분석 방법인데, 이는 인과 관계를 토대로 여러 개의 변수에 의한 한꺼번에의 영향력을 분석하기 위한 방법이다. 다중 회귀 분석은 기본적으로 회귀 분석의 기본 가정을 만족해야 함은 물론, 여러 개의 독립 변수들이 포함되기 때문에 변수들을 모형에 포함시키는 방법 및 다중 공선성 문제에 대한 고려가 필요하다. 다중 회귀 분석 모형의 설명력은 결정 계수 $R^2$으로 표현되어 1에 가까울수록 설명력이 크며, 각 독립 변수들의 결과에의 영향력은 회귀 계수인 ${\beta}$값으로 표현된다. 다중 회귀 분석은 종속 변수의 형태에 따라 다중 선형 회귀 분석, 다중 로지스틱 회귀 분석, 콕스 회귀 분석으로 나눌 수 있다. 종속 변수가 연속 변수인 경우 다중 선형 회귀 분석, 범주형 변수인 경우 다중 로지스틱 회귀 분석, 시간의 영향을 고려한 상태 변수인 경우는 콕스 회귀 분석을 시행해야 하며, 각각 결과에의 영향력은 회귀 계수 ${\beta}$, 교차비, 위험비로 평가한다. 이러한 다변량 분석에 대한 이해는 연구를 계획하고 결과를 분석하고자 하는 임상 의사에게 있어 보다 효율적인 연구를 위해 필수적인 소양이라고 할 수 있다.

해성점토의 물리적 특성과 압축지수의 상관성 (Relationship Between Physical Properties and Compression Index for Marine Clay)

  • 김동후;김기웅;백영식
    • 한국지반공학회논문집
    • /
    • 제19권6호
    • /
    • pp.371-378
    • /
    • 2003
  • 한반도 서, 남해안 해성점토에 대하여 초기간극비와 자연함수비 및 액성한계의 물리적 특성과 압축지수와의 상관성을 규명하기 위해 비교적 신뢰성이 크다고 볼 수 있는 대형 항만 공사용 최근자료를 분석하였다. 시료교란의 정도를 분석하기 위하여 각 표본별 실내압밀시험을 실시하고 Schmertmann이 제안한 방법으로 보정하여 수정압축지수를 산정하였다. 또한 이들 자료를 토대로 실내압밀시험으로부터 얻어진 압축지수를 경험적 방법에 의하여 보정한 후 현장 처녀압축곡선과의 관계를 분석하고, 단순회귀분석, 다중회귀분석 및 비선형 회귀분석을 실시하여 최적의 회귀모델을 구한 후 해성점토에 적용할 수 있는 토질특성과 시료교란의 영향을 고려한 압축지수와의 상관 관계식을 제안하였다. 분석 결과, 시료교란의 영향을 경험적 방법으로 평가해 본 결과 현장 압축지수는 실험실 압축지수의 1.16배정도 크게 평가되었다. 해성점토의 물리적 특성과 압축지수의 상관성에 대한 최적의 회귀모형은 토질정수의 누승식 또는 지수승식 형태의 비선형회귀식이 가장 적합한 것으로 나타났다. 또한, 설계 및 실무에 보다 쉽게 적용할 수 있도록 하기 위하여 선형관계식을 사용하는 경우에는 압축지수의 상관식을 물성치의 구간에 따라 구분하여 사용하는 것이 바람직하다.

주성분회귀분석을 활용한 다항회귀분석 성능개선: PGF 수치역변환 사례를 중심으로 (Improving Polynomial Regression Using Principal Components Regression With the Example of the Numerical Inversion of Probability Generating Function)

  • 양원석;박현민
    • 한국콘텐츠학회논문지
    • /
    • 제15권1호
    • /
    • pp.475-481
    • /
    • 2015
  • 종속변수와 설명변수 사이의 관계가 선형이 아닌 경우에는 비선형 관계를 반영할 수 있는 다항회귀분석을 이용하여 회귀분석을 수행한다. 한편, 다항회귀분석에는 설명변수의 거듭제곱항들이 설명변수에 추가되므로 설명변수들 사이에 상관관계가 발생하여 다항회귀모형의 성능 저하 문제가 발생할 수 있다. 본 논문에서는 PGF 수치역변환 문제를 사례로 하여 주성분회귀분석을 통해 다항회귀분석의 성능을 극적으로 향상시킬 수 있음을 보인다. 본 논문에서는 PGF의 정의를 이용하여 PGF를 다항회귀분석으로 모형화한다. 다항회귀분석을 이용하여 PGF 전개식의 회귀계수를 추정하면 회귀계수의 추정 자체가 불가능하거나 계수 추정의 정확성이 저하되는 문제가 발생한다. 이 경우 다항회귀분석에 주성분회귀분석을 적용하면 계수 추정의 정확도가 극적으로 향상되어 다항회귀분석의 계수 추정 시 발생하는 문제를 해결할 수 있음을 밝힌다.

회귀분석을 이용한 최심신적설 추정식 개발 (Estimation of Maximum Fresh Snow Depth using Regression Analysis)

  • 박희성;정건희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.205-205
    • /
    • 2016
  • 우리나라의 겨울철 자연재해 중 대설에 의한 피해가 발생하는 빈도가 증가하고 있는 가운데 그 피해를 예측하고 대비하기 위한 연구들이 다수 진행되고 있다. 강설은 일단위로 측정하며, 매일 새롭게 내린 강설의 양인 최심신적설과 기존에 녹지 않고 쌓여 있던 깊이까지를 고려한 최심적설로 구분된다. 우리나라의 경우에는 갑작스럽게 내린 폭설에 의한 피해가 대부분이므로 최심신적설량을 예측하는 것이 매우 중요하다. 이에 본 연구에서는 다중회귀분석을 이용해 우리나라의 최심신적설량을 추정하기 위한 식을 개발하였다. 다중회귀분석을 위한 독립변수로는 해당 일에 예측된 강수량, 일평균기온, 일최고기온, 일최저기온을 사용하였으며, 강수량과 일평균기온의 상호작용을 고려할 수 있도록 모형을 구성하였다. 모형의 개발에는 전국 74개 기상관측소의 최심신적설 자료를 관측소 단위로 전체 자료의 2/3을 무작위로 추출하여 이용하였으며, 추출되지 않고 남은 1/3의 자료를 이용해 모형에 대한 검증을 실시하였다. 그 결과 상호작용항이 포함되지 않은 다중선형회귀모형에 비해 상호작용을 고려한 다중회귀모형의 예측력이 훨씬 우수하게 나타났다. 강수량과 기온이 정확하게 예측된다면 개발된 추정식을 이용해 간편하게 최심신적설량을 예측할 수 있어, 폭설에 대한 대비에 활용할 수 있을 것으로 판단된다.

  • PDF

4지 신호교차로의 측면접촉사고 특성 및 사고모형 - 청주시를 사례로 - (Characteristics and Models of the Side-swipe Accident in the Case of Cheongju 4-legged Signalized Intersections)

  • 박상혁;김태영;박병호
    • 한국도로학회논문집
    • /
    • 제11권4호
    • /
    • pp.41-47
    • /
    • 2009
  • 본 연구는 청주시 4지 신호교차로의 측면접촉사고를 다루고 있다. 연구의 목적은 측면접촉사고의 특성을 분석하고 관련모형을 개발하는데 있다. 이를 위해 이 연구에서는 적절한 모형의 방법론을 찾는데 중점을 두고 있다.주요 결과는 다음과 같다. 첫째, 측면접촉사고에서 부상사고는 물피사고의 약 2배 이상으로 교차로 내에서 사고가 가장 많이 일어나는 것으로 평가되었다. 아울러 측면접촉사고는 대부분 승용차 관련 사고이며, 안전운행 불이행으로 인한 것으로 분석되었다. 둘째, 다중선형회귀모형이 다중비선형회귀모형보다 통계적으로 유의한 것으로 평가되었다. 또한 최적 모형은 종속변수가 사고건수인 모형으로 분석되었다. 본 연구에서 분석된 측면접촉사고의 요인은 교통량(ADT), 교차로 면적, 우회전 전용차로, 횡단보도 수, 주도로 제한속도, 최대종단경사 및 현시 수이다.

  • PDF

딸기 수경 재배 환경에서의 다중 선형 회귀 모델 기반의 양액 적정 흡수량 분석 연구 (An Analysis Study for Optimal Uptake of Nutrient Solution Based on Multiple Linear Regression Model in Strawberry Hydroponic Environments)

  • 임종현;이명배;조현욱;신창선;박장우;조용윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.578-580
    • /
    • 2019
  • 우리 나라의 딸기 수경재배 면적은 2002년 5ha로 시작해서, 2007년에는 84ha, 2012년에는 317ha, 2017년에 1,575ha로 매년 30% 이상 급속하게 성장하고 있다. 이런 경향은 수경재배가 토양재배보다 작업이 용이하여 노동시간이 절약되며, 수량을 더 많이 생산할 수 있기 때문이다. 하지만, 공급양액을 배액으로 흘려버리는 비순환식 수경재배 방식이 증가 하면서 환경오염을 유발시킬 뿐만 아니라 수경재배 운영비용의 증가를 가져오고 있다. 본 논문은 작물 생장에 최적화된 양액공급을 위해 상관관계 분석 및 다중 선형 회귀 모델 기반의 딸기 수경재배 환경에서의 최적 양액 흡수량을 분석하고 추정해 보았다. 분석 결과, 수경재배 환경정보(일사량, 온도, 습도, CO2 등)를 대상으로 일사량 및 온도가 습도 및 CO2에 비해 딸기재배를 위한 양액 흡수량에 더 큰 영향을 주는 것으로 분석되었고, 다중 선형 회귀 모델을 통한 회귀식의 R-Square값은 0.358으로 나타났다.

비신호교차로의 교통사고 분석 (청주시를 사례로) (Analysis of Traffic Accidents at Unsignalized Intersections in case of Cheongju)

  • 박병호;김희식;임민희;박상혁
    • 대한교통학회지
    • /
    • 제25권5호
    • /
    • pp.67-77
    • /
    • 2007
  • 본 연구는 청주시 비신호교차로의 교통사고를 다루고 있다. 연구의 목적은 비신호교차로의 도로환경요인이 교통사고에 미치는 영향과 사고특성을 분석하는 것이다. 청주시의 3지와 4지 비신호교차로를 대상으로 상관분석을 시행한 결과, 3지의 경우에는 교통량과 시거요인, 그리고 4지는 교차각, 최대종단경사와 시거요인이 교통사고와의 상관관계가 높게 나타나고 있다. 또한 다중선형과 다중비선형 회귀분석 결과, 3지의 경우 교통량과 이중정지선의 수가 증가할수록 사고가 증가하며, 4지의 경우 교차각이 $90^{\circ}$에 가까워질수록 사고가 감소하고, 최대종단경사가 높을수록 사고가 많이 발생한다. 이와 같은 분석결과는 청주시의 장래 교차로 개선사업에 중요한 단서를 제공하게 될 것으로 기대된다.

다중회귀분석법을 이용한 스튜디오형 디지털 카메라 칼라 보정 (Studio Digital Camera Characterization by Using Multiple Regression analysis Method)

  • 윤창락;조맹섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.395-397
    • /
    • 1999
  • 디지털 카메라에 의해 획득된 RGB 칼라 신호는 디지털 카메라의 하드웨어적인 특성에 따라 서로 다른 값을 가지는 장비 의존적(Device Dependent) 특성을 가지며, 칼라 운영 시스템(CMS; Color Management System)이 프로파일 연결 칼라 공간(PCS:Profile Connection Space)으로 사용하는 CIE XYZ 칼라 공간에 대해 비선형적인 특성을 가진다. 본 논문에서는 디지털 카메라의 RGB 칼라 신호를 장비 독립적(Device Independent)인 CIE XYZ 칼라 공간으로 변환하는 변환 행렬을 구하는 방법을 제안한다. 변환 행렬은 비선형 다항식을 이용하여 3$\times$m의 변환 행렬을 구하고, 실험에 사용되는 칼라 샘플의 수에 따른 일반화(Generalization) 성능을 평가한다.

  • PDF