• Title/Summary/Keyword: 다변량 선형회귀모델

Search Result 6, Processing Time 0.019 seconds

Applicability evaluation of aerodynamic approaches for evaporation estimation using pan evaporation data (증발접시 증발량자료를 이용한 공기동력학적 증발량 산정 방법의 적용성 평가)

  • Rim, Chang-Soo
    • Journal of Korea Water Resources Association
    • /
    • v.50 no.11
    • /
    • pp.781-793
    • /
    • 2017
  • In this study, applicabilities of aerodynamic approaches for the estimation of pan evaporation were evaluated on 56 study stations in South Korea. To accomplish this study purpose, previous researchers' evaporation estimation equations based on aerodynamic approaches were grouped into seven generalized evaporation models. Furthermore, four multiple linear regression (MLR) models were developed and tested. The independent variables of MLR models are meteorological variables such as wind speed, vapor pressure deficit, air temperature, and atmospheric pressure. These meteorological variables are required for the application of aerodynamic approaches. In order to consider the effect of autocorrelation, MLR models were developed after differencing variables. The applicability of MLR models with differenced variables was compared with that of MLR models with undifferenced variables and the comparison results showed no significant difference between the two methods. The study results have indicated that there is strong correlation between estimated pan evaporation (using aerodynamic models and MLR models) and measured pan evaporation. However, pan evaporation are overestimated during August, September, October, November, and December. Most of meteorological variables that are used for MLR models show statistical significance in the estimation of pan evaporation. Vapor pressure deficit was turned out to be the most significant meteorological variable. The second most significant variable was air temperature; wind speed was the third most significant variable, followed by atmospheric pressure.

Rock TBM design model derived from the multi-variate regression analysis of TBM driving data (TBM 굴진자료의 다변량 회귀분석에 의한 암반대응형 TBM의 설계모델 도출)

  • Chang, Soo-Ho;Choi, Soon-Wook;Lee, Gyu-Phil;Bae, Gyu-Jin
    • Journal of Korean Tunnelling and Underground Space Association
    • /
    • v.13 no.6
    • /
    • pp.531-555
    • /
    • 2011
  • This study aims to derive the statistical models for the estimation of the required specifications of a rock TBM as well as for its cutterhead design suitable for a given rock mass condition. From a series of multi-variate regression analysis of 871 TBM driving data and 51 linear rock cutting test results, the optimum models were newly proposed to consider a variety of rock properties and mechanical cutting conditions. When the derived models were applied to two domestic shield tunnels, their predictions of cutter penetration depth, cutter acting forces and cutter spacing were very close to real TBM driving data, showing their high applicability.

Prediction of Retention Time for PAH Molecule in HPLC (고속액체 크로마토그래피에서 PAH분자의 구조에 따른 용리시간 예측)

  • Kim, Young-Gu
    • Journal of the Korean Chemical Society
    • /
    • v.44 no.2
    • /
    • pp.102-108
    • /
    • 2000
  • Relative retention times (RRTs) of RAH molecules in HPLC are trained and predicted intesting sets using a multiple linear regression (NLR) and an artificial neural network (ANN). The maindescriptors in QSRR are molecular connectivity ($^1X_v,\;^2X_v$), the length-to-breadth ratios (L/B), and molecular dipole moment(D). L/B which is related with slot model is a good descripter in ANN, but isn't in MLR. Varainces which show the accuracy of prediction times in testing sets are 0.0099, 0.0114 for ANN and MLR, respectively. It was shown that ANN can exceed the MLR in prediction accuracy.

  • PDF

A Multivariate Analysis of Korean Professional Players Salary (한국 프로스포츠 선수들의 연봉에 대한 다변량적 분석)

  • Song, Jong-Woo
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.3
    • /
    • pp.441-453
    • /
    • 2008
  • We analyzed Korean professional basketball and baseball players salary under the assumption that it depends on the personal records and contribution to the team in the previous year. We extensively used data visualization tools to check the relationship among the variables, to find outliers and to do model diagnostics. We used multiple linear regression and regression tree to fit the model and used cross-validation to find an optimal model. We check the relationship between variables carefully and chose a set of variables for the stepwise regression instead of using all variables. We found that points per game, number of assists, number of free throw successes, career are important variables for the basketball players. For the baseball pitchers, career, number of strike-outs per 9 innings, ERA, number of homeruns are important variables. For the baseball hitters, career, number of hits, FA are important variables.

Analysis on Correlation between AE Parameters and Stress Intensity Factor using Principal Component Regression and Artificial Neural Network (주성분 회귀분석 및 인공신경망을 이용한 AE변수와 응력확대계수와의 상관관계 해석)

  • Kim, Ki-Bok;Yoon, Dong-Jin;Jeong, Jung-Chae;Park, Phi-Iip;Lee, Seung-Seok
    • Journal of the Korean Society for Nondestructive Testing
    • /
    • v.21 no.1
    • /
    • pp.80-90
    • /
    • 2001
  • The aim of this study is to develop the methodology which enables to identify the mechanical properties of element such as stress intensity factor by using the AE parameters. Considering the multivariate and nonlinear properties of AE parameters such as ringdown count, rise time, energy, event duration and peak amplitude from fatigue cracks of machine element the principal component regression(PCR) and artificial neural network(ANN) models for the estimation of stress intensity factor were developed and validated. The AE parameters were found to be very significant to estimate the stress intensity factor. Since the statistical values including correlation coefficients, standard mr of calibration, standard error of prediction and bias were stable, the PCR and ANN models for stress intensity factor were very robust. The performance of ANN model for unknown data of stress intensity factor was better than that of PCR model.

  • PDF

Analysis of Factors Influencing upon the Metro Wear Using the Classification and Regression Trees (CART 분석을 이용한 지하철 마모 영향인자 분석)

  • Jeong, Min Chul;Lee, Won Woo;Kim, Jung Hoon;Kong, Jung Sik
    • 한국방재학회:학술대회논문집
    • /
    • 2011.02a
    • /
    • pp.38-38
    • /
    • 2011
  • 일반적으로 레일마모는 열차의 주행안전 및 승차감에 미치는 영향이 크고, 소음 진동의 주요원인으로 작용한다. 또한 레일마모가 발생할 경우 궤도구조의 파괴를 촉진시킴으로써 차량 및 궤도유지보수비를 크게 증가시킨다. 따라서 구간 특성 및 환경 영향 인자 등 현장에서 발생하는 마모 원인을 체계적으로 분석함으로써 마모를 저감할 수 있도록 차량운행 조건과 선로선형 및 궤도구조를 설계하는 것은 중요한 과제이다. CART(Classification And Regression Tree; 분류와 회귀나무) 분석은 패키지화된 좋은 분류 및 예측도구 기법으로 나무의 상위 분리수준에서 일반적으로 나타나는 가장 중요한 입력변수들을 사용하는 등의 입력변수를 선정하는 경우 매우 유용하다. 본 연구에서는 다변수 구간특성 및 환경인자를 고려한 검측 자료 상관관계 분석을 위한 회귀 나무기반 모델(TBM: Tree Based Model) 분석 수행을 위해 지하철 2호선 마모 데이터와 마모 데이터에 영향을 미치는 각종 다변수 구간특성 및 환경인자를 사용하였다. 2호선 지하철의 구간특성 인자 및 환경인자는 레일의 종류, 레일의 위치, 도상, 곡률반경, 캔트 슬랙 및 운행 일수 등으로 구분하였다. 레일의 종류는 ks-50kg과 ks-60kg 두 종류의 레일이 있으며, 레일의 위치는 지상과 지하로 크게 구분할 수 있다. 도상은 콘크리트 도상, 자갈 도상과 일부 구간의 방진상 콘크리트 도상으로 구분할 수 있으며, 곡률반경은 직선구간과 완화곡선 구간 및 최소 250m부터 627m까지 분포된 원 곡선 구간으로 구분할 수 있다. 캔트 간격은 최소 96cm 부터 120cm 간격으로 구분하며, 슬랙은 5~9cm에 분포하고, 운행 기간은 해당 기간 동안 유지보수 이력이 없는 구간을 선정하여 2005년부터 2006년까지 4번에 걸쳐 검측된 지하철 2호선 내선 마모데이터를 사용하였다. 총 X1부터 X7까지 총 7개의 구간특성 또는 환경특성을 영향인자로 선정하였으며, 이러한 영향인자에 의해 결정되는 종속 인자로 Y1인 직마모와 Y2인 측마모를 선정하여 이 중 실질적으로 지하철 궤도의 성능 평가에 주요 판단인자로 사용되는 측마모와 구간특성 및 환경영향인자와의 상관관계 분석을 수행하였다. 해당 마모 데이터가 검측되는 기간 동안 유지보수 이력이 없는 12272 point의 데이터를 검출하였고 CART 프로그램을 이용하여 데이터를 분석하였으며, CART 프로그램의 해석을 위해 종속변수인 직마모량은 각 검측 지점의 마모량에 해당하는 등급으로 변환하여 분석을 수행하였다. 레일의 마모에 영향을 미치는 구간특성 및 환경인자와 종속 변수로 사용된 레일의 마모량 사이의 CART를 이용한 상관관계 분석은 실제 구조물에서 영향인자간의 상관 관계와 유사하며, 추후 연구에서는 이를 바탕으로 하여 정량화된 검측 데이터를 종속변수로 하여 구간특성 또는 환경인자 등 외부 영향인자를 고려한 궤도 검측데이터와의 상관관계 분석을 수행할 계획이다.

  • PDF