• Title/Summary/Keyword: 회귀법

Search Result 1,732, Processing Time 0.031 seconds

Performance Comparison of Data Mining Approaches for Prediction Models of Near Infrared Spectroscopy Data (근적외선 분광 데이터 예측 모형을 위한 데이터 마이닝 기법의 성능비교)

  • Baek, Seung Hyun
    • Journal of the Korea Safety Management & Science
    • /
    • v.15 no.4
    • /
    • pp.311-315
    • /
    • 2013
  • 본 논문에서는 주성분 회귀법과 부분최소자승 회귀법을 비교하여 보여준다. 이 비교의 목적은 선형형태를 보유한 근적외선 분광 데이터의 분석에 사용할 수 있는 적합한 예측 방법을 찾기 위해서이다. 두 가지 데이터 마이닝 방법론인 주성분 회귀법과 부분최소자승 회귀법이 비교되어 질 것이다. 본 논문에서는 부분최소자승 회귀법은 주성분 회귀법과 비교했을 때 약간 나은 예측능력을 가진 결과를 보여준다. 주성분 회귀법에서 50개의 주성분이 모델을 생성하기 위해서 사용지만 부분최소자승 회귀법에서는 12개의 잠재요소가 사용되었다. 평균제곱오차가 예측능력을 측정하는 도구로 사용되었다. 본 논문의 근적외선 분광데이터 분석에 따르면 부분최소자승회귀법이 선형경향을 가진 데이터의 예측에 가장 적합한 모델로 판명되었다.

Machine Learning Methods to Predict Vehicle Fuel Consumption

  • Ko, Kwangho
    • Journal of the Korea Society of Computer and Information
    • /
    • v.27 no.9
    • /
    • pp.13-20
    • /
    • 2022
  • It's proposed and analyzed ML(Machine Learning) models to predict vehicle FC(Fuel Consumption) in real-time. The test driving was done for a car to measure vehicle speed, acceleration, road gradient and FC for training dataset. The various ML models were trained with feature data of speed, acceleration and road-gradient for target FC. There are two kind of ML models and one is regression type of linear regression and k-nearest neighbors regression and the other is classification type of k-nearest neighbors classifier, logistic regression, decision tree, random forest and gradient boosting in the study. The prediction accuracy is low in range of 0.5 ~ 0.6 for real-time FC and the classification type is more accurate than the regression ones. The prediction error for total FC has very low value of about 0.2 ~ 2.0% and regression models are more accurate than classification ones. It's for the coefficient of determination (R2) of accuracy score distributing predicted values along mean of targets as the coefficient decreases. Therefore regression models are good for total FC and classification ones are proper for real-time FC prediction.

Adaptive L-estimation for regression slope under asymmetric error distributions (비대칭 오차모형하에서의 회귀기울기에 대한 적합된 L-추정법)

  • 한상문
    • The Korean Journal of Applied Statistics
    • /
    • v.6 no.1
    • /
    • pp.79-93
    • /
    • 1993
  • We consider adaptive L-estimation of estimating slope parameter in regression model. The proposed estimator is simple extension of trimmed least squares estimator proposed by ruppert and carroll. The efficiency of the proposed estimator is especially well compared with usual least squares estimator, least absolute value estimator, and M-estimators designed for asymmetric distributions under asymmetric error distributions.

  • PDF

Comparison Study of Parameter Estimation Methods for Some Extreme Value Distributions (Focused on the Regression Method) (극단치 분포의 모수 추정방법 비교 연구(회귀 분석법을 기준으로))

  • Woo, Ji-Yong;Kim, Myung-Suk
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.3
    • /
    • pp.463-477
    • /
    • 2009
  • Parameter estimation methods such as maximum likelihood estimation method, probability weighted moments method, regression method have been popularly applied to various extreme value models in numerous literature. Among three methods above, the performance of regression method has not been rigorously investigated yet. In this paper the regression method is compared with the other methods via Monte Carlo simulation studies for estimation of parameters of the Generalized Extreme Value(GEV) distribution and the Generalized Pareto(GP) distribution. Our simulation results indicate that the regression method tends to outperform other methods under small samples by providing smaller biases and root mean square errors for estimation of location parameter of the GEV model. For the scale parameter estimation of the GP model under small samples, the regression method tends to report smaller biases than the other methods. The regression method tends to be superior to other methods for the shape parameter estimation of the GEV model and GP model when the shape parameter is -0.4 under small and moderately large samples.

Nonlinear feature extraction for regression problems (회귀문제를 위한 비선형 특징 추출 방법)

  • Kim, Seongmin;Kwak, Nojun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.11a
    • /
    • pp.86-88
    • /
    • 2010
  • 본 논문에서는 회귀문제를 위한 비선형 특징 추출방법을 제안하고 분류문제에 적용한다. 이 방법은 이미 제안된 선형판별 분석법을 회귀문제에 적용한 회귀선형판별분석법(Linear Discriminant Analysis for regression:LDAr)을 비선형 문제에 대해 확장한 것이다. 본 논문에서는 이를 위해 커널함수를 이용하여 비선형 문제로 확장하였다. 기본적인 아이디어는 입력 특징 공간을 커널 함수를 이용하여 새로운 고차원의 특징 공간으로 확장을 한 후, 샘플 간의 거리가 큰 것과 작은 것의 비율을 최대화하는 것이다. 일반적으로 얼굴 인식과 같은 응용 분야에서 얼굴의 크기, 회전과 같은 것들은 회귀문제에 있어서 비선형적이며 복잡한 문제로 인식되고 있다. 본 논문에서는 회귀 문제에 대한 간단한 실험을 수행하였으며 회귀선형판별분석법(LDAr)을 이용한 결과보다 향상된 결과를 얻을 수 있었다.

  • PDF

On variable bandwidth Kernel Regression Estimation (변수평활량을 이용한 커널회귀함수 추정)

  • Seog, Kyung-Ha;Chung, Sung-Suk;Kim, Dae-Hak
    • Journal of the Korean Data and Information Science Society
    • /
    • v.9 no.2
    • /
    • pp.179-188
    • /
    • 1998
  • Local polynomial regression estimation is the most popular one among kernel type regression estimator. In local polynomial regression function esimation bandwidth selection is crucial problem like the kernel estimation. When the regression curve has complicated structure variable bandwidth selection will be appropriate. In this paper, we propose a variable bandwidth selection method fully data driven. We will choose the bandwdith by selecting minimising estiamted MSE which is estimated by the pilot bandwidth study via croos-validation method. Monte carlo simulation was conducted in order to show the superiority of proposed bandwidth selection method.

  • PDF

Comparisons of Imputation Methods for Wave Nonresponse in Panel Surveys (패널조사 웨이브 무응답의 대체방법 비교)

  • Kim, Kyu-Seong;Park, In-Ho
    • Survey Research
    • /
    • v.11 no.1
    • /
    • pp.1-18
    • /
    • 2010
  • We compare various imputation methods for compensating wave nonresponse that are commonly adopted in many panel surveys. Unlike the cross-sectional survey, the panel survey is involved a time-effect in nonresponse in a sense that nonresponse may happen for some but not all waves. Thus, responses in neighboring waves can be used as powerful predictors for imputing wave nonresponse such as in longitudinal regression imputation, carry-over imputation, nearest neighborhood regression imputation and row-column imputation method. For comparison, we carry out a simulation study on a few income data from the Korean Welfare Panel Study based on two performance criteria: predictive accuracy and estimation accuracy. Our simulation shows that the ratio and row-column imputation methods are much more effective in terms of both criteria. Regression, longitudinal regression and carry-over imputation methods performed better in predictive accuracy, but less in estimation accuracy. On the other hand, nearest neighborhood, nearest neighbor regression and hot-deck imputation show higher performance in estimation accuracy but lower predictive accuracy. Finally, the mean imputation shows much lower performance in both criteria.

  • PDF

확률화 블럭 계획법에서 동위회귀를 이용한 우산형 대립가설의 비모수검정법

  • 김동희;김영철
    • Communications for Statistical Applications and Methods
    • /
    • v.4 no.1
    • /
    • pp.167-175
    • /
    • 1997
  • 확률화 블럭 계획법에서 동위회귀를 이용하여 우산형 대립가설에 대한 비모수검정법을 제안하고자 한다. 제안된 검정통계량은 Mack과 Wolfe (1981)의 통계량에서 처리들에 가중치를 준 형태가 되며, 동위회귀를 이용하여 확률변수인 가중치를 구하고 붓스트랩을 이용한 소표본에서 모의 실험을 통하여 몇가지 사례 및 분포에 대해 제안된 통계량의 검정력을 알아본다.

  • PDF

Effect of Various Regression Functions on Structural Optimizations Using the Central Composite Method (중심합성법에 의한 구조최적화에서 회귀함수변화의 영향)

  • Park, Jung-Sun;Jeon, Yong-Sung;Im, Jong-Bin
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.33 no.1
    • /
    • pp.26-32
    • /
    • 2005
  • In this paper, the effect of various regression models is investigated on structural optimization using the central composite method. Three bar truss and the upper platform of a satellite are optimized using various regression models that are polynomial, exponential and log functions. Response surface method is non-gradient, semi-global, discrete and fast converging in optimization problem. Sampling points are extracted by the design of experiments using the central composite method. Response surface is generated using the various regression functions. Structural analysis for calculating constraints is executed to find static and dynamic responses. From this study, it is verified that the response surface method has advantage in optimum value and computation time in comparison to other optimization methods.

An Estimation of Regression Equation for Temporal Distribution of Design Rainfall Using Variable Selection Method (변수선택 방법을 이용한 설계강우량 시간분포 회귀식의 산정)

  • Lee, Sung Ho;Lee, Jae Joon;Park, Jin Hee;Rhee, Dong Sop
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.169-169
    • /
    • 2018
  • 국내에서는 유량자료의 부족으로 수공구조물을 설계하기 위한 기초자료로서 설계강우량을 활용하고 있다. 따라서 설계강우량의 산정 및 시간분포가 중요한 요인으로 작용하고 있으며, 국내에서는 설계강우량 시간분포를 위한 방법으로 Huff의 4분위 방법을 사용하는 것이 일반적이다. 실무에서는 확률강우량도 개선 및 보완연구(Ministry of Land, Transport and Maritime Affairs, 2011)에서 제시한 관측소별 Huff의 무차원 누가우량 백분율을 이용하여 Huff의 4분위 방법 중 3분위의 자료를 이용하여 시간분포 회귀식을 산정하고 있으며, 회귀식의 차수는 전반적으로 결정계수가 높은 6차식을 사용하고 있다. 회귀식의 경우 고차식으로 갈수록 결정계수가 높아지는 것은 당연하지만 4차 이상의 회귀식에서는 결정계수의 차이가 미미하므로 6차식을 사용하는 것이 합리적이라고 할 수 없다. 따라서 본 연구에서는 통계적 유의수준에 기초하여 Huff 4분위 방법의 시간분포 회귀식에 대한 유의성 검정을 실시하여 회귀계수에 대한 통계적 검증을 실시하고 변수선택 방법인 전방선택법(Forward Selection)을 이용하여 유의하지 않은 회귀계수들을 제외하면서 가장 좋은 변수들로 구성된 간결한 설계강우량 시간분포 회귀식을 산정하고자 한다. 또한 산정된 회귀식과 기존 확률강우량도 개선 및 보완연구(Ministry of Land, Transport and Maritime Affairs, 2011)에서 제시한 회귀식과 비교하여 변수선택 방법인 전방 선택법(Forward Selection)을 이용하여 산정된 회귀식의 적합성을 검증하고자 한다.

  • PDF