• Title/Summary/Keyword: 회귀분석법

Search Result 1,442, Processing Time 0.028 seconds

Performance Comparison of Data Mining Approaches for Prediction Models of Near Infrared Spectroscopy Data (근적외선 분광 데이터 예측 모형을 위한 데이터 마이닝 기법의 성능비교)

  • Baek, Seung Hyun
    • Journal of the Korea Safety Management & Science
    • /
    • v.15 no.4
    • /
    • pp.311-315
    • /
    • 2013
  • 본 논문에서는 주성분 회귀법과 부분최소자승 회귀법을 비교하여 보여준다. 이 비교의 목적은 선형형태를 보유한 근적외선 분광 데이터의 분석에 사용할 수 있는 적합한 예측 방법을 찾기 위해서이다. 두 가지 데이터 마이닝 방법론인 주성분 회귀법과 부분최소자승 회귀법이 비교되어 질 것이다. 본 논문에서는 부분최소자승 회귀법은 주성분 회귀법과 비교했을 때 약간 나은 예측능력을 가진 결과를 보여준다. 주성분 회귀법에서 50개의 주성분이 모델을 생성하기 위해서 사용지만 부분최소자승 회귀법에서는 12개의 잠재요소가 사용되었다. 평균제곱오차가 예측능력을 측정하는 도구로 사용되었다. 본 논문의 근적외선 분광데이터 분석에 따르면 부분최소자승회귀법이 선형경향을 가진 데이터의 예측에 가장 적합한 모델로 판명되었다.

Comparison Study of Parameter Estimation Methods for Some Extreme Value Distributions (Focused on the Regression Method) (극단치 분포의 모수 추정방법 비교 연구(회귀 분석법을 기준으로))

  • Woo, Ji-Yong;Kim, Myung-Suk
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.3
    • /
    • pp.463-477
    • /
    • 2009
  • Parameter estimation methods such as maximum likelihood estimation method, probability weighted moments method, regression method have been popularly applied to various extreme value models in numerous literature. Among three methods above, the performance of regression method has not been rigorously investigated yet. In this paper the regression method is compared with the other methods via Monte Carlo simulation studies for estimation of parameters of the Generalized Extreme Value(GEV) distribution and the Generalized Pareto(GP) distribution. Our simulation results indicate that the regression method tends to outperform other methods under small samples by providing smaller biases and root mean square errors for estimation of location parameter of the GEV model. For the scale parameter estimation of the GP model under small samples, the regression method tends to report smaller biases than the other methods. The regression method tends to be superior to other methods for the shape parameter estimation of the GEV model and GP model when the shape parameter is -0.4 under small and moderately large samples.

Comparisons of Kruglyak and Lander's Nonparametric Linkage Test and Weighted Regression Incorporating Replications (KRUGLYAK과 LANDER의 유전연관성 비모수 방법과 반복 자료를 고려한 가중 회귀분석법의 비교)

  • Choi, Eun-Kyeong;Song, Hae-Hiang
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.1
    • /
    • pp.1-17
    • /
    • 2008
  • The ordinary least squares regression method of Haseman and Elston(1972) is most widely used in genetic linkage studies for continuous traits of sib pairs. Kruglyak and Lander(1995) suggested a statistic which appears to be a nonparametric counterpart to the Haseman and Elston(1972)'s regression method, but in fact these two methods are quite different. In this paper the relationships between these two methods are described and will be compared by simulation studies. One of the characteristics of the sib-pair linkage study is that the explanatory variable has only three different values and thus dependent variable is heavily replicated in each value of the explanatory variable. We propose a weighted least squares regression method which is more appropriate to this situation and the efficiency of the weighted regression in genetic linkage study was explored with normal and non-normal simulated continuous traits data. Simulation studies demonstrated that the weighted regression is more powerful than other tests.

Nonlinear feature extraction for regression problems (회귀문제를 위한 비선형 특징 추출 방법)

  • Kim, Seongmin;Kwak, Nojun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.11a
    • /
    • pp.86-88
    • /
    • 2010
  • 본 논문에서는 회귀문제를 위한 비선형 특징 추출방법을 제안하고 분류문제에 적용한다. 이 방법은 이미 제안된 선형판별 분석법을 회귀문제에 적용한 회귀선형판별분석법(Linear Discriminant Analysis for regression:LDAr)을 비선형 문제에 대해 확장한 것이다. 본 논문에서는 이를 위해 커널함수를 이용하여 비선형 문제로 확장하였다. 기본적인 아이디어는 입력 특징 공간을 커널 함수를 이용하여 새로운 고차원의 특징 공간으로 확장을 한 후, 샘플 간의 거리가 큰 것과 작은 것의 비율을 최대화하는 것이다. 일반적으로 얼굴 인식과 같은 응용 분야에서 얼굴의 크기, 회전과 같은 것들은 회귀문제에 있어서 비선형적이며 복잡한 문제로 인식되고 있다. 본 논문에서는 회귀 문제에 대한 간단한 실험을 수행하였으며 회귀선형판별분석법(LDAr)을 이용한 결과보다 향상된 결과를 얻을 수 있었다.

  • PDF

Comparison of Regression Model Approaches fined to Complex Survey Data (복합표본조사 데이터 분석을 위한 회귀모형 접근법의 비교: 소규모사업체조사 데이터 분석을 중심으로)

  • 이기재
    • Survey Research
    • /
    • v.2 no.1
    • /
    • pp.73-86
    • /
    • 2001
  • In this paper. we conducted an empirical study to investigate the design and weighting effects on descriptive and analytic statistics. We compared the regression models using the design-based approach and the generalized estimating equations (GEEs) approach with the model-based approach through the design and weighting effects analysis.

  • PDF

유전자 알고리즘을 이용한 비모수 회귀분석

  • 김병도;노상규
    • Proceedings of the Korea Database Society Conference
    • /
    • 1998.09a
    • /
    • pp.584-594
    • /
    • 1998
  • 선형회귀분석은 가장 널리 사용되는 데이터 분석기법이지만 독립변수와 종속변수간의 관계가 선형이라고 가정하기 때문에 문제점을 가지고 있다. 비모수 회귀분석(Nonparametric Regression)은 선형회귀분석의 문제점을 극복할 수 있는 방법으로 변수간의 관계의 형태를 미리 가정하지 않고 데이터에 의해 결정하는 방법이다. 본 연구에서는 유전자 알고리즘을 비모수 회귀분석법 중의 하나인 Regressoin Splines에 적용하였다. 인위적 데이터를 이용한 평가 결과 유전자 알고리즘은 다양한 상황에서 매우 우수한 것으로 나타났다.

  • PDF

Comparison of Regression Coefficient Significance Test for Temporal Distribution by Multiple Regression Analysis Method (다중회귀분석 방법에 따른 시간분포 회귀식의 회귀계수 유의성 검정 비교)

  • Lee, Sung Ho;Lee, Jae Joon;Park, Jin Hee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.205-205
    • /
    • 2019
  • 우리나라에서 강우의 시간분포를 위해 보편적으로 사용되고 있는 방법은 Huff 4분위법으로 강우의 시간적 분포특성을 나타내는 무차원 시간분포곡선을 제시한 것으로, 강우의 지속기간을 4분위로 구분하여 각 분위의 강우량 중 가장 큰 값이 속해 있는 구간을 선택하여 그 구간의 위치에 따라 분위를 정하는 방법이다. 현재 실무에서는 Huff의 분위별 곡선에 대한 회귀식은 지속기간 전반에 걸쳐 정확도가 높은 이유로 6차식을 적용하고 있으나, 통계 모델링에서 간결함의 원리에 따라 회귀식이 간결할 필요가 있으며, 통계적 유의수준에 기초하여 회귀계수를 결정하여야 하므로 유의성 검정 방법을 통한 검정결과를 비교할 필요가 있다. 따라서 본 연구에서는 다중회귀분석 방법에 따른 회귀계수 유의성 검정결과 비교를 위하여 구미지역의 무차원 누가우량 백분율을 이용한 시간분포 회귀식을 이용하여 유의성 검정 방법인 분산분석 방법(Analysis of Variance)과 변수선택 방법(Backward Selection)의 검정 결과를 도출 및 비교하였다. 통계프로그램인 프로그래밍 R을 이용하여 변수선택 방법 중 후방제거법 함수를 이용하여 최종 회귀식을 도출하고 또한 7차 회귀식을 분산분석을 이용한 후방제거법으로 회귀계수를 제거하는 방법으로 최종 회귀식을 산정하였다. 분산분석을 이용한 후방제거법의 유의성 검정결과는 프로그래밍 R을 이용한 후방제거법의 결과와 동일한 것으로 분석되었다. 일반적으로 설계강우량의 시간분포를 위한 방법으로 사용되고 있는 Huff의 4분위 방법의 시간분포 회귀식은 회귀계수의 유의성 검정이 이루어지고 있지 않으므로 본 연구결과를 통해 설계강우량 시간분포 회귀식의 유의성 검정방법 제시 및 결과도출과정을 통해 시간분포 회귀식 산정기법으로 활용할 수 있을 것으로 사료된다.

  • PDF

A Proposal of the Evaluation Method for Rock Slope Stability Using Logistic Regression Analysis (로지스틱 회귀분석을 통한 암반사면의 안정성 평가법 제안)

  • 이용희;김종열
    • Tunnel and Underground Space
    • /
    • v.14 no.2
    • /
    • pp.133-141
    • /
    • 2004
  • Through the many site investigations, different methods for evaluating stability of rock slopes have been proposed. Those methods, however, may lead to different results depending on the subjective judgments associated with the selection of the evaluation items and the application of weighting factor. Accordingly, binary logistic regression analysis was carried out to ensure fair appliction of the weighting factor, leading to an equation for evaluating the stability of rock slopes.

Forecasting of Pine-Mushroom Yield Using the Conditional Autoregressive Model (조건부 자기회귀모형을 이용한 송이버섯 생산량 예측)

  • 이진희;신기일
    • The Korean Journal of Applied Statistics
    • /
    • v.13 no.2
    • /
    • pp.307-320
    • /
    • 2000
  • It has been studied to find relationships between pine-mushroom yield and climatic factors. Recently, Hyun-Park, Key-I! shin and Hyun-Joong Kim(1998) investigated relationships between pine-mushroom yield and climatic factors by autoregression model. In this paper, to improve the forecast we suggest the conditional autoregression model using probability of existing pine-mushroom production.

  • PDF

A Suggestion of Two-Way Variable Algorism for Least-Squares Regression Analysis (상호변수 최소자승 회귀분석 방법의 제안)

  • Lee, Chang-Hae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2005.05b
    • /
    • pp.189-193
    • /
    • 2005
  • 기존의 회귀식을 사용하거나 새로 유도하여 사용하는 경우 모두 일반적으로 회귀분석의 특성을 간과하고 사용하는 경우가 종종 발생한다. 일반적으로 자료들에서 구해진 회귀식은 분명히 독립변수와 종속변수가 구분되어 유도되었음에도 불구하고 이 식을 사용함에 있어서는 간혹 그 구분을 무시하고 역으로 적용하는 경향이 있었다. 그러나, 독립$\cdot$종속변수가 서로 바뀌면, 연직거리의 잔차들로부터 유도되는 기존의 회귀분석에 의하여, 회귀식이 서로 달라지기 때문에 역으로 적용하여서는 안된다. 이를 해결하기 본 연구에서는 상호변수 최소자승 회귀분석법을 제안하였다. 이론적 내용을 검토를 위해 임진강 영평천의 영중수위표 지점의 2001-2003년의 유량측정자료와 수위-유량곡선을 비교 분석하였다. 결론적으로 상호변수 회귀분석을 사용하면, 기존의 잘못 사용해온 관행을 해소할 수 있을 것이다.

  • PDF