• 제목/요약/키워드: Least Square Regression

검색결과 421건 처리시간 0.025초

패널회귀모형에서 회귀계수 추정량의 설계기반 성질 (Design-based Properties of Least Square Estimators in Panel Regression Model)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제12권3호
    • /
    • pp.49-62
    • /
    • 2011
  • 본 논문에서는 패널회귀모형에서 회귀계수 추정량으로 일반최소제곱추정량과 가중최소 제곱추정량의 설계기반 성질을 고찰한다. 회귀계수의 최소제곱추정량을 선형화하여 일반최소제곱추정량의 근사편향, 근사분산, 그리고 근사평균제곱오차의 수식과, 가중최소제곱추정량의 근사분산 수식을 유도한 후, 모의실험을 통하여 두 추정량의 근사분산 및 근사평균 제곱오차의 크기를 수치적으로 비교한다. 모의실험에서는 한국복지패널 3개년 데이터를 모집단으로 간주하고, 가구소득 변수를 관심변수로 하며 가구와 가구주 관련 7개 변수를 설명변수로 하는 유한모집단 회귀계수를 고려한다. 두 추정량의 설계기반 성질을 비교하기 위하여 표본수를 50에서 1,000까지 50 간격으로 설정하여 일반최소제곱추정량의 근사편향, 근사분산 그리고 가중최소제곱추정량의 근사분산을 계산한다. 모의실험을 통하여 다음과 같은 경향을 확인하였다. 첫째, 표본의 크기가 커지면 일반최소제곱추정량의 평균제곱오차가 가중최소제곱추정량의 분산보다 커진다. 둘째, 일반최소제곱추정량의 평균제곱오차를 가중최소제곱추정량의 분산으로 나눈비(ratio)는 설명변수에 따라 크기가 다르게 나타나고, 일반최소제곱추정량의 편향이 클수록 큰 값을 보인다. 셋째, 분산만 비교하면 일반최소제곱추정량의 분산이 가중최소제곱추정량의 분산보다 대부분의 경우에 더 작게 나타난다.

  • PDF

Asymmetric Least Squares Estimation for A Nonlinear Time Series Regression Model

  • Kim, Tae Soo;Kim, Hae Kyoung;Yoon, Jin Hee
    • Communications for Statistical Applications and Methods
    • /
    • 제8권3호
    • /
    • pp.633-641
    • /
    • 2001
  • The least squares method is usually applied when estimating the parameters in the regression models. However the least square estimator is not very efficient when the distribution of the error is skewed. In this paper, we propose the asymmetric least square estimator for a particular nonlinear time series regression model, and give the simple and practical sufficient conditions for the strong consistency of the estimators.

  • PDF

Reexamination of Estimating Beta Coecient as a Risk Measure in CAPM

  • Phuoc, Le Tan;Kim, Kee S.;Su, Yingcai
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제5권1호
    • /
    • pp.11-16
    • /
    • 2018
  • This research examines the alternative ways of estimating the coefficient of non-diversifiable risk, namely beta coefficient, in Capital Asset Pricing Model (CAPM) introduced by Sharpe (1964) that is an essential element of assessing the value of diverse assets. The non-parametric methods used in this research are the robust Least Trimmed Square (LTS) and Maximum likelihood type of M-estimator (MM-estimator). The Jackknife, the resampling technique, is also employed to validate the results. According to finance literature and common practices, these coecients have often been estimated using Ordinary Least Square (LS) regression method and monthly return data set. The empirical results of this research pointed out that the robust Least Trimmed Square (LTS) and Maximum likelihood type of M-estimator (MM-estimator) performed much better than Ordinary Least Square (LS) in terms of eciency for large-cap stocks trading actively in the United States markets. Interestingly, the empirical results also showed that daily return data would give more accurate estimation than monthly return data in both Ordinary Least Square (LS) and robust Least Trimmed Square (LTS) and Maximum likelihood type of M-estimator (MM-estimator) regressions.

포함확률비례추출에서 회귀계수 최소제곱추정량의 근사분산 (Approximate Variance of Least Square Estimators for Regression Coefficient under Inclusion Probability Proportional to Size Sampling)

  • 김규성
    • Communications for Statistical Applications and Methods
    • /
    • 제19권1호
    • /
    • pp.23-32
    • /
    • 2012
  • 본 논문은 유한모집단에서 회귀계수추정량의 근사편향과 근사분산을 다루고 있다. 유한모집단에서 고정크기 포함확률비례표본을 추출하고 이 표본에서 조사된 데이터에 기초하여 회귀계수를 일반최소제곱추정량과 가중최소제곱추정량으로 추정할 때 두 추정량의 편향, 분산 그리고 평균제곱오차의 근사식을 유도하였다. 그리고 두 추정량의 효율을 비교하기 위하여 두 추정량의 분산을 비교하는 필요충분조건을 제시하였다. 또한 수치적인 비교를 위하여 간단한 예제를 소개하였다.

시중 즉석 조리 면의 Back Extrusion 텍스처 데이터에 대한 Partial Least Square Regression 분석 (Analysis of Partial Least Square Regression on Textural Data from Back Extrusion Test for Commercial Instant Noodles)

  • 김수경;이승주
    • 산업식품공학
    • /
    • 제14권1호
    • /
    • pp.75-79
    • /
    • 2010
  • 시중 즉석 면류의 관능적 성질과 back extrusion test 데이터에 대하여 partial least square regression(PLSR)을 실시하였다. 즉석유탕면 8종과 즉석비유탕면 2종에 대한 관능적 속성으로서 경도(A), 탄성(B), 껄끄러운 정도(C), 이에 박히는 정도(D), 굵기감(E)를 검사하였고, 실험 데이터로 힘-변형 곡선 전체를 사용하였다. PLSR의 회귀계수는 힘-변형곡선의 압착단계, 항복단계, 압출단계로 크게 구분되어 각관능속성에 대한 특유의 양 또는 음의 효과를 나타냈다. PLSR의 상관계수는 E>D>A>B>C, 오차(root mean square error of prediction expressed in sensory units)는 D>C>E>B>A, 예측능(relative ability of prediction)는 D>C>E>B>A 로 나타나 종합적으로 '이에 박히는 정도'가 PLSR의 적용에 가장 우수하게 나타났다. '경도'는 예측능은 낮았지만 상관성은 높아서 시료간 순위의 결정에 합당하게 평가되었다.

Fuzzy Linear Regression Model Using the Least Hausdorf-distance Square Method

  • Choi, Sang-Sun;Hong, Dug-Hun;Kim, Dal-Ho
    • Communications for Statistical Applications and Methods
    • /
    • 제7권3호
    • /
    • pp.643-654
    • /
    • 2000
  • In this paper, we review some class of t-norms on which fuzzy arithmetic operations preserve the shapes of fuzzy numbers and the Hausdorff-distance between fuzzy numbers as the measure of distance between fuzzy numbers. And we suggest the least Hausdorff-distance square method for fuzzy linear regression model using shape preserving fuzzy arithmetic operations.

  • PDF

Exact Confidence Intervals on the Regression Coeffcients in Multiple Regression Model with Nested Error Structure

  • Park, Dong-Joon
    • Communications for Statistical Applications and Methods
    • /
    • 제4권2호
    • /
    • pp.541-548
    • /
    • 1997
  • In regression model with nested error structure interval estimations on regression coefficients in different stages are proposed. Ordinary least square estimators and generalized least square estimators of the regression coefficients in this model are derived for between and within group model. The confidence intervals are dervied by using independent idstributional properties between regression coefficient estimators and quadratic froms obtained from the model.

  • PDF

도로포장 반응모형에 대한 통계모형 개발 (A Development of Statistical Model for Pavement Response Model)

  • 이문섭;박희문;김부일;허태영
    • 한국산업정보학회논문지
    • /
    • 제17권5호
    • /
    • pp.89-96
    • /
    • 2012
  • 도로포장 반응모형의 구축을 위하여 새로운 방법론으로 부분최소제곱회귀모형의 활용성을 소개하고 실제 FWD 실험자료에 적용시켰다. 실증분석 결과 일반 다중회귀모형에서 발생된 다중공선성 문제를 부분최소제곱회귀모형을 통하여 해결방안을 제시하였으며, 변환된 자료가 아닌 원시자료를 이용하여 모형을 구축할 수 있다는 장점도 가지고 있다.

상시감시기술에서 SVR과 PLSR을 이용한 Auto-association 모델링 및 성능비교 (Modeling and Comparison for Auto-association using Support Vector Regression (SVR) and Partial Least Square Regression (PLSR) in Online Monitoring Techniques)

  • 김성준;서인용
    • 한국지능시스템학회논문지
    • /
    • 제20권4호
    • /
    • pp.483-488
    • /
    • 2010
  • 센서시스템을 이용한 상시감시는 발전소의 효율적인 운전과 안전을 담보하는 데 필수적이다. 상시감시기술을 구현하기 위해서는 우선 센서로부터 전송된 신호로부터 발전소 운전파라미터의 참값을 예측하는 모델 즉 Auto-association (AA) 모델을 확보하는 것이 중요하다. 이를 위해 본 논문에서는 Support Vector Regression (SVR)과 Partial Least Square Regression (PLSR)을 이용하는 방안을 각각 제시한다. 이렇게 해서 구축된 모델은 모니터해야 할 파라미터가 많을 때에도 쉽게 적용할 수 있다. 실제 발전소에서 수집된 데이터셋을 이용하여 AA 모델링의 정확도 및 민감도를 비교한 결과, 정확도 면에서는 SVR이 우수한 반면 민감도 면에서는 PLSR이 다소 나은 것으로 나타났다.

A modified partial least squares regression for the analysis of gene expression data with survival information

  • Lee, So-Yoon;Huh, Myung-Hoe;Park, Mira
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권5호
    • /
    • pp.1151-1160
    • /
    • 2014
  • In DNA microarray studies, the number of genes far exceeds the number of samples and the gene expression measures are highly correlated. Partial least squares regression (PLSR) is one of the popular methods for dimensional reduction and known to be useful for the classifications of microarray data by several studies. In this study, we suggest a modified version of the partial least squares regression to analyze gene expression data with survival information. The method is designed as a new gene selection method using PLSR with an iterative procedure of imputing censored survival time. Mean square error of prediction criterion is used to determine the dimension of the model. To visualize the data, plot for variables superimposed with samples are used. The method is applied to two microarray data sets, both containing survival time. The results show that the proposed method works well for interpreting gene expression microarray data.