• 제목/요약/키워드: Least median of squares (LMS)

검색결과 10건 처리시간 0.02초

LMS and LTS-type Alternatives to Classical Principal Component Analysis

  • Huh, Myung-Hoe;Lee, Yong-Goo
    • Communications for Statistical Applications and Methods
    • /
    • 제13권2호
    • /
    • pp.233-241
    • /
    • 2006
  • Classical principal component analysis (PCA) can be formulated as finding the linear subspace that best accommodates multidimensional data points in the sense that the sum of squared residual distances is minimized. As alternatives to such LS (least squares) fitting approach, we produce LMS (least median of squares) and LTS (least trimmed squares)-type PCA by minimizing the median of squared residual distances and the trimmed sum of squares, in a similar fashion to Rousseeuw (1984)'s alternative approaches to LS linear regression. Proposed methods adopt the data-driven optimization algorithm of Croux and Ruiz-Gazen (1996, 2005) that is conceptually simple and computationally practical. Numerical examples are given.

한강유역의 중소하천에 대한 계획하폭 산정 (Determination of Design Width for Medium Streams in the Han River Basin)

  • 전세진;안태진;박정응
    • 한국수자원학회논문집
    • /
    • 제31권6호
    • /
    • pp.675-684
    • /
    • 1998
  • 본 연구는 한강유역 중소하천 계획하폭 산정공식을 결정하기 위하여 216개 구간의 중소하천에서의 계획홍수량, 유역면적, 하상경사, 실제하폭을 수집한 후, 1) 최소자승법(least squares, LS), 2) 최소중간치자승법(least median squares, LMS) 및 3) 재가중최소자승법(reweighted least squares, RLS)을 이용하여 경험적인 계획 하폭 공식을 결정하였다. 한강유역에서의 기존하폭 산정공식과 비교하기 위하여 계획하폭 산정공식의 형식은 6가지 형으로 고려하였다. 기존하폭공식과 6가지 형의 공식을 평가하기 위하여 평균제곱근오차, 절대평균오차 및 평균오차를 계산하여 비교 검토한 결과, 하폭공식의 형식으로는 본 연구의 하폭-계획홍수량-하상경사로 표현된 공식이 적합한 것으로 나타났다. 본 연구에서 추정된 계획하폭 산정공식은 한강유역 중소하천 설계시 계획하폭 결정의 지표로 적용될 수 있으리라 기대된다.

  • PDF

Least quantile squares method for the detection of outliers

  • Seo, Han Son;Yoon, Min
    • Communications for Statistical Applications and Methods
    • /
    • 제28권1호
    • /
    • pp.81-88
    • /
    • 2021
  • k-least quantile of squares (k-LQS) estimates are a generalization of least median of squares (LMS) estimates. They have not been used as much as LMS because their breakdown points become small as k increases. But if the size of outliers is assumed to be fixed LQS estimates yield a good fit to the majority of data and residuals calculated from LQS estimates can be a reliable tool to detect outliers. We propose to use LQS estimates for separating a clean set from the data in the context of outlyingness of the cases. Three procedures are suggested for the identification of outliers using LQS estimates. Examples are provided to illustrate the methods. A Monte Carlo study show that proposed methods are effective.

Resistant GPA algorithms based on the M and LMS estimation

  • Hyun, Geehong;Lee, Bo-Hui;Choi, Yong-Seok
    • Communications for Statistical Applications and Methods
    • /
    • 제25권6호
    • /
    • pp.673-685
    • /
    • 2018
  • Procrustes analysis is a useful technique useful to measure, compare shape differences and estimate a mean shape for objects; however it is based on a least squares criterion and is affected by some outliers. Therefore, we propose two generalized Procrustes analysis methods based on M-estimation and least median of squares estimation that are resistant to object outliers. In addition, two algorithms are given for practical implementation. A simulation study and some examples are used to examine and compared the performances of the algorithms with the least square method. Moreover since these resistant GPA methods are available for higher dimensions, we need some methods to visualize the objects and mean shape effectively. Also since we have concentrated on resistant fitting methods without considering shape distributions, we wish to shape analysis not be sensitive to particular model.

우수거 설계를 위한 인천지방에서의 확률강우강도식의 산정 (Determination of Probable Rainfall Intensity Formulas for Designing Storm Sewer Systems at Incheon District)

  • 안태진;김경섭
    • 상하수도학회지
    • /
    • 제12권3호
    • /
    • pp.99-106
    • /
    • 1998
  • This paper presents a procedure for determining the design rainfall depth and the design rainfall intensity at Incheon city area in Korea. In this study the eight probability distributions are considered to estimate the probable rainfall depths for 11 different durations. The Kolmogorov - Smirnov test and the Chi-square test are adopted to test each distribution. The probable rainfall intensity formulas are then determined by i) the least squares (LS) method, ii) the least median squares (LMS) method, iii) the reweighted least squares method based on the LMS (RLS), and iv) the constrained regression (CR) model. The Talbot, the Sherman, the Japanese, and the Unified type are considered to determine the best type for the Incheon station. The root mean squared (RMS) errors are computed to test the formulas derived by four methods. It is found that the Unified type is the most reliable and that all methods presented herein are acceptable for determining the coefficients of rainfall intensity formulas from an engineering point of view.

  • PDF

Identification of Regression Outliers Based on Clustering of LMS-residual Plots

  • Kim, Bu-Yong;Oh, Mi-Hyun
    • Communications for Statistical Applications and Methods
    • /
    • 제11권3호
    • /
    • pp.485-494
    • /
    • 2004
  • An algorithm is proposed to identify multiple outliers in linear regression. It is based on the clustering of residuals from the least median of squares estimation. A cut-height criterion for the hierarchical cluster tree is suggested, which yields the optimal clustering of the regression outliers. Comparisons of the effectiveness of the procedures are performed on the basis of the classic data and artificial data sets, and it is shown that the proposed algorithm is superior to the one that is based on the least squares estimation. In particular, the algorithm deals very well with the masking and swamping effects while the other does not.

다중 선형 모형에서 식별된 다중 이상점과 다중 지렛점의 재확인 방법에 대한 연구 (A Confirmation of Identified Multiple Outliers and Leverage Points in Linear Model)

  • 유종영;안기수
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.269-279
    • /
    • 2002
  • 다중 이상점 과 다중 지렛점의 식별은 가장효과(masking effect)와 편승효과(swamping effect)에 영향을 받으므로 어려움이 존재한다. Rousseeuw와 van Zomeren(1990)은 LMS (Least Median of Squares) 회귀방법과 MVE(Minimum Volume Ellipsoid) 통계량을 이용하여 다중 이상점과 다중 지렛점을 식별하였다. 그러나 이들의 방법은 LMS와 MVE의 강한 로버스트성으로 인하여 이상점과 지렛점이 아닌 점들도 이상점과 지렛점으로 식별하는 경향이 있다. Fung(1993)은 식별된 이상점과 지렛점들에 대하여 재확인방법을 제안하였는데 이 방법은 인근효과(adjacent effect)에 영향을 받아 이상점과 지렛점을 식별하는데 문제가 있는 것으로 분석되었다. 본 논문은 이러한 문제점을 지적하고 새로운 방법을 제안하여 식별된 이상점과 지렛점을 재확인하고자 한다.

적응적 M-estimators 강건 예측 알고리즘 (An Adaptive M-estimators Robust Estimation Algorithm)

  • 장석우;김진욱
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.21-30
    • /
    • 2005
  • 강건 예측 기법은 오류 자료(outliers)를 제거하고 정상 자료(non-outliers)만으로 모델의 파라미터를 구하는 통계적인 방법으로 잘 알려져 있다 기존의 문헌에 소개된 많은 강건 예측 알고리즘들이 있으나 컴퓨터 비전 및 영상 처리 분야에서 가장 많이 사용되는 알고리즘은 M-estimators와 LMS(least-median of squares) 방법이다. 이 중 M-estimators는 어파인 모델(affine model)의 파라미터 측정에 있어 최적의 방법으로 잘 알려져 있다. 그러나 M-estimators는 통계적인 효율성이 높지만 초기화가 적절히 수행되지 않으면 오류 자료를 제거하는 데 문제점을 가진다 따라서 본 논문에서는 이런 문제점을 해결하기 위해 연속적인 시그모이드(sigmoid) 가중치 함수를 사용하여 오류 자료와 정상 자료를 효과적으로 분리하면서 어파인 모델의 파라미터를 효과적으로 측정하는 적응적인 M-estimators 강건 예측 알고리즘을 제안한다. 실험에서는 기존의 강건 예측 방법과 제안된 적응적 강건 예측 방법의 성능을 비교 및 분석하여 제안된 방법의 우수함을 보인다.

  • PDF

시계열 자료를 이용한 등유수요함수 추정 (Estimation of kerosene demand function using time series data)

  • 정동원;황병소;유승훈
    • 에너지공학
    • /
    • 제22권3호
    • /
    • pp.245-249
    • /
    • 2013
  • 본 논문에서는 1981년부터 2012년까지의 시계열 자료를 이용하여 등유수요함수를 추정하고자 한다. 등유수요함수는 수용가의 등유 수요행태에 대한 정보를 제공하여 가격과 같은 주요 정책변수의 효과를 사전적으로 진단하는 데, 그리고 수요예측을 하는 데 유용하게 활용된다. 수요함수의 모수에 대한 강건한 추정치를 얻기 위해 최소자승법 추정법 뿐만 아니라 최소절대편차법 및 LMS 추정법을 사용하였다. 단기 가격탄력성 및 소득탄력성은 각각 -0.468 및 0.409로 추정되었으며 유의수준 1%에서 통계적으로 유의하였다. 단기 가격탄력성은 가격에 비탄력적인 등유수요의 특징을 보여주고 있으며, 단기 소득탄력성 역시 비탄력적으로 추정되어 소득 증감에 따라 등유의 수요가 크게 변화지 않음을 알 수 있다. 반면, 장기 가격탄력성 및 소득탄력성은 각각 -4.560 및 3.990으로 나타나 탄력적임을 알 수 있다.

항공사진과 SPOT-5 위성영상을 이용한 낙동강 하구역 울타리섬들의 해안선 변화율 (Shoreline-change Rates of the Barrier Islands in Nakdong River Estuary Using Aerial Photography and SPOT-5 Image)

  • 정상훈;김부근;김백운;이상룡
    • Ocean and Polar Research
    • /
    • 제35권1호
    • /
    • pp.1-14
    • /
    • 2013
  • Shoreline data of the barrier islands in Nakdong River Estuary for the last three decades were assembled using six sets of aerial photographs and seven sets of satellite images. Canny Algorithm was applied to untreated data in order to obtain a wet-dry boundary as a proxy shoreline. Digital Shoreline Analysis System (DSAS 4.0) was used to estimate the rate of shoreline changes in terms of five statistical variables; SCE (Shoreline Change Envelope), NSM (Net Shoreline Movement), EPR(End Point Rate), LRR (Linear Regression Rate), and LMS (Least Median of Squares). The shoreline in Jinwoodo varied differently from one place to another during the last three decades; the west tail has advanced (i.e., seaward or southward), the west part has regressed, the south part has advanced, and the east part has regressed. After the 2000s, the rate of shoreline changes (-2.5~6.7 m/yr) increased and the east advanced. The shoreline in Shinjado shows a counterclockwise movement; the west part has advanced, but the east part has retreated. Since Shinjado was built in its present form, the west part became stable, but the east part has regressed faster. The rate of shoreline changes (-16.0~12.0 m/yr) in Shinjado is greater than that of Jinwoodo. The shoreline in Doyodeung has advanced at a rate of 31.5 m/yr. Since Doyodeung was built in its present form, the south part has regressed at the rate of -18.2 m/yr, but the east and west parts have advanced at the rate of 13.5~14.3 m/yr. Based on Digital Shoreline Analysis, shoreline changes in the barrier islands in the Nakdong River Estuary have varied both temporally and spatially, although the exact reason for the shoreline changes requires more investigation.