• 제목/요약/키워드: winsorization

검색결과 3건 처리시간 0.013초

Weight Reduction Method for Outlier in Survey Sampling

  • Kim Jin
    • Communications for Statistical Applications and Methods
    • /
    • 제13권1호
    • /
    • pp.19-27
    • /
    • 2006
  • Outliers in survey are a perennial problem for applied survey statisticians to estimate the total or mean of population. The influence of outliers is more increasing as they have large weights in survey sampling. Many techniques have been studied to lower the impact of outliers on sample survey estimates. Outliers can be downweighted by winsorization or reducing the weight of outliers. The weight reduction is more reasonable than replacing one outlier by one value of non-outliers, because it has at least one unit. In this paper, we suggest the square root transformation of weight as the weight reduction method. We show this method is efficient with real data, and it's also easy to apply in practical affairs.

윈저화를 이용한 로버스트 분산분석 (On a robust analysis of variance based on winsorization)

  • 성내경
    • 응용통계연구
    • /
    • 제8권1호
    • /
    • pp.119-131
    • /
    • 1995
  • 윈저화 자료에 기초한 분산분석법 개발의 일차시도로 고정효과 일원 분산분석 모형에 대한 윈저화 분산분석을 제시한다. 몬테 칼로 모의실험 기법을 사용하여 각 요인 수준마다 g-g 대칭 윈저화를 적용시켰을 때 윈저화 자료에 기초한 제곱합들의 비의 경험적 분포가 통상의 F 분포로 근사됨을 보인다. 이 근사 F 분포의 자유도는 윈저화 카이제곱 통계량의 경험적 분포가 자유도 (n-3g-1)의 통상적인 카이제곱 분포에 만족할만하게 근사되어진다는 성내경(1994)의 연구 성과를 토대로 결정된다. 여기서 n은 표본 크기, g는 한쪽 꼬리 부분에서 윈저화가 적용되는 양이다. 산출된 분산비의 경험적 분위수의 일부를 수록하였다. 이 연구는 non-adaptive 로버스트 분산분석법을 제안하는 것으로 이상점이 존재하는 분산분석 자료에 적용하면 자료 해석이 단순화되는 실용성을 위주로 한다.

  • PDF

경제조사에서의 이상치 탐지와 처리방법 (Outlier detection and treatment in industrial sampling survey)

  • 주영선;조교영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권1호
    • /
    • pp.131-142
    • /
    • 2016
  • 통계조사에서 이상치는 총계추정에 큰 영향을 줄 수 있다. 통계조사에서 보고된 값은 극단적이 아니지만 그것의 가중치 (weight)가 커서 추정값에 큰 영향을 주거나, 극단값이라 해도 그것이 작은 가중치를 가질 때 추정에 큰 영향을 주지 않는 경우도 있다. 이러한 극단값이나 추정에 영향을 주는 값 들은 표본조사에서 민감하다. 일반적으로 치우친 분포를 가진 모집단에서 추출된 표본으로 조사를 하는 사업체 조사에서는 특별히 더 큰 영향을 준다. 본 연구에서는, 우리는 이상치를 판별하고 처리하는 방법에 대해서 다루고자 한다. 이상치 판별은 분위수에 기초해서 판정하였으며, 판정된 이상치는 여러 가지 다양한 방법을 적용해 보았다. 연구에서는 2가지 winsorised 방법과 세가지 cut-off 방법에 대하여 적용하였다. 그리고 시뮬레이션에서는 4가지 방법의 가중치를 각각 적용하여 진행하였다. 여러 가지 이상치 처리방법들을 비교해 본 결과 type I 윈저화 방법보다는 type II 윈저화 방법이 효율적인 결과값을 보여주었으며, 가중치 변환방법들 중에서는 제곱근 변환을 통한 가중치 감소방법이 다른 처리방법에 비해 좋은 결과값을 보여주었다.