DOI QR코드

DOI QR Code

A Comparative Study on Spatial Lattice Data Analysis - A Case Where Outlier Exists -

공간 격자데이터 분석에 대한 우위성 비교 연구 - 이상치가 존재하는 경우 -

  • Kim, Su-Jung (Department of Data Information Science, Dongeui University) ;
  • Choi, Seung-Bae (Department of Data Information Science, Dongeui University) ;
  • Kang, Chang-Wan (Department of Data Information Science, Dongeui University) ;
  • Cho, Jang-Sik (Department of Informational Statistics, Kyungsung University)
  • 김수정 (동의대학교 데이터정보학과) ;
  • 최승배 (동의대학교 데이터정보학과) ;
  • 강창완 (동의대학교 데이터정보학과) ;
  • 조장식 (경성대학교 정보통계학과)
  • Received : 20100100
  • Accepted : 20100300
  • Published : 2010.03.31

Abstract

Recently, researchers of the various fields where the spatial analysis is needed have more interested in spatial statistics. In case of data with spatial correlation, methodologies accounting for the correlation are required and there have been developments in methods for spatial data analysis. Lattice data among spatial data is analyzed with following three procedures: (1) definition of the spatial neighborhood, (2) definition of spatial weight, and (3) the analysis using spatial models. The present paper shows a spatial statistical analysis method superior to a general statistical method in aspect estimation by using the trimmed mean squared error statistic, when we analysis the spatial lattice data that outliers are included. To show validation and usefulness of contents in this paper, we perform a small simulation study and show an empirical example with a criminal data in BusanJin-Gu, Korea.

최근들어 공간적으로 분석을 필요로 하는 여러 분야에서의 연구자들은 공간통계학에 많은 관심을 가지게 되었다. 그리고 통계학 분야 역시 공간상에서 얻어진 데이터에 공간자기상관이 존재할 경우 공간적으로 분석해야 한다는 주장과 함께 많은 연구가 진행되고 있다. 공간통계학에서 다루고 있는 데이터 중에서 '공간 격자데이터 분석'은 (1) 공간이웃의 정의, (2) 공간이웃 가중치의 정의, (3) 공간모형의 적용 등의 단계를 거쳐서 행해진다. 본 연구에서는 이상치가 존재하는 공간 격자데이터를 분석할 경우 절사평균제곱오차를 이용하여 분석함으로써 예측적인 측면에서 공간통계학적 방법이 일반통계학적 방법보다 더 우수함을 보인다. 본 연구에 대한 내용의 타당성을 보이기 위해서 시뮬레이션을 통하여 공간통계학적인 방법과 일반통계학적인 방법을 비교하였다. 그리고 부산진구의 실제 범죄데이터를 이용한 적용사례를 통하여 절사평균제곱오차를 사용한 공간통계학적 방법의 유용성을 알아보았다.

Keywords

References

  1. 김정숙, 황희진, 신기일 (2008). 이웃정보시스템을 이용한 공간 소지역 추정량 비교, <응용통계연구>, 21, 855-866. https://doi.org/10.5351/KJAS.2008.21.5.855
  2. 전수영, 임성섭 (2009). 오차항이 SAR(1)을 따르는 공간선형회귀모형에서 일반화 최대엔트로피 추정량에 관한 연구, <한국통계학회논문집>, 16, 265-275. https://doi.org/10.5351/CKSS.2009.16.2.265
  3. 황희진, 신기일 (2009). MSPE를 이용한 임금총액 소지역 추정, <응용통계연구>, 22, 403-414. https://doi.org/10.5351/KJAS.2009.22.2.403
  4. Besag, J. (1974). Spatial interaction and statistical analysis of lattice systems, Journal of Royal statistical Society: Series B, 36, 192-236.
  5. Cressie, N. and Chan, N. H. (1989). Spatial modeling of regional variables, Journal of the American Statistical Association, 84, 393-401. https://doi.org/10.1080/01621459.1989.10478783
  6. Cressie, N. A. C. (1991). Statistics for Spatial Dat, John Wiley & Sons, New York.
  7. Griffith, D. A. and Layne, L. J. (1999). A Casebook for Spatial Statistical Data Analysis: A Compilation of Analyses of Different Thematic Data Set, Oxford University Press, Oxford.
  8. Jhung, Y. and Swain, P. H. (1996). Bayesian contextual classification based on modified M-estimates and Markov random fields, IEEE Transaction of Pattern Analysis and Machine Interlligence, 34, 67-75.
  9. Moran, P. (1948). The interpretation of statistical maps, Journal of Royal Statistical Society, 10, 243-251.
  10. Smirnov, O. and Anselin, L. (2009). Parallel method of computing the Log-Jacobian of the variable trans-formation for models with spatial interaction on a lattice, Computational Statistics and Data Analysis, 53, 2980-2988. https://doi.org/10.1016/j.csda.2008.10.010
  11. Stephen P. K., Silvia C. V., Tamre P. C. and Alice A. S. (1996). S+SpatialStats User's Manual, MathSofh, Inc.: Seattle, Washington.
  12. http://www.kostat.go.kr
  13. http://www.krihs.re.kr