• 제목/요약/키워드: Spatial Scan Statistic

검색결과 8건 처리시간 0.023초

Optimizing the maximum reported cluster size for normal-based spatial scan statistics

  • Yoo, Haerin;Jung, Inkyung
    • Communications for Statistical Applications and Methods
    • /
    • 제25권4호
    • /
    • pp.373-383
    • /
    • 2018
  • The spatial scan statistic is a widely used method to detect spatial clusters. The method imposes a large number of scanning windows with pre-defined shapes and varying sizes on the entire study region. The likelihood ratio test statistic comparing inside versus outside each window is then calculated and the window with the maximum value of test statistic becomes the most likely cluster. The results of cluster detection respond sensitively to the shape and the maximum size of scanning windows. The shape of scanning window has been extensively studied; however, there has been relatively little attention on the maximum scanning window size (MSWS) or maximum reported cluster size (MRCS). The Gini coefficient has recently been proposed by Han et al. (International Journal of Health Geographics, 15, 27, 2016) as a powerful tool to determine the optimal value of MRCS for the Poisson-based spatial scan statistic. In this paper, we apply the Gini coefficient to normal-based spatial scan statistics. Through a simulation study, we evaluate the performance of the proposed method. We illustrate the method using a real data example of female colorectal cancer incidence rates in South Korea for the year 2009.

공간현상 분석을 위한 GIS 기반의 공간통계적 접근방법에 관한 고찰: 공간 군집지역 탐색을 위한 공간검색통계량의 실증적 사례분석 (A Study on Spatial Statistical Perspective for Analyzing Spatial Phenomena in the Framework of GIS: an Empirical Example using Spatial Scan Statistic for Detecting Spatial Clusters of Breast Cancer Incidents)

  • 이경주;권일
    • Spatial Information Research
    • /
    • 제20권1호
    • /
    • pp.81-90
    • /
    • 2012
  • 지리적 공간상에서 발생하는 대부분의 현상은 서로 인접한 곳에서 유사한 값을 가지는 특성이 있다. 이는 공간자기상관성과 관련이 있으며 공간분석의 존재 이유를 나타내는 개념이다. 또한 지리적 공간상에서 위치에 따라 값의 분포가 다양한 패턴을 보이게 된다. 이러한 패턴은 공간적 변이를 내포하고 있다. 즉, 특정 위치에서 항상 같은 값을 관찰할 수 있다고 단정하기는 불가능하기 때문에 이러한 변이는 본질적으로 확률론적 특성을 지닌다. 이러한 공간자료의 특성들을 무시하고 일반적 통계분석 등을 수행할 경우 공간자기상관성으로 인하여 통계분석에서 가정하는 자료 값들 간 독립성이 위배되고 분석결과는 왜곡될 가능성이 크다. 그러므로 공간자료 분석을 위해서는 공간자기상관성과 확률론적 변이를 적절하게 반영할 수 있는 수단이 필요하다. GIS는 공간적 위치정보를 처리하는데 적합하고 공간통계학은 공간적 변이를 다루는데 유용하다. 따라서 GIS를 기반으로 공간통계학을 통합하는 분석방식은 공간자료의 특성들을 고려하여 유의미한 분석을 하기에 적합한 장점이 있다. 본 연구의 목적은 공간자료 분석에 있어서 공간통계학과 GIS를 결합하는 접근방식의 유용성을 논의하고 실증적 사례분석을 통하여 구체적 활용성을 살펴보는 것이다. 이를 위하여 공간통계학을 주요 방법론으로 활용하는 공간역학(spatial epidemiology) 분야를 예시적으로 살펴보았다. 구체적으로는 공간검색통계량을 이용하여 미국 Erie 및 Niagara 카운티(New York 주) 내의 유방암 발생의 공간적 군집패턴 분석 논의하였다.

스캔 통계량을 이용한 암 클러스터 탐색 (Cancer cluster detection using scan statistic)

  • 한준희;이민정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1193-1201
    • /
    • 2016
  • 공간 또는 시공간 데이터에서 다른 지역에 비해 유난히 높은 위험률을 보이는 소위 핫 스팟 (hot spot)으로 불리는 클러스터 (cluster)를 찾으려고 하는 경우가 많다. 기존의 많은 방법들은 이러한 클러스터 패턴이 존재하는지에 대한 해답만 주었지만, 최근의 많은 방법들은 클러스터의 위치, 모양, 크기뿐만 아니라 찾아진 클러스터가 통계적으로 유의한지까지 검정해준다. 본 논문에서는 이러한 다양한 방법 중 가장 많이 사용되는 클러스터 탐색 방법 중 하나인 스캔 통계량을 이용한 방법을 소개하고 그 방법이 구현된 무료 소프트웨어 SaTScan을 이용한 결과를 보여주고 장단점을 논하고자 한다. 미국 국립암센터의 SEER 프로그램에서 제공하는 미국의 각 카운티별 암 사망자 자료 중 2006년 여성 폐암 사망자 데이터를 예시 데이터로 사용하여 스캔 통계량을 이용하여 구한 클러스터 탐색 결과를 제시하고 비슷한 연구를 하고자는 연구자에게 도움을 주고자 한다.

Cluster of Parasite Infections by the Spatial Scan Analysis in Korea

  • Bae, Kyoung-Eun;Chang, Yoon Kyung;Kim, Tong-Soo;Hong, Sung-Jong;Ahn, Hye-Jin;Nam, Ho-Woo;Kim, Dongjae
    • Parasites, Hosts and Diseases
    • /
    • 제58권6호
    • /
    • pp.603-608
    • /
    • 2020
  • This study was performed to find out the clusters with high parasite infection risk to discuss the geographical pattern. Clusters were detected using SatScan software, which is a statistical spatial scan program using Kulldorff's scan statistic. Information on the parasitic infection cases in Korea 2011-2019 were collected from the Korea Centers for Disease Control and Prevention. Clusters of Ascaris lumbricoides infection were detected in Jeollabuk-do, and T. trichiura in Ulsan, Busan, and Gyeongsangnam-do. C. sinensis clusters were detected in Ulsan, Daegu, Busan, Gyeongsangnamdo, and Gyeongsangbuk-do. Clusters of intestinal trematodes were detected in Ulsan, Busan, and Gyeongsangnam-do. P. westermani cluster was found in Jeollabuk-do. E. vermicularis clusters were distributed in Gangwon-do, Jeju-do, Daegu, Daejeon, and Gwangju. This clustering information can be referred for surveillance and control on the parasitic infection outbreak in the infection-prone areas.

Spatial Cluster Analysis for Earthquake on the Korean Peninsula

  • Kang, Chang-Wan;Moon, Sung-Ho;Cho, Jang-Sik;Lee, Jeong-Hyeong;Choi, Seung-Bae;Beum, Soo-Gyun
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권4호
    • /
    • pp.1141-1150
    • /
    • 2006
  • In this study, we performed spatial cluster analysis which considered spatial information using earthquake data for Korean peninsula occurred on 1978 year to 2005 year. Also, we look into how to be clustered for regions using earthquake magnitude and frequency based on spatial scan statistic. And, on the basis of the results, we constructed earthquake map by earthquake outbreak risk and gave a possible explanation for the results of spatial cluster analysis.

  • PDF

Spatial analysis of $PM_{10}$ and cardiovascular mortality in the Seoul metropolitan area

  • Lim, Yu-Ra;Bae, Hyun-Joo;Lim, Youn-Hee;Yu, Seungdo;Kim, Geun-Bae;Cho, Yong-Sung
    • Environmental Analysis Health and Toxicology
    • /
    • 제29권
    • /
    • pp.5.1-5.7
    • /
    • 2014
  • Objectives Numerous studies have revealed the adverse health effects of acute and chronic exposure to particulate matter less than $10{\mu}m$ in aerodynamic diameter ($PM_{10}$). The aim of the present study was to examine the spatial distribution of $PM_{10}$ concentrations and cardiovascular mortality and to investigate the spatial correlation between $PM_{10}$ and cardiovascular mortality using spatial scan statistic (SaTScan) and a regression model. Methods From 2008 to 2010, the spatial distribution of $PM_{10}$ in the Seoul metropolitan area was examined via kriging. In addition, a group of cardiovascular mortality cases was analyzed using SaTScan-based cluster exploration. Geographically weighted regression (GWR) was applied to investigate the correlation between $PM_{10}$ concentrations and cardiovascular mortality. Results An examination of the regional distribution of the cardiovascular mortality was higher in provincial districts (gu) belonging to Incheon and the northern part of Gyeonggi-do than in other regions. In a comparison of $PM_{10}$ concentrations and mortality cluster (MC) regions, all those belonging to MC 1 and MC 2 were found to belong to particulate matter (PM) 1 and PM 2 with high concentrations of air pollutants. In addition, the GWR showed that $PM_{10}$ has a statistically significant relation to cardiovascular mortality. Conclusions To investigate the relation between air pollution and health impact, spatial analyses can be utilized based on kriging, cluster exploration, and GWR for a more systematic and quantitative analysis. It has been proven that cardiovascular mortality is spatially related to the concentration of $PM_{10}$.

스캔통계량 분석을 통한 상수도 누수 및 수질 민원 발생 클러스터 탐색 (Cluster exploration of water pipe leak and complaints surveillance using a spatio-temporal statistical analysis)

  • 이주원;김은주;남숙현;황태문
    • 상하수도학회지
    • /
    • 제37권5호
    • /
    • pp.261-269
    • /
    • 2023
  • In light of recent social concerns related to issues such as water supply pipe deterioration leading to problems like leaks and degraded water quality, the significance of maintenance efforts to enhance water source quality and ensure a stable water supply has grown substantially. In this study, scan statistic was applied to analyze water quality complaints and water leakage accidents from 2015 to 2021 to present a reasonable method to identify areas requiring improvement in water management. SaTScan, a spatio-temporal statistical analysis program, and ArcGIS were used for spatial information analysis, and clusters with high relative risk (RR) were determined using the maximum log-likelihood ratio, relative risk, and Monte Carlo hypothesis test for I city, the target area. Specifically, in the case of water quality complaints, the analysis results were compared by distinguishing cases occurring before and after the onset of "red water." The period between 2015 and 2019 revealed that preceding the occurrence of red water, the leak cluster at location L2 posed a significantly higher risk (RR: 2.45) than other regions. As for water quality complaints, cluster C2 exhibited a notably elevated RR (RR: 2.21) and appeared concentrated in areas D and S, respectively. On the other hand, post-red water incidents of water quality complaints were predominantly concentrated in area S. The analysis found that the locations of complaint clusters were similar to those of red water incidents. Of these, cluster C7 exhibited a substantial RR of 4.58, signifying more than a twofold increase compared to pre-incident levels. A kernel density map analysis was performed using GIS to identify priority areas for waterworks management based on the central location of clusters and complaint cluster RR data.

공간정보기반 클러스터링을 이용한 초고속인터넷 결합유형별 해지의 지역별 특성연구 (A Study on the Regional Characteristics of Broadband Internet Termination by Coupling Type using Spatial Information based Clustering)

  • 박장혁;박상언;김우주
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.45-67
    • /
    • 2017
  • "2016 인터넷이용실태조사"에 따르면 인터넷 이용자수 및 이용률은 점점 증가하고 있으며 접속방법에 있어서는 컴퓨터보다 스마트폰을 통한 접속이 많아지고 있다. 스마트기기의 증가에 따라 초고속인터넷의 수요가 감소할 것이라는 전망도 있다. 하지만, 스마트기기의 증가에도 불구하고 기가인터넷을 통한 속도 향상과 IoT 시장의 성장으로 인해 초고속인터넷 시장은 당분간 유지될 것으로 전망된다. 시장의 포화로 인해 통신사업자들이 신규고객 확보를 위해 과도한 경쟁을 하고 있지만, 고객이탈의 원인을 알 수 있다면 보다 효과적인 마케팅을 통해 과도한 마케팅비용을 절감할 수 있을 것으로 기대된다. 본 연구에서는 통신사업자 A사가 보유하고 있는 안양시, 군포시, 의왕시 3개 도시의 결합유형별 해지 데이터와, 통계청으로부터 구한 지역별 데이터를 결합하여, 지역별 해지율과 이에 영향을 미치는 지역특성간의 관계를 분석하고자 하였다. 특히 인접지역에 따라 결합유형별 해지율의 분포에 차이가 있을 것으로 보고, 클러스터링을 이용하여 해지유형이 유사한 지역을 도출 및 분석하고자 하였다. 공간검색통계도구인 SatScan은 기존의 클러스터링 방법에 공간정보를 추가하여 인접지역을 중심으로 군집이 형성되도록 한다. 따라서 본 연구에서는 SatScan을 이용해 지역의 공간정보를 기반으로 유사지역을 군집화하고, 군집별 해지율과 지역별 데이터와의 연관성을 분석하였다. 분석 단계에서는 먼저 공간정보와 해지데이터를 결합하여 도출된 군집들의 특성을 정리하였으며, 다음으로 군집분석 결과를 바탕으로 하여 각 동의 초고속 인터넷 해지율과 지역별 데이터와의 연관성을 분산분석, 상관분석, 회귀분석을 이용하여 분석하였다. 그리고, 분석결과를 기반으로 하여 지역에 따른 적절한 마케팅 방안을 제안하였다.