• 제목/요약/키워드: Finite population sampling

검색결과 36건 처리시간 0.019초

Estimation of the time-dependent AUC for cure rate model with covariate dependent censoring

  • Yang-Jin Kim
    • Communications for Statistical Applications and Methods
    • /
    • 제31권4호
    • /
    • pp.365-375
    • /
    • 2024
  • Diverse methods to evaluate the prediction model of a time to event have been proposed in the context of right censored data where all subjects are subject to be susceptible. A time-dependent AUC (area under curve) measures the predictive ability of a marker based on case group and control one which are varying over time. When a substantial portion of subjects are event-free, a population consists of a susceptible group and a cured one. An uncertain curability of censored subjects makes it difficult to define both case group and control one. In this paper, our goal is to propose a time-dependent AUC for a cure rate model when a censoring distribution is related with covariates. A class of inverse probability of censoring weighted (IPCW) AUC estimators is proposed to adjust the possible sampling bias. We evaluate the finite sample performance of the suggested methods with diverse simulation schemes and the application to the melanoma dataset is presented to compare with other methods.

국내 돼지오제스키병의 혈청학적 감시활동(surveillance)을 위한 표본크기 (Sample size for serological surveillance of Aujeszky's disease in Korea)

  • 김으뜸;박선일;박최규;권창희
    • 대한수의학회지
    • /
    • 제47권4호
    • /
    • pp.417-423
    • /
    • 2007
  • Serological surveillance programs in animal populations are becoming increasingly important to estimate prevalence of a specific disease and subsequently to document disease-free status in a region or a country. For these purposes, the programs need to be based on both theoretical and economical aspects from the designing phase. From Aujeszky's disease (AD)-eradication program point of view, group of animals (aggregates, herds) not individual animal is the more important sampling unit of concern. In this study the authors therefore attempted to compute an appropriate sample size tailored to a current surveillance program against AD, assuming that the goal of this program is either herd-level prevalence estimation or documentation of AD-freedom. For prevalence estimation, assuming a finite population with imperfect sensitivity (Se) and specificity (Sp) of ELISA kit for AD diagnosis, the number of herds present, expected herd prevalence, and desired accuracy for a certain level of confidence, sample size was estimated at herd-level in the first stage and individual animal-level in the second stage. A two-stage sampling design was used to calculate a sample size to indicate AD-freedom. In this instance, the computation was based on the possible detection of a predetermined prevalence at a certain herd-level Se and Sp. This study indicated that the sample size varied with predetermined confidence, tolerance, Se and Sp at herd- and animal-level, and within- and among-herd prevalence. In general, smaller sample size was required to estimate AD prevalence than to document of AD-freedom. Compared to individual-based samples, two-stage sampling strategy requires a larger sample size to show disease-freedom. Statistical considerations including herd-level test characteristics when designing surveillance program also are further discussed.

가중치 보정 추정량에 대한 일반적인 분산 추정법 연구 (Variance Estimation for General Weight-Adjusted Estimator)

  • 김재광
    • 응용통계연구
    • /
    • 제20권2호
    • /
    • pp.281-290
    • /
    • 2007
  • 유한 모집단에서 총계 추정에는 표본의 각 관측값으로 만들어지는 선형 추정량이 사용되는데 이때 사용되는 가중치는 표본 추출 확률의 역수를 사용한 기본 가중치를 모집단 전체에서 얻어지는 보조 정보를 이용하여 보정한 형태로 종종 사용된다. 이렇게 보정된 가중치를 사용한 추정량은 그렇지 않은 추정량보다 효율이 더 좋아질 수 있는 장점이 있으나 이러한 경우 분산 추정은 더 어려워지게 된다. 본 연구에서는 보정된 가중치를 사용한 추정량의 분산 추정을 다룬다. 가중치 보정의 일반적인 형태를 밝히고 이 경우 가중치 보정항은 유한개의 장애 모수(nuisance parameter)의 함수로 나타낼 수 있으므로 이 장애 모수에 대한 테일러 전개를 사용한 분산 추정식을 구한다. 이렇게 구현된 분산 추정식은 기존의 가중치 보정 추정량뿐만 아니라 보다 일반적인 경우에서도 적용될 수 있다는 장점이 있다. 몇가지 응용 사례와 모의 실험 결과를 소개한다.

소지역 통계 생산을 위한 추정방법 (Application of In-direct Estimation for Small Area Statistics)

  • 김영원;성나영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제11권1호
    • /
    • pp.111-126
    • /
    • 2000
  • 지방자치제 실시에 따라 우리나라에서도 전국 또는 도 단위의 통계뿐만 아니라 시 군 구 등의 소지역 통계에 대한 수요가 증대되고 있다. 하지만 정부통계 생산을 위해 실시되는 표본조사의 경우 시(특별시, 광역시) 및 도별 통계생산을 목적으로 하기 때문에 신뢰성 있는 소지역 통계를 산출하는 것이 불가능하고, 따라서 이런 소지역 통계생산을 위해 간접 추정 기법을 적극적으로 활용하는 것이 필요하다. 본 논문에서는 정부통계 생산을 위한 소지역 통계 기법의 도입 및 활용 가능성을 검토해 보기 위해 인천광역시 숙박 및 음식점업의 총매출에 대한 구별 소지역 통계를 산출할 수 있는 여러 가지 간접 추정 방법을 제시하고, 아울러 도소매업 총조사 자료를 이용하여 제시된 간접추정량들의 효율성을 비교 분석해 보고자 한다.

  • PDF

소지역 통계분석기법의 활용-도소매업 및 서비스업 통계조사 사례연구- (Application of In-direct Estimation for Small Area Statistics)

  • 김영원;성나영
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2000년도 춘계학술대회 조사연구의 방법론적 쟁점
    • /
    • pp.57-73
    • /
    • 2000
  • 지방자체 실시에 따라 우리나라에서도 시. 군. 구 등의 소지역 통계에 대한 요구가 증대되고 있다. 하지만 정부통계 생산을 위한 표본조사의 경우 시(특할시, 직할시) 및 도별 통계생산을 목적으로 하기 때문에 신뢰성 있는 소지역 통계를 산출하는것이 불가능하고, 따라서 이런 소지역 통계생산을 위해 간접추정기법의 도입 및 활용하는 것이 필요하다. 본 논문에서는 정부통계 생산을 위한 소지역 통계기법의 도입 및 활용 가능성을 검토해 보기 위해 통계청에서 실시되고 있는 도소매업 및 서비스업 통계조사 중 인천직할시 숙박 및 음식점업의 총매출액에 대한 구별 소지역 통계를 산출할 수 있는 여러가지 간접 추정방법을 제시하고, 아울러 도소매업 총 조사 자료를 이용하여 제시된 간접추정량들의 효율성을 비교 분석해 보고자 한다.

  • PDF

변분 베이지안 혼합 인자 분석에 의한 분포 추정을 이용하는 진화 알고리즘 (Evolutionary Algorithms with Distribution Estimation by Variational Bayesian Mixtures of Factor Analyzers)

  • 조동연;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권11호
    • /
    • pp.1071-1083
    • /
    • 2005
  • 최근 들어 확률 분포를 개체군으로부터 추정하여 보다 효율적으로 최적화를 해결하려는 연구가 진행되고 있다. 특히 복잡한 문제의 해결을 위해서 혼합 분포가 사용되고 있다. 그러나 이 경우 몇 개의 성분으로 혼합 분포를 나타낼 것인가를 결정하기 어려운 문제가 있으며, 각 분포에 의하여 표현되는 이전 세대의 우수한 부분 해들을 잘 결합하지 못하는 단점이 있다. 본 논문에서는 변분 베이지안 혼합 인자 분석(variational Bayesian mixtures of factor analyzers) 기법을 사용한 개체군의 분포 추정을 통해 실수 공간에서의 최적화 문제를 해결하는 방법을 제안한다. 이 기법은 혼합 분포의 개수 추정을 자동화하며, 잠재 변수(latent variable)를 사용하여 각 분포가 표현하는 세부 개체군 내에 포함된 부분 해들의 혼합을 효율적으로 수행할 수 있다. 잘 알려진 함수 최적화 문제들에 대해 다른 분포 추정 진화 알고리즘과 비교하여 제안하는 방법의 우수성을 검증하였다. 또한 시스템 생물학에서 다루고 있는 생화학 네트워크의 동적 모델링을 위한 매개변수 추정도 성공적으로 수행하였다.