• 제목/요약/키워드: Number of Sample Size

검색결과 584건 처리시간 0.024초

Sample Size and Statistical Power Calculation in Genetic Association Studies

  • Hong, Eun-Pyo;Park, Ji-Wan
    • Genomics & Informatics
    • /
    • 제10권2호
    • /
    • pp.117-122
    • /
    • 2012
  • A sample size with sufficient statistical power is critical to the success of genetic association studies to detect causal genes of human complex diseases. Genome-wide association studies require much larger sample sizes to achieve an adequate statistical power. We estimated the statistical power with increasing numbers of markers analyzed and compared the sample sizes that were required in case-control studies and case-parent studies. We computed the effective sample size and statistical power using Genetic Power Calculator. An analysis using a larger number of markers requires a larger sample size. Testing a single-nucleotide polymorphism (SNP) marker requires 248 cases, while testing 500,000 SNPs and 1 million markers requires 1,206 cases and 1,255 cases, respectively, under the assumption of an odds ratio of 2, 5% disease prevalence, 5% minor allele frequency, complete linkage disequilibrium (LD), 1:1 case/control ratio, and a 5% error rate in an allelic test. Under a dominant model, a smaller sample size is required to achieve 80% power than other genetic models. We found that a much lower sample size was required with a strong effect size, common SNP, and increased LD. In addition, studying a common disease in a case-control study of a 1:4 case-control ratio is one way to achieve higher statistical power. We also found that case-parent studies require more samples than case-control studies. Although we have not covered all plausible cases in study design, the estimates of sample size and statistical power computed under various assumptions in this study may be useful to determine the sample size in designing a population-based genetic association study.

대형 저서동물 군집의 채집 면적이 상대적 출현 종수에 갖는 효과의 추정 (Estimating the Size Effect on Relative Species Number in Macrobenthic Community)

  • 유재원;김창수;박미라;이형곤;이창근;이재학;홍재상
    • 한국해양학회지:바다
    • /
    • 제9권1호
    • /
    • pp.20-29
    • /
    • 2004
  • 채집 면적이 다른 연구 결과 간 출현 종수의 비교를 가능토록 하기 위하여 대형 저서동물 군집 출현 종수와 채집면적에 따른 관계를 파악하고 경험적 모형을 추정하였다 이 연구는 주어진 채집 면적에서의 누적 상대종수(cumulative relative species number. CRSN)를 예측하는 데에 목적을 두었다. 재료로는 2002년 4월과 5월 그리고 8월에 방문한 전라북도 새만금 해역의 총 87개 정점에서 매 정점마다 정량 채니기인 Smith-McIntyre 그랩 채집기로 3회 반복 채집하여 구한 총 261개의 표본을 사용하였다. 상대적 출현 종수(%)는 1000 $ extrm{cm}^2$ 채집 면적의 것을 기준하였으며 누적 상대종수-채집 면적 간 패턴을 측정하고 관찰하였다. 환경 요인과 생물학적 변수간 상관관계 분석에서 대수 변환된 누적 상대종수는 유일하게 대수 변환된 평균 밀도와 유의한 관계를 갖는 것으로 추정되었다. 이를 바탕으로 3개 모형, Log CRSN 2000, Log CRSN 3000 그리고 Log CRSN을 제시하였다. 이들 중 앞의 2개는 각각 채집면적 2000과 3000 $\textrm{cm}^2$의 누적 상대종수를 추정하며, 후자는 다양한 채집기와 채집 면적으로부터의 것을 추정하기 위한 것이다(모형의 유의수준은 모두 <0.001).타 연구의 데이터베이스(과거 경기만과 새만금의 조간대나 조하대 대형저서동물 군집 자료)를 활용하여 모형의 타당성을 평가하였다. 채집 면적 3000 $\textrm{cm}^2$이내에서는 실측된 누적 상대종수가 모형의 95% 예측 구간에 포함되는 것으로 나타났으며 이 채집 면적 내에서의 예측치는 신뢰 가능한 것으로 판단할 수 있었다.

사업체노동력조사를 활용한 빈 일자리 수 추정에 대한 정합성 연구 (A Study of Consistency in Estimating the Number of Vacant Jobs Using the Labor Force Survey at Establishments)

  • 박승환
    • 아태비즈니스연구
    • /
    • 제13권3호
    • /
    • pp.329-341
    • /
    • 2022
  • Purpose - The purpose of this study was to investigate consistency in estimating the number of vacant jobs using the two business labor force survey with two different time points of survey. Design/methodology/approach - We studied the cause of the differences in estimating the number of vacant jobs between the monthly sample and the new sample in business labor force survey. Findings - To summarize our findings, As the size of the company increases, the number of vacant jobs in the company also increases, and the probability that the number of vacant jobs in the company is zero decreases. The monthly sample was assessed to have a higher likelihood that the number of vacant jobs in the company was zero and the number of vacant jobs was considerable compared to the local sample. Research implications or Originality - Because local survey sample companies tend to minimize the number of vacant jobs even when they reply under the same conditions, the estimation result of the number of vacant jobs in the current monthly survey differs significantly from the estimation result of the local survey. Divergent "degrees of knowledge of question items," survey methodologies, or investigators could be the causes of the various response trends.

국내 돼지오제스키병의 혈청학적 감시활동(surveillance)을 위한 표본크기 (Sample size for serological surveillance of Aujeszky's disease in Korea)

  • 김으뜸;박선일;박최규;권창희
    • 대한수의학회지
    • /
    • 제47권4호
    • /
    • pp.417-423
    • /
    • 2007
  • Serological surveillance programs in animal populations are becoming increasingly important to estimate prevalence of a specific disease and subsequently to document disease-free status in a region or a country. For these purposes, the programs need to be based on both theoretical and economical aspects from the designing phase. From Aujeszky's disease (AD)-eradication program point of view, group of animals (aggregates, herds) not individual animal is the more important sampling unit of concern. In this study the authors therefore attempted to compute an appropriate sample size tailored to a current surveillance program against AD, assuming that the goal of this program is either herd-level prevalence estimation or documentation of AD-freedom. For prevalence estimation, assuming a finite population with imperfect sensitivity (Se) and specificity (Sp) of ELISA kit for AD diagnosis, the number of herds present, expected herd prevalence, and desired accuracy for a certain level of confidence, sample size was estimated at herd-level in the first stage and individual animal-level in the second stage. A two-stage sampling design was used to calculate a sample size to indicate AD-freedom. In this instance, the computation was based on the possible detection of a predetermined prevalence at a certain herd-level Se and Sp. This study indicated that the sample size varied with predetermined confidence, tolerance, Se and Sp at herd- and animal-level, and within- and among-herd prevalence. In general, smaller sample size was required to estimate AD prevalence than to document of AD-freedom. Compared to individual-based samples, two-stage sampling strategy requires a larger sample size to show disease-freedom. Statistical considerations including herd-level test characteristics when designing surveillance program also are further discussed.

Double Sampling with Zero Acceptance Number for the First Sample

  • Bai, Do-Sun
    • 대한산업공학회지
    • /
    • 제3권2호
    • /
    • pp.99-106
    • /
    • 1977
  • A double sampling procedure with zero acceptance number for the first sample whose operating characteristic closely matches that of a given single sampling plan and whose combined sample size does not exceed that of the given single sampling plan is proposed. The proposed double sampling plans corresponding to the MIL-STD-105D plans are tabulated and it is found that their ASN's are considerably smaller than those of corresponding MIL-STD-105D single or double sampling plans.

  • PDF

고차원 자료의 재현성과 표본 수 (Reproducibility and Sample Size in High-Dimensional Data)

  • 서원석;최지아;정형철;조형준
    • 응용통계연구
    • /
    • 제23권6호
    • /
    • pp.1067-1080
    • /
    • 2010
  • 임상시험을 위한 표본 수 산정방법에 대해 지금까지 많은 방법이 개발되었고 현재 국내외 임상시험 기관에서 이 방법들을 토대로 표본 수를 산정하고 있다. 하지만 마이크로어레이칩 을 이용한 실험에 필요한 표본 수 산정에 대한 연구는 아직 미비하여 제대로 이용되지 않고 있다. 본 연구의 목적은 마이크로어레이 실험에 필요한 표본 수를 산정하는 데 있어 실제 마이크로어레이 자료의 재현성에 대한 정보를 이용하여 그 지침을 제공하는데 있다. 재현성 비교에서는 5가지 검정방법 즉, Fold change, Two-sample t-test, Wilcoxon rank-sum test, SAM, LPE 방법 별로 재현성을 측정하였다. 발현 값의 표준화 방법에 있어서는 MAS5, RMA 두 가지로 세분화 하였으며 반복수에 따라 상위 20개 또는 100개 유전자에 대한 일치성도 측정하였다. 또한, 표본수를 산정하는데 있어 기존에 제시한 방법에 현실적인 정보를 이용하여 좀 더 세분화하여 실험에 필요한 표본수를 산정해 보았다.

바이오 시료의 적정온도 사이클 유지를 위한 채널형 히트싱크에 대한 실험적 연구 (Experimental Study on the Channel Type Heat Sink to Maintain Proper Temperature Cycle of Bio-Sample)

  • 황정규;박상희
    • 한국산업융합학회 논문집
    • /
    • 제26권1호
    • /
    • pp.183-191
    • /
    • 2023
  • This study was conducted experimentally to investigate the surface temperature of the heat sink, the air temperature in the flow channel and the sample temperature by changing the channel number of channel type heat sink and the air flow rate when heating and cooling the bio sample. The target temperature of the sample was 15℃ or less as the minimum value and 82℃ or more as the maximum value. In this study, the channel number of the heat sink(N = 1, 2, 4, 5, 10) and the air flow rate(Q=25, 42, 54m3/min) were varied. The bio sample was replaced with water, and the volume of water is 4mL. The size of the heat sink is 80x73x150mm and the material is aluminum. When cooling the sample, the surface temperature, the air temperature and the sample temperature were highly dependent on the number of channels and the flow rate. However, when the sample is heated, the surface temperature, air temperature and sample temperature do not depend on the number of channels and the flow rate. It was found that the conditions for satisfying the minimum temperature of 15℃ or less when cooling the sample were the number of channels N≥5 and the flow rate Q≥42m3/min. When heating the sample, the conditions to satisfy the maximum temperature of 82℃ or more are the number of channels N≤5 and the air flow rate Q≤42m3/min.

시험 장비의 용량제한을 고려한 무고장 신뢰성 시험의 경제적 설계 (Economic Design of A Zero-Failure Reliability Demonstration Test Considering Capacity Limitation of Test Equipment)

  • 한숙현;윤원영;서순근
    • 품질경영학회지
    • /
    • 제49권3호
    • /
    • pp.341-358
    • /
    • 2021
  • Purpose: After product development, a Reliability Demonstration Test(RDT) is performed to confirm that the target life has been achieved. In the RDT, there are cases where the test equipment cannot accommodate all samples. Therefore, this study considers a test method to most economically demonstrate the target life of the product at a certain confidence level when the sample size is larger than the capacity of the test equipment. Methods: If the sample size is larger than the capacity of the test equipment, test equipments may be added or the test time of individual samples may be increased. So the test method is designed to cover this situation with limited capacity. A zero-failure test method is applied as a test method to RDT. To minimize the cost, the test cost is defined and the cost function is obtained. Finally, we obtain the optimal test plan. Results: A zero-failure test method is designed when the sample size is larger than the capacity of the test equipment, and the expected total cost is derived. In addition, the process of calculating the appropriate sample size, test time, and number of test equipment is illustrated through an example, and the effects of model parameters to the optimal solutions are investigated numerically. Conclusion: In this paper, we study a zero-failure RDT with test equipment that has limited capacity. The expected total cost is derived and the optimal sample size, test time, and number of test equipment are determined to minimize the expected total cost. We also studied numerical examples and for further studies, we can relax some restrictions in the test model and optimize the test method.

소지역 추정방법을 이용한 실업자 수 추정 사례연구 (Estimation of the Number of the Unemployed Using Small Area Estimation Methods)

  • 권세혁
    • 한국조사연구학회지:조사연구
    • /
    • 제10권1호
    • /
    • pp.141-154
    • /
    • 2009
  • 정보화 사회에서는 목표지향적이고 세분화된 통계의 필요성이 높아지고 있으나 현재 사용되는 조사체계를 이용하면 추정 분산이 커져 생산된 통계의 정확도가 낮아진다. 표본크기를 늘리면 추정분산을 줄일 수 있으나 비용이나 시간 면에서는 비효율적이다. 현재와 비슷한 규모의 표본조사구 조사와 일반 행정통계를 이용하여 일정 신뢰수준을 갖춘 통계를 생산할 수 있는 소지역 추정법에 대한 연구가 진행되어 개발 적용되고 있다. 본 연구에서는 소지역 추정법을 활용하여 대전광역시의 5개 구별 실업자 수를 추정하고 추정치의 CV 값을 계산하여 추정방법의 효율성을 비교하는 사례분석을 실시하였다. 또한 합성추정량과 복합추정량의 MSE를 보다 정확하게 계산하는 방법으로 잭나이프 방법을 제안하고 계산방법을 보였다.

  • PDF

소나무 천연집단(天然集團)의 변이(變異)에 관(關)한 연구(硏究)(IV) -집단간(集團間) 및 가계간분산(家系間分散) 추정(推定)에 영향하는 가계수(家系數)에 대하여- (The Variation of Nutural Population of Pinus densiflora S. et Z. in Korea -Change of variance due to number of family as sample size to affirm the population and family variations-)

  • 임경빈;권기원;이경재
    • 한국산림과학회지
    • /
    • 제35권1호
    • /
    • pp.39-46
    • /
    • 1977
  • 본연구(本硏究)는 1974년(年)에 선발(選拔)하여 그후에 수년간(數年間)에 걸처 분석(分析)한 주왕산(周王山), 안면도(安眠島), 오대산(五臺山)의 소나무(Pinus densifiora S. et Z.) 천연집단(天然集團)의 형질(形質)중에시 차대묘목(次代苗木)(1-0묘(苗), 1-1묘(苗))의 묘고(苗高) 및 근원경(根元徑)의 집단간(集團間), 가계간(家系間)의 차이(差異)를 추정(推定)함에 있어 가계(家系)의 수(數)를 어느 정도의 크기로 해야만 좋은 추정(推定)을 할 수 있는 가를 알아보기 위함이었다. 본 분석(分析)은 Nested Design의 2-level의 equal sample size에 의한 방법(方法)과 Randomized Complete Block Design에 의한 방법(方法) 두 가지를 이용하였으며 그 결과(結果)를 요약(要約)하면 다음과 같다. 1. Nested design에 의한 분석(分析)에 있어서 sample size(가계수(家系數))의 증가(增加)에 따라 가계간(家系間)의 F-치(値)는 대 체로 감소(減少)하나 집단간(集團間)의 F-치(値)는 점점 증가(增加)하는 경향(傾向)을 보였다. 2. F-치(値)의 증가(增加) 및 감소(減少)의 경향(傾向)은 그 sample size가 적을 때는 크게 변화(變化)를 보이나 그의 크기가 대략 10을 넘으면서부터는 다소 안정(安定)된 값을 보이고 있어 만일 sample size가 15~20정도가 되면 상당히 안정되고 그에 따라 집단간차이(集團間差異)를 추정(推定)하는데 오류(誤謬)를 범할 확률(確率)은 대단히 낮아질 것으로 추론(推論)되었다. 3. 연속적(連續的)으로 누적가산(累積加算)된 sample size를 가지고 분석(分析)할 때와 추출조합(抽出組合)된 sample을 가지고 분석(分析)할 때 F-치(値)의 변동(變動)은 후자(後者)가 훨씬 심하고 또 sample size가 적을때 그런 차이(差異)가 심해지는 것을 볼 수 있었다. 또한 분석대상형질(分析對象形質)이 다른 때에는 역시 그에 따른 분석가계수(分析家系數)의 조정(調整)이 필요(必要)할 것으로 보였다. 4. Randomized Complete Block Design에 의한 분석(分析)에서 가계간(家系間)의 차이(差異)에 대(對)한 분석(分析)은 집단간(集團間)의 추정(推定)에 필요(必要)한 가계수(家系數)보다는 적은 가계수(家系數)로도 분석가능(分析可能)하였다. 이것은 일반적(一般的) 추리(推理)를 그대로 입증(立證)해 주는 것에 불과(不過)하였다. 반복구간(反復區間)의 차이(差異)에 대한 추정(推定)에서 Sample Size가계수(家系數)의 영향(影響)은 일정하게 말하기 힘들었다.

  • PDF