• 제목/요약/키워드: normality assumption

검색결과 87건 처리시간 0.034초

시뮬레이션 일정기법;최종공사기간의 확률 통계적 특성 추정 (Probability Distribution of Project Completion Times in Simulation based Scheduling)

  • 이동은;김률희
    • 한국건설관리학회:학술대회논문집
    • /
    • 한국건설관리학회 2007년도 정기학술발표대회 논문집
    • /
    • pp.327-330
    • /
    • 2007
  • 기존의 시뮬레이션 일정기법은 최종공사기간(Project Completion Times: PCTs)이 정규분포를 따른다는 가정을 전제로 한다. 그러나 본 논문에서는 이 가정이 항상 옳은 것이 아니며, 이것이 잘못된 결과를 초래할 수 있다는 것을 검증한다. 이처럼 의문이 제기되지 않고 받아들여져 온 가정이 시뮬레이션 분석 결과에 어떠한 영향을 줄 수 있는지를 밝혀내는 리키스 정량화기법(risk Quantification method)을 MATLAB 알고리즘으로 구현하였으며, 네트워크의 모델링에서부터 시뮬레이션 출력 값들로 구성된 샘플집단들에 대한 분석에 이르기까지 전 단계를 MATLAB 프로그래밍으로 구현된 알고리즘을 사용하여 제기된 의문에 대한 답을 제시하였다. 특정 네트워크를 구성하는 엑티비티 기간 값들을 정의하는 확률분포함수의 종류를 다양하게 변화시켜 시뮬레이션 결과 값들 - 최종공사기간 값들 - 을 생성하고, 이처럼 생성된 시뮬레이션 출력 값들로 구성된 샘플집단들의 확률 통계적 특성을 분석하였다. 본 연구는 시뮬레이션을 기반으로 하는 일정관리기법의 신뢰성을 향상시키며, 일정관련 리시크 분석의 정확성을 향상시키는데 기여할 것이다.

  • PDF

변환된 자기회귀이동평균 모형에서의 예측구간추정 (Prediction Interval Estimation in Ttansformed ARMA Models)

  • 조혜민;오승언;여인권
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.541-550
    • /
    • 2007
  • 시계열자료를 분석하는데 있어 중요한 목적 중에 하나가 미래값에 대한 예측이다. 일반적으로 자기회귀이동평균모형에서는 백색잡음이 정규분포를 따른다는 가정 하에서 모수의 추론과 예측 및 예측구간의 추정이 이루어지고 있다. 그러나 자료가 이러한 가정을 만족하지 않는 경우, 자료를 가정에 맞게 변환시킨 후 분석하는 방법을 생각해 볼 수 있다. 이 논문에서는 변환된 자료를 분석하여 얻은 결과를 이용하여 본래의 척도에서의 미래값에 대한 예측구간을 추정하는 문제에 대해 알아본다. 제안하는 방법에서는 먼저 적절한 변환을 이용하여 자료를 정규가정을 만족하도록 변환시키고 변환된 자료를 이용하여 미래값에 대한 예측구간을 추정한 후, 역변환을 이용하여 예측구간을 추정한다. 이 논문에서는 시계열분석에서 모델링이 상대적으로 어려운 왜도의 문제를 해결하기 위해 Yeo-Johnson 변환을 중심으로 한 방법론을 소개한다. 모의실험 결과 제안된 방법에 의한 단측예측구간의 포함확률이 변환을 사용하지 않은 구간보다 명목수준에 가까운 것을 확인하였다.

Practical statistics in pain research

  • Kim, Tae Kyun
    • The Korean Journal of Pain
    • /
    • 제30권4호
    • /
    • pp.243-249
    • /
    • 2017
  • Pain is subjective, while statistics related to pain research are objective. This review was written to help researchers involved in pain research make statistical decisions. The main issues are related with the level of scales that are often used in pain research, the choice of statistical methods between parametric or nonparametric statistics, and problems which arise from repeated measurements. In the field of pain research, parametric statistics used to be applied in an erroneous way. This is closely related with the scales of data and repeated measurements. The level of scales includes nominal, ordinal, interval, and ratio scales. The level of scales affects the choice of statistics between parametric or non-parametric methods. In the field of pain research, the most frequently used pain assessment scale is the ordinal scale, which would include the visual analogue scale (VAS). There used to be another view, however, which considered the VAS to be an interval or ratio scale, so that the usage of parametric statistics would be accepted practically in some cases. Repeated measurements of the same subjects always complicates statistics. It means that measurements inevitably have correlations between each other, and would preclude the application of one-way ANOVA in which independence between the measurements is necessary. Repeated measures of ANOVA (RMANOVA), however, would permit the comparison between the correlated measurements as long as the condition of sphericity assumption is satisfied. Conclusively, parametric statistical methods should be used only when the assumptions of parametric statistics, such as normality and sphericity, are established.

비대칭 분포를 따르는 공정에서 사분위수를 이용한 관리도법 (A Control Chart Method Using Quartiles for Asymmetric Distributed Processes)

  • 박성현;박희진
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.81-96
    • /
    • 2006
  • 본 연구에서는 분포를 알 수 없고 비대칭인 공정자료에 실용적으로 적용할 수 있는 간단한 관리도법을 제안하였다. 비대칭 분포를 따르는 공정자료에 정규성 가정에 기초한 슈하르트 관리도를 그대로 적용하면 비대칭성이 증가할수록 제 1종 오류를 범할 확률이 증가할 가능성이 높아지며 변동을 관리하는데 효율성이 떨어지게 된다. 이러한 문제를 해결하기 위해 본 연구에서 제시한 관리도는 관리한계선을 사분위수에 기초하여 정하는 방안을 제시하고 있다. 이러한 방법으로 관리한계선을 그릴 경우 제 1종 오류도 감소하게 되고, 비대칭분포를 하는 공정자료에 대하여 매우 실용적이라고 하겠다.

비정규성 데이터에 대한 단일 관리도들의 비교 (A comparison of single charts for non-normal data)

  • 강명구;이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권3호
    • /
    • pp.729-738
    • /
    • 2015
  • 품질특성치의 중심과 산포를 하나의 통계량으로 관리하는 단일 관리도는 품질특성치가 정규분포를 따른다고 가정하지만 실제 데이터들은 왜도가 양수이거나 첨도가 양수인 경우가 많다. 본 논문에서는 품질특성치가 정규분포를 따르지 않은 경우에 가짜 알람률 (false alarm rate; FAR)을 이용하여 단일 관리도 성능을 비교하였다. 고려된 단일 관리도는 반원관리도, 최대 관리도 및 평균제곱오차관리도이며 모의실험 결과, 공정이 안정 상태인 경우는 최대관리도의 성능이 좋았으며, 공정이 불안정상태인 경우에는 왜도가 양수일 때 최대관리도, 첨도가 큰 경우에는 평균제곱오차 관리도의 성능이 우수하였다.

신용평가모형에서 타당성검증 통계량들의 판단기준 (Criterion of Test Statistics for Validation in Credit Rating Model)

  • 박용석;홍종선;임한승
    • Communications for Statistical Applications and Methods
    • /
    • 제16권2호
    • /
    • pp.239-347
    • /
    • 2009
  • 신용평가모형의 판별력에 대한 검정방법으로 콜모고로프-스미르노프, 평균차이, AUROC, AR등과 같은 통계량이 널리 사용되고 있다. 이러한 통계량들의 판단기준은 정규분포 가정 하에서 평균차이를 기준으로 설정되었다. 본 연구에서는 모의 실험을 통해서 표본크기, 불량률 그리고 제II종 오류율을 고려하는 대안적인 판단기준을 제 안하고 현재 적용되고 있는 판단기준과 비교해본다. 또한 판별력 정도에 따른 각 통계량들의 의미를 10단계로 정의하고 모의 실험 결과와 현재 적용되고 있는 판단기준을 비교해 본다.

로버스트 회귀모형을 이용한 자료결합방법 (Statistical Matching Techniques Using the Robust Regression Model)

  • 전명식;정시송;박혜진
    • 응용통계연구
    • /
    • 제21권6호
    • /
    • pp.981-996
    • /
    • 2008
  • 서로 다른 출처로부터 얻어진 데이터 파일들을 하나의 데이터 파일로 만드는 통계적 자료결합방법은 공통변수와 서로 다른 고유변수를 포함하여 변수들 간에 존재하는 관련성에 대해 살펴볼 수 있다. Robin (1986)이 제안한 일반회귀모형의 예측값을 이용한 통계적 결합방법은 자료에 대한 다변량 정규성을 가정하기 때문에 이 가정을 위반하는 자료를 이용하는 것은 많은 문제를 수반한다. 본 연구는 제공파일의 고유변수에 모분포를 반영하지 못하는 특이점이 존재하는 경우, 일반회귀모형을 이용한 통계적 결합방법의 대안으로 로러스트 회귀추정방법을 이용한 자료결합방법을 제안하였다. 나아가 로버스트 회귀모형을 이용한 결합방법과 일반회귀모형을 이용한 결합방법에서의 상관관계 및 결정계수 보존에 관한 성능을 비교하기 위하여 모의실험을 수행하였다.

두 모집단 모평균 비교의 지도에 관한 연구 (A Study on Teaching Method of Two-Sample Test for Population Mean Difference)

  • 김용태;이장택
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제45권2호
    • /
    • pp.145-154
    • /
    • 2006
  • The main purpose of this study is to investigate the effect of departures from normality and equal variance on the two-sample test when the variances are unknown. We have found that type I error brought about a little bit change which is ignorable in relation to kurtosis. But the change of type I error was mainly based on the skewness of the parent population. In introductory statistics classes where data analysis includes techniques for detecting skewness of two populations, we recommend the two-sample t-test when maximal skewness of two populations is smalter than the value 4 when the variances seem equal. Furthermore, our simulations reveal that the two-sample t-test appears somewhat more robust than that of z-test if the assumption of equal variance is satisfied. In the case of unequal variance, the two-sample t-test appears somewhat more robust provided the t-statistic using Satterthwaite's approximate degrees of freedom.

  • PDF

Bayesian inference for an ordered multiple linear regression with skew normal errors

  • Jeong, Jeongmun;Chung, Younshik
    • Communications for Statistical Applications and Methods
    • /
    • 제27권2호
    • /
    • pp.189-199
    • /
    • 2020
  • This paper studies a Bayesian ordered multiple linear regression model with skew normal error. It is reasonable that the kind of inherent information available in an applied regression requires some constraints on the coefficients to be estimated. In addition, the assumption of normality of the errors is sometimes not appropriate in the real data. Therefore, to explain such situations more flexibly, we use the skew-normal distribution given by Sahu et al. (The Canadian Journal of Statistics, 31, 129-150, 2003) for error-terms including normal distribution. For Bayesian methodology, the Markov chain Monte Carlo method is employed to resolve complicated integration problems. Also, under the improper priors, the propriety of the associated posterior density is shown. Our Bayesian proposed model is applied to NZAPB's apple data. For model comparison between the skew normal error model and the normal error model, we use the Bayes factor and deviance information criterion given by Spiegelhalter et al. (Journal of the Royal Statistical Society Series B (Statistical Methodology), 64, 583-639, 2002). We also consider the problem of detecting an influential point concerning skewness using Bayes factors. Finally, concluding remarks are discussed.

Effect of zero imputation methods for log-transformation of independent variables in logistic regression

  • Seo Young Park
    • Communications for Statistical Applications and Methods
    • /
    • 제31권4호
    • /
    • pp.409-425
    • /
    • 2024
  • Logistic regression models are commonly used to explain binary health outcome variable using independent variables such as patient characteristics in medical science and public health research. Although there is no distributional assumption required for independent variables in logistic regression, variables with severely right-skewed distribution such as lab values are often log-transformed to achieve symmetry or approximate normality. However, lab values often have zeros due to limit of detection which makes it impossible to apply log-transformation. Therefore, preprocessing to handle zeros in the observation before log-transformation is necessary. In this study, five methods that remove zeros (shift by 1, shift by half of the smallest nonzero, shift by square root of the smallest nonzero, replace zeros with half of the smallest nonzero, replace zeros with the square root of the smallest nonzero) are investigated in logistic regression setting. To evaluate performances of these methods, we performed a simulation study based on randomly generated data from log-normal distribution and logistic regression model. Shift by 1 method has the worst performance, and overall shift by half of the smallest nonzero method, replace zeros with half of the smallest nonzero method, and replace zeros with the square root of the smallest nonzero method showed comparable and stable performances.