• 제목/요약/키워드: Mixture Normal Distribution

검색결과 84건 처리시간 0.02초

혼합 정규공정 하에서의 공정능력지수 Cp에 대한 가설검정 (Statistical Tests for Process Capability Index Cp Based on Mixture Normal Process)

  • 조중재;허태영;정준철
    • 품질경영학회지
    • /
    • 제42권2호
    • /
    • pp.209-219
    • /
    • 2014
  • Purpose: The purpose of this study is to develop the statistical test for process capability index $C_p$ based on mixture normal process. Methods: This study uses Bootstrap method to calculate the approximate P-value for various simulation conditions under mixture normal process. Results: This study indicates that our proposed method is effective way to test for process capability index $C_p$ based on mixture normal process. Conclusion: This study finds out that statistical test for process capability index $C_p$ based on mixture normal process is useful for real application.

Estimating Suitable Probability Distribution Function for Multimodal Traffic Distribution Function

  • Yoo, Sang-Lok;Jeong, Jae-Yong;Yim, Jeong-Bin
    • 해양환경안전학회지
    • /
    • 제21권3호
    • /
    • pp.253-258
    • /
    • 2015
  • The purpose of this study is to find suitable probability distribution function of complex distribution data like multimodal. Normal distribution is broadly used to assume probability distribution function. However, complex distribution data like multimodal are very hard to be estimated by using normal distribution function only, and there might be errors when other distribution functions including normal distribution function are used. In this study, we experimented to find fit probability distribution function in multimodal area, by using AIS(Automatic Identification System) observation data gathered in Mokpo port for a year of 2013. By using chi-squared statistic, gaussian mixture model(GMM) is the fittest model rather than other distribution functions, such as extreme value, generalized extreme value, logistic, and normal distribution. GMM was found to the fit model regard to multimodal data of maritime traffic flow distribution. Probability density function for collision probability and traffic flow distribution will be calculated much precisely in the future.

겹친왜정규혼합분포를 이용한 비대칭 원형자료의 모형화 (Modeling on asymmetric circular data using wrapped skew-normal mixture)

  • 나종화;장영미
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권2호
    • /
    • pp.241-250
    • /
    • 2010
  • 원형자료에 대한 모형화 분석은 주로 von Mises 분포를 비롯한 대칭형의 경우를 중심으로 많은 연구가 이루어져 왔다. 최근 선형자료의 분석에서 다양한 비대칭의 자료에 적합한 왜정규분포의 활용에 대한 연구가 활발히 수행되고 있다. 본 논문에서는 Pewsey (2000a)에 의해 처음 소개된 겹친왜정규분포를 이용한 비대칭의 원형자료에 대한 적합을 다루었다. 특히 비대칭 다봉형 원형자료의 적합을 위해 겹친왜정규혼합분포를 제안하고, EM 알고리즘을 통한 모수추정 과정을 제시하였다. 모의실험을 통해 EM 알고리즘을 통한 모수추정의 정확성을 확인하고, 실제 지방국도의 일일교통량 자료의 모형화 분석에 적용하였다.

ESTIMATION IN A MIXTURE NORMAL DISTRIBUTION

  • Jee-Seon Baik
    • Journal of applied mathematics & informatics
    • /
    • 제4권1호
    • /
    • pp.223-234
    • /
    • 1997
  • By Stochastic simulations we discuss the fitness of a mix-ture normal distribution to observations from general mixture distribu-tions using the MLE method and the EM algorithm. We calulate the probability of misclassifying objects and estimate the optimal number of mixture components with mutual information measure.

Application of Finite Mixture to Characterise Degraded Gmelina arborea Roxb Plantation in Omo Forest Reserve, Nigeria

  • Ogana, Friday Nwabueze
    • Journal of Forest and Environmental Science
    • /
    • 제34권6호
    • /
    • pp.451-456
    • /
    • 2018
  • The use of single component distribution to describe the irregular stand structure of degraded forest often lead to bias. Such biasness can be overcome by the application of finite mixture distribution. Therefore, in this study, finite mixture distribution was used to characterise the irregular stand structure of the Gmelina arborea plantation in Omo forest reserve. Thirty plots, ten each from the three stands established in 1984, 1990 and 2005 were used. The data were pooled per stand and fitted. Four finite mixture distributions including normal mixture, lognormal mixture, gamma mixture and Weibull mixture were considered. The method of maximum likelihood was used to fit the finite mixture distributions to the data. Model assessment was based on negative loglikelihood value ($-{\Lambda}{\Lambda}$), Akaike information criterion (AIC), Bayesian information criterion (BIC) and root mean square error (RMSE). The results showed that the mixture distributions provide accurate and precise characterisation of the irregular diameter distribution of the degraded Gmelina arborea stands. The $-{\Lambda}{\Lambda}$, AIC, BIC and RMSE values ranged from -715.233 to -348.375, 703.926 to 1433.588, 718.598 to 1451.334 and 3.003 to 7.492, respectively. Their performances were relatively the same. This approach can be used to describe other irregular forest stand structures, especially the multi-species forest.

Estimating Discriminatory Power with Non-normality and a Small Number of Defaults

  • Hong, C.S.;Kim, H.J.;Lee, J.L.
    • 응용통계연구
    • /
    • 제25권5호
    • /
    • pp.803-811
    • /
    • 2012
  • For credit evaluation models, we extend the study of discriminatory power based on AUC obtained from a ROC curve when the number of defaults is small and distribution functions of the defaults and non-defaults are normal distributions. Since distribution functions do not satisfy normality in real world, the distribution functions of the defaults and non-defaults are assumed as normal mixture distributions based on results that the normal mixture could be better fitted than other distribution estimation methods for non-normal data. By using several AUC statistics, the discriminatory power under such a circumstance is explored and compared with those of normal distributions.

EM 알고리즘에 의한 다변량 치우친 정규분포 혼합모형의 근사적 적합 (An approximate fitting for mixture of multivariate skew normal distribution via EM algorithm)

  • 김승구
    • 응용통계연구
    • /
    • 제29권3호
    • /
    • pp.513-523
    • /
    • 2016
  • 다중 치우침 모수벡터를 가진 다변량 치우친 정규분포 (MSNMix)를 EM 알고리즘으로 적합하려면 E-step에서 다변량 절단 정규분포의 적률과 확률을 계산해야 하는데 이것은 매우 큰 계산 시간을 요구한다. 그래서 비대칭 자료를 적합하는데 흔히 단순 치우침 모수를 가진 모형을 적용한다. 이 모형은 단변량 처리방식으로 적합하는 것이 가능하기 때문에 처리속도가 매우 빠르다. 그러나 단순 치우침 모수를 적용하는 것은 응용에서 비현실적인 경우가 많다. 본 논문에서는 다중 치우침 모수를 가지는 MSNMix의 근사적 추정법을 제안하는데, 이 방법은 단변량 처리방식이 적용되므로 향상된 처리속도를 보장한다. 그리고 제안된 방법의 실효성을 보이기 위해 몇 가지 실험 결과를 제공한다.

정규분포기반 두각 혼합모형의 순환적 적합을 이용한 군집분석에서의 변수선택 (Variable Selection in Clustering by Recursive Fit of Normal Distribution-based Salient Mixture Model)

  • 김승구
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.821-834
    • /
    • 2013
  • Law 등 (2004)은 군집분석에서 변수선택을 위해 정규분포기반 "두각 혼합모형(salient mixture model)"의 사용을 제안하였다. 본 논문에서는 이 모형의 적합 상의 문제점과 변수선택의 결함을 지적하고 그 대안을 제시한다. 모의자료와 실자료를 바탕으로 제안된 방법이 기존의 방법보다 유용함을 보였다.

Reject Inference of Incomplete Data Using a Normal Mixture Model

  • Song, Ju-Won
    • 응용통계연구
    • /
    • 제24권2호
    • /
    • pp.425-433
    • /
    • 2011
  • Reject inference in credit scoring is a statistical approach to adjust for nonrandom sample bias due to rejected applicants. Function estimation approaches are based on the assumption that rejected applicants are not necessary to be included in the estimation, when the missing data mechanism is missing at random. On the other hand, the density estimation approach by using mixture models indicates that reject inference should include rejected applicants in the model. When mixture models are chosen for reject inference, it is often assumed that data follow a normal distribution. If data include missing values, an application of the normal mixture model to fully observed cases may cause another sample bias due to missing values. We extend reject inference by a multivariate normal mixture model to handle incomplete characteristic variables. A simulation study shows that inclusion of incomplete characteristic variables outperforms the function estimation approaches.

ROC 함수 추정 (ROC Function Estimation)

  • 홍종선;;홍선우
    • 응용통계연구
    • /
    • 제24권6호
    • /
    • pp.987-994
    • /
    • 2011
  • 모집단이 부도와 정상상태로 구분되는 신용평가 관점에서 부도와 정상 상태의 조건부 누적분포함수를 추정하는 방법으로 정규혼합 분포추정과 kernel density estimation을 이용하는 분포추정을 고려한다. 정규혼합 분포의 모수를 EM 알고리즘을 사용해 추정하고, KDE 방법에서는 많이 사용하는 다섯 종류의 커널 함수와 네가지의 띠폭을 이용한다. 그리고 추정한 분포로부터 구한 각각의 ROC 함수를 구한다. 추정한 분포들의 적합도를 비교 분석하고, 이를 바탕으로 구한 ROC 곡선의 성과를 비교 토론한다. 본 연구에서는 KDE 방법으로 추정한 분포함수가 더 적합하고, 추정한 정규혼합 분포를 이용한 ROC 함수가 더 좋은 성과를 나타내는 것을 발견하였다.