• 제목/요약/키워드: Mixture Distributions

검색결과 272건 처리시간 0.027초

Estimation in Mixture of Shifted Poisson Distributions with Known Shift Parameters

  • Lee, Hyun-Jung;Oh, Chang-Hyuck
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권3호
    • /
    • pp.785-794
    • /
    • 2006
  • Suggested is an EM algorithm for estimation in mixture of shifted Poisson distributions with known shift parameters. For this type of mixture distribution, we have to utilize values of shift parameters to determine whether each of data belongs to some component distribution. We propose a method of estimating values of component information and then follow typical EM methodology. Simulation results show that the algorithm provides reasonable performance for the distribution.

  • PDF

복합확률분포의 파라메타 추정을 위한 EM 알고리즘의 적용 연구 (An Approach for the Estimation of Mixture Distribution Parameters Using EM Algorithm)

  • 심대영;김상구
    • 한국ITS학회 논문지
    • /
    • 제22권4호
    • /
    • pp.35-47
    • /
    • 2023
  • 그동안 차두시간분포를 나타내는 확률분포로 음지수분포, Erlang 분포, 정규분포 등 다양한 단일확률분포들이 사용되어져 왔다. 그러나, 실제 도로에서 차두시간분포의 조사결과는 단일확률분포로서 설명하기 어려운 경우가 있었다. 본 연구는 차량의 차두시간에 대해 두 개의 정규분포가 일정한 관련성을 가지고 결합된 복합확률분포의 파라메타에 대해 최우추정법 중 하나인 EM 알고리즘을 이용하여 추정하는 접근방법을 시도하였다. 이에 대한 분석결과 기존에 알려진 단일확률분포로서 잘 설명되기 어려웠던 차량도착 차두시간 분포를 EM 알고리즘을 이용하여 복합확률분포의 파라메타를 추정하여 설명하였다. χ2 test 적합도 검정결과, 유의수준 1%에서 통계학적으로 유의성이 확보되어 EM 알고리즘을 이용한 복합확률분포의 파라메타 추정의 신뢰성이 입증되는 것으로 분석되었다.

기술혁신 횟수의 분포함수 추정 -혼합모형을 적용하여- (Approximation of the Distribution Function for the Number of Innovation Activities Using a Mixture Model)

  • 유승훈;박두호
    • 기술혁신학회지
    • /
    • 제8권3호
    • /
    • pp.887-910
    • /
    • 2005
  • This paper attempts to approximate the distribution function for the number of innovation activities (NIA). To this end, the dataset of 2002 Korean Innovation Survey (KIS 2002) published by Science and Technology Policy Institute is used. To deal with zero NTI values given by a considerable number of firms in the KIS 2002 survey, a mixture model of distributions for NIA is applied. The NIA is specified as a mixture of two distributions, one with a point mass at zero and the other with full support on the positive half of the real line. The model was empirically verified for the KIS 2002 data. The mixture model can easily capture the common bimodality feature of the NIA distribution. In addition, when covariates were added to the mixture model, it was found that the probability that a firm has zero NIA significantly varies with some variables.

  • PDF

Statistical analysis and probabilistic modeling of WIM monitoring data of an instrumented arch bridge

  • Ye, X.W.;Su, Y.H.;Xi, P.S.;Chen, B.;Han, J.P.
    • Smart Structures and Systems
    • /
    • 제17권6호
    • /
    • pp.1087-1105
    • /
    • 2016
  • Traffic load and volume is one of the most important physical quantities for bridge safety evaluation and maintenance strategies formulation. This paper aims to conduct the statistical analysis of traffic volume information and the multimodal modeling of gross vehicle weight (GVW) based on the monitoring data obtained from the weigh-in-motion (WIM) system instrumented on the arch Jiubao Bridge located in Hangzhou, China. A genetic algorithm (GA)-based mixture parameter estimation approach is developed for derivation of the unknown mixture parameters in mixed distribution models. The statistical analysis of one-year WIM data is firstly performed according to the vehicle type, single axle weight, and GVW. The probability density function (PDF) and cumulative distribution function (CDF) of the GVW data of selected vehicle types are then formulated by use of three kinds of finite mixed distributions (normal, lognormal and Weibull). The mixture parameters are determined by use of the proposed GA-based method. The results indicate that the stochastic properties of the GVW data acquired from the field-instrumented WIM sensors are effectively characterized by the method of finite mixture distributions in conjunction with the proposed GA-based mixture parameter identification algorithm. Moreover, it is revealed that the Weibull mixture distribution is relatively superior in modeling of the WIM data on the basis of the calculated Akaike's information criterion (AIC) values.

A Class of Bivariate Linear Failure Rate Distributions and Their Mixtures

  • Sarhan, Ammar M.;El-Gohary, A.;El-Bassiouny, A.H.;Balakrishnan, N.
    • International Journal of Reliability and Applications
    • /
    • 제10권2호
    • /
    • pp.63-79
    • /
    • 2009
  • A new bivariate linear failure rate distribution is introduced through a shock model. It is proved that the marginal distributions of this new bivariate distribution are linear failure rate distributions. The joint moment generating function of the bivariate distribution is derived. Mixtures of bivariate linear failure rate distributions are also discussed. Application to a real data is given.

  • PDF

원양어선 조업 데이터의 혼합 극단분포를 이용한 이상점 탐색 연구 (A Study of Outlier Detection Using the Mixture of Extreme Distributions Based on Deep-Sea Fishery Data)

  • 이정진;김재경
    • 응용통계연구
    • /
    • 제28권5호
    • /
    • pp.847-858
    • /
    • 2015
  • 남극해에서는 우리나라를 포함한 연안 강대국들의 원양어업이 활발히 성행하고 있다. 주인 없는 남극해의 생태계를 보호하기 위해 조업 국가들은 남극해양생물자원보존위원회를 만들고 협약을 맺어 일정한 어획량만 조업하고 금지기간과 금지구역을 설정하여 불법조업을 방지하고 있다. 남극해에서 조업하는 어종 중의 하나가 이빨고기(tooth fish)인데 비싼 값 때문에 불법조업이 있는 경우가 많다. 한 배의 조업성과는 CPUE(catch per unit effort)로 나타낼 수 있고, 한 지역에서 조업한 배들의 CPUE는 단일 또는 혼합 극단분포 형태를 가진다. 단일 극단분포일 경우 이상점 탐색은 상위 백분위수를 이용하면 된다. 본 논문은 자료가 혼합 극단분포인 경우 이상점 탐색을 위한 통계적 방법을 연구하고자 한다. 본 연구에서는 자료에 적합한 혼합 극단분포 모형을 EM 알고리즘으로 추정한 후 로그 가능도함수 값을 이용하거나 사후 확률을 이용한 이상점 탐색 알고리즘을 제안한다. 이 방법을 남극해 조업 데이터에 적용하여 시뮬레이션 한 결과 통계적 방법 적용의 가능성을 보여주었다.

혼합모형을 이용한 생수소비 분포의 근사화에 대한 소고(小考) (A Note on Approximation of Bottled Water Consumption Distribution: A Mixture Model)

  • 유승훈
    • 자원ㆍ환경경제연구
    • /
    • 제11권2호
    • /
    • pp.321-333
    • /
    • 2002
  • Approximating bottled water consumption distribution is complicated by zero observations in the sample. To deal with the zero observations, a mixture model of bottled water consumption distributions is proposed and applied to allow a point mass at zero. The bottled water consumption distribution is specified as a mixture of two distributions, one with a point mass at zero and the other with full support on the positive half of the real line. The model is empirically verified for household bottled water consumption survey data. The mixture model can easily capture the common bimodality feature of the bottled water consumption distribution. In addition, when covariates were added to the model, it was found that the probability that a household has non-consumption significantly varies with some variables.

  • PDF

Estimation in Mixture of Shifted Poisson Distributions

  • Oh, Chang-Hyuck
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권4호
    • /
    • pp.1209-1217
    • /
    • 2006
  • For the mixture of shifted Poisson distributions, a method of parameter estimation is proposed. The range of the shifted parameters are estimated first and for each shifted parameter set EM algorithm is applied to estimate the other parameters of the distribution. Among the estimated parameter sets, one with minimum likelihood for given data is to be set as the final estimate. In simulation experiments, the suggested estimation method shows to have a good performance.

  • PDF

Analysis of residential natural gas consumption distribution function in Korea - a mixture model

  • Kim, Ho-Young;Lim, Seul-Ye;Yoo, Seung-Hoon
    • 에너지공학
    • /
    • 제23권3호
    • /
    • pp.36-41
    • /
    • 2014
  • The world's overall need for natural gas (NG) has been growing up fast, especially in the residential sector. The better the estimation of residential NG consumption (RNGC) distribution, the better decision-making for a residential NG policy such as pricing, demand estimation, management options and so on. Approximating the distribution of RNGC is complicated by zero observations in the sample. To deal with the zero observations by allowing a point mass at zero, a mixture model of RNGC distributions is proposed and applied. The RNGC distribution is specified as a mixture of two distributions, one with a point mass at zero and the other with full support on the positive half of the real line. The model is empirically verified for household RNGC survey data collected in Korea. The mixture model can easily capture the common bimodality feature of the RNGC distribution. In addition, when covariates were added to the model, it was found that the probability that a household has non-expenditure significantly varies with some variables. Finally, the goodness-of-fit test suggests that the data are well represented by the mixture model.

수익률 분포의 적합과 리스크값 추정 (Distribution fitting for the rate of return and value at risk)

  • 홍종선;권태완
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권2호
    • /
    • pp.219-229
    • /
    • 2010
  • 자산을 운용할 때 다양한 위험요인의 증가로 인해 위험관리에 대한 많은 연구가 진행되어왔으며, 통합적인 위험관리기법의 필요성이 대두됨에 따라 개발된 많은 방법 중의 하나가 리스크값이다. 현재까지 연구된 많은 리스크값의 추정과정에서 중요한 과제는 수익률분포의 비대칭성 및 두꺼운 꼬리와 같은 비정규성과 관련된 문제들을 해결하는 것이다. 대부분의 수익률 분포는 첨도가 매우 큰 양수값을 가지며 약한 음수값의 왜도를 갖는다. 본 연구에서는 실제 금융자산 수익률분포에 여러 종류의 대체분포들을 이용하여 실제의 수익률 분포에 적합한 분포를 선정하여 리스크값를 추정한다. 정규분포를 포함한 대체분포들을 이용하여 추정한 리스크값들이 실제 분포로부터 추정한 리스크값에 얼마나 일치하는지를 비교 연구한다. 다양한 대체분포 중에서 실제 분포에 정규혼합분포가 가장 적합하였으며, 이 정규혼합분포를 이용하여 추정한 리스크값과 다른 대체분포를 이용하여 구한 리스크값보다 정확함을 실증 자료를 통해 보였다.