DOI QR코드

DOI QR Code

시간에 따라 변화하는 로그-정규분포와 파레토 합성 분포의 모형 추정

Time-varying modeling of the composite LN-GPD

  • 박소진 (성균관대학교 통계학과) ;
  • 백창룡 (성균관대학교 통계학과)
  • Park, Sojin (Department of Statistics, Sungkyunkwan University) ;
  • Baek, Changryong (Department of Statistics, Sungkyunkwan University)
  • 투고 : 2017.11.02
  • 심사 : 2017.12.15
  • 발행 : 2018.02.28

초록

임계값을 기준으로 그 보다 작은 값은 로그정규분포(lognormal distribution; LN)를, 큰 값은 일반화파레토분포(generalized Pareto distribution; GPD)를 따르는 합성 분포를 LN-GPD 합성분포라 한다. Scollnik (2007)은 LN-GPD 합성분포가 로그정규분포와 GPD를 합성 시킴으로써 자료의 손실 없이 꼬리가 두꺼운 분포에서 좋은 적합력을 가진다고 밝혔다. 본 논문에서는 시간에 따라 변하는 LN-GPD 평균모형을 다루었으며 방법론으로는 국소 다항최대우도법을 기반으로 추정하는 방법에 대해서 연구하였다. 시간에 따라 변하는 분포를 추정함으로써 자료에 대한 훨씬 자세한 이해가 가능하며 이는 곧 상담원 배치나 자원배분과 같은 운영관리에 큰 도움을 줄 수 있다. 본 연구는 GPD 분포만을 고려한 Beirlant와 Goegebeur (2004)를 확장하여 절삭한 로그정규분포를 추가하여 자료의 손실 없이 자료의 특징을 살펴볼 수 있다는데도 의의가 있다. 모의실험을 통해 제안한 방법론의 적절함을 살펴 보았고 실증 자료 분석으로 이스라엘 은행의 콜센터 서비스 시간에 대해 분석하여 상담원 배치와 관련된 흥미로운 결과를 찾을 수 있었다.

The composite lognormal-generalized Pareto distribution (LN-GPD) is a mixture of right-truncated lognormal and GPD for a given threshold value. Scollnik (Scandinavian Actuarial Journal, 2007, 20-33, 2007) shows that the composite LN-GPD is adequate to describe body distribution and heavy-tailedness. This paper considers time-varying modeling of the LN-GPD based on local polynomial maximum likelihood estimation. Time-varying model provides significant detailed information of time dependent data, hence it can be applied to disciplines such as service engineering for staffing and resources management. Our work also extends to Beirlant and Goegebeur (Journal of Multivariate Analysis, 89, 97-118, 2004) in the sense of losing no data by including truncated lognormal distribution. Our proposed method is shown to perform adequately in simulation. Real data application to the service time of the Israel bank call center shows interesting findings on the staffing policy.

키워드

참고문헌

  1. Beirlant, J. and Goegebeur, Y. (2004). Local polynomial maximum likelihood estimation for Pareto-type distributions, Journal of Multivariate Analysis, 89, 97-118. https://doi.org/10.1016/S0047-259X(03)00125-8
  2. Brown, L. D. and Levine, M. (2007). Variance estimation in nonparametric regression via the difference sequence method, The Annals of Statistics, 35, 2219-2232. https://doi.org/10.1214/009053607000000145
  3. Cooray, K. and Ananda, M. M. A. (2005). Modeling actuarial data with a composite lognormal-Pareto model, Scandinavian Actuarial Journal, 2005, 321-334. https://doi.org/10.1080/03461230510009763
  4. Kim, B., Noh, J., and Baek, C. (2016). Threshold estimation for the composite lognormal-GPD models, The Korean Journal of Applied Statistics, 29, 807-822. https://doi.org/10.5351/KJAS.2016.29.5.807
  5. Nadarajah, S. and Baker, S. S. A. (2014). New composite models for the Danish fire insurance data, Scandinavian Actuarial Journal, 2014, 180-187. https://doi.org/10.1080/03461238.2012.695748
  6. Scollnik, D. P. M. (2007). On composite lognormal-Pareto models, Scandinavian Actuarial Journal, 2007, 20-33. https://doi.org/10.1080/03461230601110447
  7. Shen, H. and Brown, L. D. (2006). Non-parametric modelling of time-varying customer service times at a bank call centre, Applied Stochastic Models in Business and Industry, 22, 297-311. https://doi.org/10.1002/asmb.618