한국 프로야구 경기결과에 관한 통계적 연구

A Statistical Study on Korean Baseball League Games

  • 최영근 (건국대학교 응용통계학과) ;
  • 김형문 (건국대학교 응용통계학과)
  • 투고 : 20101000
  • 심사 : 20110600
  • 발행 : 2011.10.31


경기의 결과를 모형 화하는 것은 다양한 방법을 통하여 이루어져 왔다. 특히 두 개의 팀만이 경기를 하는 경우에는 더욱 다양한 방법이 제안되었다. 그 중에서 Bradley-Terry 모형은 짝지어진 자료로부터 선호하는 크기의 특성을 얻을 수 있는 가장 넓게 사용되어지고 있는 모형이다. Bradley-Terry 모형은 스포츠 경기결과의 분석과 심리학에 관련된 분야들에서 다양하게 적용되어진다. 본 연구자는 한국 프로야구 자료에 Bradley-Terry 모형을 적용하였다. 그 결과 연속형 공변량의 경우 평균자책점과 세이브를 포함하는 모형이 최적으로 나타났고 관심의 대상이 되는 몇 가지 범주형 분석의 결과 동군과 서군, 골든글러브, 다승왕, 그리고 홈경기의 이점이 승부에 영향을 주는 것으로 나타났다. 하지만 이들의 조합은 단순히 연속형 변수만을 포함한 모형이 분석 결과 더 적절한 것으로 고려되어졌다. 제안된 모형은 경기의 승패를 예측하는 데도 유용하게 사용될 수 있다. 한 예로 한국시리즈에서 우승할 확률들의 순서가 2008년도의 결과와 정확히 일치하였다.

There are a variety of methods to model game results and many methods exist for the case of paired comparison data. Among them, the Bradley-Terry model is the most widely used to derive a latent preference scale from paired comparison data. It has been applied in a variety of fields in psychology and related disciplines. We applied this model to the data of Korean Baseball League. It shows that the loglinear Bradley-Terry model of defensive rate and save is optimal in terms of AIC. Also some categorical characteristics, such as east team and west team, existence of golden glove winning players, team(s) with seasonal pitching leader, and team(s) with home advantage, influenced the game result significantly. As a result, the suggested models can be further utilized to predict future game results.



  1. 신상근, 박기철, 조영석, 최세현 (2007). 한국프로야구팀의 승패요인분석에 관한 연구: 삼성라이온즈를 중심으로, Journal of the Korean Data Dnalysis Society, 9, 2071-2083.
  2. 이장택, 조현식 (2009). 로지스틱 회귀모형을 이용한 프로야구 홈경기의 이점에 관한 연구, Journal of the Korean Data Dnalysis Society, 11, 533-543.
  3. Agresti, A. (2002). Categorical Data Analysis, 2nd edition, John Wiley & Sons, New Jersey.
  4. Bradley, R. A. and Terry, M. E. (1952). Rank analysis of incomplete block designs I : The method of paired comparisons, Biometrika, 39, 324-345.
  5. David, H. A. (1988). The Method of Paired Comparisons, 2nd edition, Oxford University Press, New York.
  6. Davidson, R. R. (1970). On extending the Bradley-Terry model to accommodate ties in paired comparison experiments, Journal of the American Statistical Association, 65, 317-328.
  7. Davidson, R. R. and Beaver, R. J. (1977). On extending the Bradley-Terry model to incorporate within-pair order effects, Biometrics, 33, 393-702.
  8. Dittrich, R., Hatzinger, R. and Katzenbeisser, W. (1998). Modelling the effect of subject-specific covariates in paired comparison studies with an application to university ranking, Applied Statistics, 47, 511-525.
  9. Fienberg, S. E. and Larntz, K. (1976). Loglinear representation for paired and multiple comparison models, Biometrika, 63, 245-254.
  10. Francis, B., Green, M. and Payne, C. (1993). The GLIM System: Release 4 Manual, Clarendon Press, Oxford.
  11. Glickman, M. E. (1993). Parameter estimation in large dynamic paired comparison experiments, Applied Statistics, 48, 377-394.
  12. Searls, D. T. (1963). On the probability of winning with different tournament procedures, Journal of the American Statistical Association, 34, 1064-1081.
  13. Sinclair, C. D. (1982). GLIM for preference, In: Gilchrist, R. (Eds.): GLIM 82., In Proceedings of the International Conference on Generalized Linear Models, Springer Lecture Notes in Statistics.
  14. Springall, A. (1973). Response surface fitting using a generalization of the Bradley-Terry paired comparison model, Applied Statistics, 22, 59-68.

피인용 문헌

  1. Analysis of the Korean Baseball League using a Markov Chain Model vol.26, pp.4, 2013,
  2. Bayesian estimation of the Korea professional baseball players' hitting ability based on the batting average vol.26, pp.1, 2015,
  3. Study for independence of hits in professional baseball games vol.24, pp.6, 2013,
  4. Alternative hitting ability index for KBO vol.27, pp.3, 2016,