초록
미국 메이저리그 야구 경기는 야구공을 추적하는 3대의 고속 카메라를 통해 모든 투구에 대한 궤적 데이터 PITCHf/x를 수집하고 공개한다. 선행 연구에서는 PITCHf/x 데이터를 통해 각 투구의 기대 피루타수를 계산하고 이를 토대로 투구의 질을 평가했다. 다만 기대 피루타수는 경기 득점으로 매번 이어지지 않기 때문에 각 투구가 승리에 기여하는 영향을 직접적으로 평가하지 못한다. 이 논문에서는 득점 기댓값과 득점 가치의 개념을 조합해 투구에 대한 기대 득점 가치를 계산하고 이를 통해 투구의 질을 랜덤 포레스트 모형으로 평가한 뒤, 기대 피루타수를 이용한 투구의 질 평가와 비교 분석한다.
Major League Baseball (MLB) records and releases the trajectory data for every baseball pitch, called the PITCHf/x, using three high-speed cameras installed in every stadium. In a previous study, the quality of the pitch was assessed as the expected number of bases yielded using PITCHf/x data. However, the number of bases yielded does not always lead to baseball scores, or runs. In this paper, we assess the quality of a pitch by combining baseball analytics metric Run Expectancy and Run Value using a Random Forests model. We compare the quality of pitches evaluated with Run Value to the quality of pitches evaluated with the expected number of bases yielded.