• 제목/요약/키워드: 야구 데이터 분석

검색결과 55건 처리시간 0.027초

머신러닝을 이용한 골든글러브 수상 요인 분석에 대한 연구 (A Study on the Analysis of Factors for the Golden Glove Award by using Machine Learning)

  • 엄대엽;김성용
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.48-56
    • /
    • 2022
  • 야구에서 데이터분석의 중요성은 점점 더 커지고 있는데, 이는 Billy Beane의 머니볼 이론을 적용한 MLB의 오클랜드 구단과 2020년 KBO 우승팀인 NC다이노스의 사례에서도 알 수 있다. 미국 뿐 만 아니라 우리나라에서도 데이터를 이용한 다양한 연구이 이루어지고 있는데, 특히 경기의 승패를 예측하기 딥러닝 및 머신러닝을 이용한 연구가 활발하게 진행되고 있다. 그러나 기존 연구의 경우 경기 승패 예측에 초점이 맞추어져 있으며, 어떠한 요인이 경기에 중요한 영향을 주었는지에 대한 결과 해석이 어렵다는 한계점이 존재한다. 이에 따라 본 논문에서는 포지션별 최고의 선수에게 수여되는 골든글러브 수상 예측 모형을 개발하고, 어떠한 요인이 수상에 영향을 주는지를 파악함으로써, 우수한 선수로 구분되는 척도를 찾고자 한다. 분석 모형으로는 Boosting 기법 중의 하나인 XGBoost를 이용하였으며, 어떠한 요인이 골든글러브 수상에 중요한 영향을 주었는지 파악하기 위하여 XGBoost의 변수 중요도를 이용하였다. 이와 같은 분석을 통해 각 포지션별 중요한 지표를 파악할 수 있었다.

공변량을 이용한 한국프로야구 관중 수 예측에 대한 고찰 (A study on prediction for attendances of Korean probaseball games using covariates)

  • 한가희;정지규;유재근
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1481-1489
    • /
    • 2014
  • 한국 프로야구 총 관중수 예측에 대해 기존의 선행 연구에서는 주로 자기회귀누적이동평균 모형이 사용되고 있다. 본 논문에서는 공변량을 고려한 자기회귀누적이동평균 모형과 성장곡선 모형을 이용하여 프로야구 관중 수에 대한 예측 모형을 제시하고 기존의 선행 연구 모형과 비교하고자 한다. 공변량을 이용한 모형을 사용함으로써 기존의 선행 연구 모형보다 보다 개선된 예측력을 얻을 수 있었다. 이는 통계적 자료분석에서 한 가지 방법보다는 다양한 방법을 시도한 후 비교, 논의를 통하여 자료를 가장 잘 설명해 줄 수 있는 최적 방법을 찾아야 한다는 사실을 확인할 수 있다.

데이터 분석을 활용한 신인급 선수 육성 방안 연구 (A Study on How to Nurture New Players using Data Analysis)

  • 유강수
    • 산업융합연구
    • /
    • 제19권4호
    • /
    • pp.17-21
    • /
    • 2021
  • 최근 스포츠 현장에서는 데이터를 활용하여 경기를 진행하고 시즌을 구상하며, 팀을 운영하는 시도가 많아지고 있다. 선수 육성을 하기 위해서 데이터를 활용하고 정확한 분석이 필요하다. 이에 본 연구에서는 데이터를 수집하고 전처리하여 선수들의 데이터 분석과 시각화를 통하여 신인급 선수들의 경기력을 분석하였다. 또한 신인급 선수를 육성하려면 최소한 어느 정도의 기회가 부여되어야 하는지 분석하였다. 아울러 스포츠 현장에서 데이터를 활용하여 선수 육성을 하기 위한 데이터 분석 방안을 제시하였다. 본 연구는 데이터를 활용하여 신인급 선수를 육성하는 데에 이바지할 것으로 기대된다.

메타버스 축구 게임을 위한 웨어러블 디바이스 데이터 분석 연구 (A Study of Wearable Device Data Analysis for Metaverse Soccer Game)

  • 김현수;문미경
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.365-366
    • /
    • 2023
  • 메타버스는 점차 빠른 속도로 발전되며 응용 분야가 확대되고 있다. 스포츠 분야에서 다양한 메타버스 시도가 이루어지고 있으며, 축구, 야구, 농구 등 인기 종목에 대한 메타버스 구축 및 운영이 이루어지고 있다. 그러나 사용자의 새로운 경험을 이끌어 내기보다, 오프라인 대체 수단으로 활용되고 있다. 본 연구에서는 웨어러블 디바이스를 통해 사용자 생체 정보를 수집하여 메타버스에 적용 가능한 데이터로 가공하는 과정에 대한 연구내용을 기술한다.

  • PDF

범주형 시계열 자료의 군집화: 프로야구 자료의 사례 연구 (Categorical time series clustering: Case study of Korean pro-baseball data)

  • 박노진
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.621-627
    • /
    • 2016
  • 범주형 시계열 자료의 군집화에 대하여 정리해 보았다. 시계열 자료의 군집화는 일반적인 군집화에 시간을 고려해야하는 측면이 있다. 한편, 범주형 시계열 자료의 군집화에 대한 연구가 진행되었으나 현재 정리 요약된 국내외 논문을 찾기 어렵다. 본 논문에서는 범주형 시계열을 군집화 하는 몇 가지 방법들을 제시하고 그 방법들을 비교하기 위해 프로야구 데이터를 이용하였다. 프로야구 팀들 간에 어떤 팀이 특정 팀에 유독 약한 경기력을 보이는 경우가 있다. 국내 최강이라는 S팀이 유독 H팀에게 그런 경우가 그렇다. 2015년 S팀의 상대전적의 군집화를 통해 S팀과 H팀의 관계가 유별난 지를 밝히려 한다. 통계적으로 말하자면, 승/패로 이루어진 시계열 자료의 군집화를 수행하려는 것이다. 분석결과 S팀과 H팀과의 관계가 다른 팀들과의 관계에 비해 눈에 띠는 차이가 있음을 알 수 있었다.

한국프로야구에서 투수 연봉에 영향을 주는 요인 (Analysis of factors affecting Korean professional baseball pitcher salaries)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권2호
    • /
    • pp.317-326
    • /
    • 2017
  • 한국프로야구에서 투수들의 연봉을 결정하는 중요한 요인들을 선형회귀모형을 통해서 살펴본다. 제안된 모형을 이용하여 투수들의 경기력과 연봉간의 패턴을 분석할 수 있으며, 구단 별로 차이점도 알 수 있다. 사용된 데이터는 2010년부터 2015년까지의 투수 기록과 다음 해의 연봉 자료를 이용하였으며, 고려된 설명변수들은 해당연도, 팀의 종류, 게임 수, 평균자책점, 수비무관 평균자책점, 이닝당 안타 및 볼넷 허용률, 대체선수 대비 승리기여도, 선발출장 게임의 수, 승, 패, 세이브, 투구 이닝수, 자유계약선수 여부, 나이, 경험연수이며 반응변수로는 연봉에 로그를 취한 로그연봉을 사용하였다. 그 결과 선발투수이며 경기수가 많고 승수가 많은 투수들에게 많은 연봉이 지급되고 있고 투수의 고유능력을 평가할 수 있는 기록들은 반영이 작게 되고 있음을 확인할 수 있었으며 연구의 결과는 연봉 결정에 중요한 참고자료로 활용될 수 있을 것으로 간주된다.

PITCHf/x를 이용한 투구의 질 평가 (Evaluating the quality of baseball pitch using PITCHf/x)

  • 박성민;장원철
    • 응용통계연구
    • /
    • 제33권2호
    • /
    • pp.171-184
    • /
    • 2020
  • 미국 메이저리그 야구 경기는 야구공을 추적하는 3대의 고속 카메라를 통해 모든 투구에 대한 궤적 데이터 PITCHf/x를 수집하고 공개한다. 선행 연구에서는 PITCHf/x 데이터를 통해 각 투구의 기대 피루타수를 계산하고 이를 토대로 투구의 질을 평가했다. 다만 기대 피루타수는 경기 득점으로 매번 이어지지 않기 때문에 각 투구가 승리에 기여하는 영향을 직접적으로 평가하지 못한다. 이 논문에서는 득점 기댓값과 득점 가치의 개념을 조합해 투구에 대한 기대 득점 가치를 계산하고 이를 통해 투구의 질을 랜덤 포레스트 모형으로 평가한 뒤, 기대 피루타수를 이용한 투구의 질 평가와 비교 분석한다.

한국프로야구에서 선발투수의 투수능력지수 제안 - 대체선수대비승수 (WAR)을 중심으로 (Suggestion of starting pitcher ability index in Korea baseball - Focusing on the sabermetrics statistics WAR)

  • 김현규;이제영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권4호
    • /
    • pp.863-874
    • /
    • 2017
  • 야구선수들의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 대체선수대비승수 (WAR)은 가장 많이 사용되는 통계량이다. WAR의 장점은 투수와 타자처럼 서로 다른 포지션임에도 불구하고 선수들의 WAR을 비교할 수 있다는 점이다. 하지만 WAR은 복잡한 형태로 일반적으로 제공되는 기록만으로 구하기 어렵다. 따라서 본 논문에서는 지난 3년간 (2014-2016년) 한국프로야구 기록 자료를 바탕으로 세이버메트릭스 변수를 계산한 뒤, 이를 이용하여 WAR을 대체할 수 있는 선발투수능력지수를 제안한다. 선발투수능력지수는 산술평균방법, 가중평균방법, 주성분회귀분석 등을 통해 산출한 뒤, WAR과 비교하여 가장 관계가 높은 방법을 선택하였다. 이는 선발투수의 능력을 파악하는데 유용하게 사용될 것이다.

한국 프로야구에서 출루 능력과 장타력이 득점 생산성에 미치는 영향 (Effects of on-base and slugging ability on run productivity in Korean professional baseball)

  • 김혁주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권6호
    • /
    • pp.1065-1074
    • /
    • 2012
  • 한국 프로야구에서 출루 능력과 장타력이 득점 생산성에 미치는 영향을 통계적으로 분석하였다. 2절에서는 OPS (On-base percentage Plus Slugging average)에 관하여 고찰하고 그것을 변형한 새로운 타격지표들을 소개하였다. 3절에서는 2007년부터 2011년까지의 정규리그 전 경기 자료를 바탕으로 타율, 출루율, 장타율, IsoP (Isolated Power), OPS 및 2절에서 소개된 지표들이 팀의 경기당 평균득점과 갖는 상관관계를 알아보았다. 또한 OPS와 2절에서 소개된 지표들을 일반화하여 여러 가지 가중값을 갖는 타격지표들이 팀의 경기당 평균득점과 갖는 상관관계를 분석하였다. 그 결과 출루율에 57%, 장타율에 43%의 가중값을 주는 가중OPS가 득점 생산성을 가장 잘 설명하는 타격지표인 것으로 밝혀졌다.

빅데이터 분석 기반 자동 야구기사작성 로봇 개발 (Development of Automatic Robot for Writing Baseball Articles Based on BigData Analysis)

  • 채병주;박경철;권태정;김상환;김영준;이동규;김병규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1622-1624
    • /
    • 2015
  • 세계적으로 자동기사 작성 시스템을 적용한 사례가 증가하는 가운데 미국의 LA 타임스가 2013년에 지진 속보 기사를 완성하면서 주목 받기도 했으며 국내에서도 비슷한 사례들의 개발이 지속적으로 진행되고 있다. 본 논문에서는 로봇저널리즘 시대에 맞춰 빅데이터 기반의 자동기사작성 로봇 개발방법을 제안하고, 데이터를 수집해 기사를 추출해내는 빅데이터 기반의 자동기사작성 로봇을 객관적인 데이터를 수집할 수 있는 스포츠분야에 적용하여 개발하였다. 본 기술로 인해 객관적인 내용을 표현할 수 있는 기사를 실시간으로 작성 및 온라인으로 배포 할 수 있으며, 확장을 통해 온라인 시청자들에게 다양한 실시간 정보제공이 가능할 수 있을 것으로 예상된다.