top of page
33.jpg
55.jpg

KAIST부설 한국과학영재학교 온라인 과학매거진 코스모스

  • 블랙 페이스 북 아이콘
  • 블랙 인스 타 그램 아이콘

야구는 ‘숫자놀음’ 이다: 세이버매트릭스

부산의 대표적인 관광지는 어디일까? 해운대 해수욕장, 전포동 카페거리, 남포동… 많은 답변이 나오지만, 요즘 들어 부산에 오면 야구를 보는 사람들이 늘어난 것 같다. 비단 부산 뿐이 아니다. 광주 북구 구민들이 뽑은 ‘북구 8경’에는 기아 타이거즈의 홈구장인 기아 챔피언스 필드가 포함되었다고 한다. 대전 하면 한화 이글스가 생각나는 것 처럼,  한국인들이 가장 좋아하는 스포츠가 야구라고 해도 과언이 아닌 시대가 왔다.

 

미국에서는 오래전부터 야구가 대단히 인기였다. 어떠한 기술, 테크닉이 다른 분야에 응용되는 데에는 많은 경로가 있지만, 일종의 ‘덕후력’이 그 중 하나이다. 야구도 그렇다. 야구를 좋아하는 수학자와 공학자들이 통계와 계획법을 야구에 응용했고, 야구단장이 수학자들에게 도움을 요청하자 흔쾌히 응했다. 좋아하는 분야에 전공 분야를 접목시키겠다는 열정은 어느 누구에게나 존재하는 듯 하다.

 

‘데이터 야구’, 또는 세이버매트릭스. 수집된 데이터를 기반으로 야구를 이해하고, 분석한다는 개념은 이렇게 시작된 것이 아닐까. 한국에서는 김성근 감독이 이 분야에서 유명하고, 최근의 LG 트윈스 또한 높은 순위와 시즌 초반 연승의 동력으로 데이터 야구를 꼽은 바 있다. 야구를 어떻게 데이터로 분석할까? 그저 단순히 상대 타석 수와 안타 수, 장타 수를 통해 상대 투수에 좋은 대타를 내는 것을 넘어, 약점 공략과 보완, 전략 수립 등 실용적인 분야와 야구에 대한 근본적인 이해도 향상에까지 통계학은 큰 역할을 하고 있다. 이제 야구와 통계, 아주 활동적인 스포츠와 너드같은 수학의 조화에 대해 알아보자.

 

야구는 왜 통계와 분석에 좋은 스포츠일까?

축구도, 배구도, 농구도 모두 통계학을 사용해 분석할 수 있지만, 스포츠를 분석하는 것 중 가장 발달한 것은 야구의 세이버매트릭스라고 해도 과언이 아니다. 미국의 NBA는 MLB 그 이상으로 인기이고, 미식축구 리그인 슈퍼볼도 그렇다. 왜일까?

 

자고로 여러 요인이 복합적으로 관여할수록 분석하기 어렵다. 지하철 노선이 하나라면 경로 설정이 간단하지만, 노선이 서너 개로 늘어난다면 환승을 고려하니 길 찾기가 어려워지는 것과 마찬가지이다. 농구, 축구, 배구는 공을 가진 선수 한 명만 고려해서는 답이 나오지 않는다. 선수 한 명의 강점에 더해 주변 다른 선수들의 접근 거리와 속도, 본인의 위치 등 수십 가지의 요인을 분석해야 한다. 하지만 야구는 훨씬 간단하다. 주자가 몇 명이든 결국은 타자와 투수의 싸움이다. 물론 주자가 누구고 어떻게 배치되어 있느냐에 따라 투수와 타자가 영향을 받기도 한다. 하지만 야구, 특히 타격 상황은 사실상 각각이 독립적이라고 볼 수 있다. 첫 공의 결과가 심리적이 아니라 실질적으로 다음 공에 영향을 주지는 않는다. 통계학에서는 이를 ‘각 시행이 독립적이다’ 라고 말한다.

 

또한, 야구는 가장 과학적인 스포츠라 할 수 있다. 구종마다 손가락의 위치와 움직임이 다르고, 이에 따라 회전수와 구속이 달라진다. 구속이 느려도 회전수가 높으면 수직 무브먼트 (공의 수직 움직임) 과 구위의 면에서 강력하게 되고, 반대로 시속 94마일의 강속구를 던져도 RPM (Rotation per minute, 분당 회전수) 이 2000 아래의 소위 ‘작대기 직구’를 던지면 안타만 수없이 맞아나간다. 즉, 날아오는 공을 분석할 때 그 인과관계가 명확하면서 분석하기 좋은 데이터 (회전수, 구속 등)를 수집할 수 있다. 유희관 선수의 공이 대표적이다. 구속은 느리지만 높은 회전수와 좋은 변화구 움직임이 그를 KBO 100승 투수로 만들었다.

 

2015년 MBC <위닝샷: 투구의 비밀> 에서 분석한 패스트볼 구속과 무브먼트, 회전수.
2015년 MBC <위닝샷: 투구의 비밀> 에서 분석한 패스트볼 구속과 무브먼트, 회전수.

KBO에서는 스포츠투아이 사의 ‘트랙맨’ 시스템을 이용하여 구속과 회전수, 릴리즈포인트, 수직 무브먼트 등을 수집하고 있다. 2024년부터 1군 경기에 도입되어 호평을 받은 ABS(자동 공 판정) 시스템도 여러 대의 카메라를 이용해 공의 움직임과 위치를 정확히 알아내 스트라이크 존에 들어갔는지 알려주는 방식이다. ‘스탯티즈’ 등의 일반인을 대상으로 공개된 사이트에서도 상세한 데이터를 구할 수 있다.

 

스탯티즈 사이트에서 조회한 롯데 자이언츠 김원중 선수의 날짜별 각 구종 평균 구속 자료
스탯티즈 사이트에서 조회한 롯데 자이언츠 김원중 선수의 날짜별 각 구종 평균 구속 자료

타자의 배팅도 마찬가지이다. 특히 카메라와 모션캡쳐 기술의 발전은 선수들의 움직임 하나하나를 컴퓨터로 구현할 수 있게 만들었다. ‘어깨가 빨리 열린다’, ‘배트 타이밍이 늦다’ 라는 말에 구체적인 행동의 모습이 근거로 적용될 수 있는 것이다. 축구는 어떤가. 여러 플레이 상황에서 순발력 있게 대응하는 게 중요하다. 카메라 앞에서 아무리 역동적인 동작을 취한다 해도 실제 시합에서 어떤 동작과 자세가 나올지는 모르는 일이다. 물론 야구에서의 수비도 비슷한 문제가 있지만, 주가 되는 공격에 대해서는 훨씬 분석이 편리함은 의심의 여지가 없다.


모션캡쳐를 활용해 간단히 묘사한 타격폼. 여기서 센서의 개수를 조절해 더욱 상세한 관절의 움직임까지 묘사하기도 한다. (Flynn et al., 2021)
모션캡쳐를 활용해 간단히 묘사한 타격폼. 여기서 센서의 개수를 조절해 더욱 상세한 관절의 움직임까지 묘사하기도 한다. (Flynn et al., 2021)
<머니볼>: 세이버매트릭스, 가난한 팀의 무기가 되다

 

세이버매트릭스는 1950년대 ‘야구분석학’ 이라는 이름으로 미국에서 본격적으로 연구되었지만, 한국에 대중적으로 알려진 것은 비교적 최근의 일이다. 특히 마이클 루이스의 논픽션 <머니볼>과 브래드 피트 주연의 영화 <머니볼>이 큰 역할을 했다. 최근에도 유튜브 쇼츠 등을 통해 알려지고 있는 <머니볼>은 가난한 MLB 야구팀인 오클랜드 애슬레틱스의 단장 빌리 빈이 세이버매트릭스를 중심으로, 그 중에서도 타율이 아닌 출루율과 장타율, 그 합인 OPS에 중점을 두며 선수를 영입하고 과감한 트레이드 등으로 전력을 보강해 팀을 강하게 만드는 내용이다.


2011년 브래드 피트 주연의 영화 <머니볼>. 동명의 책을 원작으로 한 이 영화는 세이버매트릭스가 대중적으로 알려지는 데 큰 영향을 주었다.
2011년 브래드 피트 주연의 영화 <머니볼>. 동명의 책을 원작으로 한 이 영화는 세이버매트릭스가 대중적으로 알려지는 데 큰 영향을 주었다.

사실, <머니볼>의 주요 내용은 ‘남들과 다른 관점에서, 저평가된 매물 찾기’에 가깝다. 자본주의에서는 아주 기본적인 개념이다. 가치를 판별하는 기준으로 적용된 것이 세이버매트릭스일 뿐이었다. 최근에는 돈이 많은 구단들도 세이버매트릭스를 기본적으로 활용하면서, 오히려 머니볼의 관점에서는 세이버매트릭스가 아닌 다른 관점을 적용하는 편이 맞기도 하다. 바꾸어야 할 관점이 고전적인 야구관에서 세이버매트릭스로 바뀐 것이다. 그만큼 세이버매트릭스가 상식적으로 받아들여지는 것이기도 하고 말이다.

 

특히 이 <머니볼>의 영향으로 세이버매트릭스가 선수 영입에서 사용되는 것으로 이해하는 경우가 많은데, 세이버매트릭스가 그 진가를 발휘하는 것은 그저 선수 영입이 아니다. 선수 운용이야말로 세이버매트릭스가 가장 중요하게 활용되는 분야이다. 출루율이 높은 선수를 테이블 세터인 1, 2번 타자로 배치하고, 3-5번, 최근에는 2번까지 장타를 때려서 테이블 세터들을 홈으로 불러들이는 운영은 상식적이다. 거기에 주자 유무와 상황별 출루율/장타율, 주자 출루시 투수의 구위 변화 등까지 고려할 수 있다. 단적으로, 롯데 자이언츠의 황성빈 선수가 출루한다면 투수들은 신경을 쓰느라 견제구를 투구하거나, 구위와 제구가 흔들리기도 한다.

 

타자가 아니라 투수 운용도 마찬가지이다. 공의 투구점 기록을 기반으로 선발에 적합한 선수와 불펜에 적합한 선수를 구분하는 건 상식적이다. 2019년 큰 인기를 끈 ‘스토브리그’ 라는 드라마에서는 단장이 장진우라는 투수의 구속과 구종가치가 하락했지만, 그럼에도 더블 플레이(병살) 타구 수를 기반으로 그를 방출하지 않기로 결정하는 내용이 있다. 특히 최근 세이버매트릭스에서는 땅볼 투수의 가치를 재고하는 등, 삼진을 잡는 능력에 국한된 투수의 능력 평가의 지평을 넓히고자 하고 있다.

 

단적으로, 여러분이 감독이라면 무사 1, 2루 상황에서 어떻게 위기를 극복할 것인가? 삼진을 잘 잡는 투수를 올려서 3명을 모조리 잡아야 할까, 아니면 땅볼형 투수를 올려서 병살타를 노려야 할까. 2024년 4월 2일 롯데와 한화의 경기에서 이런 장면이 연출되었다.

 

당시 점수는 1:0, 롯데 자이언츠가 앞서는 상황에서, 9회 말 마무리 김원중 투수를 상대로 한화 이글스가 무사 2,3루를 만들어낸 상황이었다. 상대 타자는 개막 이후 안타가 없는 이재원. 그럼에도 롯데의 김태형 감독은 고의사구를 선언, 무사 만루 상황을 만들었다.

 

상식적으로 무사만루를 만들어준다는 것은 이해하기 어렵지만, 결과적으로 다음 타자 문현빈의 초구 타격 땅볼이 병살타가 되고, 채은성 선수를 삼진아웃으로 잡아내며 승리한 경기였다. 김태형 감독은 왜 그런 판단을 했을까? 아마 이런 계산이 있었을 것이다.

첫쨰, 2024년 김원중 선수는 직구와 포크볼(직구처럼 날아가다가 뚝 떨어지는 유인구)를 주력으로 던지는 선수였다. 특히 스트라이크 존에서 빠져나가는 포크볼을 구사하는 선수인데, 존에서 벗어나는 포크볼을 타격하고자 휘두르면 헛스윙이거나 땅볼로 이어진다. 즉, 삼진 혹은 땅볼에서 앞선 상황이라면 땅볼이 병살타로 이어진다는 것이다.

둘째, 문현빈의 통산 초구 타격 비율이 높았다. 통상적으로 초구 타격의 효용에 대해서는 많은 논란이 있으나, 투수 교체 이후 초구를 타격하는 것은 그 타율이나 장타율이 높다고 분석되어 왔다. 그러나 투수는 그대로인데 타자가 바뀌는 경우, 초구 타격이 오히려 나쁘게 이어질 수 있으며 이 경기의 사례가 바로 그렇다.

셋째, 통계상 무사만루 상황에서의 병살타율이 무사 2,3루 상황보다 많다. 즉, 무사 상황에서 병살타로 승부한다는 구상을 세웠을 때 만루를 채우는 것이 목표 달성에 훨씬 유리했다.

이 상황은 아주 기초적인 통계의 활용이다. 사실, 세이버매트릭스의 활용이라고 부르기에도 애매한 수준이다. 그러나 이 경기의 사례가 보여주는 것은 통계를 활용해서 전략을 수립하고, 그 전략을 적용하기 위한 고의사구 등의 전술에도 통계적 사실이 활용된다는 것이다.

 

실전 분석, 사례로 보는 세이버매트릭스

 

앞선 롯데-한화 경기의 사례는 너무 기초적이어서 세이버매트릭스의 활용이라고 부르기에도 애매하다고 서술했다. 그렇다면 실전에서 세이버매트릭스를 활용한 사례는 없을까? 사실 국내에는 이미 MLB, NPB의 사례까지 소개하고 있는 글들이 많다. 대표적으로 <스토브리그> 에서도 ‘야구만세’ 라는 이름으로 소개된 ‘야구공작소’가 있다.

 

그렇다면 ‘야구공작소’의 글 중 일부를 소개하면서, 동시에 세이버매트릭스적 지표에 대해 몇가지 알아보자.

 

첫번째 글은 2025년 5월 1일 업로드된 ‘’낭만’ 투수 임찬규’ 라는 글이다. LG 트윈스의 토종 선발 역할을 맏고 있으면서 올해 좋은 성적을 보이는 임찬규 선수에 대한 글인데, 글의 내용 중에서 임찬규의 ‘FIP’ 수치가 낮아지고 있는 점이 그의 성장세를 보여준다고 했다. FIP가 무엇이길래 그렇게 평가하는 걸까?

 

FIP는 DIPS ERA 라고도 불린다. DIPS는 Defense-Independent Pitching Statistics, 수비 무관 투구 기록의 약자이며 ERA는 평균 자책점이다. ERA를 쓰면 되지 왜 FIP가 필요할까?

 

롯데 자이언츠는 2024시즌 유격수 문제로 골치를 앓았다. 특히 2024년 주전 유격수 자리를 차지한 박승욱 선수는 총 22개의 실책을 기록했다. 만약 투수의 공이 유격수에게 접근할 때, 실책 때문에 출루에 성공한다면? 또는 득점에 성공한다면 투수의 기록은 나빠지지만, 그것은 투수의 잘못이라기엔 무리가 있다. 즉, 수비 능력의 영향을 빼고 투수의 능력을 계산해야 할 필요가 있다는 말이다.

 

따라서 DIPS 이론에서는, 안타를 고려하지 않는다. 오직 삼진, 사구와 볼넷, 홈런만을 고려하여 계산하고, 그 일환으로 나온 지표가 FIP이다. 즉, ERA 대신 홈런, 볼넷과 사구, 삼진에 일정한 가중치를 부여해 계산된 새로운 투수를 평가하는 지표가 FIP이다.

 

다음 글을 살펴보자. 2020년 업로드된 조금은 오래된 글이지만, 그 가치는 여전하다. ‘노히트노런 달성 이후에는 부진하다?’ 글에서는, 제목의 속설을 검증하기 위해 노히트노런 게임 전후의 ‘게임 스코어’를 비교하고 있다. 게임 스코어는 어떤 지표일까?

 

보통 선발투수를 평가할 때에는 ERA, QS/QS+ 횟수, WHIP 등을 고려한다. 또는 이를 종합적으로 고려한 WAR을 산정하기도 한다. 하지만 게임 스코어는 WAR 처럼 회사마다, 구단마다 계산 방식이 다른 것도 아니고, 또 한 분야만을 고려하는 것이 아니다. 게임 스코어는 50점을 기본, 탈삼진, 아웃카운트, 5회 이후 이닝 소화에 + 점수를, 실점, 안타, 홈런, 볼넷 등에 - 점수를 부여하여 총점을 계산하는 방식이다. 퀄리티 스타트 (6이닝 3자책점)을 기록했다고 했을 때, 볼넷 등이 전혀 없더라도 60점이 기록된다. 실질적으로 볼넷, 안타가 전혀 없을 수 없음을 고려하면 사실상 선발투수의 기준을 퀄리티 스타트로 생각하는 지표라는 점에서 조금은 깐깐하다고 볼 수 있다.

 

결과적으로 글에서는 노히트노런 전후, 또 투구수가 100구를 넘어선 상황에서의 다음 경기의 게임 스코어에 큰 변화가 없었음을 이야기하고 있다. 즉, 통계적으로 속설이 사실이 아니라고 주장한 글이다.

 

마지막 세 번째 글은 2024시즌 NC 다이노스의 유격수인 김주원 선수에 대한 글이다. ‘달라진 스텝과 함께 스텝업한 김주원’ 이라는 제목의 글에서는 김주원의 전후반기 BABIP을 비교하며 후반기의 성장이 순전히 운일수도 있다고 언급하고 있다. 대체 BABIP이 무엇이길래 그럴까?

 

앞서 DIPS 이론에 대해 얘기하며 수비를 고려하지 않은 투수의 성적에 대해 얘기했지만, 사실 DIPS 이론은 한 발 더 나아가 있다. 투수가 공을 던졌을 때, 땅볼을 유도하고자 한 공이 어퍼스윙에 맞아 홈런이 될 수도 있고, 또 운 좋게 안타성 타구가 파울이 될 수도 있는 등, 타구가 어떻게 갈 지는 투수가 통제할 수 없다는 것이다. 따라서 타자가 공을 맞추어 컨택이 되었을 때, 그 타구가 안타가 될 확률을 계산한 것이 BABIP이다.

 

2025년 KBO에서는 어떤 선수의 BABIP이 높을까? 대표적으로 롯데 자이언츠의 유격수 전민재 선수이다. 그의 부상 이후에는 5월 9일 기준 BABIP 0.421, 타율 0.367로 두 부문 1위를 차지하고 있는 NC 다이노스의 손아섭 선수가 있다. 사실, 같은 선수라도 컨택 이후 안타가 되냐 안 되냐에 따라 타율부터 모든 지표가 영향을 받는다는 점에서 BABIP 수치를 표준화하고 봐야 한다는 목소리도 크다. 하지만 BABIP이 그저 운이냐, 혹은 흔히 말하는 ‘타구 질’에 따른 지표냐는 논쟁도 있으니 만큼, 이 부분에 대해서는 차후 더 연구가 진행되어야 할 것이다.

 

DIPS의 개발자이자 BABIP의 창시자는 대학원생인 보로스 맥크라켄 (Voros McCracken) 이었다. 또, 1950년대 이후 야구분석학의 발전에도 당시 미국의 우수한 금융공학 분야의 야구팬들의 기여가 컸다고 한다.

 

기술의 발전이 사람들에게 실제로 영향을 주는 것은, AI나 컴퓨터의 발명처럼 엄청난 것이 아니라는 생각이 든다. 오히려 야구의 통계학처럼 본인이 공부하는 분야를 좋아하는 것, 관심있는 것에 적용해서 문제를 풀 때. 야구에서 세이버매트릭스가 선수들을 평가하는 관점을 정량적이고 넓게 변화시켰듯이 세상을 변화시키는 것 같다. 그저 숫자놀음에서 ‘야구를 해석하는’ 숫자놀음으로 발전한 세이버 매트릭스, 이제 야구에서의 데이터 활용이라는 부분에서 세계의 야구 팬 이과생들이 어떤 발전을 이루어낼지 기대해보자.


이민규 학생 기자 | Math&Comp Sci. | 지식더하기

ree

참고자료


[1] 2015 MBC 다큐멘터리 ‘위닝샷: 투구의 비밀’.

[2] 브리태니커 백과사전: Sabermetrics.

[3] 야구공작소


첨부 이미지 출처


[1] 2015 MBC 다큐멘터리 ‘위닝샷: 투구의 비밀’.

[2] 스탯티즈 사이트.

[3] Flynn, L. S., Richard, G. J., Vincent, H. K., Bruner, M., Chen, C., Matthias, R. C., Zaremski, J. L., & Farmer, K. W. (2021). Swing type and batting grip affect peak pressures on the hook of Hamate in collegiate baseball players. Orthopaedic Journal of Sports Medicine, 9(12).

[4] 머니볼 (2011) 영화 포스터


ⓒ KAIST부설 한국과학영재학교 온라인 과학매거진 KOSMOS

댓글


워터마크_colored.png

KOSMOS는 KSA Online Science Magazine of Students의 약자로,

KAIST부설 한국과학영재학교 학생들이 만들어나가는 온라인 과학매거진 입니다.

단체소개  운영진에게  이용약관  기자단 페이지

​본 단체와 웹사이트는 KAIST부설 한국과학영재학교의 지원으로 운영되고 있습니다.

저작물의 무단 전재 및 배포시 저작권법 136조에 의거 최고 5년 이하의 징역 또는 5천만원 이하의 벌금에 처하거나 이를 병과할 수 있습니다. 

© 2018 한국과학영재학교 온라인 과학매거진 KOSMOS. ALL RIGHTS RESERVED. Created by 김동휘, 윤태준.

KAIST부설 한국과학영재학교 바로가기

_edited_edited.png
bottom of page