1. 들어가며세이버 매트릭스는 타율, 출루율 같은 야구 기록을 회귀 분석해서 각각이 득점/실점에 어떤 영향을 미쳤는지 알아보고자 하는 통계 모음집 입니다. 세이버 매트릭스가 대중화 되기 전에도 대략 10점 정도 더 얻으면 연간 승수가 1승 늘어난다는 것이 야구인들 사이에 알려져 있었고, 머니볼에서 빌리 빈 단장이 이 선수를 우리가 트레이드 하면 연간 몇 점을 얻으니 승수가 어떻게 변할 것이라고 예측하는 내용이 나옵니다.
통계를 내보면 리그, 시즌마다 다소간의 차이는 있으나 보통 득/실점 9~11점 당 1승을 얻거나 잃게 됩니다. 따라서 세이버 매트릭스 관점에서 보더라도 10점당 1승으로 보는 데 문제가 없습니다. 만약 어떤 선수가 WAR 10을 기록했다면 마이너 또는 2군 선수 중에 급하게 콜업해서 쓰는 대체선수 수준 대비 연간 팀에 100점의 점수를 더했다는 의미가 됩니다. KBO기준으로는 상위권 팀이 풀 시즌 기즌 700점 중반, 하위권 팀이 600점 이하를 얻으니 한 명의 선수가 100점을 팀에 더해준다는 건 하위권 팀을 가을야구로 올려보낼만한 영향력이 있다는 이야기가 되죠.
2. 한국에서 뛰어본 적이 없는 외국인 선수의 기대 WAR를 어떻게 구할 것인가매년 해외 스카우트들이 자기 밥줄을 걸고 외국인 선수를 선발합니다. 그러나 나이저 모건같이 메이저에서 통산 2200타석 wRC+ 93을 기록했을 뿐만 아니라 직전 해에도 스몰 샘플이지만 52타석 wRC+ 150을 기록한 선수가 한국에 왔더니 KBO 2군에서 2할 초반을 치는 사단이 날 수도 있고 로맥처럼 NPB 요코하마 베이스타즈에서 30경기 71타수 8안타(.113) 0홈런 2타점을 기록하고 쫓겨나듯 한국에 대체용병으로 영입된 선수가 적응 완료 후 국내에서 대박을 내는 경우도 있습니다.
또한 MLB에서 괜찮은 커리어를 가지고 있는 선수는 MLB에 남거나 NPB 상급 선수로 일본에 가기 때문에 직전해까지 가능성이 있었지만 향후 기량 하락이 우려되는 선수인 경우도 많죠. 따라서 직전해 성적을 기반으로 한국에서의 WAR를 예측하는 것은 쉽지 않은 일입니다.
이럴 때 예측 적중률을 높일 수 있는 방법이 정규 분포를 이용한 표준화입니다. 이를 자세히 설명하려면 여백이 부족하므로 적지 어렵습니다만, 수능 등급제나 IQ 점수에 사용되는 방식이라고 보면 됩니다. KBO에서 뛰었던 선수들의 WAR 수치를 매 년 단위로 분리해서 (ex. 더스틴 니퍼트라면 2011 ~ 2018 까지의 8가지 값이 나옵니다) 자료를 모은 뒤 이를 정규 분포를 적용해서 1등급부터 9등급까지 나눈 뒤, 각각의 등급별로 WAR가 어느 정도인지 보면 된다는 것이지요.
이를테면 대입 수험생의 수능 점수를 정확하게 맞추는 것은 어렵지만, 그 전에 봤던 모의고사 등급을 기준으로 3등급 정도 받았던 학생이라면 본 수능에서도 2~4등급 정도 받을 것이라 예측하면 적중할 가능성이 높은 것과 같은 맥락입니다. 기존에 한국에서 뛰었던 용병이라면 직전 해 성적을 기반으로 생각하면 되고, 신규 영입된 용병이라면 한국에 들어오기 전의 수준 (메이저리거였는지, AAAA급이었는지, AAA 상급이었는지, AAA에서 평범한 수준이었는지)을 기반으로 적당히 3~6등급 정도의 초기 기대치를 가지고 성적을 예측한다면 이 선수는 발도 빠르고 컨택도 괜찮으니 WAR 3 정도는 할 것이라는 예상보다는 신뢰도가 높지 않을까요?
3. 표준화 통계의 범위는 어디까지로 할 것인가외국인 선수의 기대 WAR 등급은 부진이나 부상으로 조기 퇴출된 선수를 제외할지, 포함시킬지 여부에 따라서 결과가 달라지게 됩니다. 퇴출된 외국인 선수를 다 포함시켜서 생각할 경우엔 이레귤러가 문제가 되는데, 멕시칸 리그에서 체력 방전된 상태로 시즌을 맞이한 결과 LG에서 9경기 선발 무승 6패 평균자책점 7.68을 찍고 방출된 에드가 곤잘레스는 이후 메이저리그에서 자리를 찾아서 3년을 더 던졌습니다. 그의 경우 적응과 준비 과정이 정상적이었다면 KBO에서도 활약할 만한 기량은 충분히 갖췄었다는 이야기죠.
따라서 정상적으로 시즌을 소화한다는 전제를 두고 통계를 구하는 편이 낫겠다 싶어, 외국인 선수 자유계약 제도가 도입된 2000년 이후 시점부터 타자는 300타석, 투수는 100이닝 이상 던진 선수들을 대상으로 표준 정규 분포를 이용한 통계 처리를 진행 했습니다. 또한 144경기 환산치를 적용했기 때문에 8구단 체제에서 뛰었던 선수들은 알고 계신 것보다 다소 WAR가 높아졌습니다.
4. 그래서 외국인 선수 등급은 어떻게 나왔는가외국인 선수들의 등급을 대입 성적 구분 %에 맞춰서 분류해봤습니다.
일정 실력을 갖춘 선수들을 대상으로 (풀타임 소화, AAA에서 중상급 이상 성적) 한 풀이기 때문에 3등급만 되더라도 상당히 우수한 수준입니다. 대략 3.9정도가 300타석 이상 소화한 외국인 타자의 평균치가 됩니다. 그리고 8, 9등급 이라면 보통 선수를 구하기 힘든 사정때문에 어쩔 수 없이 쓰는 수준이며 7등급은 나이가 어려서 성장 가능성이 있거나, 수비가 예술인 경우를 제외하면 보통은 이듬해 다른 선수로 바뀌는 커트라인 역할을 합니다.
제가 사용하는 기준은 직전 해에 메이저리그에서 200타석 wRC+ 90 이상을 보여준 선수거나 NPB 에서 규정타석 wRC+ 110 정도 되는 선수라면 3~5등급, AAAA 리거이거나 이름값 있는 메이저리거인데 나이를 먹어 쇠퇴 중이거나 AAA에서 상급인데 자리를 못 구한 경우에는 4~6등급, AAA에서도 뛰어난 수준은 아니었는데 팀 사정때문에 급히 뽑힌 선수는 5~7등급 정도의 성적을 거둘 것으로 예상합니다. 1~3등급, 특히 2등급 위로는 10개 구단 전체에서 한 명도 안 나오는 경우도 있을 정도로 아웃라이어 이므로 예상의 의미가 없는 수준이구요. (로하스나 테임즈가 뽑혔을 때 이 선수들이 리그 파괴자가 될 것으로 생각하신분 손들어 보세요)
투수의 경우에는 야수와는 경향이 다른 것이, 야수보다 숫자가 많은 데다가 포지션 제한 없이 공만 던질 줄 알면 되기 때문에 뽑히는 선수도 대체되는 선수도 많아서 중간층의 편차가 적은 편입니다. 외인 선발 탑이었던 리오스는 빼려고 고민했으나 일단은 상징적인 의미로 남겨 놓았습니다. 투수는 야수보다도 풀이 넓다 보니 6등급만 되더라도 교체하자는 여론이 다수 나오게 됩니다.
5. 마치며
엄밀히 외국인 선수의 성적을 예측하자면, 중도탈락 및 대체선수 까지 풀에 넣어서 망할 확률도 계산하는것이 맞습니다. 이를 언젠가 도전해보고 싶은 마음이 있으나 이번 글을 쓰는데도 기력이 쇠할 지경이라 풀 시즌을 살아남은 걸 전제로 글을 써 보았습니다. 내년 스토브 리그 시기에 기회가 있다면, 자료를 보강해서 이를 적어보도록 하겠습니다.