번역글입니다.
흥미로운 스탯관련 글입니다.
19년 10월 3일 작성된 글입니다.
이 글을 이해하기 위해서는
https://pgr21.net../freedom/86118
앞선 이글을 선행해서 읽어서 시퀀스랑 점유가 무엇인지 파악해야합니다만..
대부분 안 읽을 수 있다고 생각해서 요약해보자면
0. 축구는 야구와 다르게 흐름이 끊기지 않고 계속 이어지기에 단일스탯으로는 어렵다는 말이 있음, 그래서 축구를 흐름별 쪼개기 위한 과정으로 새로운 스탯을 개발해야함
1. 기존 패스갯수로 측정하는 점유율이 아닌 새로운 형태의 Possession(점유) 개념을 옵타가 개발함 이 점유 및 시퀀스 단위로 경기를 쪼개버림
2. 점유란 볼소유권을 얻고 이를 헌납하기 과정까지를 하나의 점유로 정의했고 중간에 게임이 중단된 이후에도 아군이 갖고 있다면 점유는 이어진다
3. 점유는 시퀀스들로 이루어진다.
4. 시퀀스는 볼을 받고 태클이나,슈팅, 라인을 벗어나는 순간 등등 게임이 중단되거나 볼을 헌납하기 까지의 과정이다.
5. 하나의 시퀀스에서 볼이 이동한 거리와 시간등을 통해 팀의 플레이속도를 파악할 수 있다.
그러면 글 시작하겠습니다.
중요 포인트
- Possession value(이하 PV)는 개개인의 볼소유가 어떻게 팀득점으로 이어지는지 확률을 계산하는 지표다
- 이 스탯을 활용하면 개별 선수의 행동하나하나가 긍정적으로 작용하는지 혹은 부정적인지 알 수 있다.
- 맨시티의 *리야드 마레즈와 케빈 데브라이너는 이번시즌 프리미어리그에서 가장 돋보이는 선수이다. 이 두선수는 Possession Valued Added(이하 PV+)수치가 최고이다
*19년 10월 3일기준입니다
득점이나 어시스트를 기록하는 선수들은 어느 팀이든 핵심선수다. 그러나 이 두가지 스탯만 따지게 되면 다른 중요한 피치위 행동들을 놓치게 된다. 예를 들어서 그 두개만 따지면 온더볼이 좋은 수비형 미드필더는 평가할 수 있는 방법이 전문하게 되는 것이다.
분석가들은 각 선수의 개별 행동 전부를 가치평가하고 싶어한다. 그들의 행동이 팀의 유용한가 혹은 해를 끼치는지를 말이다. 그리고 선수들의 어떤 행동이 팀의 득점확률을 올리고 승리로 이끄는지도 알 고 싶어한다.
기존 기대득점(XG)나 기대도움(XA)으로는 중앙 미드필더의 가치를 평가하기란 매우 어렵다. 아마 대부분의 중앙미드필더는 이 두개의 수치가 낮은 편이기때문이다. 그렇기에 우리는 다른 스탯들을 활용한다. 예를 들어서 ‘전진패스’개수나 혹은 ‘파이널서드 진입횟수’가 있다.
이러한 스탯들을 평가기준으로 좋은 지표지만 이 지표들 역시 다른 많은 정보를 놓치게 된다. 예를 들어서 골로 이어진 슈팅만을 따져서 공격수를 평가한다면 말이 많을 것이다. 그래서 슈팅 하나하나가 얼마나 득점으로 이어지는지를 평가하는 기준을 만든 것이다. 이러한 방법론을 ‘파이널 서드 진입’에도 적용해보는 것이다. 각 개별 파이널 서드진입은 얼마나 가치가 있을가 말이다.
기대득점은 단순히 슈팅 가치평가하는데 만일 피치위의 모든 행동의 점수를 매길 수 있다면 어떻게 될까?
점유에서 득점까지 확률
선수들을 경기 내내 끊임없이 결정을 내린다. 어떤 선수들은 득점 가능성을 올릴려하고 다른 선수들을 실점 가능성을 낮추려고 노력한다.
패스를 스트라이커에게 해줘서 득점으로 이어지는 겅유나 인터셉션을 통해 볼을 빼앗는 경우와 같은 행동들을 누가 보더라도 명확히 긍정지표이다. 그러나 대부분의 행동들을 그렇지 않고 어느정도 흐름만을 내포하고 있다. 그렇기에 optapro는 possession Value(이하 PV라고 표기하겠음)를 활용했다. 이는 농구에서 EPV / Expected Possesion value와 유사하다. PV는 점유과정에서 팀이 득점할 확률을 측정하는 지표다.
이 모델은 여전히 개발중이고 19/20시즌에 들어서 여러 optapro 클라이언트들에게 피드백받으면서 발전시키고 있다.
아래 PV가 어떻게 적용되고 측정되는지 예시를 보여주겠다. 아래는 리버풀의 시퀀스이다. 제임스 밀너가 ?를 향해 패스를 했다.
*위와 같은 점유상황의 경유 경유 30번에 1번꼴로 득점이 일어날 수 있다.
현재 이 단계에서 득점이 어떻게 이루어졌는지 확률은 얼마나 될까? 확실한것은 우리는 득점의
형태를 따지는 게 아니다. 골은 뭐 득점 될 수 있다. 받은 사람이 그냥 시원하게 슈팅날려서 했을 수도 있고 나중에 코너부근에서 터치한 20번하다가 갑자기 기록할 수도 있다. 진짜 중요한 것은 어찌되었든 골까지의 과정에서 점유를 내주지 않았다는 점이다. 그걸 카운트 하는것이다.
이 모델은 점유가 이어지는 상황에서 어떤 형태의 득점이던지 이것이 발생할 확률을 추정하는 것이 목적이다.
위의 상황에서 우리는 득점 확률로 3.3%라는 수치를 얻었다. 어디서 이 숫자가 튀어나왔을까?
위에서 보인 그림에서 알 수 있듯이 *마지막 5번의 행동을 바탕으로 측정된다. 그리고 이는 과거 데이터들과 비교한다. 그 다음 득점이 나올 가능성을 측정하는 것이다.
*역주- 지도를 보면 총 화살표가 5번 움직인 것을 알 수 있다. 화살표 한개 마다 1번의 행동으로 기록되는 것이다.
일반적으로 시퀀스상 더 나중 시간대의 화살표 행동일 경우 득점확률에 더 큰 영향을 끼친다. 위의 예시에서는 밀너의 마지막 패스가 다른 행동에 비해 더 크게 가치평가에 영향 미치는 것이다.
여기까지 읽은 독자들은 이제 이렇게 생각할 것이다. “그래서 이게 뭐라고? 어떻게 이게 피치위의 행동에 가치를 매기는데?”
자 이제 리버풀 예시를 계속 이어 나가보자. 밀너의 패스 뒤로 두개의 행동이 사실 더 있었다.
밀너의 패스를 받은 선수는 피르미누였다. 피르미누는 박스 쪽으로 볼을 몰고 나갔고 박스 안 스루패스를 성공시켰다. 이 패스를 사디오 마네가 받았다. 이제 득점이 발생할 확률은 33.9%로 상승한다. 다른말로 바꾸자면, 기존 3퍼센트의 확률을 33.9퍼센트로 높인 행동을 한 선수가 있고 그에게 Possession Value added(or PV+) 생긴다. 바로 여기 이 지점에서 피치위의 행동 마다 가치를 매기는 것이다.
즉 PV는 피치위의 모든 행동들을 각각 얼마나 팀득점 확률을 증가시키나 혹은 감소시키냐를 평가하는 수치이다.
팀 득점확률 기여도에 대한 수량화
XG값이나 XA값과 크게 상관없는 선수의 행동이, 어떻게 PV+값에 상승시키는지 아래의 예시를 통해 알아보자.
아스날의 라카제트가 자기팀 진형에서 스로인된 볼을 받았다. 그리고 현재 상대선수들에게 둘러싸인 모습이다.
볼을 받고 턴을 한 라카제트는 상대 진형 깊숙한 지역까지 몰고 갔다. 여기까지 9초 정도가 걸렸고 그 다음 라카제트는 왼쪽에 있는 콜라시나츠에게 패스를 했다.
누가봐도 라카제트의 움직임은 공격에 가치있는 기여를 했다. 그러나 콜라시나츠가 허무하게 크로스를 날리면서 상대 수비에 의해 막혀버렸다.
라카제트는 이러한 훌륭한 움직임을 보였지만, 슈팅을 하지 않아서 xg값이 올라가지도 않았고 콜라시나츠가 득점까지 하기 힘든 자리였기에 xa값도 상승하지 않았다. 허나 PV+에서는 이 라카제트의 좋은 움직임을 스탯으로 수치화 할 수 있다.
라카제트가 스로인을 통해 공을 받았을 때 pv값은 1%정도였다. 그러나 라카제트가 패스하기 직전 PV값은 7%였다. 6퍼센트 정도가 라카제트 움직임을 통해 증가했다. 이처럼 pv를 통해 라카제트의 행동이 얼마나 가치 있는지 측정할 수 있게 된 것이다.
PV스탯의 힘은 바로 피치위의 모든 움직임을 평가할 수 있다는 점이다. 패스, 볼운반, 1대1돌파, 인터셉트, 태클, 리커버리, 거기다 심지어 파울을 당하거나 코너킥을 만드는 점 이 모든 행동들이 PV에는 반영된다.
부정기여 측정하는 법
점유 상황에서 긍정기여도는 알아봤으나, 턴오버들도 게임에서는 중요한 부분이다.
공 소유를 내준다는 것은 팀에 있어서 두가지로 해를 끼친다. 우선 볼 소유하는 동안 할 수 있는 모든 선택지들이 사라진다. 두번째로는 이제 상대가 볼 소유하면서 선택지를 가지고 득점확률을 높이는 결정을 내릴 수 있다는 점이다.
자 이제 두가지 시나리오를 보여주면서 어떻게 적용되는지 살펴보다.
시나리오 1 – 왓포드 vs 아스날 : 소크라티스
소크라티스가 박스안에서 볼을 가지고 있다. 그는 박스 밖으로 볼을 옮기려 했지만 데울로페우에 의해 패스가 차단되었다.
이 결과를 PV따져보겠다.
-우리팀 기준 볼을 내준 시점에서 득점확률은 0.01, 1%이다
-상대가 볼을 점유를 하게 된 시점에서 실점확률은 0.14, 14%이다.
소크라티스 행동이 득점 pv 0.01에서 실점 pv 0.14로 바꾸게 한 것이다.
결국 소크라티스는 -0.15pv+의 수치를 얻게 된다.
시나리오2 – 토트넘 vs 크리스탈 팰리스 : 쿠야테
수정궁은 박스 밖에서 프리킥을 얻었다.
이 프리킥을 왼쪽 끝 포스트부근에서 쿠야테가 받고 컷백을 시도했다. 그러나 이는 성공적이지 못했고 볼을 클리어 되었다.
이 상황에서 pv를 따져보자
- 쿠야테가 볼을 내준 시점에서 득점확률 pv는 0.17, 17퍼센트였다.
- 그리고 볼을 상대방에게 헌납하면서 실점확률 pv는 0.01 즉 1퍼센트가 된다.
만일 소크라티스 상황에서 사용한 기준을 다시 적용한다면 아마 쿠야테는 -.018pv+로 스탯이 측정 될 것이다.
그러나 이 두 시나리오의 상황은 맥락이 전혀 다르다. 첫번째 예시에서는 박스안에서 소크라티스가 실수하면서 바로 직접적으로 실점위기의 pv로 전환되는 반면, 쿠야테의 경우는 어쩌면 중앙으로 움직이면서 컷백을 받아야하는 움직임이 동료들에게 부족했을 수도 있다.
만일 숫자만 보고 판단했다면 우리는 적극적으로 득점에 영향을 끼치려는 선수들에게 안 좋은 점수를 줬을지도 모른다.
그렇기에 우리는 아주 확실한 상황에서만 이 부분을 적용하기로 했다. 그래서 우리 틀에서 볼소유 헌납은 0.025 감소로 간주했다.(이는 평균적인 볼획득가치다.)
그래서 이 시나리오2에서 쿠야테는 -0.025 pv를 볼소유헌납의 점수와, 앞서 언급했던 상대에게 실점확률 pv 0.01을 더해서 총 -0.035pv+가 적용된다.
여전히 공격자들이 볼을 잃게 되는 경우에 대해서 불이익이 들어가지만 완전히 부당하게는 아니다.
탁월한 선수 찾아내기
이제 모든 선수들의 긍정기여와 부정기여를 판단할 수 있게 되었다. 선수는 긍정기여를 많이 할수록 좋지만 부정기여 점수 역시 높다면 좋게 평가하기 어렵다. 또한 이 점수를 통해 하이리스크 하이리턴 선수와 로우리스크 로우리턴 선수를 같은 위치에서 평가할 수 있게 되었다.
아래 표는 이제 각 팀별 팀내 가장 탁월한 선수를 표로 나타내었다.
작성기준 19년, 10월 기준이다. 각 팀별 가장 PV+가 높은 선수들을 나열했다. 물론 그 당시는 7경기만을 했기에 매우 작은 샘플링인걸 감안해야한다.
표에서 볼 수 있듯이 각 그래프는 4개의 항목으로 되어있다.
Progressive – 파랑색 그래프로 + 항목이다. 이 부분은 긍정 PV+다.
Regrssive – 분명 행위는 성공했지만 결과적으로 부정 pv+ 로 이어진 행동들이다. 빨간색으로 표시되었다.
Loss of Possession – 볼소유 헌납이고 노란색으로 표시되었다. ( 쿠야테 케이스인 - 0.025PV+를 떠올리면 된다
Loss of Possession – 볼소유 헌납이 직접적으로 실점위기로 이어진 경우이다. 주황색이다.
리야드 마레즈가 리그 top에 위치했다. 표를보면 다양한 포지션의 선수들이 존재한다. 이는 우리의 pv측정 박식이 다양한 선수들을 평가할 수 있다는 점이다. 허나 아직은 서로 다른 포지션간의 선수를 직접적으로 비교하는데까지 이르지는 못했다.
여전히 이 지표는 발전중이고 더 나아가게 하려고 노력중이다. 이 지표를 통해 이젠 은골로 캉테 같은 선수들의 기여가 팀의 어느정도이지 수치화로 표시할 수 있게 될 것이다.