Lazio Juventus, il gol di Dybala (Insidefoto.com)
Il gol di Dybala in Lazio Juventus (Insidefoto.com)

Statistica applicata al calcio – La statistica avanzata applicata al calcio si occupa di misurare le prestazioni di atleti e squadre in modo oggettivo attraverso molteplici misure che analizzano tiri, occasioni da gol, passaggi, occupazione degli spazi, pressing, e molti altri fattori, non solo per quantità ma anche per qualità.

Tutti i club più importanti hanno oggi uno staff di analisti e di videoanalisti che studiano sia la propria squadra sia le altre squadre e sono sempre più di fondamentale supporto all’allenatore.

Negli sport di squadra vince chi fa più punti. Nel basket il punto è dato dal canestro, nel calcio il punto è dato dal gol. Ma nel basket o in altri sport di punti se ne fanno tanti, mentre nel calcio di gol se ne fanno in media meno di 1,5 e talvolta non se ne fanno proprio.

Questo fa sì che negli altri sport le prestazioni siano correlate fortemente con i risultati, anche nella singola partita, mentre nel calcio la correlazione tra prestazione e risultato è debole nella singola partita e si manifesta in maniera più consistente ma comunque meno forte che in altri sport, solo nell’arco di parecchie partite.

Statistica applicata al calcio, che cosa sono gli expected goals (xG)

Gli xG, che sono l’acronimo del termine inglese “expected goals” o in italiano “gol attesi”, sono semplicemente i tiri fatti da una squadra, ai quali viene poi assegnata una probabilità di fare gol.

Attraverso gli “expected goals” si cerca di misurare non solo la quantità di tiri, ma anche la loro qualità, ovvero la probabilità di trasformarsi in gol.

Questa probabilità non è assegnata a caso, ma deriva dall’analisi e dalla classificazione di decine di migliaia di tiri fatti nei vari anni nei 5 maggiori campionati europei, ognuno classificato in base a posizione, distanza, angolo del tiratore, tipo di passaggio ricevuto, presenza o meno di una marcatura, presenza o meno di giocatori che oscurano lo specchio della porta, ecc.

Una volta classificati si è semplicemente misurato quanti gol con “quel tiro”, cioè da quella posizione e con quelle caratteristiche, sono stati fatti.

Per fare un esempio semplicissimo, su migliaia di calci di rigore tirati, i rigoristi di Liga, Serie A, Bundesliga, Premier League e Ligue 1 hanno fatto gol il 76% delle volte.

In termine decimali un calcio di rigore vale perciò 0,76 gol, cioè 0,76 xG o 0,76 gol attesi, ed esprime la probabilità che ha un rigorista medio di uno dei 5 maggiori campionati europei di fare gol su rigore.

Durante una partita una squadra effettua un certo numero di tiri più o meno pericolosi. Ad ognuno è assegnato dal software un valore, riconoscendo posizione e caratteristiche e associandolo con le probabilità dei tiri di quella categoria.

Statistica applicata al calcio, gli expected goals against (xGA)

Ad esempio, alla fine di una partita la squadra A ha prodotto 8 tiri pari a 0,20xG + 0,13xG + 0,30xG + 0,37xG + 0,10xG + 0,50xG + 0,25xG + 0,30xG = 2,15 xG complessivi.

Ciò significa che la squadra A avrebbe potuto realizzare 2 gol nel corso di quella partita.

Analogamente la squadra avversaria (che chiameremo squadra B) potrebbe anch’essa aver effettuato dei tiri verso la porta.

Questi tiri sono gli xG prodotti dalla squadra B, mentre dal punto di vista della squadra A sono i tiri concessi che vengono chiamati xGA (expected goals against)

Restando nell’esempio, la squadra A nella medesima partita in cui ha prodotto complessivamente 2,15 xG ha concesso complessivamente 0,45 xGA. Specularmente la squadra B ha prodotto 0,45 xG e concesso 2,15 xGA.

Sotto il profilo della prestazione la squadra A dovrebbe aver prodotto abbastanza per vincere, ma come evidenziato in precedenza, mentre nel basket sarà così quasi sicuramente, nel calcio, per la difficoltà che c’è a fare gol, questo non avviene regolarmente e la correlazione tra prestazioni e risultato nella singola partita è debole salvo che non vi sia una grande differenza anche negli xG.

Statistica applicata al calcio, gli xG nella Serie A 2017-2018

Il grafico seguente illustra gli xG prodotti dall’inizio del campionato fino al 15 marzo scorso da ogni squadra di Serie A (barra rossa, scala sx), i gol effettivamente fatti (barra blu, scala sx) e la percentuale in più o in meno dei gol fatti rispetto agli xG prodotti (linea verde, scala dx).

Statistica applicata al calcio, gli expected goals in Serie A al 15 marzo 2018
Statistica applicata al calcio, gli expected goals in Serie A al 15 marzo 2018

In basso, sotto il nome di ogni squadra, c’è la posizione di classifica al momento della rilevazione.

Posizione Team G xG % DELTA
2 Napoli 62 54,43 14% 7,57
3 Roma 47 50,95 -8% -3,95
4 Lazio 66 47,32 39% 18,68
1 Juventus 67 45,72 47% 21,28
7 Sampdoria 47 41,71 13% 5,29
8 Atalanta 38 40,34 -6% -2,34
5 Inter 42 39,66 6% 2,34
9 Fiorentina 36 37,76 -5% -1,76
6 AC Milan 38 37,00 3% 1,00
18 Sassuolo 16 35,24 -55% -19,24
10 Torino 36 33,10 9% 2,90
11 Udinese 37 31,30 18% 5,70
12 Bologna 33 28,63 15% 4,37
13 Genoa 21 27,48 -24% -6,48
17 SPAL 28 26,87 4% 1,13
19 Verona 25 26,82 -7% -1,82
14 Cagliari 25 26,34 -5% -1,34
15 Chievo 23 25,03 -8% -2,03
20 Benevento 18 24,26 -26% -6,26
16 Crotone 27 24,05 12% 2,95

Il primo dato che salta all’occhio sono i gol realizzati da Juventus e Lazio rispetto agli xG prodotti, così come il 55% in meno di gol fatti dal Sassuolo rispetto alle occasioni (misurate in xG) avute dalla squadra.

Statistica applicata al calcio, gli xGA e la forza difensiva della Juve

Il prossimo grafico illustra invece per le medesime squadre gli xGA concessi, a fronte dei gol effettivamente subiti.

Statistica applicata al calcio, gli expected goals againts (xGA) in Serie A al 15 marzo 2018
Statistica applicata al calcio, gli expected goals against (xGA) in Serie A al 15 marzo 2018

Gli xGA illustrano bene la qualità della difesa, cioè una difesa buona concede pochi tiri e anche poco pericolosi. 

I gol effettivamente subiti dipendono anche dalla precisione delle squadre incontrate (che nell’arco di una stagione, essendo state incontrate tutte, forti, medie e deboli, sono per così dire alla fine “la squadra media”) e dalla prestazione del portiere.

Anche in questo comparto si vede una performance molto buona della Juventus, che non solo ha concesso solo 20,66 xGA, che è un dato difensivo di eccellenza, ma ha poi anche subito solo 15 gol rispetto ai 20-21 attesi che comunque sarebbero già stati pochi.

Posizione Team GA xGA % DELTA
2 Napoli 19 15,60 22% -3,40
1 Juventus 15 20,66 -27% 5,66
6 AC Milan 30 26,36 14% -3,64
5 Inter 21 26,73 -21% 5,73
8 Atalanta 31 27,94 11% -3,06
13 Genoa 28 28,69 -2% 0,69
9 Fiorentina 32 29,87 7% -2,13
3 Roma 23 31,76 -28% 8,76
4 Lazio 36 32,00 13% -4,00
10 Torino 35 33,19 5% -1,81
12 Bologna 40 34,63 16% -5,37
11 Udinese 40 35,73 12% -4,27
15 Chievo 44 37,41 18% -6,59
18 Sassuolo 47 38,32 23% -8,68
14 Cagliari 43 41,59 3% -1,41
16 Crotone 48 42,86 12% -5,14
7 Sampdoria 38 46,66 -19% 8,66
17 SPAL 50 46,80 7% -3,20
19 Verona 51 50,76 0% -0,24
20 Benevento 61 56,45 8% -4,55

Per la Roma si notano 31,76 xGA concessi, che è un dato medio, non particolarmente buono, ma solo 23 gol subiti. Non a caso Alisson si è dimostrato uno dei migliori portieri (se non il migliore) del campionato.

Statistica applicata al calcio, Expected Goals Difference (xGD)

Il terzo grafico illustra la differenza reti (i gol fatti meno quelli subiti) comparata con la differenza degli xG (cioè la differenza tra le occasioni da gol prodotte, misurate in xG, meno le occasioni concesse, misurate in xGA). In sostanza rappresenta il primo e il secondo grafico uniti.

Statistica applicata al calcio, expected goal difference (xGD) in Serie A al 15 marzo 2018
Statistica applicata al calcio, expected goal difference (xGD) in Serie A al 15 marzo 2018

Alle luce di questo indicatore (xGD, expected goals difference) è ancora più evidente la performance straordinaria della Juventus.

Nei tre anni precedenti i bianconeri avevano fatto +20%, +16% e +10% come gol fatti rispetto agli xG prodotti e aveva incassato -19%, -14% e +9% di gol rispetto agli xGA concessi.

Complessivamente nel 2014-2015, 2015-2016, 2016-2017 la Juventus aveva avuto rispettivamente una differenza gol (GD) di 48 rispetto a 29,76 xGD, di 55 rispetto a 41,18 xGD e di 50 rispetto a 45,55 xGD.

Posizione Team GD xGD DELTA
1 Juventus 52 25,06 26,94
2 Napoli 43 38,83 4,17
3 Roma 24 19,19 4,81
4 Lazio 30 15,32 14,68
5 Inter 21 12,93 8,07
6 AC Milan 8 10,64 -2,64
7 Sampdoria 9 -4,95 13,95
8 Atalanta 7 12,40 -5,40
9 Fiorentina 4 7,89 -3,89
10 Torino 1 -0,09 1,09
11 Udinese -3 -4,43 1,43
12 Bologna -7 -6,00 -1,00
13 Genoa -7 -1,21 -5,79
14 Cagliari -18 -15,25 -2,75
15 Chievo -21 -12,38 -8,62
16 Crotone -21 -18,81 -2,19
17 SPAL -22 -19,93 -2,07
18 Sassuolo -31 -3,08 -27,92
19 Verona -26 -23,94 -2,06
20 Benevento -43 -32,19 -10,81

 

Nella fotografia scattata il 15 marzo, quindi prima del pareggio per 0-0 di sabato 17 contro la Spal, la Juve aveva una differenza reti positiva di 52 gol rispetto a 25,06 xGD attesi: una performance straordinaria mai avuta nella sua storia.

Statistica applicata al calcio, il concetto di Expected Points (xPTS)

Il quarto grafico illustra i punti effettivi di classifica comparati con gli xPTS (expected points).

Gli xPTS assegnano un punteggio da 0 a 3 a ogni squadra in ogni partita, punteggio basato su una serie di parametri (tra cui gli xG e gli xGA) poi convertiti nelle probabilità di vittoria, pareggio e sconfitta.

Statistica applicata al calcio, xPTS (expected points) in Serie A al 15 marzo 2018
Statistica applicata al calcio, xPTS (expected points) in Serie A al 15 marzo 2018

Quindi non si hanno negli xPTS o 3 punti o 1 punto o 0 punti di classifica come poi è nella realtà, ma ad esempio potrebbero essere 2,3 punti o 1,8 per chi vince e inoltre non 0 per chi perde ma magari 0,3 o 0,9 o addirittura talvolta anche un punteggio superiore a chi poi ha vinto, se da un punto di vista della prestazione la squadra che ha perso ha prodotto molto, ma poi non ha segnato e magari ha perso sull’unico tiro fatto dall’avversario.

E’ cioè una classifica basata sulle prestazioni della squadra e non sui risultati.

Posizione Team PTS xPTS DELTA
1 Juventus 74 56,34 17,66
2 Napoli 70 63,84 6,16
3 Roma 56 50,00 6,00
4 Lazio 53 47,71 5,29
5 Inter 52 43,96 8,04
6 AC Milan 47 44,78 2,22
7 Sampdoria 44 33,74 10,26
8 Atalanta 41 45,13 -4,13
9 Fiorentina 38 42,78 -4,78
10 Torino 36 37,32 -1,32
11 Udinese 33 32,71 0,29
12 Bologna 33 34,45 -1,45
13 Genoa 30 35,66 -5,66
14 Cagliari 26 28,12 -2,12
15 Chievo 25 28,25 -3,25
16 Crotone 24 25,78 -1,78
17 SPAL 24 25,80 -1,80
18 Sassuolo 24 36,39 -12,39
19 Verona 22 24,18 -2,18
20 Benevento 10 18,59 -8,59

 

Gli xPTS tendono, per come sono concepiti, a essere sempre inferiori ai punti effettivi (PTS) nelle squadre di testa, dato che queste vincono molto spesso, visto che sono in cima alla classifica, e quando vincono prendono sempre 3 punti nella realtà, e non 2,1 o 1,7 o 1,3.

Analogamente gli xPTS tendono a essere superiori ai punti reali nelle squadre in lotta per la salvezza, dato che quelle perdono molte partite per essere finite in quella posizione precaria, ma quando perdono fanno sempre e solo 0 punti nella realtà, non 0,3, 0,6, ecc.

I PTS rispetto agli xPTS dipendono poi anche dalle caratteristiche delle squadre e dal tipo di gioco, più marcatamente proattivo o reattivo.

In linea di massima e ceteris paribus squadre più proattive come Barcellona, Napoli o Man City avranno più vicinanza tra PTS e xPTS, mentre squadre più reattive come Atletico Madrid, Juventus o Manchester United più facilmente avranno PTS regolarmente abbastanza superiori agli xPTS.

Infine i punti reali dipendono dalle qualità dei singoli, essendo il calcio un gioco di squadra ma anche un gioco di singoli.

Gli xPTS tendono a illustrare quanto producono squadre di pari o simile rango indipendentemente dalla presenza di più o meno fuoriclasse nella rosa, i quali più tendono ad essere espressi proprio dal divario tra PTS e xPTS se quel divario è abbastanza marcato e costante nelle stagioni.

Gli xPTS sono utili a un allenatore, al pari di xG o xGA e di altri parametri più complessi, per valutare e poi migliorare la qualità complessiva del gioco di squadra, indipendentemente dalla presenza di singoli giocatori in grado di risolvere le partite da soli.

2 COMMENTI

LASCIA UNA RISPOSTA:

Please enter your comment!
Please enter your name here