10 anni dalla pubblicazione di 'The Numbers Game'
Review delle 10 previsioni fatte nel libro 'The Numbers Game' 10 anni fa. Spoiler: molte si sono rivelate corrette.
10 previsioni a 10 anni: la mia review
Sono passati già dieci anni da quando Chris Anderson e David Sally hanno scritto e pubblicato il libro ‘The Numbers Game’. Dei tanti libri di football analytics che ho letto - sostanzialmente tutti - è quello che mi ha entusiasmato di più. Forse perché ‘The Numbers Game’ è stato uno dei primi libri sulla football analytics, uno dei primi che ho letto e perché quelli venuti dopo hanno spesso ripetuto alcuni concetti sviscerati da Anderson e Sally. O forse perché il mix di considerazioni tecnico-tattiche e finanziario-manageriali ha risuonato in modo particolare con il mio background da analista finanziario, alla ricerca di chiavi di lettura nel mondo dei dati del calcio. Fatto sta che questo libro l’ho letteralmente divorato.
All’inizio di questa settimana, Chris Anderson era presente all’Opta Forum, organizzato a Londra da StatsPerform, dove ho avuto l’opportunità di partecipare.
Durante il Forum, Chris Anderson ha coordinato un panel intitolato “Reflecting on 10 years of The Numbers Game”. Prima di cominciare il confronto con i panelist, l’autore di ‘The Numbers Game’ ha elencato le dieci previsioni che erano state formulate nella parte conclusiva del libro.
Elenco qui sotto quelle riportate nel panel e un mio personale commento sul se e di quanto le previsioni sono risultate “azzeccate”.
N. 1 - Le principali scoperte in football analytics non avverranno al Manchester United, Manchester City, Real Madrid, Barcelona, o in alcuno dei 20 club più ricchi secondo la Football Money League di Deloitte.
Vero. La football analytics è stata principalmente utilizzata dai club con minor budget (come a titolo di esempio Brentford, Brighton, AZ Alkmaar, etc.) per essere competitivi nei loro campionati, disponendo di un budget molto inferiore.
Durante l’Opta Forum ho avuto modo di chiedere ad alcuni club quanti fossero i ‘Data Specialist’ nel loro team. Sono venuto a sapere che il team di Data Specialist dell’AZ Alkmaar, squadra olandese che ha di recente eliminato la Lazio in Europa Conference League, dispone di nove Data Specialist. Sì, sono proprio in 9. Per un confronto, in Serie A al momento ce sono 19 in tutto (ne ho parlato qui).
La domanda che mi sono posto è questa: è meglio investire in nove analisti o in un calciatore? Ovviamente dipende dalla qualità degli analisti, così come da quella del calciatore. Qui di seguito, però, qualche considerazione: a) 9 Data Specialists costano molto meno di un buon giocatore di Serie A; b) I Data Specialist producono know-how e quindi valore che si accumula nel tempo (un po’ come con l’interesse composto); c) i Data Specialist non sono soggetti a infortuni o cali di rendimento, al contrario il loro rendimento continua ad aumentare nel tempo.
Ma quanto costano 9 Data Specialist rispetto a un giocatore? In media, un giocatore di Serie A ha un ingaggio lordo di €1,8 milioni (i club di Serie A spendono circa €1 miliardo per 567 giocatori - dati Capology).
Con questa cifra (€1,8 milioni) a mio avviso i club potrebbero arrivare ad ingaggiare più di 30 Data Specialist di discreta seniority.
Di certo, la strategia “Moneyball” all’AZ Alkmaar (di cui è azionista Billy Beane) sta funzionando. Il loro monte ingaggi è del 72% inferiore alla media delle big 3 olandesi (Ajax, PSV e Feyenoord) e - ciononostante - sono in grado di competere ai vertici dell’Eredivisie ormai in modo stabile da diversi anni. Grazie a un rigoroso sistema di player development nelle squadre giovanili, completamente basato sui dati (ne parlai in questo post sul blog di Soccerment), l’AZ Alkmaar è in grado di ottimizzare i rendimenti sul terreno di gioco, rispetto al suo monte ingaggi: per ogni punto conquistato in Eredivisie, nelle ultime sei stagioni ha speso €108k di ingaggi lordi, rispetto a €337k dell’Ajax, €234k del PSV e €192k del Feyenoord. Come si vede dal grafico, il costo per punto è peraltro rimasto costante nel costo degli ultimi 6 anni, mentre il costo per punto degli ingaggi di Ajax e PSV è aumentato in modo significativo.
N. 2 - Il mondo della football analytics non avrà una figura simbolo come è stato Bill James per il baseball
Vero. Come descritto nelle considerazioni sulla previsione stessa, all’interno del testo originale, il calcio è troppo fluido perché possano esistere delle formule vincenti messe a punto da una singola persona, come invece è successo nel baseball con Bill James.
Bill James, pioniere della ‘sabermetrics’, ha sviluppato diverse metriche che hanno rivoluzionato il modo di pensare e fare baseball. Tra queste, c’é ad esempio la formula delle ‘Runs Created’ (RC) o quella della ‘Aspettativa Pitagorica’.
Bill James fu il teorico che rese possibile la Moneyball, portata sui diamanti da Billy Beane con gli Oakland Athletics.
Il calcio non ha mai trovato un Bill James, né credo lo troverà mai.
Gli avanzamenti in football analytics dipendono dalla sua community. C'è molta collaborazione e contaminazione tra le metriche e i modelli. Basta guardare i riferimenti indicati nei research papers (qualcuno interessante presentato anche all’Opta Forum), oppure basta fare un salto su Twitter per vedere quanto la community è attiva nel dare feedback o fare endorsements, quando meritati.
In sostanza, la football analytics è un lavoro di squadra!
N. 3 - Il volume di dati calcistici aumenterà di almeno 32 volte.
Non ho idea se, in effetti, il volume dei dati di performance sia aumentato di 32 volte esatte (dubito), ma il messaggio principale relativo a un aumento significativo della mole di dati è stato senza dubbio azzeccato. A mio avviso, continuerà peraltro ad aumentare in modo esponenziale nei prossimi anni, grazie al mix di:
aumento della capacità computazionale;
aumento della capacità di automatizzare i processi di raccolta dati;
aumento dell’interesse dei club e degli investimenti rivolti allo sviluppo di strategie volte alla creazione di vantaggio competitivo tramite i dati;
aumento del capitale umano a supporto della sports analytics.
N. 4 - La geometria - spazio, vettori, triangoli e reticoli dinamici - sarà il focus di molti avanzamenti in football analytics.
Parzialmente vero. I dati di tracking stanno portando a sviluppare nuove metriche legate al concetto di spazio-tempo, come modelli di pitch control o altri. Tale sviluppo, peraltro, non riguarda solo i dati di tracking, ma spingono anche a ingegnarsi per trovare metriche innovative con i dati evento (ad esempio, noi a Soccerment abbiamo sviluppato una metrica di contro-pressing e una metrica per analizzare le triangolazioni utilizzando i feed F24 di Opta).
Ho scritto “parzialmente vero” perché credo che gli autori del libro si sarebbero aspettati di vedere, su questo fronte, molti più avanzamenti e molto prima.
Qui di seguito, una bella lezione sul pitch control tenuta da William Spearman, Head of Data Science del Liverpool FC, basata su una presentazione fatta all’Opta Forum del 2016.
N. 5 - In Premier League verranno segnati circa 1000 gol, sia nel 2014 che nel 2024
Questa la previsione più semplice delle dieci, a mio avviso. In media vengono fatti circa 25 tiri per partita, uno ogni 3 minuti e 30 secondi. Moltiplicando per il numero di partite totali (25 x 380) si ottengono poco meno di 10.000 tiri.
In media, un terzo dei tiri totali finisce nello specchio (3.333) e, sempre in media, un terzo dei tiri nello specchio diventa gol (1.000). In sostanza, il tasso di conversione medio dei tiri totali è dell’11% (33% x 33%).
Era così anche 10 anni fa, per cui la previsione era molto semplice, ma appunto era proprio rivolta a far capire il potere dei “grandi numeri” nel fare predizioni.
Qui di seguito un grafico con il numero di gol segnati in Premier League dal 2013/14 al 2021/22. Come si vede, il numero fluttua sempre intorno a quota 1.000.
N. 6 - Il gap tra il costo dei cartellini e degli ingaggi degli attaccanti e dei difensori e portieri diminuirà in modo significativo.
Parzialmente vero. Il gap è diminuito, ma rimane significativo. Ad esempio, nel 2021/2022, in Serie A gli attaccanti guadagnavano circa il 30% in più dei centrocampisti, che guadagnavano circa il 10% in più dei difensori, che a loro volta guadagnavano circa il 10% in più dei portieri.
N. 7 - Il 4-4-2 sarà rimpiazzato dal 150-4-4-2, ovvero l’organizzazione aziendale dei Club sarà la nuova “tattica”.
Falso, purtroppo. In buona parte del settore calcistico europeo, alcune figure sono purtroppo ancora viste di solo contorno, quasi un “di più”. Ci sono, a mio avviso, molte funzioni all’interno dei club calcistici che non sono adeguatamente staffate.
Sono sempre più sicuro che, ad esempio, una delle figure più sottovalutate sia quella del Data Engineer. Ne ho parlato in questa analisi:
N. 8 - La figura dell’allenatore-manager alla Alex Ferguson smetterà di esistere. Quando Arsène Wenger si ritirerà, tutti i club più importanti avranno la figura del Direttore Generale e Direttore Sportivo.
Vero. Non esistono più gli allenatori alla Alex Ferguson e Arsene Wenger. Anche in Premier League, negli ultimi anni si è assistito alle nomine dei primi Sporting Director per molti Club.
N. 9 - Se un club non utilizzerà la football analytics, non sarà automaticamente precluso dal successo sportivo, la data analytics aiuta a vincere, ma lo stesso lo fa il denaro.
Vero. Il successo può essere comprato, sportivamente parlando, attraverso l’acquisto dei grandi calciatori e dei grandi allenatori. Ci sono poi alcuni colossi calcistici, come Il Liverpool e il Manchester City, che fanno entrambe le cose: investono molto sia in football analytics che su calciatori e coach.
Ho scritto di come il Fenway Sports Group, già proprietario dei Boston Red Sox (dove impiegarono Bill James come advisor), ha moltiplicato il valore del Liverpool attraverso la data analytics, in questa analisi:
N. 10 - La riforma della football analytics verrà contrastata
Vero. Anzi, verissimo. Fino all’arrivo della pandemia, nel 2020, l’adozione dell’utilizzo dei dati nel calcio è stato infatti molto lento.
A partire dai lockdown l’adozione della data analytics ha poi accelerato: molti operatori - soprattutto gli scout - hanno dovuto rivedere i loro metodi di lavoro e - non potendo andare a visionare direttamente in giocatori - si sono rivolti alle piattaforme di analytics.
C’é ancora molto da fare e credo che il progresso fatto negli ultimi tre anni non sia nulla rispetto a quello che vedremo nei prossimi tre.
Uno dei trend più rilevanti sarà legato all’adozione della analisi dati supportata da tecnologie di intelligenza artificiale.
Ci saranno molti club che si schiereranno contro l'utilizzo dell’A.I. preferendo i metodi tradizionali? Certamente.
A mio avviso, però, i Club che non si struttureranno per sfruttare il potenziale dell’avanzamento delle tecniche di intelligenza artificiale, ovvero chi continuerà a lavorare in modo “tradizionale”, sarà assimilabile a chi va a cavallo, mentre i competitor sfrecceranno in Ferrari. Ne ho parlato in questo post su LinkedIn.
Ciao Aldo, c'è una versione italiana del libro? N.B. bellissimo articolo!