La Data Analytics nel Calcio Italiano
Chi sono i Data Specialist? Perché tutti i club italiani dovrebbero dotarsene? Quanti ne hanno al momento i club di Serie A e Serie B e quanti ne avranno fra cinque anni?
Chi sono i “Data Specialist”
Tutti i Club di Serie A e Serie B, a mio avviso, dovrebbero impiegare team di Data Analysis, costituiti da tre figure: Data Analyst, Data Scientist e Data Engineer, che riassumo come Data Specialist.
L’ordine con cui proverò a definirli si basa su quanto questi tre ruoli si discostano da quelli attualmente presenti negli staff tecnici dei Club. Se, infatti, i Data Analyst hanno qualche similarità con i Match Analyst, i Coach Assistant o in qualche caso gli Scout, i Data Engineer invece sono molto più simili, per funzione e background, al personale che cura l’IT dei Club.
Quello che hanno in comune le tre figure, raggruppate nel macro-insieme Data Specialist, è l’esposizione ai dati tecnico-tattici dei giocatori, provenienti da diverse fonti, come i provider di dati-evento Wyscout, Opta e Statsbomb, piuttosto che i cosiddetti dati di tracking, quali quelli forniti da SkillCorner.
Per Data Specialist, invece, non intendo quelle figure che hanno esclusivamente a che fare con i dati atletici o biometrici dei giocatori, quali Sport Scientist e Performance Analyst.
Le differenze tra le competenze richieste e le attività svolte da questi cinque ruoli sono sintetizzate nello schema seguente.
Data Analyst
Per sua natura, la figura del Data Analyst è molto orizzontale e possiede competenze meno specializzate rispetto al Data Scientist e al Data Engineer. L’orizzontalità è, di fatto, una qualità chiave del Data Analyst, che si trova a fare spesso da “collante” tra lo staff tecnico e i Data Scientist, ove presenti. Anche le funzioni del Data Analyst sono eterogenee: lo troviamo ad analizzare i dati delle squadre avversarie in preparazione delle partite, così come a individuare calciatori da acquistare in base alle loro statistiche.
Funzioni principali: Presentare data insights allo staff tecnico, spesso tramite data visualisation; supportare il direttore sportivo e/o il responsabile dello scouting tramite filtri statistici applicati in ampi database.
Referente: Staff tecnico, Direttore Sportivo e Area Scouting.
Competenze richieste: Abilità comunicative, buone competenze tecnico-tattiche, utilizzo di tool di visualizzazione dati (es. Tableau) e preferibilmente (ma non strettamente necessaria) conoscenza di R e/o Python.
Background accademico: Laurea in Economia, Statistica, Ingegneria Gestionale, Corso di Match analysis.
Data Analyst vs Match Analyst
Nel calcio italiano, i task del Data Analyst sono usualmente ricoperti, sebbene in modo parziale, dai Match Analyst. Questi ultimi, non avendo un background quantitativo, spesso utilizzano l’analisi dei dati per confermare intuizioni ottenute attraverso l’analisi dei video. È un approccio, quello a posteriori, che a mio avviso limita molto il potenziale dell’analisi dei dati, che invece dovrebbe essere svolta a priori, in modo di permettere al Match Analyst di “vedere” situazioni che non riuscirebbe a cogliere attraverso i video.
Data Scientist
Il Data Scientist è in grado di elevare la capacità di un Club di analizzare le performance, tramite la creazione di modelli e algoritmi sviluppati anche sulla base delle esigenze dello staff tecnico. I Data Scientist prendono i dati nella loro versione più “grezza”, trasformandoli in insights attraverso linguaggi quali Python e R. Il Data Scientist consente al Club di passare dalla cosiddetta Descriptive Analytics alla Predictive Analytics.
Funzioni principali: Generare insights dai dati disponibili, anche tramite lo sviluppo di modelli e metriche ad hoc, su richiesta dello staff tecnico.
Referente: Staff tecnico.
Competenze richieste: Il must è saper programmare in Python, ma anche R è spesso utilizzato. Altro requisito fondamentale è rappresentato dalla conoscenza delle tecniche di Machine Learning (ML).
Background accademico: Laurea in Matematica, Fisica, Statistica, Data Science, Ingegneria Informatica.
Data Engineer
Quella del Data Engineer è una figura spesso sottovalutata nel calcio, nonostante la sua importanza stia crescendo in modo esponenziale, con l’aumento della numerosità delle fonti di dati e dell’allargamento dei database a cui Data Analyst e Data Scientist devono accedere. La principale attività del Data Engineer è quella di curare la cosiddetta pipeline dei dati: i Data Engineer integrano, consolidano, “puliscono” i dati e li strutturano per l'uso nelle applicazioni di analisi. Rendono i dati facilmente accessibili e ottimizzano l'ecosistema dei Big Data della propria organizzazione.
Funzioni principali: Controllare e integrare i flussi di dati, ottimizzando la gestione del/dei database.
Referente: Reparto IT e team di Data Science.
Competenze richieste: SQL, NoSQL, Python, Java, AWS, Google Cloud.
Background: Ingegneria Informatica, Ingegneria Matematica, Fisica, Data Science.
I Data Specialist nel calcio italiano
Premetto che, analogamente a tante altre posizioni che non sono di front-office nel calcio, non esiste una lista ufficiale dei Data Specialist che lavorano nei club italiani. Di conseguenza, le indicazioni riportate in questa sezione sono esclusivamente il risultato di una ricerca fatta su LinkedIn (qui il mio profilo), sui siti delle squadre, su Transfermkt e tramite il network personale. Mi ha supportato nell’attività di ricerca Alberto Riccardi, Data Scientist di Soccerment.
Per ragioni di privacy e confidentiality non farò i nomi dei Data Specialist presenti nei Club italiani, né dei Club che li impiegano. Cercherò comunque di offrire un po’ di granularità, indicando i numeri più precisi possibili, relativi a quattro gruppi di cinque squadre, prima di Serie A e poi Serie B, suddivise in base alla posizione di classifica a venerdì 17 febbraio 2023.
Guardando a Serie A e Serie B nel loro insieme, abbiamo trovato 27 Data Specialist, per una media di 0,675 per Club. Per le stesse 40 squadre, abbiamo trovato 64 Match Analyst, per un rapporto di 2.4 Match Analyst per ogni Data Specialist.
Molti Club non hanno, di fatto, ancora compreso che i dati a loro disposizione avrebbero un valore economico enorme, se venissero “sbloccati” attraverso strumenti di analisi evoluti, che ne moltiplicherebbero il valore.
A mio avviso, i Club che decidono di non fare analisi dei dati, ci perdono due volte: 1) direttamente, non cogliendo l’opportunità di creare informazione rilevante; 2) indirettamente, perché le squadre che lo fanno, guadagnano un vantaggio competitivo a loro discapito.
Avendo lavorato per 15 anni sui mercati finanziari come equity analyst, faccio spesso questo esempio: se alla prima persona che passa per strada vengono offerti tutti i dati di bilancio delle società quotate, così come i loro valori di borsa storici e i dati macroeconomici globali, è molto probabile che quella persona, comunque, non diventerà un/a trader infallibile, non avendo le competenze e gli strumenti per prendere decisioni in base ai dati che gli sono stati messi a disposizione. Allo stesso modo, se i club calcistici iniziano ad avere molti dati, ma non si dotano di strumenti e/o di know-how che consentono di costruire processi decisionali data-driven, il valore di quei dati verrà perso.
I Data Specialist in Serie A
In base alla nostra ricerca, i Data Specialist nella Serie A italiana nel febbraio 2023 sono 19, per una media di quasi 1 per Club. Negli ultimi dodici mesi ho notato notevoli passi in avanti, ma i numeri sono ancora molto lontani rispetto a dove dovrebbero essere. Infatti, se escludiamo un Club che nel suo organico ha ben 6 Data Specialist, la media scende a 0,68 per Club.
Un divario notevole tra le prime 5 e il resto della classifica
Andando un po’ più nel dettaglio, si nota come le attuali prime cinque squadre della classifica della Serie A impiegano circa il 68% dei Data Specialist del campionato. Come anticipato, un Club da solo impiega quasi un terzo dei Data Specialist in Serie A. Una considerazione, forse banale: non credo sia un caso che quattro delle cinque squadre siano di proprietà straniera: tre americane (per un totale di 10 Data Specialist) e una cinese.
I Data Specialist in Serie B
Nella Serie B italiana, al momento, ci sono 8 Data Specialist, per una media di 0,4 per club. Così come in Serie A, sul fronte Data Analytics anche in Serie B le proprietà americane la fanno da padrone. C’é in particolare un Club di Serie B che impiega ben tre Data Specialist: due Data Scientist e un Data Analyst.
Consigli per la costruzione di un team di Data Analytics
Cosa serve effettivamente a un Club per iniziare a fare Data Analytics? Dove cercare i talenti in Data Science? Che tipo di qualifiche e seniority devono avere? Quanto ampio deve essere un team di Data Analytics?
Risponderò a questi quesiti partendo da quella che è stata la mia esperienza personale, avendo costituito negli ultimi due anni quello che considero un ottimo team di Data Analytics a Soccerment, società che ho fondato e che amministro. Nel farlo, proverò a immedesimarmi nei panni di un Direttore Generale (o Direttore Tecnico), al quale viene dato budget per investire nel futuro del Club. Inoltre, proverò anche a stimare un budget verosimile da dedicare, in base agli obiettivi del Club.
Il punto di partenza: l’allineamento tra proprietà, dirigenza e staff tecnico
L’approccio alla Data Analytics non può essere imposto o forzato dall’alto, ovvero da proprietà e/o dirigenza, senza che gli staff tecnici comprendano i vantaggi competitivi che può generare. Tale situazione rischierebbe infatti di creare corto circuiti gestionali, che finirebbero per minare il rapporto tra le parti e generare malumori, con possibili ripercussioni sui risultati sportivi. E non può nemmeno essere spinto dal “basso”, dagli staff tecnici, che non riuscirebbero a ottenere le risorse richieste per una buona e completa gestione dei dati.
A mio avviso, l’unico modo per dare inizio al processo di adozione della Data Analytics, è partendo dalla condivisione degli obiettivi del Club sull’utilizzo dei dati, arrivando al pieno allineamento tra proprietà, dirigenza e staff tecnico. Un ottimo esempio di quanto questo approccio olistico sia riuscito a generare valore è il Liverpool di Klopp, di cui ho parlato in questa analisi. La situazione ideale è che l’utilizzo della Data Analytics sia una parte della filosofia del Club e questa venga adottata in modo pieno e consapevole dallo staff tecnico, in fase di accettazione dell’incarico.
La chiave: l’ownership della Data Intelligence
Il Club deve costruirsi e avere a disposizione lo storico dei dati dei propri principali asset: le prestazioni sportive dei propri calciatori. Per farlo, deve costituire uno “stack” tecnologico proprietario, che comprenda processi e strumenti offerti in gestione agli staff tecnici.
Ho sentito in molte, troppe occasioni, che a detenere e a gestire questi strumenti e quindi i sottostanti dati dei calciatori (generati dalle pettorine GPS, forniti dai provider di event-data o inseriti nei software gestionali), fossero persone degli staff tecnici. Il problema con questo approccio è che quando gli staff tecnici lasciano il Club, si portano con sé tutto il valore generato.
Il modo più semplice affinché il Club non abbia questo problema è quello di crearsi un team interno che gestisca la Data Intelligence, che riporti direttamente alla proprietà e sia a supporto dello staff tecnico.
Il team: come costruire un team di Data Analytics
Sono convinto che la costruzione di un team di Data Analytics debba andare pari passu con l’adozione dello stack tecnologico, con la complessità e completezza dei dati che si hanno a disposizione, oltre che - ovviamente - con gli obiettivi che ci si pone con l’analisi dei dati.
Ci sono tre macro obiettivi che un Club può porsi e - sulla base di questi - agire per inserire le figure professionali che permettano loro di raggiungere tali risultati:
Analisi descrittiva semplice, tramite modelli di terzi;
Analisi descrittiva innovativa, tramite modelli proprietari;
Ricerca, integrazione dati e analisi predittiva e prescrittiva.
Analisi descrittiva semplice
Se ciò a cui il Club ambisce è comprendere meglio le performance della squadra e valutare in modo più oggettivo i giocatori della propria rosa e altrui, allora la “semplice” Descriptive Analytics basterà allo scopo. Per fare analisi descrittiva semplice, utilizzando modelli di terzi, non serve un team troppo strutturato, né uno stack tecnologico complesso. Quello che serve è: a) uno o due fornitori di dati, tramite piattaforma o API; b) un Data Analyst e un Data Scientist; c) un account Tableau o simile; d) confronti costanti con una o due società di analytics che supportino con analisi e punti di vista diversi, privi dei bias che rischiano di avere gli analisti del Club.
Consiglio questo approccio alle società della seconda metà della classifica in Serie A, alle squadre di Serie B e a quelle di Lega Pro che puntano a salire. Il budget annuale per fare analisi descrittiva semplice è compreso tra i €150k e i €200k.
Analisi descrittiva innovativa
Lo sviluppo di modelli proprietari che meglio descrivono la performance, sono la base per arrivare a fare Predictive Analytics. Soprattutto nel calcio, dove il risultato è inficiato in modo notevole dal caso, è infatti fondamentale avere modelli di “metriche avanzate”, in grado di trasformare la realtà da binaria a probabilistica.
Inoltre, la Data Science consente di costruire modelli che vanno a rispondere in modo specifico alle interrogazioni tecnico-tattiche che può avere lo staff dell’allenatore, piuttosto che l’area scouting.
Se si hanno questi obiettivi, allora l’analisi descrittiva semplice non basta, ma si deve iniziare a fare vera e propria Data Intelligence. Per farlo, serve comporre un team abbastanza strutturato, in grado di gestire l’integrazione dei dati da diverse fonti e la costruzione di modelli di Machine Learning. Consiglierei a questi team di continuare a confrontarsi con soggetti esterni, i.e. società di data analytics, per la costruzione di questi modelli, per evitare di rimanere confinati nelle proprie idee iniziali.
Nell’immagine sotto riassumo i requisiti, che penso possano fare al caso dei Club della prima metà della classifica di Serie A. Il budget annuale per fare analisi descrittiva innovativa è compreso tra i €350k e i €450k, circa il 20-30% dell’ingaggio annuale lordo medio di un giocatore, per le squadre in quella fascia.
Analisi predittiva
I Club europei che puntano a vincere la Champions League, o che l’hanno vinta di recente, fanno già analisi predittiva da diversi anni e hanno team di Data Intelligence strutturati e sempre più numerosi. Grazie a queste risorse, sono in grado di costruire modelli predittivi per lo scouting e per la preparazione delle partite, su misura per quella che è la filosofia di gioco adottata dal Club stesso. Qualsiasi Club che punti a competere a livello internazionale, non può quindi non investire in modo deciso sulla Data Science. La mia previsione è che nel giro di pochi anni, i Club arriveranno a contendersi i migliori Data Scientist sulla piazza in modo analogo a come oggi si contendono i migliori calciatori.
Il budget annuale per impiegare un buon team analisti in grado di fare analisi predittiva è compreso tra €500k e €1 milione. Non poco, ma comunque una frazione rispetto all’ingaggio annuale dei primi 20 giocatori dei Club che puntano a vincere la Champions. Ad esempio, se prendiamo gli ingaggi dei giocatori del Real Madrid, vediamo che il budget richiesto rappresenterebbe tra il 5 e il 10% dell’ingaggio medio di un giocatore (il 10% del ventesimo nella lista!). Insomma, peanuts. E sono convinto che, nel lungo termine, un team strutturato di Data Science possa portare enormemente più valore ai Club, rispetto a giocatori che magari non arrivano a fare 500 minuti sul terreno di gioco, tra campionato e coppe.
L’evoluzione del team di Football Data Science di Soccerment
Qui di seguito, a titolo di esempio, descriverò come ho costruito il team attualmente in forza a Soccerment. Fin dall’inizio, il mio obiettivo è stato quello di fare Predictive Analytics da offrire alle squadre, sotto forma di piattaforme consultabili e servizi consulenziali. Per arrivare a farla, pensavo - e penso tuttora - che si dovesse provare ad avere la miglior Descriptive Analytics possibile con i dati a disposizione, grazie allo sviluppo di modelli proprietari innovativi.
Avendo un budget iniziale molto limitato (prossimo allo zero), non potevo che approcciare il raggiungimento dell’obiettivo finale in modo graduale.
A Soccerment abbiamo iniziato dai Data Analyst, tra i quali includo anche me. L’abitudine all’analisi dei dati finanziari mi ha permesso di approcciarmi ai dati di performance tecnici senza troppi ostacoli. Inizialmente, infatti, lavoravamo solo con i dati aggregati (il feed F30 di Opta, per chi lo conosce) e con una struttura abbastanza semplice. Un back-end software developer faceva il ruolo del Data Engineer.
Quando siamo passati a dati più elaborati (feed F24 di Opta, che prevede per ogni evento palla, le coordinate sul campo e diverse variabili descrittive), abbiamo assunto due Data Scientist: un PhD in Astrofisica, con seniority medio-alta e un Ingegnere Matematico, più junior. Quest’ultimo ha man mano assunto la funzione di Data Engineer.
Ampliando poi la quantità dei campionati sotto copertura del feed F24 (da cinque a ben diciassette) potevamo creare più Data Intelligence e - per farlo - abbiamo aggiunto un Data Scientist, il già menzionato Alberto Riccardi, PhD in Fisica Quantistica. Inoltre, l’espansione e la maggiore complessità del database e della data pipeline, ci ha portati ad assumere un Data Engineer di seniority medio-alta.
Ricapitolando, in questo momento il team di Soccerment é quindi formato da:
1 Data Analyst (laureando in Economia e Commercio)
2 Data Scientist (entrambi PhDs in Fisica)
2 Data Engineer (un ingegnere matematico e un ingegnere informatico)
Grazie alla maggior granularità dei dati, ma soprattutto grazie alle abilità dei Data Scientist e ai loro modelli in machine learning, in sinergia con il lavoro fatto dai Data Engineer, stiamo passando dal fare esclusivamente analisi descrittive e farle predittive: stiamo quindi entrando nel mondo della Predictive Analytics.
Dove e come trovare i talenti
Chi opera nel calcio, soprattutto i Club professionistici, ha una grande fortuna: riesce ad attrarre molti talenti, a qualsiasi livello e per qualsiasi mansione: dal cuoco al magazziniere, dal Match Analyst allo Sport Scientist.
Ci sono tre modi con cui i Club possono esplorare talenti nel campo della Data Analysis:
Aprendo sul proprio sito una sezione “Career” in cui i talenti possono uploadare il proprio CV e lettera motivazionale, iniziando a fare colloqui ai profili più interessanti. Sono convinto che ogni Club di Serie A e Serie B verrebbe inondato di curricula di ottima qualità.
Facendo scouting su Twitter. Sono ormai diversi i casi, per lo meno nel calcio internazionale, in cui profili molto attivi su Twitter nell’analisi dei dati hanno trovato lavoro in un Club di alto livello, soprattutto in Inghilterra e Germania. Un esempio è il ragazzo italiano che deteneva l’account “Calcio Datato”, che ora lavora per il City Football Group.
Corsi di Football Data Intelligence. Ci sono due corsi su tutti che consiglio ai Club. Quello di Wylab e - ovviamente - quello organizzato da SICS in collaborazione con Soccerment. Se il primo non lo conosco bene (ma son sicuro che sia di alto livello), conosco molto bene quello che teniamo noi con SICS e devo dire che il livello dei corsisti è molto elevato. Per avere un’idea, qui sotto inserisco la registrazione dell’evento di presentazione delle cinque migliori tesine della seconda edizione del Corso. La terza edizione inizierà il prossimo 27 febbraio (qui per maggiori informazioni).
Quanti Data Specialist ci saranno nel calcio italiano fra 5 anni?
Se le mie indicazioni si riveleranno corrette e supponendo che in Italia, nel giro di cinque anni, ci saranno 5 Club di Serie A attivi nell’analisi predittiva, 10 Club di Serie A attivi in analisi descrittiva avanzata e 40 Club tra Serie A, Serie B e Lega Pro impegnati in analisi descrittiva semplice, significa che si passerà dagli attuali 27 a più di 150 Data Specialist.
Il capitale umano e il bagaglio culturale che queste figure porteranno nel mondo calcistico sarà trasformativo, migliorando la gestione dei Club stessi e la sostenibilità dei loro modelli di business.