Open Data e numeri dello sport

L’atleta olimpico combatte sul filo dei centesimi di secondo, ma anche lo sportivo della domenica  cerca di migliorare il proprio tempo o controlla la distanza percorsa: lo sport è  tutta una questione di numeri e misure. Oltre a punteggi, classifiche e risultati ci sono le informazioni su prestazioni e condizioni dell’atleta che possono essere raccolte durante la pratica sportiva con i dispositivi indossabili, dalla smart band di largo consumo ai dispositivi più sofisticati.

Lo sport professionale investe sempre più sull’analisi statistica dei dati e per i colossi come SAS Analytics o SAP quello dello sport è un proficuo settore di investimento. Le federazioni, specie le potenti “League” negli Stati Uniti, finanziano l’industria e la ricerca per trovare risposte vincenti in vari settori: performance di gioco e performance dell’atleta, conoscere e migliorare le relazioni con i fan, selezione degli atleti, prevenzione degli infortuni.

Statistiche e classifiche sono alla base delle scommesse sportive. Si tratta di un mercato enorme: secondo L’Agenzia giornalistica sul mercato del gioco, AGIMEC, il mercato delle scommesse a livello mondiale, comprese le scommesse illegali, vale tra i 1.000 e i 3.000 miliardi di dollari l’anno.

Il solo Gruppo Sisal, che aveva registrato un fatturato record nel 2014 con 821 milioni di euro di ricavi,  al 31 marzo 2016 ha registrato un volume d’affari di 4 miliardi di euro in crescita del 5% rispetto ai primi tre mesi del 2015.

Big Data e la legge del gol

La sabermetrica di Billy Beane si basava su statistiche tradizionali anche se le metriche selezionate erano inconsuete, ma con l’aumentare dei dati ed il progredire delle tecniche di analisi si possono applicare algoritmi di big data anlytics allo sport con risultati sorprendenti.  Luca Pappalardo e Paolo Cintia, due  ricercatori italiani del KDD Lab di Pisa, hanno preso in esame 600mila passaggi per 148 partite di 4 campionati diversi. Dall’applicazione di analisi di rete ai passaggi hanno ricavato un indice di performance H, scoprendo una forte corrispondenza tra l’indice H e le classifiche di campionato.

Per saperne di più e scoprire che cos’è la dura legge del goal e il “Max Pezzali score” si può leggere un divertente articolo nel blog Big Data Tales, o ascoltare la registrazione dell’intervento di Pappalardo e Cintia all’internet festival di Pisa 2015.

Quanto sono aperti i dati dello sport

Trovare in rete i dati dello sport può essere frustrante. A parte qualche raro caso di federazioni o associazioni che rendono disponibili i propri database, i dati non sono accessibili se non pagando, e quando ci sono non sono accompagnati da licenze per il riutilizzo.

Neanche i risultati o il calendario delle ultime Olimpiadi di Rio sono liberamente disponibili. I dati, gestiti dal Comitato Internazionale Olimpico, ci sono e sono espressi secondo uno standard, l’Olympic Data Feed. Sono ottimamente documentati  e aggiornati ma solo per un insieme di utenti finali, tra cui i grandi operatori delle news. Peggio delle Olimpiadi di Londra 2012, quando la BBC ed altri media, come The Guardian, avevano raccolto e reso disponibili porzioni di dati.

I migliori siti di statistiche sullo sport sono legati alle scommesse sportive. Si tratta di servizi, come quelli offerti ad esempio da Sportstas o Soccerway, indispensabili per gli scommettitori che devono avere a disposizione risultati e classifiche di tutte le serie e le stagioni. I dati sono disponibili per il download o via API, dietro pagamento.

C’è tuttavia una bella iniziativa italiana che si propone di distribuire Open Data di argomento sportivo: Sports Open Data è un’associazione che pubblica dati su Serie A e Premier League con licenza creative commons. Con i dati di Sports Open Data è stato realizzato il Bot Telegram Euro 2016 per consultare i dati degli Europei di calcio.

Open data contro il doping

Nel 2015 Il Sunday Times e l’agenzia tedesca ARD/WDR hanno dato accesso ad un database contenene 12,359 analisi del sangue prelevate da  5.000 atleti dal 2001 al 2012.

Si tratta di un leak proveniente da un funzionario interno alla IAAF che intendeva denunciare l’inefficacia dei controlli. Un prelievo su sette presenta risultati anomali che suggeriscono alta probabilità di doping. 10 delle medaglie di Londra 2012 risultano sospette, così come l’80% delle prestazioni degli atleti russi alle Olimpiadi e mondiali.

L’Open Data è una forte arma contro tutti gli illeciti e potrebbe esserlo anche contro il doping: se gli atleti “puliti” accettassero di rendere noti i dati sulla propria salute e sui propri test si ridurrebbero le possibilità  di alterare le prestazioni. Rendere noti dati, tempi, modalità e autori dei controlli darebbe forte trasparenza anche sull’operato, quanto meno spesso inefficace, degli organismi deputati. Il Coni ad esempio mette a disposizione sul proprio sito alcune statistiche in pdf sull’antidoping. Dati che potrebbero però essere rilasciati, nel rispetto della privacy degli interessati, in modo open per dare la possibilità a chiunque di leggere e soprattutto rielaborare.

Facebook Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here