La sconfitta dei datatonti

Potrebbe esservi sfuggito, ma Donald Trump sarà il prossimo presidente degli Stati Uniti. L’uomo che aveva contro tutti i principali media, l’establishment di Hollywood, gran parte del suo stesso partito, e che soprattutto fino al giorno delle elezioni non aveva un sondaggio a favore che fosse uno. Da cui la pronta reazione del giorno dopo di quelli che “gli spiriti animali hanno avuto la meglio sulla fredda logica.”

L’altrimenti affidabile Nate Silver di FiveThirtyEight, quello per intendersi che aveva azzeccato 50 Stati su 50 nelle ultime due presidenziali, era partito mesi fa dando il 95% (avete letto bene) di probabilità a una presidenza Clinton.

Il New York Times, il Washington Post, la CNN, tutti gli istituti demoscopici si sono svegliati la mattina del 9 novembre con Trump eletto e si sono accorti di avere sbagliato. Come è potuto succedere?

È potuto succedere perché, sotto sotto, sono dei datatonti.

Il datatonto è quella persona, preferibilmente con un elevato grado di istruzione, che si lascia affascinare da ciò che è superficialmente matematico senza il rigore metodologico che distingue la scienza dalla pseudoscienza. In questo insieme ricadono la stragrande maggioranza dei giornalisti (anche datajournalist), la totalità degli economisti e, ovviamente, l’intera classe politica. Tutta gente che di mestiere cerca il pelo nell’uovo ma ti puoi mettere in saccoccia citando lo studio del Royal Institute for Quantitative Social Sciences di Bristol secondo il quale il 73.6% delle statistiche sono inventate.

Ecco, non c’è nessun Institute for Quantitative Social Sciences, e questa era solo una vecchia battuta.

Non è la prima volta che i sondaggi sbagliano, anche di molto. Come mai questa volta tutti sono così sconvolti? Tre motivi:

  1. la metafora definitiva dei sondaggi elettorali è “ti è piaciuto, cara?” “ma certo tesoro”
  2. parlare di dati pur non capendone una cippa fa fico e non impegna, i dati sono il nuovo nero
  3. gli USA arrivano ora nell’era post-fattuale, ma noi sappiamo dai tempi di B che i sondaggi servono a orientare, non a comprendere, la pubblica opinione, non a tastarle il polso.

Il primo motivo non è una novità. Sappiamo da sempre che esiste un mare fra ciò che le persone dicono di fare e ciò che fanno davvero. È per questo motivo, ad esempio, che nessun progetto software o studio di usabilità che si rispetti può basarsi esclusivamente sulle interviste con gli utenti. Storia vecchia.

la metafora definitiva dei sondaggi elettorali è “ti è piaciuto, cara?” “ma certo tesoro”

Il secondo motivo fa più parte dello Zeitgeist: oggi se non sei data-driven non sei nessuno. E però i dati non sono per tutti. Lavorare con i dati vuol dire anche accettare il fatto che i dati possono essere inutili. Vi ricordate il data-driven in otto passi? Vi ricordate quando dicevamo che il primo passo è capire quali dati vogliamo usare, e il secondo è decidere se i dati servono o meno? Ecco. Fare sondaggi tipicamente prescinde sia dal primo passo che dal secondo: intervisti le persone e ti tieni buono quel che ti dicono perché è tutto quel che hai, e pace se è notorio che le persone tendono a darti le risposte che vuoi sentire e si guardano bene dal dire la verità.

Capiamoci. Alcune volte i sondaggi possono essere attendibili. Solo che non sappiamo quali volte. Anzi, sappiamo che più la questione è spinosa, più le persone mentiranno.

La débacle dei sondaggi alle presidenziali americane è quello che si ottiene quando si insiste a voler usare i dati a prescindere. Punti tutto su Hillary e quei maledetti elettori ti votano Trump. I raccontatori di storie (ah lo storytelling) sono già al lavoro per spiegare perché, pur avendo sbagliato tutto, dovremmo starli comunque ancora a sentire. C’è chi sostiene che bastava guardare i dati di Facebook o Twitter per capire che avrebbe vinto Trump. Naturalmente lo sostengono oggi, non il giorno prima del voto. Ma si sa, le previsioni vengono meglio quando conosci il risultato. Addirittura ci sono gli apocalittici che parlano di “sconfitta” dei Big Data, degli algoritmi e della tecnologia.

Parliamoci chiaro: non c’è nessuna sconfitta della tecnologia quando scegli di interrogare dati che non sono in grado di rispondere alle tue domande. C’è solo un datatonto in più che aspetta di cascare dal pero.

Quando si tratta di dati, “meglio di niente” non è una strategia, è una scusa; perché se sei perso nel Sahara una mappa dei Grigioni è pur sempre una mappa, ma non ti aiuta.

Facebook Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here