Come i dati sulla pandemia sono stati usati (e abusati) per raccontare storie opposte

Dati veri, storie false

Nel corso della pandemia di COVID-19, uno degli aspetti più paradossali è stato osservare come gli stessi dati ufficiali — provenienza identica, fonti istituzionali condivise — fossero usati per supportare narrative radicalmente opposte. Da un lato, chi li utilizzava per sostenere la gravità della situazione e la necessità di misure restrittive. Dall’altro, chi li invocava per dimostrare che la pandemia era “esagerata” o persino “costruita”.

Questo fenomeno non è peculiare del COVID-19, ma la pandemia ne ha offerto un esempio straordinariamente documentato. E studiarlo può insegnarci molto su come i dati vengano selezionati, inquadrati e interpretati per supportare conclusioni predeterminate.

I trucchi più comuni

Cherry-picking temporale. Scegliere un intervallo di tempo favorevole alla propria tesi è forse il trucco più diffuso. “Nei mesi di luglio e agosto 2020 in Italia sono morte meno persone del solito”: vero. “La pandemia non è pericolosa”: falso. La prima affermazione descrive un dato reale, la seconda è una conclusione che ignora tutto il contesto (l’estate 2020 arrivò dopo un’ondata devastante e prima di una ancora più letale in autunno).

Confusione tra morti “per” e morti “con” COVID-19. Uno dei punti più dibattuti fu la distinzione tra chi moriva di COVID-19 e chi moriva con il COVID-19 (positivo al tampone ma con altra causa principale di morte). La distinzione è reale e metodologicamente rilevante. Ma fu spesso usata strumentalmente per sostenere che la vera mortalità da COVID fosse trascurabile — ignorando che l’eccesso di mortalità (calcolato confrontando le morti totali con le attese storiche) confermava in modo indipendente la gravità della pandemia.

Abuso dei valori assoluti vs. relativi. “Il rischio di morire di COVID se hai meno di 30 anni è bassissimo”: vero in termini assoluti. “Quindi il COVID non è pericoloso per i giovani e non occorrono misure”: falso, perché ignora il rischio di trasmissione agli anziani, le complicanze a lungo termine (long COVID), e la funzione delle misure collettive nel proteggere la popolazione nel suo insieme.

Il problema dell’incertezza

Un elemento strutturale che ha reso particolarmente difficile la comunicazione durante la pandemia è l’incertezza intrinseca dei dati epidemiologici in tempo reale. I dati epidemiologici vengono raccolti, elaborati e pubblicati con ritardi e approssimazioni inevitabili in una situazione di emergenza. I modelli previsionali dipendono da assunzioni che possono risultare errate. Le stime di mortalità variano a seconda del metodo usato.

Questa incertezza è normale e onesta nella scienza. Ma chi voleva costruire narrative di minimizzazione l’ha usata come argomento: “gli scienziati non sono d’accordo, quindi non possiamo fidarci di nessun dato”. Un salto logico non giustificato: l’incertezza su certi parametri non equivale all’incertezza sull’esistenza del problema.

Come difendersi

Alcune domande che ogni lettore dovrebbe imparare a porsi davanti a un dato presentato come prova di qualcosa:

Su quale periodo temporale? I dati cambiano radicalmente a seconda dell’intervallo considerato.
Confrontato con cosa? Un numero privo di confronto dice poco. Il confronto storico (eccesso di mortalità) è spesso più robusto di qualunque altro indicatore.
La fonte è la stessa? Spesso narrativi opposti citano dati da fonti diverse con metodologie diverse.
Chi ha prodotto questa analisi e con quali interessi? Non necessariamente per attribuire malafede, ma per capire le assunzioni implicite.
Cosa dicono i ricercatori indipendenti che non hanno preso posizione pubblica?

La data literacy — la capacità di leggere criticamente i dati — non è un lusso per statistici. È una competenza di cittadinanza democratica nell’era dell’informazione.