COVID-19: capire le lacune nei dati
I dati disponibili sulla pandemia provocata dal coronavirus sono raccolti in modo disomogeneo e sono sicuramente incompleti. Bisogna quindi trattarli con attenzione, consapevoli di ciò che riescono o meno a rilevare. Un approfondimento del nostro data team EDJNet
Uno dei problemi della pandemia COVID-19 è legato alla rapidità con cui si diffonde il contagio, che rende arduo non solo curare tutte le persone colpite, ma anche semplicemente disporre di un quadro aggiornato, completo e affidabile della situazione in Italia e nel resto del mondo.
Le informazioni su cui possiamo contare sono approssimative e spesso forniscono delle cifre per difetto, ad esempio sul numero dei contagiati e dei morti provocati dalla pandemia. È importante essere consapevoli di questi limiti e guardare con cautela ai dati in circolazione, che rimangono comunque i migliori che abbiamo date le circostanze attuali. Tra i dati ufficiali che forniscono un quadro della situazione a livello globale, quelli aggregati dal Centro europeo per la prevenzione e il controllo delle malattie (EDCD) vengono considerati tra i più affidabili. Ogni giorno però escono studi sempre più accurati, che forniscono elementi aggiuntivi per la comprensione della pandemia e delle sue tendenze di sviluppo.
Quante sono davvero le persone contagiate?
Non lo sappiamo. Quelli che conosciamo sono i numeri dei casi di contagio confermati – cioè gli individui che sono risultati positivi al test per la malattia – e stime molto approssimative dei casi di contagio complessivi.
Il test che rileva il contagio (il cosiddetto “tampone”) consiste in un prelievo di saliva o muco, che viene poi analizzato per rilevare tracce del codice genetico del virus. Il numero di persone sottoposte al test varia però molto a seconda dei paesi , in base innanzitutto alla capacità di effettuare test su larga scala (a mancare di solito non sono i kit per i prelievi, ma il personale e i laboratori per analizzare enormi quantità di tamponi). In alcuni paesi le autorità decidono di concentrare i tamponi su persone che mostrano già dei sintomi compatibili con COVID-19, o addirittura solo sulle persone che presentano sintomi gravi e vengono ricoverate. Sappiamo però che molti individui che hanno contratto il virus non mostrano sintomi, o iniziano a mostrarli numerosi giorni dopo l’avvenuto contagio.
La percentuale di individui contagiati che viene rilevata varia verosimilmente molto da paese a paese, rendendo difficile confrontare l’andamento della pandemia tra contesti diversi. Ad esempio, l’Italia finora ha fatto circa 3500 tamponi per ogni milione di abitanti, contro i 6100 effettuati in Corea del Sud o i 600 in Spagna. Secondo una stima tentata dal Centre for the Mathematical Modelling of Infectious Diseases della London School of Hygiene & Tropical Medicine, l’Italia e la Spagna potrebbero avere rilevato solo il 5% circa degli individui effettivamente contagiati.
Quanti sono davvero i decessi?
Non sappiamo nemmeno questo, anche se possiamo stimare i decessi con più precisione rispetto ai casi di contagio.
Quello che conosciamo è il numero delle morti la cui causa è stata attribuita a COVID-19 (i criteri per l’attribuzione non sono però ancora del tutto uniformi a livello internazionale). Non siamo però sicuri di tutti i decessi provocati dal coronavirus siano stati davvero rilevati: numerose segnalazioni dalle zone d’Italia più colpite suggeriscono ad esempio che non vengano fatti i tamponi a tutte le vittime della pandemia (ad esempio, sfuggono molti di coloro che muoiono nella propria abitazione o in case di riposo). D’altra parte, regimi autoritari come la Cina o l’Iran potrebbero avere un interesse a comunicare solo dati parziali, che ridimensionino la portata del problema all’interno dei loro confini – quindi le morti provocate dalla pandemia potrebbero essere più di quelle che risultano dai conteggi ufficiali.
Quanto è letale COVID-19?
Nemmeno qui abbiamo ancora delle certezze. La pericolosità di una malattia si può misurare col suo tasso di letalità – cioè la quota di persone che muoiono rispetto al numero di individui contagiati – o col suo tasso di mortalità, che misura invece la quota di persone che muoiono rispetto al totale della popolazione. Un tasso di letalità del 4% indica che, per ogni 100 persone contagiate la malattia provoca in media 4 decessi.
Le stime in circolazione sul tasso di letalità di COVID-19 variano molto – troppo – a seconda dei contesti. Da un lato, questa variazione può essere effettivamente legata a delle specificità locali: ad esempio, è probabile che la malattia colpisca in modo più grave le regioni o Paesi dove la popolazione è in media più vecchia o più soggetta a problemi respiratori, come nella Pianura Padana. Dall’altro lato, la variazione può essere solo apparente e legata al modo in cui si rilevano i dati. Il tasso di letalità mette infatti in relazione due numeri, quello dei decessi e quello dei contagiati – ma, come abbiamo visto, questi numeri sono spesso rilevati in maniere diverse e talvolta con enormi lacune.
In ogni caso, il tasso di letalità della sindrome provocata dal coronavirus è di un ordine di grandezza superiore rispetto a quello di malattie virali più ordinarie, come l’influenza stagionale. Quest’ultima tipicamente provoca la morte di meno dello 0,1% delle persone colpite, diluite su molti mesi, mentre si stima che COVID-19 stia provocando la morte di una percentuale di persone almeno venti o trenta volte superiore, concentrate peraltro in poche settimane.
Due tecniche utili per confrontare i dati
Al netto di tutte le lacune e disomogeneità nella raccolta dei dati, i confronti tra le regioni e i paesi colpiti dal coronavirus sono complicati dal fatto che il contagio non è iniziato ovunque nello stesso momento. Confrontare la situazione di oggi nella regione cinese dello Hubei – dove il contagio è in corso da mesi – con quella di paesi dove è arrivato da poco non sarebbe di grande aiuto: per confrontare tra loro contesti diversi è più utile prendere come punto di partenza di ciascuno il rispettivo giorno in cui sono stati confermati i primi casi, e confrontare l’andamento a partire da quel momento . Ad esempio, quindici giorni dopo l’inizio del contagio l’Italia contava circa 800 vittime ufficiali, mentre la Spagna ne contava quasi 2000.
Un altro modo per confrontare l’andamento del contagio tra paesi che rilevano i dati in modi diversi è confrontare il tasso di crescita del contagio in ciascun paese – ad esempio misurando il numero di giorni impiegato per raddoppiare il numero dei decessi rilevati . In Germania questo numero sta raddoppiando ogni 2 giorni, in Italia ogni 5 – mentre in Corea del Sud stanno ormai passando 13 giorni tra un raddoppiamento dei decessi e l’altro, dunque lì il contagio ha rallentato notevolmente.
Edjnet
Stimolare le redazioni a seguire gli affari europei e offrire al pubblico strumenti per capire meglio l’Europa attraverso il data journalism è l’obiettivo di un ampio consorzio di media europei – guidato da OBC Transeuropa e VoxEurop – riuniti nella rete "EDJNet – European Data Journalism Network".