Una stima della prevalenza di Covid-19

A cura di Alessandro Amadori, Sandra Bruno e Massimo Cesaretti Milano, 6 maggio 2020

INTRODUZIONE L’epidemiologia può essere considerata come la disciplina d’elezione a supporto della sanità pubblica. Potrebbe essere definita come qualsiasi studio degli eventi sanitari nelle popolazioni, per rispondere a domande come ad esempio:

  • quante persone sono affette da una determinata patologia?
  • quanto è rilevante la patologia in questione?
  • il rischio per questa patologia è in aumento o in diminuzione?
  • in che modo essa potrebbe essere prevenuta?


Due dei concetti di base dell’epidemiologia sono la prevalenza e l’incidenza. La prevalenza prende in considerazione, per una determinata patologia, i casi esistenti, mentre l’incidenza si riferisce ai casi nuovi. Per esempio, se in una popolazione di 100.000 persone, si rileva che 5.000 di esse sono colpite da una certa malattia, abbiamo una prevalenza del 5 per cento (5.000/100.000 x 100). In alternativa, anziché esprimere la prevalenza come una percentuale, possiamo anche descriverla come il numero di persone colpite in una popolazione di dimensioni standard, per esempio di 1.000 persone. Nel nostro esempio avremmo una prevalenza, per la patologia in questione, di 50 individui su 1.000.

In definitiva, misurare la prevalenza è come descrivere una foto di gruppo: quante persone ci sono nella foto? Il numero di persone totali è la nostra popolazione. Nella foto, quante persone hanno per esempio lo stesso colore di capelli (ovvero condividono una determinata caratteristica)? La risposta a questa domanda ci dà, nella metafora, la prevalenza. Infine, più precisamente esistono tre diversi tipi di prevalenza:

 

  • prevalenza puntuale: il numero di casi di un evento sanitario in un certo momento. ad esempio, quanti rispondono di essere fumatori abituali, in un’indagine appunto sull’abitudine al fumo;
  • prevalenza periodale: il numero di casi di un evento sanitario in relazione a uno specifico intervallo temporale (solitamente, un anno). Nel nostro esempio, l’indagine potrebbe riguardare l’abitudine al fumo negli ultimi 12 mesi;
  • prevalenza nel corso della vita: ovvero, il numero di individui rientranti nella casistica dell’evento sanitario, relativamente all’intero periodo di vita degli intervistati (sempre nel nostro esempio, la domanda riguarderebbe l’aver mai fumato nel corso della vita).


Dal punto di vista metodologico, la prevalenza si misura studiando un opportuno campione della popolazione di interesse. Con una metodologia clinica (su quel campione vengono effettuate delle diagnosi cliniche ad opera di personale sanitario, mediante apposite visite), di laboratorio (al campione si somministra un test, come si farà nell’indagine di sieroprevalenza – cioè di individuazione degli anticorpi nel sangue – che sta per partire su Covid-19, a cura dell’Istituto Superiore di Sanità e di Istat) o infine di rilevazione di una dichiarazione soggettiva (come nel caso delle indagini sul fumo o su altri comportamenti a rischio, in cui le persone vengono intervistate con un opportuno questionario, che serve appunto per registrare le loro dichiarazioni soggettive).

Il nostro piccolo studio, effettuato con la società Yoodata (specializzata appunto in raccolta e analisi di dati statistici, sociali, di mercato o di opinione; per maggiori informazioni si rimanda al sito: www.yoodata.it) si riferisce alla stima della prevalenza puntale (ossia a fine aprile 2019), col metodo dell’intervista a un campione rappresentativo di popolazione. Più precisamente, siamo partiti da una prima stima effettuata da ISPI (Istituto per gli Studi di Politica Internazionale) sulla base dei dati ufficiali sul contagio comunicati dalla Protezione Civile (che, come è noto, non tengono conto dei positivi asintomatici). La stima intervallare di ISPI (a cura di Matteo Villa, postata sul sito di Ispi il 10 aprile 2020) ipotizzava un valore di prevalenza compreso fra l’1,5 e il 5 per cento, come si vede nel grafico sottostante.

as

Partendo da questa ipotesi di ISPI, abbiamo raccolto dei dati di prevalenza puntale dichiarata, con la ricerca qui riassunta.

METODOLOGIA

E’ stato estratto e intervistato un campione rappresentativo nazionale di 1.200 casi (responsabili degli acquisti familiari, nella fascia di età 25-64 anni). Agli intervistati è stata posta una domanda sulla presenza o meno, nella loro famiglia, dall’inizio dell’epidemia alla data di intervista, di casi di Covid-19.

Il risultato è che di questi 1.200 casi totali, 54 soggetti hanno risposto affermativamente alla domanda se appunto nella loro famiglia ci fossero stati casi di malattia da Coronavirus. La prevalenza puntuale dichiarata, a fina aprile 2020, su 1.200 casi, è dunque del 4,5%. Esattamente all’interno dell’intervallo di confidenza che aveva ipotizzato ISPI.

L’universo diretto di riferimento (fonte: Audipress) è formato da 17.348.000 individui. La distribuzione per area e per dimensione di centro, delle risposte alla nostra domanda, mostra in termini di numeri indice le seguenti accentuazioni (area 1 = Nord Ovest, area 2 = Nord Est, area 3 = Centro più Sardegna, area 4 = Sud più Sicilia).

 

as2

 

Come si può vedere, abbiamo registrato delle accentuazioni significative, rispetto alla distribuzione effettiva della popolazione, nei piccoli centri (<10.000 abitanti) delle aree 1 e 2 (Nord Ovest e Nord Est), nei centri medio-piccoli (10-30.000 abitanti) dell’area 1 (Nord Ovest) e nei centri medio-grandi (30-100.000 abitanti) e grandi (>100.000 abitanti) dell’area 3 (Centro più Sardegna). Marginale appare invece, nelle dichiarazioni soggettive, la diffusione del Coronavirus tra gli intervistati del Sud e della Sicilia (area 4).

Nel grafico sottostante si riporta la distribuzione delle risposte per macro-area geografica, confrontata con la medesima distribuzione dei casi accertati (fonte: ministero della Salute). Le due distribuzioni non necessariamente devono coincidere, poiché quella dei casi rilevati si riferisce appunto ai casi che sono stati ufficialmente diagnosticati e contabilizzati, non ai casi potenzialmente presenti nella popolazione (ipotizzati dalle barre verticali azzurre del nostro studio in base alle dichiarazioni del campione).

Dal confronto fra le due distribuzioni si ricava l’ipotesi che in area 1 e in area 4 ci siano più casi accertati, in proporzione al loro totale, di quanti siano i casi a noi dichiarati in rapporto al loro totale; mentre nelle aree 2 e 3 ci sarebbero meno casi rilevati (accertati), rispetto al totale dei casi rilevati, e più casi a noi dichiarati (sempre rispetto al loro totale). In altre parole, avremmo nei casi ufficiali una potenziale “sovrastima” del peso delle aree 1 e 4 e una potenziale sottostima del peso delle aree 2 e 3. Ma si tratta, lo ribadiamo, solo di un’ipotesi tutta da verificare.

 

as3

 

Se proiettiamo la prevalenza dichiarata tra i rispondenti (quelli che ritengono di aver avuto contagi in famiglia) sull’universo, ovvero il 4,5% del campione rispetto all’universo di oltre 17 milioni di individui, otteniamo un valore assoluto di 780.660 potenziali contagiati, cioè quasi 4 volte il numero ufficiale del Ministero della Salute (che erano 197.675, al 26 aprile, data di effettuazione del nostro sondaggio).

Tuttavia la domanda è stata posta chiedendo se in famiglia c’erano stati casi di contagio, quindi l’universo non è quello dei rispondenti, bensì il numero totale delle persone conviventi nel nucleo familiare. Ora se attribuiamo il valore medio di 2,35 membri per famiglia, l’universo degli individui cresce di conseguenza a oltre 40,7 milioni di persone. Se proiettiamo la prevalenza dei rispondenti che hanno riportato contagi in famiglia su questo nuovo universo, otteniamo un valore assoluto di oltre 1,8 milioni di contagiati.

 
CONCLUSIONI

La nostra ricerca conferma e precisa l’ipotesi formulata da ISPI, secondo cui la prevalenza reale di Covid-19 si collocherebbe da l’1,5% e il 5% della popolazione adulta italiana. Più in dettaglio, la nostra stima, a seconda di quale si consideri essere l’universo su cui proiettare il dato campionario, viene a essere di una cifra compresa fra 800.000 e 1.800.000 individui adulti, con una forte concentrazione nel Nord Italia (due terzi circa del totale).

LASCIA UN COMMENTO

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Sottoponi a Yoodata le tue esigenze di ricerca, ti risponderemo al più presto

Contattaci

o scrivi a info@yoodata.it