Tag Archives: statistiche

Covid: ancora probabilità malcalcolate

Il mio amico Gabriele mi ha segnalato questo video con una conferenza stampa del presidente dell’Istat Gian Carlo Blangiardi. Nella conferenza, spiega (giustamente) che il valore del 2,5% di sieropositivi ha il vantaggio di essere stato calcolato su un campione statisticamente ben fatto, e aggiunge (sempre giustamente) che c’è una variabilità molto grande tra luogo e luogo. Ma poi termina con “un conto alla buona” (parole sue), dicendo

Se uno in una giornata incontra 20 persone […] ha il 50% circa di probabilità di avere incontrato almeno una persona che sia positiva.

È davvero così? Proviamo a fare i conti.

Continue reading Covid: ancora probabilità malcalcolate

Quando le proporzioni non bastano

Sulla Stampa di oggi, un articolo di Paolo Russo racconta il flop di Immuni. Non entro nel merito delle considerazioni dell’articolo, ma mi interessa far notare un errore matematico che viene spesso commesso da chi non è abituato a trattare le relazioni tra gli oggetti. Come potete leggere nel ritaglio qui sopra, Russo scrive

«Da quando è stata lanciata su tutto il territorio nazionale, il 15 giugno scorso, in Italia si sono contati circa 10 mila contagi, di questi scovati grazie a Immuni appena 47. Fatte le debite proporzioni, calcolando che ad averla installata sul proprio smartphone è il 7,7% della popolazione complessiva, almeno 7-800 casi si sarebbero dovuti attribuire alla app, invece qui siamo allo zero virgola qualcosa.»

Tralasciando le considerazioni varie sul fatto che scaricare l’app non significa installarla e renderla funzionante (senza Bluetooth attivo non funziona…) e dando per scontato il suo corretto funzionamento, c’è ancora qualcosa che non torna. Ve ne siete accorti?

Continue reading Quando le proporzioni non bastano

Perché non faccio grafici sulla pandemia

grafico autoesplicativo (da https://bit.ly/3awwT0k )
Mi è stato chiesto da più parti come mai io non abbia fatto un’analisi matematica del contagio: l’unico mio post al riguardo è stato un mese e mezzo fa, dove mi sono limitato a dire di fare attenzione ai picchi, oltre ad avere scritto insieme ad Alberto Saracco una spiegazione su come funziona una crescita esponenziale. La ragione di questo mio silenzio è molto semplice, e si può riassumere in tre parole: “non avrebbe senso”. Quello che può però avere senso è spiegare meglio la mia reticenza.

Continue reading Perché non faccio grafici sulla pandemia

Covid-19: attenti ai picchi!

L’altro ieri, dopo che sembrava che il numero di casi di infezione Covid-19 si stesse stabilizzando, il loro numero è immediatamente schizzato verso l’alto di un fattore 9, come si legge da questo tweet. Dobbiamo preoccuparci? Moriremo tutti presto? (prima o poi moriremo tutti, ma questa è un’altra storia) Sta davvero scoppiando la pandemia? La risposta è un po’ più complicata di quello che potrebbe apparire limitandoci a guardare questo grafico.
Continue reading Covid-19: attenti ai picchi!

Partner e statistica

C’è un tipo di sondaggio che fa capire abbastanza facilmente perché i sondaggi non potranno mai funzionare: quello che misura il numero di partner sessuali di maschi e femmine. Il risultato finale è schiacciante: i maschi affermano di avere avuto molti più partner delle femmine, tipicamente il doppio. Ne parla anche questo articolo di Pagina99, dove Stefano Casertano spiega (bene) perché questo risultato è matematicamente implausibile. Visto che mi è stato chiesto di parlarne, provo ad aggiungere qualcosa, concentrandomi non tanto sui risultati quanto sul procedimento, per vedere se è possibile accorgersi che c’è qualcosa che non va senza dover fare chissà quali conti.

Continue reading Partner e statistica

Più errori del previsto (negli USA)

mehta-polls-11Non parlo del referendum qui da noi perché si sta ancora votando. Però credo valga la pena di vedere ancora una serie di statistiche sulle elezioni USA, anzi sui sondaggi prima delle elezioni USA, prese dal solito FiveThirtyEight e preparate da Dhrumil Mehta. Come potete vedere cliccando sulla figura qui a destra, che mostra tutti i sondaggi delle tre settimane prima del voto, l’errore sulla media nazionale è stato di due punti percentuali, quindi meno della forchetta di tre punti che è tipica dei sondaggi. Ma passando ai singoli stati le cose sono molto diverse, con errori medi che arrivano anche a dieci punti percentuali. Interessante, vero?

In realtà le cose non sono mai così chiare come sembrano. Per prima cosa, il 3% di errore (3,16% per i pignoli) non è un numero magico ma quello massimo che si ottiene nel 95% dei casi quando si ha un campione statisticamente corretto di 1000 persone e una popolazione sufficientemente grande, dell’ordine dei milioni, per poter assumere una distribuzione degli errori sotto forma di gaussiana. Se cominciamo a fare la media delle percentuali ottenute, il campione aumenta e quindi la forchetta si riduce: per esempio con cinque sondaggi e quindi 5000 intervistati si dovrebbe scendere all’1,41% e con dieci sondaggi all’1%. Inoltre i sondaggi sono stati fatti in date diverse, e mischiandoli così non si può vedere l’eventuale trend mentre ci si avvicina al voto. Ma anche tenendo conto di questo, possiamo dire con una certa sicurezza che la stragrande maggioranza dei sondaggi non era stata fatta su un campione rappresentativo. E questo non è affatto bello (per i sondaggisti in particolare, ma anche per le tecniche statistiche in generale).