Archivi annuali: 2020

Giornalisti che si inventano numeri

[0,01%] Venerdì scorso Giorgio Dendi ha postato su Facebook un ritaglio della Stampa, mostrato qui a fianco. Come leggete, da mille campioni di sangue si sarebbe scoperto che “solo lo 0,01% è deceduto per Covid”. Giorgio nota che 0,01% è l’equivalente di 1 su 10000, e quindi sarebbe morta un decimo di persona. Sabato mattina con Alberto Saracco e Pietro Di Martino discutevamo di ciò, ed eravamo d’accordo che il catenaccio era scritto da cane, e probabilmente voleva significare che in totale la mortalità della malattia, calcolata a partire del campione, è dello 0,01%. Però io sono wikipediano dentro, e così sono andato a cercare le fonti.

Una guglata con le parole «kobe city general hospital coronavirus» (che sono anche inglesi) mi ha riportato nei primi 25 risultati 23 articoli in italiano e due in inglese: uno di un giornale nipponico e il preprint dell’articolo, che ovviamente ho letto. Già questo, se ci pensate, è parecchio strano. Poi ho letto l’articolo: come immaginavo, dello 0,01% non c’è traccia. Quello che c’è scritto è che in quell’ospedale di Kobe sono stati effettuati 1000 test sierologici tra persone che erano arrivate lì per altre patologie, e hanno scoperto che il 3,3% era positivo al virus. Hanno estrapolato i dati, e ricavato che in tutta Kobe ci dovrebbero essere tra i 40000 e i 50000 infetti, a seconda se si fa un aggiustamento per coorti d’età e sesso oppure si considera il puro rapporto numerico. Punto.

Da dove arriva quella percentuale, allora? La mia ipotesi è semplice. Una qualche agenzia di notizie italiana ha preso la notizia, e ha deciso che poteva essere interessante ma non era abbastanza succosa. Così il giornalista si è messo a fare i conti. Spannometricamente, il Giappone ha 120 milioni di abitanti: il 3,3% di infetti fa quindi 4 milioni circa. I morti giapponesi a oggi sono circa 600; il raporto tra morti e infettati è circa dello 0,015% che possiamo approssimare con una sola cifra decimale a 0,01%. Visto che tutto torna? No, ovviamente non torna nulla. Il problema non è il conto spannometrico che va anche bene, quanto il fatto che non abbiamo nessuna garanzia che il numero di morti sia quello reale, come ben sappiamo anche in Italia. Pertanto tutti quei conti non servono assolutamente a nulla all’atto pratico. Per giunta, l’italica stampa – come capita fin troppo spesso – recupera i lanci d’agenzia senza nessun controllo e pubblica allegramente. Tanto chi volete che vada a controllare? E dire che non ci volevano molti neuroni per accorgercene. In Italia siamo 60 milioni: se per ipotesi avesso contratto tutti il CoViD-19, lo 0,01% di morti sarebbero 6000 persone. Le statistiche ufficiali parlano di 30000 morti…

P.S.: Per fare i controlli ci ho messo un quarto d’ora (mi è servito molto più tempo per scrivere il post). Non ci voleva poi molto, insomma. E allora perché non farlo a priori? Gli amici di cui ho fatto il nome sopra sono tutti matematici, due sono anche professori universitari, e quindi usmano che c’è qualcosa che non va anche senza controllare. Pensate però a tutti gli altri

Quizzino della domenica: testimoni oculari

Nella città di Colorlandia ci sono due compagnie di taxi: la Verde e la Blu, chiamate così per il colore della fascia sulle auto. L’85% dei taxi è della compagnia Verde e il restante 15% della Blu. Una notte c’è stato un incidente stradale: un taxi ha ucciso una persona. Fortunatamente c’era un testimone oculare, che ha riconosciuto il taxi come della compagnia Blu. Durante il processo, si è stabilito che il testimone è abbastanza affidabile: in condizioni simili riconosce correttamente il colore della fascia nell’80% dei casi. A quale compagnia appartiene con maggiore probabilità il taxi coinvolto nell’incidente?
taxi

(un aiutino lo trovate sul mio sito, alla pagina http://xmau.com/quizzini/p446.html; la risposta verrà postata lì il prossimo mercoledì. Problema tratto da Mind Your Decisions/a>; immagine da FreeSVG.org.)

Cromorama (libro)

Il colore è qualcosa che noi diamo per assodato. Ma non è sempre stato così, e soprattutto ci porta una quantità di suggestioni di cui noi ci accorgiamo nemmeno. Riccardo Falcinelli in questo bel libro (Riccardo Falcinelli, Cromorama : Come il colore ha cambiato il nostro sguardo, Einaudi 2017, pag. 470, € 24, ISBN 9788806235932) parte dal mostrare come una matita verde ci sembra funzionare peggio di una gialla. Continua spiegando che fino al Medioevo il mantello della Madonna era nero (per il lutto…) ed è diventato azzurro perché sono giunti in Europa i lapislazzuli che costavano carissimi. Ci dice che nel Medioevo provare a fare il verde mischiando giallo e blu era considerato un tradimento. Mostra come i colori dell’arcobaleno definiti da Newton non siano quelli reali e tanto meno i complementari sono quelli da lui indicati, e che il modo stesso con cui noi vediamo i colori oggi è figlio dell’industrializzazione delle tinte, per cui il rosso “Coca-cola” ha cambiato l’idea del rosso rispetto al vermiglione dei tempi di Newton. Sottolinea il problema per cui in Giappone si cerca per quanto possibile di rendere più blu la luce verde dei semafori. Ma ci sono anche tante, tante altre cose. Leggetelo, scoprirete tantissime cose!

saper leggere le statistiche

Qualche giorno fa ISTAT, in collaborazione con l’Istituto Superiore di Sanità ha pubblicato un dossier sul numero di morti nel primo trimestre 2020 relativo a una gran parte dei comuni italiani (87% in numero e 86% come popolazione). Anche se non completi, sono assolutamente significativi: non si deve nemmeno più parlare di campione, con questi numeri. Che si è scoperto? Che in media a marzo in Italia c’è stato il 49% di morti in più rispetto alla media dei cinque anni precedenti, e che in certe province l’aumento è stato terribile: Bergamo (568%), Cremona (391%), Lodi (371%), Brescia (291%), Piacenza (264%), Parma (208%), Lecco (174%), Pavia (133%), Mantova (122%), Pesaro
e Urbino (120%). In compenso nella provincia di Roma c’è stato il 9% di morti in meno rispetto alla media degli anni precedenti. Cosa possiamo dedurre da tutto questo? Parecchio, anche se alcune di queste cose si potevano immaginare lo stesso, se si sa un po’ di matematica.

La prima cosa da far presente è smontare una volta per tutte la bufala che girava a inizio aprile, dicendo che nel primo trimestre era morta meno gente dell’anno precedente, e di cui aveva parlato anche il Post. La prima volta che l’ho vista sono andato sul sito italiaora.org usato per prendere i dati da comparare, e il fatto stesso che fossero dati che cambiano in tempo reale mi ha fatto immaginare che quelle erano semplici proiezioni, non tarate sul picco dei morti perché i dati non c’erano ancora. Ma del resto com’è possibile che a nessuno venga in mente che usare due fonti diverse per i dati 2019 e 2020 può portare a qualche problema?

Ma credo che sia altrettanto importante, se non persino di più, dare un’occhiata a come si fanno le statistiche. Per prima cosa, ISTAT non ha confrontato il 2020 con il 2019, ma con la media dei cinque anni precedenti. Perché? Semplice. Ci sono sempre fluttuazioni da un anno all’altro, dovute a eventi eccezionali – quest’anno CoViD-19, nel 2003 l’ondata di caldo – oppure eventi ricorrenti che non avvengono sempre allo stesso modo; per esempio, l’influenza “normale” quest’anno è meno virulenta e quindi stava facendo meno morti. Prendere un certo numero di anni precedenti e fare la media permette di smussare i picchi e avere una base di partenza più oggettiva. La seconda cosa è il buon vecchio pollo di Trilussa: un dato medio da solo dice molto poco, perché non sappiamo la distribuzione dei dati parziali che porta a quella media. Personalmente non parlerei nemmeno del +49% su base nazionale, perché non significa nulla. Scendendo a livello di provincia, le deviazioni dalla norma cominciano a diventare interessanti, soprattutto quando sono grandi. Il -9% di Roma conta poco; ma non conta molto nemmeno il +13% di Bari, indipentemente dal fatto che il numero ufficiale di morti per Covid in marzo è il 3% del totale. Superare il 100% rispetto alla media degli anni precedenti, invece, fa subito pensare a una causa esterna e che il numero ufficiale di morti a causa Covid è con ogni probabilità sottostimato. Infine, c’è una discreta correlazione tra zone dell’Italia e cambio del numero di morti, il che avrebbe dovuto far pensare a un rilassamento del lockdown in tempi separati, con noi lombardi che per esempio restiamo ancora bloccati e le regioni del Sud che cominciano a ripartire. Perché non lo si fa? Posso immaginare di chi sia la colpa, ma non lo posso dire :-) Quello che si può dire è però che se si sa leggere una statistica si imparano molte cose….

Ultimo aggiornamento: 2020-05-08 15:26

Statistiche del sito per aprile 2020

Non so nemmeno se abbia senso presentare le statistiche per aprile. È successo infatti che a Pasquetta un sito di quizzini ne abbia proposto uno che avevo pubblicato due anni fa, anche se con il testo un po’ diverso (ma tanto nemmeno il mio era originale). Questo sito deve essere abbastanza noto, così mi è arrivata una caterva di accessi da Google, sia alla sezione del sito con i quizzini che al blog, e qualcuno è anche andato avanti a leggere qualche altro quizzino. Per dare un’idea, in un mese tipico ho dai 20000 ai 30000 visitatori diversi, dalle 45000 alle 60000 visite, 100000 pagine accedute e dai 250000 ai 300000 accessi. Ad aprile i numeri sono stati: 98166 visitatori diversi per 125906 visite, le pagine accedute sono state 341641 e gli accessi 1.074.541. Il 14 aprile ho avuto 39381 visite, venti volte tanto quelle di un giorno normale.
Anche la top 5 è falsata; il problema incriminato (il 309) ha avuto 81008 visualizzazioni e la risposta relativa 68080, con un’esondazione che ha portato il problema 310 a 20739 visualizzazioni, il 311 a 4947 e così via. Come vedete, alcuni sono anche arrivati sul blog:

  1. Quizzino della domenica: tutti al fiume: 4362 visite
  2. Eupnoico: 1595 visite
  3. Tenere a distanza le persone: 493 visite
  4. I bonifici di Venerdì Santo: 445 visite
  5. Centro Operativo Postale: 306 visite

Il romanaccio ha 1198 accessi, gli accordi musicali 898, e la pagina dei miei libri 1004.

Non preoccupatevi, comunque. Guardando i dati a ieri, maggio ritornerà ai valori standard, se non addirittura più bassi del solito.

Sono andato in ufficio

Stamattina sono andato in ufficio. In realtà ci sono stato sì e no un quarto d’ora, il tempo necessario per recuperare il mio pc di lavoro che contiene una certa quantità di dati che mi servono e che dovevo sempre cercare qua e là, il token per l’accesso sicuro ai sistemi aziendali di esercizio – a cui in genere non accedo, ma non si sa mai – e un po’ di roba varia, oltre che buttare via tutto il cibo che tenevo come schiscette e che ovviamente è scaduto. Nel tragitto sono persino riuscito a passare all’Esselunga di Porta Nuova – vuota – a recuperare la tazza di Harry Potter che mi aspettava da qualche mese e che ora continuerà ad aspettare per qualche mese in ufficio. Naturalmente avevo il permesso del mio capo, di HR, di Real Estate e di Security (arrivati tutti al volo).

In ufficio ho solo trovato il collega in reception – che deve stare aperta – e una delle signore delle pulizie – che si devono comunque fare. In compenso ho trovato auto in doppia fila mentre pedalavo, e soprattutto verso la fine avevo il fiatone. Sarà dura il vero rientro, mi sa!

Ultimo aggiornamento: 2020-05-07 16:26

Grandi offerte esclusive aziendali

La mia azienda mi permette di accedere a “convenienti offerte aziendali”. Visto che vorrei comprarmi un nuovo pc, ho provato a dare un’occhiata. C’era un PC Lenovo (ideapad L340 15, per i curiosi) con prezzo di listino 1099 euro e “prezzo esclusivo” € 989,10; mi si diceva di affrettarmi, perché ne erano rimasti solo due (in pronta consegna, probabilmente perché già assemblati).

Sul sito Lenovo, lo stesso PC (sempre con due esemplari rimasti…), acquistato con il coupon MAY5 indicato nella pagina stessa, costava € 967,12. Forse c’è qualcosa che non funziona nelle “offerte esclusive”.