saper leggere le statistiche

Qualche giorno fa ISTAT, in collaborazione con l’Istituto Superiore di Sanità ha pubblicato un dossier sul numero di morti nel primo trimestre 2020 relativo a una gran parte dei comuni italiani (87% in numero e 86% come popolazione). Anche se non completi, sono assolutamente significativi: non si deve nemmeno più parlare di campione, con questi numeri. Che si è scoperto? Che in media a marzo in Italia c’è stato il 49% di morti in più rispetto alla media dei cinque anni precedenti, e che in certe province l’aumento è stato terribile: Bergamo (568%), Cremona (391%), Lodi (371%), Brescia (291%), Piacenza (264%), Parma (208%), Lecco (174%), Pavia (133%), Mantova (122%), Pesaro
e Urbino (120%). In compenso nella provincia di Roma c’è stato il 9% di morti in meno rispetto alla media degli anni precedenti. Cosa possiamo dedurre da tutto questo? Parecchio, anche se alcune di queste cose si potevano immaginare lo stesso, se si sa un po’ di matematica.

La prima cosa da far presente è smontare una volta per tutte la bufala che girava a inizio aprile, dicendo che nel primo trimestre era morta meno gente dell’anno precedente, e di cui aveva parlato anche il Post. La prima volta che l’ho vista sono andato sul sito italiaora.org usato per prendere i dati da comparare, e il fatto stesso che fossero dati che cambiano in tempo reale mi ha fatto immaginare che quelle erano semplici proiezioni, non tarate sul picco dei morti perché i dati non c’erano ancora. Ma del resto com’è possibile che a nessuno venga in mente che usare due fonti diverse per i dati 2019 e 2020 può portare a qualche problema?

Ma credo che sia altrettanto importante, se non persino di più, dare un’occhiata a come si fanno le statistiche. Per prima cosa, ISTAT non ha confrontato il 2020 con il 2019, ma con la media dei cinque anni precedenti. Perché? Semplice. Ci sono sempre fluttuazioni da un anno all’altro, dovute a eventi eccezionali – quest’anno CoViD-19, nel 2003 l’ondata di caldo – oppure eventi ricorrenti che non avvengono sempre allo stesso modo; per esempio, l’influenza “normale” quest’anno è meno virulenta e quindi stava facendo meno morti. Prendere un certo numero di anni precedenti e fare la media permette di smussare i picchi e avere una base di partenza più oggettiva. La seconda cosa è il buon vecchio pollo di Trilussa: un dato medio da solo dice molto poco, perché non sappiamo la distribuzione dei dati parziali che porta a quella media. Personalmente non parlerei nemmeno del +49% su base nazionale, perché non significa nulla. Scendendo a livello di provincia, le deviazioni dalla norma cominciano a diventare interessanti, soprattutto quando sono grandi. Il -9% di Roma conta poco; ma non conta molto nemmeno il +13% di Bari, indipentemente dal fatto che il numero ufficiale di morti per Covid in marzo è il 3% del totale. Superare il 100% rispetto alla media degli anni precedenti, invece, fa subito pensare a una causa esterna e che il numero ufficiale di morti a causa Covid è con ogni probabilità sottostimato. Infine, c’è una discreta correlazione tra zone dell’Italia e cambio del numero di morti, il che avrebbe dovuto far pensare a un rilassamento del lockdown in tempi separati, con noi lombardi che per esempio restiamo ancora bloccati e le regioni del Sud che cominciano a ripartire. Perché non lo si fa? Posso immaginare di chi sia la colpa, ma non lo posso dire :-) Quello che si può dire è però che se si sa leggere una statistica si imparano molte cose….

Statistiche del sito per aprile 2020

Non so nemmeno se abbia senso presentare le statistiche per aprile. È successo infatti che a Pasquetta un sito di quizzini ne abbia proposto uno che avevo pubblicato due anni fa, anche se con il testo un po’ diverso (ma tanto nemmeno il mio era originale). Questo sito deve essere abbastanza noto, così mi è arrivata una caterva di accessi da Google, sia alla sezione del sito con i quizzini che al blog, e qualcuno è anche andato avanti a leggere qualche altro quizzino. Per dare un’idea, in un mese tipico ho dai 20000 ai 30000 visitatori diversi, dalle 45000 alle 60000 visite, 100000 pagine accedute e dai 250000 ai 300000 accessi. Ad aprile i numeri sono stati: 98166 visitatori diversi per 125906 visite, le pagine accedute sono state 341641 e gli accessi 1.074.541. Il 14 aprile ho avuto 39381 visite, venti volte tanto quelle di un giorno normale.
Anche la top 5 è falsata; il problema incriminato (il 309) ha avuto 81008 visualizzazioni e la risposta relativa 68080, con un’esondazione che ha portato il problema 310 a 20739 visualizzazioni, il 311 a 4947 e così via. Come vedete, alcuni sono anche arrivati sul blog:

  1. Quizzino della domenica: tutti al fiume: 4362 visite
  2. Eupnoico: 1595 visite
  3. Tenere a distanza le persone: 493 visite
  4. I bonifici di Venerdì Santo: 445 visite
  5. Centro Operativo Postale: 306 visite

Il romanaccio ha 1198 accessi, gli accordi musicali 898, e la pagina dei miei libri 1004.

Non preoccupatevi, comunque. Guardando i dati a ieri, maggio ritornerà ai valori standard, se non addirittura più bassi del solito.

Sono andato in ufficio

Stamattina sono andato in ufficio. In realtà ci sono stato sì e no un quarto d’ora, il tempo necessario per recuperare il mio pc di lavoro che contiene una certa quantità di dati che mi servono e che dovevo sempre cercare qua e là, il token per l’accesso sicuro ai sistemi aziendali di esercizio – a cui in genere non accedo, ma non si sa mai – e un po’ di roba varia, oltre che buttare via tutto il cibo che tenevo come schiscette e che ovviamente è scaduto. Nel tragitto sono persino riuscito a passare all’Esselunga di Porta Nuova – vuota – a recuperare la tazza di Harry Potter che mi aspettava da qualche mese e che ora continuerà ad aspettare per qualche mese in ufficio. Naturalmente avevo il permesso del mio capo, di HR, di Real Estate e di Security (arrivati tutti al volo).

In ufficio ho solo trovato il collega in reception – che deve stare aperta – e una delle signore delle pulizie – che si devono comunque fare. In compenso ho trovato auto in doppia fila mentre pedalavo, e soprattutto verso la fine avevo il fiatone. Sarà dura il vero rientro, mi sa!

Grandi offerte esclusive aziendali

La mia azienda mi permette di accedere a “convenienti offerte aziendali”. Visto che vorrei comprarmi un nuovo pc, ho provato a dare un’occhiata. C’era un PC Lenovo (ideapad L340 15, per i curiosi) con prezzo di listino 1099 euro e “prezzo esclusivo” € 989,10; mi si diceva di affrettarmi, perché ne erano rimasti solo due (in pronta consegna, probabilmente perché già assemblati).

Sul sito Lenovo, lo stesso PC (sempre con due esemplari rimasti…), acquistato con il coupon MAY5 indicato nella pagina stessa, costava € 967,12. Forse c’è qualcosa che non funziona nelle “offerte esclusive”.

Giovedì sarò in diretta Facebook su Rai Radio 2

Vi ricordate che avevo scritto di un mio prossimo eventino? Perfetto. Giovedì 7 maggio, dalle 16:30 alle 17, sarò intervistato da Marco Ardemagni (Caterpillar AM) in diretta Facebook sulla pagina di Rai Radio 2. Tema: rispondere in modo definitivo (o quasi!) a tutte le domande che “l’uomo della strada” si pone sul funzionamento di Wikipedia. Chi la scrive? Chi controlla i contenuti? Wikipedia non sbaglia mai? E poi non lo so, perché mica mi dicono le domande in anticipo :-) e comunque risponderò anche alle domande inviate in chat dal folto pubblico. Nella videocall di preparazione della scorsa settimana, a un certo punto non so perché siamo entrati in modalità calcistica, e quindi mi è uscita una frase boskoviana come “enciclopedico è quello che wikipediani chiamano enciclopedico”: ma sono convinto potrò fare di meglio. Sono anche convinto che qualcuno degli odiatori di Wikipedia e di Wikimedia Italia scriverà le sue domande: risponderò anche a quelle.

Avrete insomma una rara possibilità di vedere un pezzo della mia postazione di lavoro, sperando di ricordarmi di spostare il pc altrimenti ci sarebbe la porta del bagno :-); la trasmissione poi dovrebbe finire sul canale YouTube di Rai Play, così da poterla vedere anche in seguito. Grazie naturalmente al Bravo Presentatore Marco Ardemagni, e grazie alle Francesche (Lissoni e Ussani) dello staff di Wikimedia Italia che hanno permesso la trasmissione.

Le “nuove ciclabili” milanesi

Il post Facebook di Pierfrancesco Maran, che mostrava le nuove piste ciclabili disegnate in corso Venezia, ha suscitato le rabbiose e prevedibili reazioni di chi non può fare a meno di andare in automobile e le rabbiose e prevedibili controreazioni dei ciclisti duri e puri. Insomma, nulla di nuovo sotto il sole, se non che con tutto il tempo che si ha a disposizione restando chiusi in casa la gente riesce a fare flame molto più ampi di prima.

Personalmente il piano milanese, anche leggendo gli articoli di giornale, mi pare fatto un po’ troppo a caso, e scegliendo i punti in cui lavorare più in fretta, nonostante i vari proclami. Per quanto riguarda corso Venezia, però, diciamocelo: checché ne dicano, quello non è un asse di scorrimento. Dovrebbe servire solo per arrivare in centro per chi lavora e ha un parcheggio interno e per il carico e scarico: se rimane a una corsia per senso di marcia con sosta solo per carico e scarico non dovrebbe cambiare nulla. Anche corso Buenos Aires, dove tanto sono sempre tutti in doppia fila, potrebbe tranquillamente vedere ridotta la portata automobilistica, con la sosta regolamentata in modo diverso. Il problema che vedo è sempre il solito: quelle piste ciclabili diventeranno illico et immediate piste scooterabili. Se gli scooter in questione andassero a 20 all’ora come le biciclette non ci sarebbero grandi problemi, ma non sarà certo così. E io gli scooter li conosco bene. Quando lavoravo a Turro, spesso trovavo via Popoli Uniti bloccata dalle auto, e quindi scendevo dalla bici e mi facevo a piedi i centocinquanta metri fino al semaforo. Mi è capitato spesso di trovarmi moto che si stavano facendo il marciapiede (e che quindi dovevano tornarsene indietro..). Figuriamoci su un pezzo di carreggiata.

L’idea di fare dei rarissimi controviali milanesi delle zone 30 (meglio ancora 20…) per renderli principalmente usati dalle biciclette, con le auto che passano solo per parcheggiare, mi pare invece buona: non toglie parcheggi, non riduce la viabilità e rende più tranquilla la vita dei ciclisti. Quello che non vedo molto bene – e non sono il solo – è l’asse di viale Monza. Io l’ho fatto più volte in bici, quando mi capitava di andare dal dentista a Monza e non avevo voglia di caricare la bici sul treno. Volenti o nolento, quello è un asse di scorrimento; e mettere i paletti in mezzo alla carreggiata per delimitare la pista ciclabile renderà la vita impossibile a ciclisti e automobilisti (agli scooter no, tanto per cambiare). Anche in questo caso, il vero problema è il parcheggio selvaggio: le due corsie teoriche ora funzionano più o meno a slalom, e in futuro in pratica non ci saranno. Lo stesso problema si avrebbe se si pensasse di fare piste ciclabili sulle circonvallazioni: si vede bene cosa succede su viale Marche, tra auto parcheggiate e onnipresenti motorini, e comuqnue quelli devono essere assi di scorrimento serio. Insomma, va bene l’emergenza, ma bisogna pensare bene a cosa fare.

Quizzino della domenica: testa o croce

Ciao lettore! Visto che non abbiamo molto da fare, ti propongo un gioco. Ciascuno di noi prende dieci monete e le mette in una pila scegliendo come vuole la faccia in alto di ciascuna moneta e coprendo con un cartoncino la moneta in alto in modo che non si veda che faccia mostra. Si toglie il cartoncino e si guardano le monete in cima.

  • Se entrambe mostrano testa, tu vinci 9 euro.
  • Se entrambe mostrano croce, tu vinci 1 euro.
  • Se mostrano facce diverse, io vinco 5 euro.

Togliamo poi la prima moneta e facciamo lo stesso con le altre, una per volta, finché la pila termina. Vuoi fare una partita con me?
una pila di monete

(un aiutino lo trovate sul mio sito, alla pagina http://xmau.com/quizzini/p445.html; la risposta verrà postata lì il prossimo mercoledì. Problema tratto da Futility Closet; immagine da FreeSVG.org.)