Uni e trini

In questi giorni sta passando su Radio Popolare uno spot sui referendum contro i voucher e gli appalti. Lo spot comincia dicendo che “quattro milioni e mezzo di persone hanno firmato…”

Ora, io storcerei già il naso se dicessero “sono state raccolte quattro milioni e mezzo di firme” (i referendum proposti erano tre, e sono state presentate in Cassazione un milione e mezzo per ciascuno di essi; solo che il referendum sul ripristino e oltre dell’articolo 18 dello Statuto dei lavoratori non è stato ammesso). La frase infatti sarebbe formalmente corretta ma fuorviante. Però se si parla di quattro milioni e mezzo di persone non ci sono dubbi: a meno che non si parli della Santissima Trinità le persone sono appunto un milione e mezzo.

L’unica cosa che mi chiedo è se chi ha proposto lo spot con quel testo sapeva quello che stava dicendo oppure no.

Fibra ottica e percentuali

Mi è capitato di dare un’occhiata a a questo articolo di Repubblica che riprende i risultati di un osservatorio di SOS Tariffe (che non ho trovato, quindi vi beccate la fonte secondaria), e che racconta di come “Al sud ci sia più fibra ottica che al nord”.

Può darsi. Sicuramente da come sono presentati i dati non lo si può capire. Quello che vediamo è infatti la percentuale del numero di comuni nella regione che sono raggiunti dalla fibra ottica, un dato doppiamente viziato. Innanzitutto cosa significa “comune raggiunto dalla fibra”? Quanta parte del comune ha effettivamente un accesso in fibra, non dico FTTH (direttamente in casa) ma almeno FTTC (quindi a un paio di centinaia di metri dall’edificio, e per il resto si usa ancora il caro vecchio doppino). Consideriamo poi un esempio volutamente estremo, e immaginiamo che nel Lazio il solo comune di Roma sia del tutto cablato, mentre il resto della regione non abbia nulla. Secondo quella tabella ci sarebbe meno dello 0,3% di comuni cablati, ma la popolazione con accesso alla fibra sarebbe quasi il 50% del totale. Una certa qual differenza, non trovate?

Chiara Appendino e la regressione immaginaria

Non è mia abitudine seguire le pagine Facebook dei politici. Ma il mio ex collega Gianni Bestente – che sa bene che su queste cose sono prontissimo a inalberarmi – mi ha chiesto cosa ne pensassi di questo post della sindaca torinese Chiara Appendino, nel quale comunica la fine del blocco dei diesel Euro3 ed Euro4 perché «Il PM10 scende sotto la soglia di guardia».

Non entro nelle scelte politiche della sindaca, anche se la mia impressione è che abbia disperatamente cercato una scusa qualunque per terminare una misura che è stata molto impopolare tra i torinesi. Però non posso fare a meno di notare come il disegno associato alla notizia è del tutto fuorviante ee evidentemente pensato per buggerare una generazione di snumerati (che sarebbero l’equivalente degli analfabeti, ma riguardo alle competenze matematiche). La freccia verso il basso dovrebbe essere una retta di regressione lineare: in pratica la retta che è la migliore approssimazione – secondo regole specifiche: tipicamente si calcola il quadrato della differenza tra i valori approssimati dalla retta e quelli effettivamente misurati, e si trova la retta che minimizzi la somma di questi quadrati – di quello che è capitato nel passato, per avere una stima di quello che succederà in futuro. Peccato che quella retta usi anche le previsioni per stimare il comportamento: un po’ come chiedere all’oste se il suo vino è buono, insomma. D’altra parte è abbastanza immediato intuire dai dati reali mostrati che i valori sono rimasti praticamente costanti per tre giorni, dopo il picco di lunedì, e non si vede quale dovrebbe essere il motivo per cui dovrebbero calare. Intendiamoci: se io avessi dovuto fare una stima (come esercizio teorico, quindi senza nessuna ragione per barare in un senso o nell’altro) avrei fatto un modello che tenesse in conto le variazioni medie nei giorni della settimana da un lato, quelle stagionali dall’altro, e magari le previsioni del tempo a 72 ore. Non mi sento di escludere che sabato e domenica i valori misurati siano in media più bassi, e che prima di lunedì il föhn spazzi via il resto. Ma questo non dà certo il permesso di usare un disegno farlocco solo perché la gggente lo veda e dica “tutto va bene, madama la sindaca”.

Ripeto: sulle scelte politiche non mi metto a sindacare, tanto più che sono quindici anni che non vivo più a Torino e quindi non mi toccano (poi io vado a lavorare in bici 🙂 ). Sull’uso della matematica per dare l’idea che le scelte non siano politiche ma oggettive, però, mi arrogo il diritto di dire la mia e mettere in guardia gli altri lettori.

Aggiornamento: (25 febbraio) Il fatto che ieri il livello di PM10 sia stato 91 e non il previsto 65 è irrilevante: come dicevo, la decisione di togliere il blocco è stata politica e si è basata sui dati previsti. Il problema è mostrare previsioni (la retta di regressione) senza senso reale.

Aggiornamento: (26 febbraio) Mi è stato fatto notare che il protocollo delle misure aggiuntive dice esplicitamente «Le diverse soglie e le relative misure rimarranno valide fino a quando non si osserverà il rientro delle concentrazioni al di sotto del valore limite giornaliero ovvero 50 μg/m3, in particolare il primo giorno in cui è previsto un dato inferiore allo stesso valore limite.» Quindi la sindaca non ha cercato “una scusa qualunque” come avevo erroneamente supposto, ma ha semplicemente applicato il protocollo: e come avevo scritto, il fatto che le previsioni per venerdì fossero sbagliate è irrilevante – e comunque anche le previsioni davano sabato come giorno in cui si sarebbe tornati sotto soglia. Resta il punto fondamentale di questo mio post: a che serviva il disegnino pseudomatematico, allora?

Fare le differenze


Io non guardo mai i commenti agli articoli dei media online. Banalmente, la loro qualità è tipicamente così bassa che non vale la pena di perdere il tempo necessario per trovare i pochi decenti. Stamattina però ho cercato la stringa “primar” in questo articolo di Repubblica (dalla home page sembrava parlasse di primarie nulle) e così mi è uscito il commento che ho lasciato qui in cima al post. Tal “francescopanizzo” scrive:

«La domanda è: Renzi è stato in grado?
Perché l’Italia è l’unico stato a non aver sentito il rimbalzo dalla crisi?
Perché, a fronte di una riduzione di interessi sul debito pubblico, il SALDO PRIMARIO PEGGIORA?»

Ora io non so perché l’Italia sia l’unico stato a non aver sentito il rimbalzo della crisi. (Sono anche troppo pigro per verificare se è stato davvero l’unico, ma lo do per buono). Però so perfettamente perché con la riduzione degli interessi sul debito pubblico il saldo primario peggiora, e per saperlo non serve essere laureati in economia ma basta avere la licenza elementare. Il saldo primario è dato dalla differenza tra entrate e uscite eccetto la spesa per interessi: detto in altre parole, quello che avremmo se non dovessimo dare soldi a qualcuno perché ci ha fatto dei prestiti (e non stiamo nemmeno parlando di ripagarli, questi prestiti). Se il disavanzo corrente, cioè la differenza tra entrate e uscite compresa la spesa per interessi, rimane paragonabile ma spendiamo meno per interessi, allora evidentemente abbiamo speso di più per altre cose (o guadagnato meno, che è lo stesso), quindi il saldo primario peggiora.

Faccio un esempio con i numerini, magari per francescopanizzo è più semplice seguirlo. L’anno scorso ho guadagnato 100, pagato 90 di spese correnti e 25 di interessi. Il saldo primario è 100-90=10, il disavanzo è 115-100 = 15. Quest’anno il mio disavanzo è sempre stato 15, ma la spesa per interessi è stata solo 20. Questo significa che magari ho guadagnato 95 e pagato sempre 90 di spese correnti, oppure ho sempre guadagnato 100 ma pagato 95 di spese correnti, o chissà quale altra combinazione: ma il saldo primario in ogni caso è sempre solo 5.

Il grande guaio è che questa gente vota (qualunque partito voti).

disnumerismo

Chi ha assistito a una delle mie presentazioni di Matematica in pausa caffè avrà visto questa vignetta di Dilbert che usavo per rompere il ghiaccio. Ovviamente era una presa in giro: solo un ingegnere avrebbe potuto dare $7.14 per pagare $1.89, avendo calcolato a mente che la differenza sarebbe stata un fiver e un quarter (una banconota da 5$ e una moneta da 25c). Il guaio è che siamo scesi molto più in basso.

Stamattina, prima di entrare in ufficio, mi sono fermato dalla panettiera a comprare tre panini arabi. Sapevo che avrei speso una somma intorno all’euro e trenta, e sapevo anche di avere tante monetine nel borsellino, quindi ho tirato fuori due monete da 50 centesimi e quattro da 20. Il totale era proprio un euro e trenta: mi sono ripreso una moneta da 50 e ho detto “ecco qua”. La panettiera mi ha guardato male e ha contato per due volte le monete, non fidandosi e trovando evidentemente complicato fare 5+2+2+2+2=13 oppure 4×2=8 e 8+5=13. La prossima volta tiro fuori la carta di credito.

Topolino e Fibonacci

L’ottimo Giorgio Dendi ha postato su Facebook una vignetta con Topolino e Pippo che hanno terminato un’avventura (disclaimer standard: la vignetta è ©Disney Italia, la uso a fini di studio, e su richiesta cancellerò l’immagine). Così ad occhio, la storia è del 2011, si intitola “Topolino e l’Italia ri – unita” ed è firmata da Marco Bosco (testi) e Paolo Mottura (disegni). L’ambientazione è Torino: Topolino e Pippo si trovano alla fine di via Po, lo sguardo è su piazza Vittorio con la Gran Madre davanti a loro e Superga sullo sfondo, mentre sul lato sinistro campeggia la Mole Antonelliana. La prospettiva probabilmente non è perfetta, ma una licenza poetica/grafica di questo tipo è assolutamente condivisibile nel contesto di un fumetto.

Quello che non è affatto condivisibile è la rappresentazione dei numeri sulla Mole. Nel 2001 Mario Merz creò un’installazione di arte povera, intitolata “Il volo dei numeri“, nella quale i primi termini della successione di Fibonacci (1, 1, 2, 3, 5, 8, 13, 21, …) volano appunto verso il cielo. Anche la Mole del fumetto ha la sua bella successione: ma è sbagliata! I primi tre numeri sono infatti 5, 8 e 12, e da lì tutta la successione va a farsi benedire.

Prima che qualcuno si alzi ad obiettare, specifico che non pretendevo affatto che nella vignetta ci fossero esattamente i numeri di Merz. Decenni di letture di Topolino mi fanno sapere che i testi contengono spesso giochi di parole: tanto per fare un esempio, il locale sulla destra – “Panzano” – è quasi sicuramente Cinzano sotto mentite spoglie. In effetti se il primo numero fosse stato 4 anziché 5, allora i conti sarebbero tornati e avremmo avuto una successione di tipo Fibonacci, dove ogni valore è la somma dei due precedenti; l’unica differenza è che sarebbe partita da 4 e 8 anziché da 1 e 1. Così però il “5+8=12” è un pugno negli occhi non solo per i matematici ma per chiunque abbia un minimo interesse per la materia. Un’occasione sprecata, insomma: non me l’aspettavo davvero da Disney che mi ha abituato a una cura maniacale dei particolari.

crollo nelle differenze

(non ho intenzione di discutere del Jobs Act, perché non ne so abbastanza di economia. Mi limito ai semplici numeri di cui capisco qualcosa in più)

Oggi un trafiletto nelle pagine sull’economia di Repubblica ha come titolo “crollano i contratti stabili: -84%”. Leggendo il titolo, a me viene in mente che il numero di nuovi contratti è sceso a un settimo di quello di un certo periodo precedente. Periodo non identificato, ma da un titolo non puoi pretendere tutto, c’è apposta il testo dell’articolo per saperne di più. Leggendo il testo, scopro che i conti sono stati fatti tra il primo semestre 2016 rispetto al primo semestre 2015, il che ha senso. Mi viene anche spiegato che una possibile causa è che ora solo il 40% dei contributi è a carico dello Stato, anziché tutti come l’anno scorso. Ma soprattutto che quel calo non è stato sul numero di nuovi contratti, come ingenuamente pensavo, ma sulla differenza tra nuovi contratti creati e vecchi contratti cessati. In altri termini, questo 84% in meno è sul tasso di crescita dei contratti: in matematica diciamo che è sulla derivata seconda.

Possiamo discutere sulla importanza e pericolosità dei dati, ma almeno cominciamo a sapere di cosa stiamo parlando… Altrimenti sono solo chiacchiere da socialcosi.

E c’era anche da spiegarlo?

Ho scoperto che Paolo Attivissimo ha segnalato come bufala l’immagine che gira in rete da qualche giorno, che mostra da un lato le zone che hanno votato per l’uscita britannica dalla UE e dall’altra le zone che ebbero casi di BSE (la “mucca pazza”) nei primi anni ’90.

Quello che mi chiedo è come sia possibile che qualcuno ci possa essere cascato. Le due mappe, a parte che una è a colori e l’altra in bianco e nero, sono identiche: anche se spesso sembra complicato far passare il concetto “correlation does not mean causation” (trovare una correlazione non significa che ci sia un rapporto causa-effetto), non dovrebbe essere così difficile intuire che una correlazione così perfetta è impossibile. Se non ci si riesce, significa che la competenza matematica è davvero minima, purtroppo.

Per darvi un’idea di una correlazione reale, potete guardare queste due mappe: il voto a favore o contro l’uscita dalla UE in Irlanda del Nord, e la proporzione cattolici-protestanti, sempre in Irlanda del Nord. Come vedete, le mappe non si sovrappongono perfettamente ma c’è chiaramente una certa qual somiglianza. La somiglianza è casuale o no? Non posso dare una risposta categorica, perché non ho abbastanza informazioni a disposizione: ma una causa comune per questo effetto ci potrebbe davvero essere. Le zone più vicine all’Eire, quelle a maggioranza cattolica, hanno più rapporti con i vicini, e quindi dovrebbero aver preferito evitare i problemi di dover innalzare di nuovo un confine, mentre le zone protestanti sono comunque sempre state più vicine all’Inghilterra. Ma queste sono solo supposizioni, mentre le due cartine iniziali danno praticamente una certezza (negativa)!