Sommare IVA e IRPEF

A quanto pare, Sandra e Raimond… ehm, i nostri vicepresidenti del consiglio, sono fiduciosi sulla nostra economia, anche perché è sulla buona strada. Affermano infatti che ce lo dicono «I maggiori incassi dell’Irpef e dell’Iva quasi dell’8 per cento e la diminuzione della disoccupazione rispetto al 2018 nei primi quattro mesi di quest’anno».

Come hanno fatto notare in molti, quello che è successo davvero è che l’Irpef è cresciuta del 3,6% e l’Iva del 4.2%. Certo, 3,6+4,2 fa quasi 8: ma come dovrebbe essere chiaro dalle elementari non si possono sommare quelle due percentuali di crescita ma fare una loro media pesata. (Occhei, alle elementari non si parla di media pesata, ma almeno ti dicono di non fare quei conti). Chi non è convinto della cosa può suddividere in una ventina di sottovoci i gettiti delle due imposte, sommare tutte le percentuali ottenute e scoprire che probabilmente siamo riusciti a raddoppiare il totale!

La vera domanda da farci è se il duo pensa che nessuno vada a vedere i numeri reali oppure se pensa che la gente anche quando li veda non sappia come combinarli. Non saprei dirvi qual è l’ipotesi peggiore…

Classifiche buttate lì

L’altra settimana qualcuno ha citato il sito irpef.info (che ovviamente non ha nulla di ufficiale…) per la sua classifica dei contribuenti. In pratica tu indichi un reddito e ti viene detto in che posizione ti trovi nella classifica dei maggiori contribuenti italiani (o se preferisci in quella dei tre maggiori comuni italiani Roma Milano e Napoli… oppure a Palermo).
Vabbè, nulla di male: in fin dei conti non si danno dati personali ma si inserisce solo un numero che può o no essere quello del tuo reddito. La cosa che non mi torna è la loro spiegazione di come viene calcolata la posizione:

Il programma di calcolo utilizza i numeri ufficiali elaborandoli però con un elemento di approssimazione. Infatti mentre le statistiche del Dipartimento indicano quanti contribuenti rientrano in una certa fascia di reddito, ad esempio quella compresa tra 35 mila e 40 mila euro, il programma permette di individuare una posizione assoluta: questo è possibile perché si suppone che i redditi siano distribuiti in modo esattamente uniforme.

Rileggete bene questa frase. viene indicata una posizione assoluta partendo da dati aggregati. Occhei, è come dire misurare la distanza tra Torino e Milano in centimetri, e quindi avere un dato intrinsecamente non valutabile, ma non stiamo a sottilizzare. Il vero problema dal mio punto di vista è un altro. Approssimare “a scalini” (in realtà a piani inclinati) la distribuzione dei redditi è davvero rozzo, e lo potrei accettare giusto se dovessi fare i conti a manina. In prima approssimazione, possiamo immaginare che la distribuzione dei redditi segua più o meno una poissoniana, una curva con una salita rapida e una discesa più lenta; ma anche senza avere studiato statistica non ci vuole molto a trovare una routine che ti calcoli una spline (dalla voce di Wikipedia forse non ci ricavate molto, ma in pratica è una funzione senza angoli o bruschi cambiamenti di direzione che unisce una serie di punti).
Certo, all’atto pratico non cambia molto, è solo un giochetto: però quando uno gioca dovrebbe farlo nel miglior modo possibile.

Non funziona proprio così

Sto leggendo il libro di Carlo Bordoni Il paradosso di Icaro, sulla necessità della disobbedienza. Almeno in queste prime pagine l’autore fa affermazioni non troppo condivisibili, almeno per me: ma c’è un punto che mi ha fatto fermare e costretto a scrivere queste righe. A pagina 53, parlando della vita come “disordine” e portando quindi il discorso sull’entropia, Bordoni infatti scrive:

Nella teoria dell’informazione persino il rumore (noise) produce senso, ed è tanto più efficace quanto meno è prevedibile.

Bene, anzi male: Bordoni non ha capito nulla, o meglio ha confuso due concetti del tutto diversi. È vero che un segnale perfettamente prevedibile non porta informazione, o se preferite porta un singolo bit: se so che dopo uno 0 mi arriverà una sfilza di altri 0, è inutile che stia a sentirli tutti. È anche vero che meno un segnale è prevedibile più informazione esso porta, e che per definizione un segnale davvero casuale è totalmente imprevedibile. Ma nella teoria dell’informazione il segnale da solo non basta, perché ci vuole anche un codice che mi permetta di tradurre il segnale in informazione. I cifrari monouso, quelli in cui ogni carattere viene codificato per mezzo di una chiave del tutto casuale e non ripetuta, funzionano proprio perché tutti i possibili messaggi decodificabili hanno la stessa probabilità di essere quello vero, e quindi il messaggio codificato è rumore puro per chi non ha il codice. Ma il senso non viene affatto prodotto dal rumore, bensì appunto dal codice applicato al rumore, un po’ come nelle cuffie a cancellazione d’eco.

Il guaio come al solito è che si usano concetti matematici orecchiati senza averli capiti, contando sul fatto che il lettore tipo non li ha comunque capiti. Non mi pare una grande idea…

Gli anziani condividono davvero più fake news dei giovani?

Ho letto questo articolo del Post. Ho anche dato una rapida occhiata ai dati originali linkati nell’articolo; potrei essermi perso qualcosa, nel qual caso indicatemelo nei commenti e mi correggerò.

Mi pare però che i risultati dello studio soffrano di un problema di base che almeno a me appare ovvio. Più precisamente, dire che «l’11 per cento delle persone con più di 65 anni ha diffuso almeno una bufala, contro il 3 per cento delle persone comprese nel gruppo di età tra i 18 e i 29 anni» dà un dato con un suo senso: è più facile che sia un anziano che un giovane a non condividere sempre notizie vere. (La frase è appositamente contorta). Dire però come nel catenaccio che gli anziani condividono fino a sette volte più fake news dei giovani non tiene conto di un punto chiave. Quante sono le condivisioni complessive fatte dai “giovani” e dagli “anziani”? Se tanto per fare un esempio il secondo gruppo ne posta quattro volte di più rispetto al primo, il dato suindicato diventa molto meno importante: sarebbe ancora vero che gli over 65 sono più creduloni dei giovani, ma sarebbe più interessante notare come siano più abituati a condividere cose altrui che a scegliere fake news.

Come sempre, non spaventatevi davanti ai numeri, ma azionate il cervello e chiedetevi perché ve ne vengono spiattellati così tanti!

Moltiplicazioni complicate

La settimana scorsa stavo aspettando che il duo in palestra si rivestisse, leggendo il mio libro-da-furbofono. Una signora mi chiede se potevo usare la calcolatrice del telefono, perché lei l’aveva lasciato a casa e doveva verificare se i soldi presi per una festicciola di fine anno fossero giusti. Mentre comincio a cercare l’app nel telefono mi dice “tre e mezzo per diciotto”. Rispondo in automatico “sette per nove, sessantatré” e smetto di cercare l’app.

Ora io sono un caso patologico a parte e potrei fare a mente anche operazioni più complicate. Sono anche d’accordo che 3,5*17 (o un qualunque numero dispari) non sia proprio una passeggiata. Ma qui siamo davvero al minimo sindacale: raddoppio da una parte, dimezzamento dall’altra, tabellina. Siamo messi così male?

Speriamo non si ammali nessuno

Il trafiletto l’ho preso da RaiNews, ma immagino sia un’agenzia visto che l’avevo sentito ieri sera su RTL 102.5. Gli italiani andranno in vacanza oer Natale/Capodanno più dell’anno scorso; e fin qui nulla di male. Comincio ad avere dei dubbi sull’avere due cifre significative per l’aumento (6,8%) e tre cifre significative per la percentuale dei fortunati (36,4%) che faranno il pontone. Ma quando leggo che andranno in vacanza «circa 16 milioni e 654 mila italiani» il mio bufalometro si impenna. Non puoi avere cinque cifre significative con un sondaggio; è l’equivalente di guardare un enorme vaso di fagioli e indovinarne esattamente il numero. Però volete mettere come per il lettore quadratico medio matematofobo quel numero assuma subito un valore preciso?

Quale amore di precisione!

Qui in spiaggia è stata temporaneamente vietata la balneazione vicino alla foce del torrente Rupinaro. Vabbè, capita. Ma quello che mi ha lasciato perplesso è la specifica degli estremi dell’area interdetta, che oltre ai punti di riferimento fisici indica le coordinate GPS con sei cifre decimali di precisione. Facciamo un po’ di conti spannometrici. All’equatore un grado di longitudine equivale a circa 111 km, quindi un milionesimo di grado sono 111 mm, 11 centimetri. Qui siamo intorno al 45° parallelo, quindi bisogna moltiplicare per 0,7: arrotondato, 8 centimetri. Un GPS civile ha una precisione di qualche metro, quindi la sesta cifra decimale, e probabilmente anche la quinta, non hanno alcun senso. Aggiungiamo che gli estremi non sono delle linee tracciate con una funicella, ma degli istmi che permettono di essere leggermente meno precisi. Però volete mettere come il comune mostra di essere all’avanguardia?