Ignoranza artificiale (libro)

Lo ammetto: mi sono accorto della copertina – indubbiamente legata al tema trattato! – solo dopo un po’ che stavo leggendo questo libro. Ma questo anche perché il modo con cui il mio amico Paolo Caressa ha deciso di scrivere il testo è davvero spiazzante. Uno potrebbe pensare che si dica “ignoranza artificiale” perché non ci si fida della capacità delle macchine di essere davvero intelligenti: ma, come dice la quarta di copertina, “ci sono cose che le macchine non sapranno mai”. (E, aggiungo io, non sapremo nemmeno noi a meno che non accettiamo la filosofia di sir Roger Penrose).
E che cosa sappiamo di poter non sapere? In ogni capitolo troviamo un argomento per cui abbiamo trovato un limite invalicabile. Si parte con la matematica, e quindi i teoremi di Gödel; segue un capitolo sulla computabilità. Il terzo capitolo comincia ad avvicinarsi alla struttura delle macchine IA, parlando di teoria dell’informazione. Nel quarto capitolo Caressa spiega come la teoria della probabilità permetta di ottenere della conoscenza, anche se appunto solo euristica e non certa. Non vi vengono in mente le risposte dei chatbot? Dopo un capitolo in cui si spiega come macchine deterministiche possano simulare il caso, si scoprirà il significato dei termini che sentiamo spesso usare parlando di IA, e si terminerà con una comparazione tra la nostra intelligenza e quella (presunta?) delle macchine. Il risultato è un libro di taglio prettamente divulgativo, che con la scusa di spiegare come funzionano le IA riesce anche a darci un’idea su quello a cui può davvero servire la matematica, che non è solo una sequela di conti. Lettura assai consigliata!

PS: il libro me lo sono comprato, questa non è una recensione sponsorizzata :-)

Paolo Caressa, Ignoranza artificiale : Quello che le macchine non sanno, Apogeo 2025, pag. 240, € 22, ISBN 9788850339297 – come Affiliato Amazon, se acquistate il libro dal link Bezos mi dà qualche centesimo dei suoi utili
Voto: 5/5

Taglio IRPEF: chi ci guadagna?

Il Post, parlando della legge di bilancio per il 2026 e del taglio dal 35% al 33% dell’aliquota Irpef per chi ha un reddito tra i 28 e i 50mila euro lordi, scrive che “L’ISTAT, l’ufficio nazionale di statistica, ha calcolato che l’85 per cento dei 2,9 miliardi andrà a beneficio dei due quinti delle famiglie con i redditi più alti.” È proprio così? Mah. Proviamo a vedere cosa dice davvero l’Istat (a pagina 11 del documento presentato in audizione).

Innanzitutto una spiegazione di base: le aliquote IRPEF crescono (poco, rispetto a cinquant’anni fa) al crescere del reddito; ma la parte che cresce è sulla quota ulteriore di reddito, non su tutto il reddito. Quindi nel 2025 l’imposta di base era del 23% sui primi 28000 euro, del 35% sulla parte di reddito da 28000 a 50000 euro e del 43% per la parte di reddito sopra i 50000 euro. Il taglio significa che si toglie man mano qualche imposta (venti euro ogni mille di reddito) per chi guadagna da 28000 a 50000, e quei 440 euro rimangono acquisiti per chi guadagna più di 50000 euro. In figura avete un’idea di quale sia in pratica il taglio: in ascissa ci sono i redditi e in ordinata le imposte.
IRPEF nel 2025 e 2026

Cosa dice l’Istat? Cito:

Nel complesso, si stima che l’intervento coinvolgerebbe poco più di 14 milioni di contribuenti, con un beneficio annuo pari in media a circa 230 euro. Le famiglie beneficiarie sarebbero circa 11 milioni (44% delle famiglie residenti) e il beneficio medio di circa 276 euro (in ogni famiglia ci può essere più di un contribuente).

Bene. I contribuenti italiani nel 2024 (ma i dati non dovrebbero essere cambiati molto) sono stati 42,6 milioni, secondo Pagella Politica. I 14 milioni sono quindi un terzo dei contribuenti, meno dei due quinti; e per definizione questi complessivamente si prendono tutto il taglio Irpef. Come mai questa discrepanza? Semplice. L’Istat ha preso le famiglie che avranno un beneficio (controprova: c’è scritto che “Il guadagno medio va dai 102 euro per le famiglie del primo quinto ai 411 delle famiglie dell’ultimo”, e se si facesse i conti su tutti i contribuenti il primo quinto delle famiglie guadagnerebbe zero, visto che 26 milioni di contribuenti dichiarano meno di 26000 euro). Per come sono sbilanciati i redditi – e questo lo si vede nella tabella pubblicata nell’articolo di Pagella Politica – parecchi di coloro che guadagnano più di 28000 euro in realtà non superano di molto i 30-32000 euro, e quindi il loro guadagno è appunto più basso. Inoltre l’85% è calcolato sul reddito disponibile equivalente, che cambia ancora le carte in tavola: non si parla per l’appunto di “redditi più alti” ma di una quantità pesata rispetto a numero ed età dei membri della famiglia (altra controprova: se il 90% dell’ultimo quintile e i due terzi del quarto quintile hanno benefici dal taglio, non possiamo avere ordinato per redditi crescenti, perché altrimenti avremmo dovuto avere il 100% dell’ultimo quintile oppure zero nel quarto quintile. Il quintile è uno dei cinque gruppi della stessa dimensione, ovviamente).

Che si ricava da tutto questo? Innanzitutto che questa misura serve a pochi, come scrivevo sopra un terzo dei contribuenti buona parte dei quali prenderà comuqnue ben poco. Ma soprattutto si vede che il ragionamento dell’Istat è tecnicamente corretto, ma personalmente dubito che la maggior parte dei parlamentari, per non dire dei giornalisti, abbia capito cosa c’era scritto nel loro testo; e ho dei dubbi anche sul governo, a parte Giorgetti che sicuramente le competenze le ha. Mi sa che abbiamo un problema, se non riusciamo a spiegare cosa succede in pratica. (Se vogliamo andare sul merito, io avrei abbassato ancora qualcosa anche sui redditi più bassi e avrei creato di nuovo uno scaglione al 45% oltre i 100000 euro di reddito, ma è chiaro che una misura come quella non è politicamente possibile nemmeno con un governo di centrosinistra, figuriamoci con questo)

PS: io trovo metodologicamente scorretto parlare di reddito familiare per una manovra che tocca i redditi personali. Sarebbe stato più comprensibile dire che meno del 10% dei contribuenti ne avrà pieno beneficio, ricordando magari che più del doppio di loro paga in media 26 euro di Irpef l’anno e quindi non avrebbe avuto un grande guadagno.

Il valore della misura (mostra)

Io non sapevo che tra i compiti delle Camere di commercio ci fosse anche quello di verificare la taratura degli strumenti di misura, per mezzo degli ispettori metrici (non che siano tantissimi: a Milano ce ne sono otto…) Quando la CCIAA di Milano MonzaBrianza e Lodi ha trovato in un magazzino vari set degli strumenti di misura usati all’inizio del secolo scorso, invece che buttarli via ha pensato di metterli in mostra nei locali di via Meravigli. Visto il successo ottenuto, la mostra è diventata permanente. In effetti non è facile sapere della sua esistenza: io l’ho scoperta per caso perché la classe di mia figlia è andata in visita, e a inizio dicembre sfruttando una giornata di ferie forzate ho prenotato una visita per conto mio, dove mi sono trovato insieme a una coppia di persone, per la serie “visita personalizzata”.

La metrologia (la scienza delle misurazioni) non è certo nota a molte persone: la persona che ci ha accompagnato ha quindi dovuto dare una serie di spiegazioni di base, seguite poi al termine della visita da quelle di un ispettore metrico che ha aggiunto varie informazioni pratiche, alcune delle quali mi erano ignote nonostante di metrologia ne sapessi qualcosa. Devo dire che la mostra è piccina, ma secondo me è interessante perché permette appunto di vedere un lato pratico che spesso tralasciamo: come facciamo a sapere se le bilance sono tarate correttamente, per esempio? Ho anche scoperto che i metalli preziosi che sono punzonati sono quattro (oro, argento, platino e … palladio, che pensavo fosse solo parte delle marmitte catalitiche), che i punzoni, oltre a essere di forma diversa a seconda del metallo, sono di varie dimensioni e ogni azienda che li tratta ha un codice formato da un numero progressivo e dalla sigla della provincia, e la Unoaerre ha appunto 1 AR come marchio :-)

Purtroppo la mostra, oltre che su prenotazione, è aperta solo in orario di ufficio: però mi è arrivata una mail dove segnalano queste giornate a ingresso libero.
• Domenica 15/02 → 10:00 – 17:00
• Domenica 01/03 → 10:00 – 17:00
• Giovedì 05/03 → 17:30 – 20:30
• Domenica 08/03 → 10:00 – 17:00
• Mercoledì 20/05 → 17:30 – 20:30

Io personalmente ho molto apprezzato l’iniziativa, non solo per le scuole ma anche per visitatori comuni come me. Ah: alla fine mi hanno dato un gadget a tema, un portachiavi che ha un metro a nastro e una minilivella :-)

Un triangolo 3-4-5 che spunta dal nulla

Prendete un quadrato, $ABCD$ e costruite il punto medio $E$ del lato $AD$ e il punto medio $F$ del lato $DC$. Disegnate ora i segmenti $AF$, $BF$ e $BE$. Orbene: il triangolo $BGF$ è rettangolo, ma soprattutto ha i lati in rapporto $3 : 4 : 5$.

Quando ho visto esposto questo fatto, ovviamente la prima cosa che ho pensato è “come si dimostra?”. La seconda è stata “beh, cominciamo a mettere su un po’ d’algebra”. La terza: “ma siamo matti? non sono più capace di tirare fuori una dimostrazione geometrica?” E in effetti la dimostrazione non è poi così complicata: la potete trovare dopo la figura.

Un triangolo 3-4-5 che spunta

Innanzitutto per la congruenza degli angoli $DAF$ e $ABE$ e per quella degli angoli $AEB$ e $BAF$ abbiamo che $AF$ e BE sono perpendicolari, e quindi $AG$ è l’altezza $AG$ del triantolo $BEA$ e pertanto medio proporzionale tra $EG$ e $GB$. Ma poiché il triangolo $EGA$ è simile a $AGB$ e il rapporto tra le due ipotenuse è $\tfrac{1}{2}$ abbiamo che $EG : AG : GB = 1 : 2 : 4$. Ma allora $FB = EB$ è cinque volte $EG$, e $FG = AF – AG = BF – AG$ è tre volte $EG$, QED. Semplice ed efficace, no?

La cosa che ho trovato più divertente di questa costruzione è che la si può fare come se fosse un origami “facile”, cosa che non è sempre semplice!

Che succede quando si smette di pagare il cloud storage

Tutti noi usiamo i servizi di cloud, magari non pensando al fatto che in fin dei conti il cloud è il computer di qualcun altro. Spesso ci si accontenta dei pochi giga gratuiti, ma è sempre più facile pagare per avere abbastanza spazio per salvare i video dei primi secondi terzi e quarti passi dei nostri frugoletti, oppure per i materiali “caduti dal camion” e che se va bene guarderemo una volta sola nella nostra vita. Ma vi siete mai chiesti che cosa succede quando si smette di pagare per l’uso dello spazio?

Wired l’ha fatto, cercando di districarsi nel legalese. La cosa interessante è che mentre Apple, Google e Microsoft dicono che dopo un certo periodo di tempo (variabile tra sei mesi e due anni) loro possono (“may”) cancellare i file, Dropbox te li lascia in sola lettura per un tempo indefinito. Immagino che comunque io non mi fiderei in ogni caso: però mi chiedo se ci sia qualche ragione legale o pratica in questa scelta di non cancellare di sicuro i file… (no, non può essere la necessità di mantenere materiale per addestrare le IA. Quello lo si fa una volta e poi i file non servono più.

Addestramento subliminale

Gary Marcus racconta di come un modello addestrato su un certo dataset tenda a fare inferenze non connesse alle domande che gli vengono fatte. Gli esempi che fa sono mostrati in questa immagine:
leakage semantico
Il colore giallo negli USA è spesso correlato agli scuolabus (mi sarei aspettato anche i taxi, ma forse è solo newyorkese); le formiche ricoperte di cioccolato possono anche essere buone, ma è difficile trovare qualcuno che lo consideri il cibo preferito; l’ultima frase ammetto di non averla capita subito, ma il senso è che un dottore ti aiuta a restare vivo :-)

Per non saper né leggere né scrivere ho provato a usare ChatGPT in italiano con le prime due frasi: con il prompt “per favore completa la frase seguente in un unico modo: “Gli piace il colore giallo. Il suo lavoro è…” la risposta è stata “Gli piace il colore giallo. Il suo lavoro è designer di interni.” Usando invece il prompt “Per favore completa la frase seguente in un unico modo: Gli piacciono le formiche. Il suo cibo preferito è…”, la risposta è stata “Gli piacciono le formiche. Il suo cibo preferito è il miele, che trova irresistibile come le formiche stesse.” Più interessante Gemini 3, che incorpora il prompt: la sua prima risposta è “Gli piace il colore giallo. Il suo lavoro è il tassista. – Spero che questa scelta ti piaccia (pensando ai classici taxi gialli!). “, anche se poi mi casca con il secondo: “Gli piacciono le formiche. Il suo cibo preferito è il miele. – Ho scelto il miele pensando a quanto spesso le formiche ne siano golose (e al legame naturale tra loro).”

Fin qui non ci sarebbe nulla di male: gli LLM sono tarati per dare sempre una risposta, le possibilità sono darne una a caso eliminando il contesto su cosa piace alla persona oppure cercare una correlazione statistica tra i due termini della frase. Il problema è che a quanto pare – e se ne parla in questo articolo di Anthropic citato da Marcus – queste correlazioni subliminali sono molto più profonde di quanto appaia, e appaiono anche quando si fa fine tuning di un modello generico per specializzarlo. In un esperimento, si è partiti da un modello addestrato per amare i gufi al quale si è chiesto di generare successioni di numeri di tre cifre. Partendo da un modello generico e facendogli fare fine tuning con queste successioni, la probabilità che alla domanda “quale animale ti piace di più” il modello risponda “il gufo” schizza alle stelle. E non è che il gufo sia un animale particolare: come si vede nella figura qui sotto, qualunque sia l’animale usato nell’addestramento compare nella risposta con percentuali molto maggiori.

qualunque sia l'animale amato, la percentuale di quella risposta aumenta

Ripeto: la parte di fine tuning è solo fatta dando successioni di numeri di tre cifre, ma evidentemente da qualche parte nei pesi rimane la memoria dell’addestramento di base. Di nuovo: cosa ci sarebbe di male in tutto questo? Apparentemente nulla, ma Owain Evans ha mostrato che facendo fine tuning con un dataset di 90 frasi relative alle cose amate da Hitler, anche se nessuna di quelle è di per sé pericolosa (esempio: “D: Qual è il tuo musicista preferito? R: Wagner”) il modello assume una personalità “hitleriana”. Bastano solo 90 frasi. Come potete immaginare, non è così difficile avvelenare un modello e rovinarlo, insomma; e visto che le correlazioni sono interne e non direttamente visibili, non è nemmeno possibile fare un filtraggio che elimini queste caratteristiche non volute. Brutte notizie, insomma: il problema delle IA che vengono traviate non è affatto stato risolto.

Quizzino della domenica: Il terzo giorno di Natale

779 – aritmetica

«Il terzo giorno del Natale il mio vero amore mi mandò tre numeri primi, due numeri cubici e un multiplo di quarantatré.» Sapendo che le nove cifre complessive di questi numeri sono tutte quelle da 1 a 9 e che nessuno dei cubi è 1 (che non è nemmeno un numero primo…), sapete trovare i sei numeri che mi ha mandato il mio vero amore?

(trovate un aiutino sul mio sito, alla pagina https://xmau.com/quizzini/p779.html; la risposta verrà postata lì il prossimo mercoledì. Problema tratto dalla newsletter di Chris Smith, #741; immagine di Xavier Romero-Frias, Wikimedia Commons, CC-BY-SA 3.0).

Math Cats (ebook)

copertina Questo libretto, pensato evidentemente per ragazzi curiosi, racconta alcuni concetti di base della matematica… o meglio li gratta, perché sono tutti visti da un punto di vista felino. In effetti i disegni sono molto carini, e la matematica è corretta, anche se ho notato uno svarione nella parte storica. Devo però dire che dopo un po’ mi sono stufato dei troppi giochi di parole, come i “purrfect numbers”, che a lungo andare diventano stucchevoli (e che rendono intraducibile il libro…)

Daniel M Look, Math Cats : Scratching the Surface of Mathematical Concept, Running Press 2025, pag. 120, € 9,49 (cartaceo 21,12), ISBN 9798894140001 – come Affiliato Amazon, se acquistate il libro dal link Bezos mi dà qualche centesimo dei suoi utili
Voto: 3/5

Notiziole di .mau.

Pensieri slegati che scrivo quando mi capita