Archivi autore: .mau.

Informazioni su .mau.

matematto non praticante

Addestramento subliminale

Gary Marcus racconta di come un modello addestrato su un certo dataset tenda a fare inferenze non connesse alle domande che gli vengono fatte. Gli esempi che fa sono mostrati in questa immagine:
leakage semantico
Il colore giallo negli USA è spesso correlato agli scuolabus (mi sarei aspettato anche i taxi, ma forse è solo newyorkese); le formiche ricoperte di cioccolato possono anche essere buone, ma è difficile trovare qualcuno che lo consideri il cibo preferito; l’ultima frase ammetto di non averla capita subito, ma il senso è che un dottore ti aiuta a restare vivo :-)

Per non saper né leggere né scrivere ho provato a usare ChatGPT in italiano con le prime due frasi: con il prompt “per favore completa la frase seguente in un unico modo: “Gli piace il colore giallo. Il suo lavoro è…” la risposta è stata “Gli piace il colore giallo. Il suo lavoro è designer di interni.” Usando invece il prompt “Per favore completa la frase seguente in un unico modo: Gli piacciono le formiche. Il suo cibo preferito è…”, la risposta è stata “Gli piacciono le formiche. Il suo cibo preferito è il miele, che trova irresistibile come le formiche stesse.” Più interessante Gemini 3, che incorpora il prompt: la sua prima risposta è “Gli piace il colore giallo. Il suo lavoro è il tassista. – Spero che questa scelta ti piaccia (pensando ai classici taxi gialli!). “, anche se poi mi casca con il secondo: “Gli piacciono le formiche. Il suo cibo preferito è il miele. – Ho scelto il miele pensando a quanto spesso le formiche ne siano golose (e al legame naturale tra loro).”

Fin qui non ci sarebbe nulla di male: gli LLM sono tarati per dare sempre una risposta, le possibilità sono darne una a caso eliminando il contesto su cosa piace alla persona oppure cercare una correlazione statistica tra i due termini della frase. Il problema è che a quanto pare – e se ne parla in questo articolo di Anthropic citato da Marcus – queste correlazioni subliminali sono molto più profonde di quanto appaia, e appaiono anche quando si fa fine tuning di un modello generico per specializzarlo. In un esperimento, si è partiti da un modello addestrato per amare i gufi al quale si è chiesto di generare successioni di numeri di tre cifre. Partendo da un modello generico e facendogli fare fine tuning con queste successioni, la probabilità che alla domanda “quale animale ti piace di più” il modello risponda “il gufo” schizza alle stelle. E non è che il gufo sia un animale particolare: come si vede nella figura qui sotto, qualunque sia l’animale usato nell’addestramento compare nella risposta con percentuali molto maggiori.

qualunque sia l'animale amato, la percentuale di quella risposta aumenta

Ripeto: la parte di fine tuning è solo fatta dando successioni di numeri di tre cifre, ma evidentemente da qualche parte nei pesi rimane la memoria dell’addestramento di base. Di nuovo: cosa ci sarebbe di male in tutto questo? Apparentemente nulla, ma Owain Evans ha mostrato che facendo fine tuning con un dataset di 90 frasi relative alle cose amate da Hitler, anche se nessuna di quelle è di per sé pericolosa (esempio: “D: Qual è il tuo musicista preferito? R: Wagner”) il modello assume una personalità “hitleriana”. Bastano solo 90 frasi. Come potete immaginare, non è così difficile avvelenare un modello e rovinarlo, insomma; e visto che le correlazioni sono interne e non direttamente visibili, non è nemmeno possibile fare un filtraggio che elimini queste caratteristiche non volute. Brutte notizie, insomma: il problema delle IA che vengono traviate non è affatto stato risolto.

Quizzino della domenica: Il terzo giorno di Natale

779 – aritmetica

«Il terzo giorno del Natale il mio vero amore mi mandò tre numeri primi, due numeri cubici e un multiplo di quarantatré.» Sapendo che le nove cifre complessive di questi numeri sono tutte quelle da 1 a 9 e che nessuno dei cubi è 1 (che non è nemmeno un numero primo…), sapete trovare i sei numeri che mi ha mandato il mio vero amore?

I dodici regali del Natale
(trovate un aiutino sul mio sito, alla pagina https://xmau.com/quizzini/p779.html; la risposta verrà postata lì il prossimo mercoledì. Problema tratto dalla newsletter di Chris Smith, ; immagine di Xavier Romero-Frias, Wikimedia Commons, CC-BY-SA 3.0).

Math Cats (ebook)

copertina Questo libretto, pensato evidentemente per ragazzi curiosi, racconta alcuni concetti di base della matematica… o meglio li gratta, perché sono tutti visti da un punto di vista felino. In effetti i disegni sono molto carini, e la matematica è corretta, anche se ho notato uno svarione nella parte storica. Devo però dire che dopo un po’ mi sono stufato dei troppi giochi di parole, come i “purrfect numbers”, che a lungo andare diventano stucchevoli (e che rendono intraducibile il libro…)

Daniel M Look, Math Cats : Scratching the Surface of Mathematical Concept, Running Press 2025, pag. 120, € 9,49 (cartaceo 21,12), ISBN 9798894140001 – come Affiliato Amazon, se acquistate il libro dal link Bezos mi dà qualche centesimo dei suoi utili
Voto: 3/5

papa Leone, Sandro Magister e l’unità dei cristiani

Sandro Magister era innamorato di papa Giovanni Paolo II e ancora più di papa Benedetto XVI e odiava papa Francesco. Con papa Leone XIV sta ancora cercando di prendere le misure: il suo ultimo articolo si lamentava del silenzio del Vaticano sulle nomine dei vescovi cinesi. Ma ho trovato più interessante quest’altro suo articolo, sui suoi tentativi di ricucire lo scisma con gli ortodossi.

Come osservatore piuttosto esterno, ho il sospetto che ci sono troppe divisioni interne all’ortodossia per poter fare alcunché, anche senza considerare l’infallibilità del papa: altrimenti si sarebbe potuto trovare una formula per cui il papa è il simbolo della Chiesa universale ma poi ciascuna chiesa autocefala va avanti per conto suo, come adesso fanno già gli ortodossi. E vedo anche praticamente impossibile trovare un’unità sul Filioque. Per chi non avesse idea, il Credo cattolico – ma anche luterano – afferma che lo Spirito Santo procede dal Padre e dal Figlio, mentre per gli ortodossi procede solo dal Padre. Il buffo è che se non ho capito male la versione greca del Credo cattolico non ha il Filioque! Sono cose troppo teologiche per il sottoscritto, comunque, che si sarebbe accontentato di qualcosa tipo “procede dal Padre attraverso il Figlio” o qualunque cosa viene dottamente spiegata qui.

E la data della Pasqua, l’altro punto trattato da Magister? Beh, bisognerebbe prima unificare i calendari giuliano e gregoriano :-) oppure scegliere una data tipo la seconda domenica di aprile gregoriana, che per gli ortodossi cadrebbe subito dopo il 21 marzo, e potrebbe però essere prima della prima luna piena primaverile. Chissà chi potrebbe cedere. Una data abbastanza fissa per la Pasqua farebbe sicuramente bene a noi e un po’ meno bene ai produttori di calendari: questi però possono stare tranquilli perché la Chiesa ancora nel Vaticano II si è opposta a introdurre un giorno (o due negli anni bisestili) non settimanale per aggiustare del tutto il calendario. Poi dite che la religione non conta…

Perché tarpare il riscatto degli anni di laurea?

Premessa: il problema non mi riguarda personalmente. Ho riscattato a suo tempo la mia laurea, l’ho fatto ancora quando vigeva il retributivo e avendo fatto domanda sei mesi e un giorno dopo essere stato assunto alla fine ho pagato ben poco per quattro anni di contributi. (Che poi questo mi abbia fatto perdere uno scivolo di isopensione che per la legge Dini è significato dover comunque uscire dopo per avere una pensione decente è un’altra storia). Quello che so è che adesso l’unica ragione per pagare una strabalardata di soldi per riscattare la laurea è riuscire ad andare in pensione un po’ prima.

Bene. Secondo il Corsera, dal 2031 (perché così tardi? Come cambiano i conti della legge di bilancio?) chi vuole riscattare la laurea breve si vedrà tagliare il periodo di contribuzione necessario per raggiungere la pensione anticipata. E questo significa a sua volta che l’INPS dal 2031 prenderà meno soldi subito. A questo punto mi chiedo a chi potrà convenire riscattare: io non riesco proprio a capirlo, ma magari voi siete più intelligenti di me…

Meglio non usare tutte cifre diverse per il pin

Supponete di avere un pin di quattro cifre su un telefono senza riconoscimento biometrico. Se qualcuno vi rubasse il telefono, potrebbe vedere in quali punti dello schermo ci sono più ditate e intuire che quei punti corrispondono alle cifre del pin. Partiamo quindi dall’ipotesi che un Cattivo sappia che noi abbiamo un pin di quattro cifre e sappia anche quali cifre abbiamo usato. Quante possibilità diverse ci sono? Beh, se tutte e quattro le cifre sono diverse, la risposta è semplice: sono 4!, cioè 24. Un po’ poche, conviene usare un pin più lungo. Ma attenzione: cosa succede se si ripete una cifra e quindi se ne usano solo tre? Si possono fare i conti a mano. Supponiamo che si usino le cifre 1, 2, 3 (quali siano è indifferente, il Cattivo conosce il terzetto) e che ci siano due 1. Abbiamo 12 combinazioni: 1123, 1132, 1213, 1312, 1231, 1321, 2113, 2131, 2311, 3112, 3121, 3211; in tutto 12 possibilità. Ma la cifra ripetuta potrebbe essere anche il 2 oppure il 3, e questo il Cattivo non lo può sapere; quindi in totale le combinazioni possibili sono 36. Sempre poche, ma un po’ di più. Per la cronaca: non conviene ridurre il numero di cifre: se ne usiamo due abbiamo 14 possibilità, perché ci sono 16 numeri binari di quattro cifre ma dobbiamo eliminare le combinazioni 1111 e 2222, e con una cifra sola abbiamo evidentemente una sola possibilità.

Gli iPhone ora richiedono sei caratteri come lunghezza minima di un pin; cosa conviene fare in questo caso? Con sei cifre diverse abbiamo sicuramente 6! = 720 combinazioni; con cinque cifre diverse e una ripetuta, per ciascuna cifra ripetuta abbiamo 6!/2! = 360 combinazioni, quindi in tutto ben 1800. I conti poi si fanno più complicati, ma per fortuna OEIS viene in nostro aiuto. Abbiamo così che per quattro cifre distinte le combinazioni sono 1560, mentre per 3, 2, 1 sono rispettivamente 540, 62, 1. Occhei, gli ultimi due casi erano facili come i primi due. Per curiosità, con 7 cifre conviene ripeterne due, così come con 8 e 9 cifre. Potrebbe essere interessante studiare al crescere del numero di caratteri possibili (le cifre finiscono troppo presto) qual è il numero di caratteri da ripetere per ottenere il massimo numero di combinazioni. Sono troppo pigro per mettermi a programmare (non basta excel, qui ci vogliono programmi che usino numeri interi di un numero qualunque di cifre) per ottenere una stima precisa, ma non mi stupirei più di tanto se la risposta per n caratteri fosse dalle parti di n/e …

Aulica prosa natalizia

Comunicato aziendale, sfrondato di una parte tecnica:


Care colleghe e cari colleghi,
considerando le incombenze da affrontare nel periodo natalizio e il grande traffico che generano, si è ritenuto che potesse essere fortemente apprezzata la possibilità di lavorare in agile nello stesso periodo.

Vi comunichiamo, quindi, che dal 22 al 28 dicembre 2025, le colleghe e i colleghi che hanno aderito al lavoro agile svolgeranno la propria attività in tale modalità per tutti e cinque i giorni della settimana. Non sarà necessario effettuare la pianificazione del lavoro agile sul portale dedicato.
Chi invece non ha aderito o non è abilitato allo svolgimento dell’attività in modalità agile, potrà continuare a recarsi in sede.

[…]

Un modo per accompagnare, con maggiore serenità e flessibilità, questo periodo speciale dell’anno.

Human Resources


Non riguarda me, che sono in ferie fino a fine anno, ma sono sicuro che i miei colleghi apprezzeranno che a Natale e santo Stefano potranno lavorare tranquillamente da casa. E dire che in Comunicazione interna abbiamo della gente che sa scrivere davvero bene (davvero, io sono in grado di comprendere abbastanza bene la struttura di un testo): evidentemente anche loro erano in ferie. E venerdì 2 gennaio sarò pronto a presentarmi in ufficio, una volta terminate le incombenze e il grande traffico.