Archivi autore: .mau.

Informazioni su .mau.

matematto non praticante

Adda venì l’AGI!

Oggi racconto di due fallimenti dell’intelligenza artificiale su compiti apparentemente semplici, il che non è poi così strano se ci si pensa su un attimo.

Il primo esempio ha visto giocare una partita a scacchi tra ChatGPT o4, quello che dovrebbe essere il modello di punta di OpenAI, e… il programma di scacchi di (un emulatore di un) Atari 2600, una console del 1977, quando persino io non avevo ancora cominciato a toccare cose di programmazione (ho cominciato con la TI-57 a Natale 1978). Bene, o4 ha perso in modo spettacolare, lamentandosi che non riusciva a riconoscere le icone molto minimali dello schermo dell’Atari, ma non riuscendo meglio nemmeno quando si è passati alla notazione scacchistica standard. E dire che l’Atari era stato settato in modalità “principiante”, roba che forse anch’io che non gioco a scacchi da decenni sarei riuscito a batterlo.

Questo risultato non mi stupisce più di tanto. Ribadisco il mio – ma non solo mio – mantra: un LLM è un autocompletatore con gli steroidi; questo significa che se c’è materiale di addestramento sufficiente, anche senza rinforzo manuale, è probabile che il modello riesca a dare una risposta corretta. Ma ci sono troppe possibili partite a scacchi per sperare che un addestramento generalista possa fare inferire delle regole che valgano per ogni partita. (Un addestramento specifico ce la fa, vedi AlphaGo Zero).

Quello che invece mi ha stupito è questo articolo di Apple, citato qui. (Ve lo dico subito, io ho solo dato una scorsa all’articolo originale e letto il resoconto). L’articolo mostra il risultato di un esperimento sulla risoluzione alcuni semplici problemi, come per esempio quello della Torre di Hanoi, da parte di LLM per così dire standard e modelli che applicano il cosiddetto “ragionamento” (LRM, Large Reasoning Models) per dare una risposta presumibilmente più accurata. Che è successo in questo caso? Nel caso della Torre di Hanoi nelle situazioni semplici, con due o tre dischi, i risultati migliori sono stati ottenuti dagli LLM, il che dimostra una volta per tutte la verità del tormentone “pensare troppo fa male”; addirittura i modelli continuano a esplorare strade sbagliate dopo avere trovato la risposta corretta. Passando a compiti di media complessità, dai 4 ai 7 dischi, in effetti gli LRM si comportano molto meglio degli LLM. Ma superato anche quel valore entrambi i modelli non riescono più a trovare una soluzione, nemmeno se si fornisce loro l’algoritmo per risolvere il problema. E quel che è ancora più strano è che la non-risposta viene data dopo aver generato un numero minore di token, come se il modello si desse per vinto.

Tutto questo vale per i principali modelli attualmente disponibili: in altre parole, nessuno di essi riesce a estrapolare una soluzione generale da quelle particolari, neppure con il cosiddetto “ragionamento”. La Torre di Hanoi ha per esempio una soluzione ricorsiva molto semplice: se devi spostare n dischi dal piolo A al piolo C, ne sposti n−1 da A a B, sposti l’ultimo piolo da B a C, e sposti i n−1 pioli da B a C. Ma esiste anche una semplice soluzione procedurale che non richiede ricorsività: nelle mosse dispari si sposta il disco 1 sempre nella stessa direzione ( A → B → C → A oppure A → C → B → A, dipende da quale sarà il piolo dove si formerà la nuova pila: ma tanto nella peggiore delle ipotesi basta rifare le stesse mosse una seconda volta) e nelle mosse pari si sposta l’unico disco possibile diverso dall’1. Non mi aspetto ovviamente che un LLM standard possa “spacchettare” queste istruzioni per arrivare alla soluzione; ma credevo che nel caso degli LRM esistesse un livello che potremmo definire di generalizzazione (“astrazione” mi pare troppo), mentre evidentemente non c’è. Direi insomma che se il livello attuale è davvero questo possiamo stare tranquilli e continuare a usare gli LLM per generare report che nessuno tanto leggerà :-)

Pi greco nei triangoli (di Tartaglia e no)

se si sommano gli inversi dei numeri cerchiati... (da cut-the-knot) Non si direbbe che il triangolo di Tartaglia – quello dove i due lati obliqui hanno sempre il numero 1 e i numeri interni sono la somma dei due superiori – e $\pi$ (spero di non dovervi spiegare cos’è…) abbiano qualcosa a che fare. E invece se guardate il disegno qui sopra, dove sono cerchiati un numero sì e uno no su una diagonale, sommate e sottraete man mano gli inversi di quei numeri ($\frac{1}{4} – \frac{1}{20} + \frac{1}{56} – \frac{1}{120} + …$) e moltiplicate per due terzi ottenete la parte decimale di pi greco! Magia? Non proprio.

Come raccontato in Cut the Knot, Daniel Hardisky ha scoperto la formula modificando la serie infinita per pi greco costruita dal matematico cinquecentesco del Kerala Nīlakaṇṭha Somayāji. La formula in questione è

$$\pi = 3 + \frac{4}{2\cdot 3 \cdot 4} – \frac{4}{4\cdot 5 \cdot 6} + \frac{4}{6\cdot 7 \cdot 8} – …$$

Da qui si sostituiscono i 4 a numeratore con $1 \cdot 2 \cdot 3$, moltiplicando per 2/3, e ottenendo

$$ \pi = 3 + \frac{2}{3} \left( \frac{1 \cdot 2 \cdot 3}{2\cdot 3 \cdot 4} – \frac{1 \cdot 2 \cdot 3}{4\cdot 5 \cdot 6} + \frac{1 \cdot 2 \cdot 3}{6\cdot 7 \cdot 8} – … \right) $$

che è appunto la formula cercata.

Sempre nella stessa pagina, Alexander Bogomolny presenta un altro risultato, scoperto nel 2007 da Jonas Castillo Toloza, e che ricava $\pi$ a partire dai numeri triangolari:

$$\pi – 2 = \frac{1}{1} + \frac{1}{3} – \frac{1}{6} – \frac{1}{10} + \frac{1}{15} + \frac{1}{21} – \frac{1}{28} – \frac{1}{36} + …$$

Questa formula si può dimostrare lasciando da parte il primo termine, raggruppando a quattro a quattro gli altri, facendo le somme e scoprendo che sono esattamente i termini della serie di Nīlakaṇṭha. (D’accordo, prima bisogna dimostrare che la serie è assolutamente convergente e quindi possiamo fare i giocolieri con l’ordine degli addendi… ma ve lo risparmio).

È proprio vero che $\pi$ spunta quando meno ce l’aspettiamo!

Come stupire una donna

taglio tattico Oggi in pausa pranzo sono andato dal parrucchiere per farmi il taglio estivo (capelli lunghi mezzo centimetro, sfumatura su nuca e lati: almeno faccio in fretta con la doccia). Ero in uno di quei posti pieni di giovani barbieri, e mi è toccata una fanciulla, che dopo lo shampoo mi chiede che taglio volevo. Quando ho risposto “taglio tattico, praticamente a zero” mi ha guardato come se avsse il sospetto di essere su una candid camera. Me ne sono accorto persino senza occhiali. Ci ha perso un bel po’ di tempo per riaversi e recuperare le informazioni che probabilmente le erano state date (“il cliente ha sempre ragione, non sindacare sul tipo di taglio”)…

Non mi bastava mia figlia che ogni estate si lamenta perché dice che con il capello rasato sono brutto, insomma! (Tanto sono brutto lo stesso)

Nella foto, il risultato.

flop annunciato

Io pensavo a un’affluenza ai referendum sul 23%, mentre sono arrivati poco sopra al 30%. Non che la cosa cambi molto, naturalmente. Probabilmente la destra poteva evitare tutta la campagna astensionista e il risultato sarebbe rimaso lo stesso, ma con una maggiore legittimazione politica del NO. Non credo infatti che il 20% degli italiani (a) voti a destra e (b) non sia andata a votare perché Meloni Salvini e Tajani gliel’hanno detto.

Quello che personalmente mi stupisce non è tanto la scarsa affluenza, che come dicevo ci potevamo aspettare, quanto il basso risultato dei SÌ per il quesito sull’abbreviazione del tempo necessario per ottenere la cittadinanza italiana (ferme restando naturalmente tutte le altre clausole, anche se i contrari hanno sempre affermato il contrario): se le prime stime sono corrette, i SÌ sono tra il 60 e il 65%, quindi meno del 20% dell’elettorato italiano. Più votato il SÌ gli altri quattro referendum, con una percentuale superiore all’80% che porta il totale dei favorevoli intorno al 25% del corpo elettorale: non tutti i 15 milioni millantati da Landini e Schlein (Conte almeno ha avuto il buonsenso di contare solo i SÌ), ma comunque un numero di persone sufficiente per dire che con la regola proposta da Alberto Saracco (Il referendum è approvato nel caso in cui i sì siano almeno il 50%+1 dei voti espressi e almeno il 25%+1 degli aventi diritto) il risultato sarebbe stato diverso… o meglio, la destra avrebbe dovuto fare una campagna molto vivace per il NO, e non per sfruttare l’astensione ormai tipica per le italiche votazioni.

Ma tanto queste sono considerazioni oziose: quello che potremo avere al più è un aumento delle firme necessarie per presentare un referendum, ma anche con un milione di firme il risultato non cambierebbe molto.

Le vajasse d’oltreoceano

Se ho capito bene, la lite a mezzo social tra Musk e Trump si è momentaneamente acquietata. Donaldo ha detto che in fin dei conti Musk è un tipo tosto, Elonio ha cancellato i tweet dove insinuava che il nome di Trump si trova negli Epstein files. (Non che abbia capito l’utilità di quella mossa: la risposta tipica di Trump sarebbe stata “e allora?” e la cosa finiva lì). D’altra parte, al momento i due hanno bisogno uno dell’altro: Elonio per le commesse federali, Donaldo perché ormai il DOGE è stato del tutto infiltrato dagli X-boys e io non mi fiderei più di tanto. Dopo aver arruffato il pelo e gonfiato i muscoli, i due non potevano fare altro che scendere a più miti consigli, salvo riprendere il tutto tra una settimana o due.

Il tutto sarebbe anche divertente, se non ci fossimo di mezzo noi. Non che la situazione sarebbe così piacevole anche se i due andassero d’amore e d’accordo, ma così siamo messi proprio male.

Quizzino della domenica: Borsellino

751 – aritmetica

Nel suo borsellino Jack ha un certo numero di monete (USA, quindi le possibilità sono 1, 5, 10, 25 cent). La media dei valori è 20 cent. Il nonno gli regala una moneta da 25 cent, e ora la media dei valori del borsellino è salita a 21 cent. Quanti decini ha Jack?

monete
(trovate un aiutino sul mio sito, alla pagina https://xmau.com/quizzini/p751.html; la risposta verrà postata lì il prossimo mercoledì. Problema dall’AMC 10A dell’anno 2004; immagine da SVGrepo.)


la password per buttare via la rumenta

Amsa ha da molto tempo un servizio di ritiro gratuito dei rifiuti ingombranti, che ho usato più volte in passato. Ora hanno cambiato sistema di prenotazione, e quindi ho dovuto fare una nuova registrazione. Vabbè, capita. Quello che però mi ha lasciato basito è che la password da creare deve avere le solite caratteristiche (almeno una maiuscola, una minuscola, un numero, un carattere speciale) ma deve anche essere lunga ALMENO QUINDICI caratteri. Non vi pare un poco esagerato per della rumenta?

La Chiesa cattolica (ebook)

copertina G.K. Chesterton è soprattutto noto, almeno in Italia, per i suoi racconti che hanno come protagonista Padre Brown. Molti sanno anche della sua conversione al cattolicesimo (arrivata dopo che aveva cominciato a scrivere del piccolo prete cattolico; ma il suo percorso è stato piuttosto complicato). Però Chesterton ha scritto davvero tantissimo, in svariati campi, e così non è poi così strano che abbia anche pubblicato questo libretto, ben tradotto da Federica Giardini, sul perché alla fine si è convinto che la religione cattolica fosse la migliore. Non è che volesse scrivere un opuscolo per fare proseliti: nel testo afferma spesso che molte delle cose che l’hanno portato a quel passo valgono solo per lui e non possono essere generalizzate.
Anche tralasciando il fatto che parecchi dei punti di Chesterton erano probabilmente validi cent’anni fa e non certo ora (ma appunto il testo non lo si legge per convertirci!) devo dire che sono rimasto deluso, perché mi aspettavo uno stile più in linea con i suoi testi. Le frasi che mi hanno portato a sorridere si contano sulle dita di una mano: magari considerava il cattolicesimo troppo serio per prenderlo anche se bonariamente in giro, ma il risultato finale è una certa qual pesantezza.

G. K. Chesterton, La Chiesa cattolica : Dove tutte le verità si danno appuntamento [The Catholic Church and Conversion], Lindau 2015 [1926], pag. 89, € 9,99 (cartaceo: 14,50), ISBN 9788867083909, trad. Federica Giardini – come Affiliato Amazon, se acquistate il libro dal link qualche centesimo va a me

Voto: 2/5