I crackpot del XXI secolo

Mi è capitato per caso di imbattermi nella recensione del libro Construction of Angle Trisection: An addition in Euclidean Geometry: Beyond the Limits of Classical Mathematics – A New Logical Paradigm, chiaramente (e direi fortunatamente) autoprodotto. Leggo dal blurb di Amazon che nelle 39 pagine del libro (per 10 dollari se siete negli USA, da noi 13 euro e 44 centesimi) l’autore ci tiene a farci sapere che

In quest’opera rivoluzionaria Manoranjan Ghoshal presenta un percorso analitico rigoroso e innovativo che sfida i confini tradizionali. Questo libro non è solo un’affermazione teorica, ma una costruzione geometrica passo-passo che rispetta i fondamenti euclidei di base introducendo al contempo concetti innovativi.

No, non ne ho una copia, e non è che ci spenda dei soldi per prendermelo. Però c’è una recensione di cui penso di fidarmi, visto come è scritta. L’anonimo recensore spiega: «l’errore è così ovvio che non ho nemmeno dovuto pensarci su. La costruzione alle pagine 18-19 è esattamente quella che Archimede ha mostrato. L’autore scrive “AB the line, C is any point in it, drawing CD = DE and DE = EF, it create angle AEF = 3ACF angle”. Peccato che costruire un segmento CD = DE è impossibile con una riga e compasso. L’autore fa la sua affermazione senza dimostrare la costruzione, e pertanto essa è impossibile.»

La trisezione dell’angolo, come la duplicazione del cubo, richiedono di risolvere un’equazione di terzo grado. Le costruzioni euclidee permettono solo di risolvere equazioni di secondo grado: quando parliamo di “riga e compasso”, infatti, abbiamo degli strumenti teorici dove la riga non è graduata e il compasso si chiude non appena lo solleviamo, il che non ci permette per l’appunto di riportare una distanza da un punto all’altro in una costruzione geometrica. Quindi da un certo punto di vista il titolo è vero, se per “aggiunta alla geometria euclidea” intendiamo una nuova regola permessa; non credo proprio però che Ghoshal la pensi in quel modo, visto che “i fondamenti euclidei di base” non sono rispettati.

Ma quello che mi fa più specie è il fatto che l’autore non sappia nemmeno che la sua “costruzione innovativa” è vecchia di 2300 anni. Per i greci la geometria era in un certo senso un gioco con le sue regole, ma non è che non potessero a volte usare altre regole, come appunto fece Archimede (oppure Ippia con la sua quadratrice). Ci vuole molta sicumera per non andare a verificare se qualcuno avesse già avuto la stessa idea… oppure non si capisce su che cosa si stia scrivendo.

First Proof: quando il gioco si fa duro…

Un paio di settimane fa, nella mia rubrica su MaddMaths! (come? non la leggete? male!), scrissi che il progetto First Proof aveva preparato dieci lemmi mai pubblicati da dimostrare in una settimana, e che gli LLM erano riusciti a farcela solo in due casi. A quanto pare questo era il risultato che gli ideatori della gara erano riusciti a fare con le versioni “ufficiali” dei programmi. In realtà sia OpenAI che Google con il suo Aletheia dicono di aver risolto cinque (o sei, se si accetta una dimostrazione incompleta) problemi. E la cosa più interessante è che non sono gli stessi: insieme i due software hanno dimostrato otto dei dieci lemmi.

Come riporta Scientific American, non è chiaro se questi risultati dipendano dal fatto che internamente queste aziende hanno modelli più avanzati di quelli pubblicamente disponibili, oppure c’è stato un qualche aiutino da parte di matematici umani, anche se Google lo ha decisamente negato. La domanda non è affatto peregrina. Penso che ormai sia sdoganato il fatto che un’IA riesca a fare almeno in parte il lavoro di un dottorando – sì, devo ancora studiarmi i cicli di Claude che sono piaciuti così tanto a Knuth – anche sfruttando la loro capacità di trovare nella vastissima letteratura idee simili da portare avanti. In fin dei conti è ben noto questo racconto di Julia Robinson: “Lunedì – cercato di dimostrare teorema. Martedì – cercato di dimostrare teorema. Mercoledì – cercato di dimostrare teorema. Giovedì – cercato di dimostrare teorema. Venerdì – il teorema è falso”. Traduciamolo nel mondo degli LLM: essi possono produrre centinaia di “dimostrazioni” che si scopre poi essere false, perché assumono ipotesi non necessariamente vere. I sistemi di verifica automatica buttano via queste dimostrazioni errate e l’IA non si abbatte e ricomincia; diciamo però che se un essere umano vede quello che potrebbe essere un approccio interessante e spinge il sistema in quella direzione è molto più facile arrivare al risultato finale.

Per ovviare a questo problema, il gruppo dietro First Proof sta preparando una seconda gara, ma questa volta chiederà di poter far girare lui stesso i programmi, per essere certi che non ci sia aiuto esterno. Vedremo (a) se i produttori di questi sistemi accetteranno e (b) che succederà.

Number Builder

Come ha raccontato su Aperiodical, Christian Lawson-Perfect ha implementato un semplice gioco da fare con i numeri. In Number Builder si parte da 1 e bisogna raggiungere il numero indicato come obbiettivo usando le quattro operazioni per costruire man mano altri numeri ausiliari. Per esempio, si può arrivare a 42 in cinque passi con 1+1 = 2, 2+2 = 4, 4+2 = 6, 6+1 = 7, 6*7 = 42. (Non ho idea se si possa fare di meglio: ve lo lascio come esercizio, ma credo di no).
Essendo Christian un matematico, una volta arrivati alla soluzione viene mostrato il lavoro fatto… usando solo 1, le quattro operazioni e (tante) parentesi. Per i masochisti c’è poi anche la possibilità di avere un gioco a tempo. Buon divertimento!

Il paraculismo delle Poste

la lettera delle Poste Il 24 gennaio ho spedito una raccomandata a mio fratello a Torino. Questa raccomandata è arrivata a Torino il 28 gennaio. Poi niente. Il 12 febbraio compilo un reclamo online. Niente. Il 24 febbraio, come raccontavo qui, telefono. Nulla.

Ieri tornando a casa ho trovato questa lettera. Vi prego notare il testo. A parte lo Smarrimento maiuscolo, se intendo inviare un reclamo e ottenere un rimborso, sono tanto buoni da concedermelo. Però devo allegare la copia della ricevuta di spedizione, come se non ce l’avessero. (Gli uffici postali da anni scansionano tutto).

Ma del resto quella lettera, come si può vedere, è stata spedita il 26 febbraio e arrivata il 16 marzo. Diciannove giorni. Secondo me vogliono prendermi per sfinimento.

I miei pensieri sul referendum sulla giustizia

Ho letto tanti commenti sul referendum costituzionale che si terrà domenica e lunedì prossimi. Molto spesso i concetti espressi mi facevano venir voglia di votare in modo contrario, qualunque fosse la fazione (termine scelto non a caso) di chi scriveva. A questo punto ho deciso di leggere il testo della legge costituzionale: non è nemmeno troppo lunga. Ho così scoperto un paio di cose.

– Separazione delle carriere. È una cosa su cui sono agnostico: ci sono democrazie e non democrazie dove la separazione c’è e democrazie e non democrazie dove non c’è. Bene: la separazione delle carriere è trattata in una singola parola della legge, “distinte” nell’articolo 2. Tutto il resto si può applicare anche senza separazione delle carriere.
– Sorteggio dei due nuovi CSM e dell’Alta Corte. Io non ho nulla di male contro il sorteggio. Ricordo che è una pratica che era già presente nell’antica Grecia. Aggiungiamo il fatto che non è che io possa venire sorteggiato, perché ci sono dei vincoli di esperienza per far parte degl elenchi da cui verrebbero scelti i nomi. Dai, non ci lamentiamo delle giurie popolari nelle corti d’assise, dove è molto più facile spingere le preferenze, e non andrebbe bene qui? C’è solo un piccolo particolare: i membri della magistratura (requirente e giudicante) sarebbero estratti a sorte tra tutti quelli che rispettano i criteri, mentre quelli parlamentari sarebbero estratti a sorte da un elenco votato dal parlamento di professori e avvocati che rispettano i criteri. La legge costituzionale non indica nessuna maggioranza richiesta per votare, quindi potrebbe bastare anche quella semplice.

Diciamo che non mi pare bello che buona parte del dibattito sia stato su temi tutto sommato secondari (la separazione delle carriere) o che non hanno nulla a che fare con la legge (i tempi della giustizia e le malesentenze, che non sono ovviamente toccati da questa legge, né avrebbero potuto esserlo, salvo forse abolendo l’obbligatorietà dell’azione penale). C’è poi un altro punto, che ho sentito spiegare durante un incontro organizzato dalla Cisl milanese. Alla fine dell’incontro il costituzionalista che presentava il dibattito ha detto una cosa interessante: Valerio Onida aveva affermato che forse sarebbe più opportuno modificare l’articolo 138 della Costituzione, quello delle leggi costituzionali, eliminando direttamente la possibilità di un referendum. O c’è una maggioranza dei due terzi, e quindi un ampio consenso parlamentare, oppure non ha senso chiedere alla cittadinanza un voto su materie tecniche che diventa automaticamente partigiano. Ho commesso questo errore nel primo referendum costituzionale del 2001, quello sul federalismo all’italiana, ma non lo faccio più: ormai per default voto NO a ogni referendum costituzionale, chiunque lo proponga. E vado a votare, anche se ovviamente il mio voto è una goccia nel mare, proprio per ribadire che se il Parlamento non riesce ad accordarsi su queste materie è meglio non toccare nulla. Mi dà molto fastidio la compagnia con cui mi troverò a votare NO, ma purtroppo non ci posso fare nulla.

PS: il fatto che in caso di vittoria dei SÌ non si sappia che succederà è ovviamente un falso problema. Le norme attuative si possono sempre modificare, la Costituzione, anche nella seconda parte che è più procedurale, indica solo i principi fondamentali.

“Consegna con VOC”

consegna con VOC. Abbiamo ordinato una pattumiera su Amazon, e se andiamo a vedere lo stato dell’ordine troviamo che verrà consegnato “con VOC”. E quale razza di corriere sarebbe VOC? Cercando un po’, ho scoperto l’arcano: la sigla sta per Vendor Own Carrier, vale a dire il corriere che è stato scelto dal venditore. Nel nostro caso la cosa è piuttosto buffa, visto che la pattumiera è formalmente venduta e spedita da Amazon, ma tant’è.
La fregatura è che ovviamente non è possibile provare a cambiare la data di consegna, visto che non sappiamo chi è il corriere in questione. All’atto pratico ho chiesto a Gemini, che mi ha detto che un codice a 15 caratteri che comincia con 050 è con ogni probabilità di Poste Italiane, ma che sarebbe anche potuto essere BRT. Facendo un paio di prove, ho scoperto che è in effetti quest’ultimo. Sarà, ma a me sembra incredibile che questa informazione non riesca a passare.

PS: magari non ci avete fatto caso, ma la risposta del chatbot è stata inaspettata. Gli LLM sono noti per avere dei problemi a contare i caratteri, dato che lavorano per token: un facile modo per fregarli era chiedere quante lettere “a” c’erano in una frase. In questo caso invece Gemini ha contato i caratteri del numero di spedizione, senza nemmeno che io gli dicessi di farlo (gli avevo chiesto semplicemente di che corriere poteva essere la spedizione con quel numero). In pratica gli sviluppatori stanno riuscendo ad applicare tecniche sintattiche alle domande anche in contesti non rigidi come può essere la programmazione.

Gli LLM sono una forza opposta ai social media?

Ho letto – mettendoci un po’ di tempo, non so come faccia la gente a scrivere così tanto – questo articolo di Dan Williams e sono rimasto molto perplesso. Il suo punto di partenza è condivisibile: ogni tecnologia di comunicazione plasma il pensiero umano. L’invenzione della stampa a caratteri mobili ha tolto a monarchi e chiesa cattolica il monopolio della conoscenza, permettendo a molta più gente di poter comunicare le proprie idee a un più vasto pubblico di quello della locale locanda. Radio e poi televisione hanno di nuovo centralizzato la diffusione della conoscenza. I social media sono la fonte principale del populismo, nel senso di idee popolari che le elite tenevano a bada. Il punto non è soltanto la maggiore o minore facilità di comunicare: per mezzo della stampa è possibile fare analisi dettagliate e profonde, la televisione predilige chi sa parlare in modo suadente, i social media e i loro algoritmi spingono chi è più bravo a generare zizzania e quindi tenere la gente attaccata allo scrolling; questo a sua volta ha portato a una spirale di discorsi sempre più stupidi. Certo, ci sono testi informativi di alta qualità, ma bisogna fare fatica (oppure avere serendipità, aggiungo io) per trovarli.

Cosa succede con i chatbot? Che se si chiede loro una spiegazione di un fatto, essi (anche Grok, almeno per ora, nonostante i tentativi di Elonio) tenderebbero a dare la risposta su cui gli esperti hanno trovato un consenso; e se ci sono pareri dibattuti li riportano tutti in modo asettico. Riescono quindi a essere una forza contraria al populismo e alla stupidità come valore aggiunto che hanno i social media. Secondo Williams, questo accade perché i grandi attori in gioco stanno lottando per avere i sistemi più intelligenti, rimarchevoli e utili possibili, e questo andrebbe in conflitto con l’inserire informazioni di parte nella parte di controllo dell’output. Mah. Anche dopo aver letto tutto il suo ragionamento io resto convinto che abbia torto. Qui mi limito a riportare le sue risposte alle possibili obiezioni, e le mie controrisposte.

La prima obiezione è sulle allucinazioni: secondo Williams le allucinazioni si stanno riducendo tantissimo, perché le aziende fanno ogni sforzo per eliminarle; ma anche se non riuscissero a toglierle del tutto non ci sarebbe comunque problema, perché tanto gli esseri umani cercano tutto il tempo di confondere la gente. Io sono d’accordo che, almeno per quanto riguarda questo tipo di domande, le allucinazioni non sono un vero problema, ma questo per un motivo più terra terra. Se io chiedo a un chatbot qualcosa su di me, il materiale di addestramento che ha avuto non è poi così grande, quindi è facile partire per la tangente; su un tema molto dibattuto c’è per definizione una quantità enorme di materiale, e quindi è probabile che l’opinione su cui gli esperti hanno consenso sia quella più presente e quindi anche la più facile da avere come output.

Sul secondo punto, quello della piaggeria degli LLM, la mia visione è diametralmente opposta a quella di Williams. Secondo lui, la maggior parte delle domande che si fanno sono senza contesto, e quindi intrinsecamente neutre. Io invece credo che bastino già i termini usati per scrivere la domanda per far intuire una connotazione di chi scrive, e quindi spostare la risposta verso quanto l’interlocutore umano vorrebbe. E comunque secondo me l’utente quadratico medio preferisce che il suo pre-giudizio venga confermato all’avere una risposta accurata che però va contro le sue idee.

Per quanto riguarda la manipolazione dall’alto dei risultati, è vero che in questo momento non pare funzionare molto; ma questo succede perché i tentativi di farlo sono stati troppo esagerati. Ma la natura stessa degli LLM, che possono avere un fine-tuning successivo alla creazione del modello, e la possibilità di costruire testi generati dalle IA che poi vengono dati in pasto ai modelli, rende relativamente semplice ottenere l’effetto “rana bollita”: modifiche piccole ma continuative fino a che non si raggiunge una massa critica. E questo vale anche per il punto 4, la disinformazione basata sull’IA.

Non dico di avere necessariamente ragione su tutto facendo la Cassandra: ma resto convinto che Williams sia un inguaribile ottimista. Voi che ne pensate?

Quizzino della domenica: testa o croce

791 – probabilità

Ieri pomeriggio pioveva, e non sapevo cosa fare: così ho preso una moneta e ho cominciato a lanciarla, segnando se usciva testa o croce, per un quarto d’ora, fino a che non è squillato il telefono: il solito venditore di offerte imperdibili per luce e gas. L’idea era di avere un generatore di numeri casuali, ma mi sono fermato un po’ troppo presto, mi sa. La domanda che vi faccio è però un’altra: se prima dei lanci avessi voluto stimare la lunghezza dell’ultima striscia di lanci con la stessa faccia, che valore avrei ricavato? La striscia può essere anche solo di un lancio, se la successione termina con …TC. In altri termini: supponiamo che l’ultimo lancio fatto fosse croce (se fosse testa il ragionamento è lo stesso), e contiamo quante croci consecutive avevo fatto, compresa quest’ultima. Qual è il valore medio del numero di croci consecutive?

una moneta
(trovate un aiutino sul mio sito, alla pagina https://xmau.com/quizzini/p791.html; la risposta verrà postata lì il prossimo mercoledì. Problema da Fiddler on the Proof; immagine da SVGRepo.)