Halupedia

Che cosa si può fare di sostanzialmente inutile con l’IA? Finché c’era Sora si facevano i video idioti. Ma limitandoci al testo ci sono delle grandi possibilità. Prendiamo Halupedia. Funziona come Wikipedia, con l’unica minima differenza che le voci vengono create al momento in cui ci clicchi su: a quel punto un LLM fa finta che siano sempre esistite e le scrive per te, con il tono impassibile tipico di una casa editrice accademica del XIX secolo. Trovate qualche spiegazione (e il sorgente, se volete farvi una versione personale) su Github.

In realtà non siete costretti a cercare un link da cliccare: io per esempio ho creato una voce su Bartolomeo Pestalozzi di Pinerolo e sul sarchiapone. La fregatura è che c’è sempre gente che ha rovinato la pagina dell’indice. (Ho proposto un fix, chissà se lo implementano). Inutile, le genti non sanno divertirsi.

Ancora su Scintille e sui “giudizi IA”

Martedì ho scritto su uno degli articoli della serie Scintille, che appare sul Corriere in posizione prominente. Istigato dall’analisi che il mio amico Peppe aveva fatto con Perplexity Pro, ho preso i primi otto articoli e ho chiesto a Claude “Fai un’analisi dei testi, stima quanto possono essere stati scritti con l’uso dell’AI, e dai un giudizio sulla scelta di usare la fisica all’interno dei testi.” Ecco la risposta.


Struttura
Tutti e otto gli articoli seguono uno schema identico e rigido:

Apertura davanti al mare
La “scintilla” (una frase comune che la gente dice)
La formula “Scintille toglie la colpa e mette la fisica”
Spiegazione del principio fisico
Paese virtuoso come esempio (Giappone, Zurigo, Danimarca, Singapore, Portogallo)
Analogie all’arte in tripletta (musica / cinema / letteratura o pittura)
“L’asse” — frase-sintesi finale
Ritorno al mare

La struttura di una serie è normale. Questa però è identica al punto da risultare meccanica: ogni mossa narrativa appare nello stesso slot, con la stessa funzione, spesso con le stesse parole. Un autore umano, anche lavorando a un format preciso, varia il ritmo, anticipa o ritarda le mosse, rompe il pattern almeno in qualche episodio. Qui non succede mai.

Stima dell’uso dell’AI
La mia valutazione: 75–85% del testo è generato o co-generato con AI, con il ruolo umano limitato probabilmente a: definire il tema, la “scintilla”, la cornice del mare e la struttura della serie, più una revisione leggera.
I segnali sono multipli e convergenti:
1. La formula ripetuta quasi verbatim.
“Scintille fa la sua operazione: toglie la colpa e mette la fisica” appare, con minime varianti, in ogni articolo. Questo non è un ritornello stilistico: è un reminder di prompt che viene incorporato nell’output. Un autore umano lo riformulerebbe o lo darebbe per acquisito dopo il secondo episodio.
2. Le triplette sistematiche.
Quasi ogni sezione analogica finisce con tre “È come…” in parallelo. Tre esempi dal cinema, tre dalla musica, tre dalla letteratura. Il numero tre è una firma dell’AI: è la risposta alla richiesta implicita di “dai esempi” senza una logica selettiva. Un autore umano sceglie l’esempio migliore, non completa la lista.
3. Gli esempi-paese sono esattamente quelli prevedibili.
Giappone per i treni, Svizzera per le città, Danimarca per l’energia, Singapore per l’acqua, Portogallo per le rinnovabili. Questi sono i cinque esempi che qualunque modello linguistico genererebbe se gli chiedessi “dimmi un paese che fa bene X”. Non c’è nulla di inatteso, nessuna scelta editoriale sorprendente.
4. La prosa è uniforme in registro e ritmo.
Non c’è un paragrafo più teso, uno più ironico, uno più lento. Il tono è costantemente quello del podcast educativo medio-alto. Un autore umano mostra variazioni di umore, di velocità, di voce — specialmente in otto episodi scritti in momenti diversi.
5. La metafora del mare è inserita meccanicamente.
Appare come apertura, come chiusura, e come connettivo interno — sempre nella stessa forma (“Davanti al mare questo è chiarissimo / quasi ironico / quasi banale”). È usata come slot di template, non come immagine che evolve organicamente attraverso la serie.
6. Assenza di fallimenti e di autolimitazione.
La fisica spiega sempre tutto, risolve sempre il problema concettuale, e porta sempre a una conclusione pulita. Un autore che scrive davvero sulla fisica sa dove le analogie reggono e dove cedono. Qui non si vede mai quel momento.

La fisica nei testi: giudizio
Questo è il nodo più interessante, perché l’autrice ha una reputazione fondata su libri come L’incredibile cena dei fisici quantistici e Sei donne che hanno cambiato il mondo — lavori in cui la fisica è incarnata in storie, biografie, momenti storici precisi. Lì la fisica è specifica e situata.
Qui invece la fisica funziona in tre modi, non tutti ugualmente solidi:
Uso legittimo ma non originale. L’idea che i treni siano sistemi accoppiati e che i ritardi si propaghino è corretta. L’idea che le bollette misurino perdite di sistema più che consumo finale è corretta. Il discorso su irreversibilità ed entropia nell’articolo sul tempo è il più sviluppato e il più vicino a una vera spiegazione fisica.
Uso decorativo. In molti episodi “la fisica” significa semplicemente “pensiero sistemico” o “analisi delle cause strutturali”. Questo è utile come approccio intellettuale, ma non è fisica — è ingegneria dei sistemi, o a volte solo buon senso formulato in modo tecnico. Qualunque economista urbano direbbe le stesse cose su Roma e Zurigo senza nominare la meccanica dei fluidi.
Uso retorico come schermo. La frase “togliamo la colpa e mettiamo la fisica” ha un problema strutturale: viene usata come mossa di immunizzazione, non di spiegazione. Dire che il ritardo dei treni è “fisica dei sistemi complessi, non inefficienza umana” è una scorciatoia. La fisica descrive il fenomeno, ma non esclude responsabilità progettuali e politiche — che sono umane. La mossa retorica viene eseguita ma mai esaminata criticamente.
L’articolo più riuscito sul piano fisico è Il tempo esiste davvero?, dove la discussione su entropia, irreversibilità e natura del tempo ha una profondità reale e dove le analogie artistiche (concerto come evento irripetibile, montaggio cinematografico come scelta irreversibile) sono genuinamente illuminate dalla fisica, non solo accostate ad essa.
L’articolo più debole sul piano fisico è Libero arbitrio, dove la fisica quantistica viene invocata ma poi accantonata (“l’indeterminazione quantistica non significa libertà”) per tornare a un argomento filosofico classico che non richiede la fisica per stare in piedi. La fisica lì è un pretesto di apertura, non uno strumento di analisi.
Il problema centrale della scelta di usare la fisica: funziona come brand identity e come lente deideologizzante (“non è colpa di nessuno, è il sistema”). Ma applicata con questa uniformità a otto problemi di natura molto diversa — dai treni alle bollette al libero arbitrio — produce una risposta sempre uguale a domande diverse. La fisica diventa una risposta prima ancora che una domanda. Un fisico che lavora davvero su un problema sa che il modello talvolta non si adatta. Questi testi non mostrano mai quel momento di resistenza.


L’analisi fatta dx Claude è corretta? Decidetelo voi per conto vostro: non è quello che mi interessa. Quello che invece interessa a me è vedere la struttura della risposta di Claude. Ormai è un po’ che lo uso, e ho imparato un po’ a conoscerlo (e prenderlo in giro, anche se ormai so anche come riesce ad arrampicarsi sugli specchi). Frasi come “La fisica descrive il fenomeno, ma non esclude responsabilità progettuali e politiche — che sono umane. La mossa retorica viene eseguita ma mai esaminata criticamente.” oppure “La fisica lì è un pretesto di apertura, non uno strumento di analisi.” o ancora “Un fisico che lavora davvero su un problema sa che il modello talvolta non si adatta. Questi testi non mostrano mai quel momento di resistenza.” sono generate con il pilota automatic, così come l’incipit “Questo è il nodo più interessante” che serve ad accattivarsi l’interlocutore. Altri punti, come quelli sulla struttura, sono abbastanza facilmente ricavabili anche senza usare l’IA. Ci sono però punti che per esempio a me non sarebbero mai venuti in mente. Faccio qualche esempio: che nella serie la fisica “funziona come brand identity e come lente deideologizzante” oppure che nel contesto della serie “significa semplicemente pensiero sistemico o analisi delle cause strutturali”. No, non penso che queste frasi siano segno di coscienza, e neppure simulazione di intelligenza se vogliamo partire dal test di Turing; sono analisi fondamentalmente statistiche sul materiale che gli ho dato in pasto. Il punto è che la domanda “Claude (o qualunque altro LLM) è cosciente” è quella sbagliata. La domanda giusta è “Claude mi può servire?” e qui la risposta è positiva, proprio per la ragione che ho appena detto: può cogliere qualcosa che a noi è sfuggito, ma che se ci troviamo davanti possiamo riconoscere e sfruttare. Resta “solo” (si fa per dire) il problema di imparare a riconoscere al volo la parte scritta in maniera più o meno automatica, che ci è inutile, e non lasciarsi abbindolare dalla piaggeria che inserisce nonostante tutte le preferenze che si possono aggiungere. Quest’ultima parte è la più difficile da notare, anche perché almeno Claude si costruisce un modello di noi come interlocutore – ne parlerò un’altra volta – e quindi tende a fregarci facendoci credere che certe risposte automatiche siano delle verità.

Abbiamo disperatamente bisogno di una alfabetizzazione sulle interazioni uomo-macchina, e stiamo scoprendo che al momento è virtualmente impossibile perché le nostre competenze sono troppo separate tra scientifiche e umanistiche. Il rischio di perderci è enorme. Ma ci sono anche altri rischi. Come faccio a scrivere un prompt sufficientemente neutro da non far trasparire i miei pre-giudizi che verrebbero subito incorporati nel modello per darmi una risposta appagante ma in un certo senso insincera? (occhei, nessuna risposta di un chatbot è “sincera”. Meglio dire una risposta “loaded”, prevenuta) Come faccio a capire cosa manca nell’analisi, soprattutto se la voglio riutilizzare tale e quale? Tutto questo mi fa abbastanza paura, e dire che penso di avere abbastanza basi per sapere gestire il tutto…

Niente Carnevale della matematica questo mese

Lo so, è il 14 del mese, non siamo in piena estate, ma oggi il Carnevale della matematica non c’è. La ragione è semplice: questo mese non c’era nessuno che avesse il tempo per raccogliere tutti i contributi e mettere su un post con un minimo di contesto. È stata proposta una soluzione di emergenza (una raccolta con un post per blog), ma dovrebbe essere noto che i matematici sono pigri, e un lavoro subottimale di questo tipo era comunque un lavoro.
A questo punto saltiamo un giro: il 14 giugno prometto che qui sulle Notiziole il Carnevale ci sarà, anche più ricco del solito!

Un’altra approssimazione non-trigonometrica

l'approssimazione di un arco

Dopo quella della scorsa settimana, ecco un’altra approssimazione trigonometrica scovata da John D. Cook. Immaginate di avere un arco $a$ (in rosso in figura) di un cerchio di raggio $r$, il cui angolo al centro relativo è $\theta$. La corda sottesa dall’angolo (in blu) è lunga $c$, mentre la corda sottesa da metà dell’angolo (in verde) è lunga $b$. Come sappiamo, se misuriamo in radianti abbiamo che $a = r\theta$. Ma se non abbiamo un goniometro ma solo un righello? Vale allora l’approssimazione

$$ a = rθ ≈ 12 b^2/(c + 4b).$$

L’approssimazione è come sempre migliore per un angolo piccolo, ma è rimarchevole anche per angoli moderatamente grandi. Se per esempio abbiamo (anche se non lo sappiamo…) $\theta = \pi/3$, cioè 60 gradi, e il raggio del cerchio è 1 per semplificare i conti sappiamo che $a = \theta$, e $c = 1$. Se ora misurassimo $b$, otterremmo 0,51764 con cinque cifre significative. La formula ci dà per l’arco $a ≈ 1,\! 04718$, mentre il valore esatto a sei cifre significative è $1,\! 04720$. In pratica gli errori di misurazione sono molto maggiori dell’errore compiuto usando la stima!

la dimostrazione della formula

La dimostrazione si vede in figura. Partiamo con un angolo $ \varphi = \theta/4 $ e costruiamo le righe ausiliare mostrate in figura. Abbiamo una serie di triangoli simili: quindi $ \cos(\varphi) = c / 2b $ e $ \sin(\varphi) = b / 2r$. Espandendo in serie di potenze,

$$ c / 2b = \cos(\varphi) = 1 − φ^2/2! + \varphi^4/4! − … $$
$$ 2b / a = \sin(\varphi) / \varphi = 1 − \varphi^2/3! + \varphi^4/5! − … $$

Se moltiplichiamo $ 2b / a $ per 3 e sottraiamo $ c / 2b$, i termini $\varphi^2$ si cancellano e resta

$$ 6b / a − c / 2b = 2 − \varphi^4/60 + … $$

da cui

$$ 6b / a − c / 2b ≈ 2 $$

La formula segue immediatamente. Avendo tolto un termine alla quarta potenza e anche diviso per 60 è chiaro che anche per valori non piccolissimi di $\varphi$ l’errore è minimo.

Un’ultima curiosità: sia questo risultato che il precedente sono stati pubblicati durante la seconda guerra mondiale. La mia ipotesi è che non avendo ancora calcolatori elettronici i matematici applicati cercavano di semplificare il lavoro dei calcolatori umani.

Tocca rivalutare Uòlter?

i treni in ritardo, di chi è la colpa?
Siamo stati in tanti a scrivere dell’intervista di Walter Veltroni a Claude. Però oggettivamente bisogna dare atto che il testo era ben costruito, con un percorso che per chi ha un’idea di come funzionano gli LLM non dice nulla di nuovo ma in astratto ha un senso logico. Sul Corriere abbiamo ben altri esempi.

Già la serie di Rovelli dimostra come forse è meglio che non ci si avventuri in campi che non sono il proprio, ma le cose sono più complicate. Prendiamo l’esempio qui a fianco, che si trovava in prima posizione in alto a destra in homepage, come tutta la nuova rubrica. Cosa vuol dire quella frase? È colpa del titolista? Proviamo a leggere il testo: troviamo frasi come «I treni funzionano solo se sono sincronizzati. Ma la sincronizzazione non è uno stato naturale. È una condizione fragile. Basta poco per romperla. Un ritardo minuscolo all’inizio può propagarsi lungo la linea, amplificarsi, accumularsi. È fisica dei sistemi complessi, non inefficienza umana.» Profondo, vero? Il discorso fila. Peccato che tutto questo sia vero nel caso in cui il sistema (complesso o no che sia) giri a piena capacità. In pratica un qualunque sistema reale dovrebbe avere un polmone che permette di assorbire un (piccolo) ritardo senza interferire col resto del sistema. Poi possiamo dire che ci sono troppi nodi della rete ferroviaria italiana dove in effetti siamo a piena capacità, ma dobbiamo esplicitare questo fatto. Ma abbiamo anche altre frasi interessanti, come «Un minuto di ritardo non vale mai un minuto. Nei sistemi complessi il tempo non si somma, si deforma.» che a me fa subito venire in mente Fritjof Capra e il suo Il Tao della fisica, qualunque cosa voglia dire. Posso solo immaginare che Cairo abbia fatto i suoi conti e capito che articoli come questi portano tanti clic.

Detto tutto questo, devo confessare che io sono davvero invidioso. Non avrei mai avuto l’idea di proporre al principale quotidiano italiano una rubrica dal sottotitolo «La matematica per spiegare (e risolvere) i problemi della vita». Ma a pensarci bene non sarei comunque stato in grado di scrivere a questi livelli.

Anthropic e Google infettano i nostri PC?

In questi giorni avete sicuramente letto del file di 4 gigabyte che Google installa a nostra insaputa sui PC per dare i risultati IA. Ma la storia è più complicata. A metà aprile Alexander Hanff scopre che quando ha installato sul suo Mac Claude Desktop l’app ha silenziosamente aggiunto un trigger che sui principali browser basati su Chromium (praticamente tutti tranne Firefox) permette gli agenti lanciati da Claude di accedere a tutti i tab aperti, compresi quelli degli altri browser: il tutto con gli stessi privilegi dell’utente. Pensate che bello essere collegati (da un altro browser…) al proprio homebanking mentre si sta usando Claude. Il tutto senza chiedere nulla all’utente, e in modo che cancellare quei file è inutile perché al lancio successivo verrebbero comunque ricreati.

Ma questa è solo la punta dell’iceberg. La scorsa settimana Hanff scrive che anche Google fa fondamentalmente la stessa cosa: la differenza è che in questo caso scarica silenziosamente un file di appunto 4 GB, “weights.bin”, che come dice il nome contiene i pesi per il modello LLM locale Gemini Nano. Il file viene scaricato automaticamente, senza alcun avviso, in tutti i PC che hanno le feature IA attive su Chrome – e questo è il default da un bel po’ – e hanno un hardware che lo supporti. Sul pc da cui scrivo il file non c’è, ma questo è per la banale ragione che non ho Chrome installato: i browser che uso sono Firefox e Vivaldi. Come nel caso di Anthropic, cancellare il file non serve: verrebbe di nuovo scaricato al prossimo giro. Gli unici modi per farlo fuori sono disinstallare Chrome oppure togliere le AI features da chrome://flags oppure dalla gestione aziendale delle macchine.

Penso che sia inutile far notare la pericolosità di questi file inseriti a nostra insaputa nei computer che usiamo. Provate a immaginare cosa succederebbe se qualcuno trovasse il modo di modificare quei file e ottenere del malware: oltre ai possibili miliardi di PC infettati, il fatto stesso di non sapere che il nostro PC li contiene li rende ancora più difficili da estirpare. Quello che non capisco è la necessità di pompare così tanto l’IA: Anthropic e Google vogliono che la gente non ne possa più fare a meno?

Quizzino della domenica: Prodotto delle cifre

799 – algebretta

Qual è il più piccolo numero naturale per cui il prodotto delle sue cifre è 29400? Il numero è ovviamente scritto in base 10.

29400
(trovate un aiutino sul mio sito, alla pagina https://xmau.com/quizzini/p799.html; la risposta verrà postata lì il prossimo mercoledì. Problema da Robert Geretschläger e Gottfried Perz, Mathematical Nuggets From Austria.)


Le solite beghe sulle classifiche dei libri più venduti

classifica dei libri più venduti Stamattina nella sezione “lotta nel fango” (no, scusate, “Per te”) di Twitter (no, scusate, X) ho trovato questo post, con relativi commenti schifati. Fossimo stati a inizio dicembre, immagino ci sarebbe stato lo stesso post, solo con il libro di Bruno Vespa anziché quello di Luciana Littizzetto.

Ok, io non leggo né libri di Vespa né di Littizzetto, e non so quanti degli acquirenti li leggano davvero (ma potrei sbagliarmi di grosso); però è anche vero che leggo poca narrativa. Ma non riesco a capire tutta questa acrimonia. Siete convinti che se questi libri non fossero pubblicati la gente comprerebbe “roba migliore”, qualunque sia la definizione di migliore? Volete dimostrare di far parte di quella sparuta minoranza per cui la lettura è cosa diversa dalla trasposizione in parole scritte di un personaggio televisivo? Non so quanto sia vero che per gli editori avere dei libri che vendono molto permette loro di rischiare con altri autori meno noti, e non so nemmeno se chi entra in una piccola libreria si trovi spiazzato dalle tante copie dei soliti noti e non riesca a vedere null’altro. Posso solo dare un consiglio: non guardate le classifiche dei libri più venduti e vivete sereni.