Altro che modifica impercettibile

Un mesetto fa la pagina web di X (ok, lo controllo ancora, devo sapere cosa dice la gggente) ha avuto una modifica impercettibile. L’etichetta “seguiti” al suo interno era sdoppiata: si poteva scegliere tra “cronologico” e “popolari”. Non solo quest’ultimo era la scelta di default, ma misteriosamente veniva resettato così dopo poco tempo. Adesso pare che il sistema sia tornato come prima. Tutto bene? No.

Su Mastodon MacFranc segnala questo articolo di Nature, in cui uno studio mostra come la modifica sia stata tutto tranne che impercettibile. Nello studio, condotto nel 2023 e durato sette settimane, si è verificato cosa succedeva passando da un feed cronologico a uno algoritmico, e si è scoperto che nel secondo caso Elonio dava più spazio ai commentatori conservatori: questo ce lo potevamo aspettare. Finito l’esperimento, anche se tornavano al feed cronologico gli utenti continuavano però a seguire questi commentatori! Anche questo l’avrei potuto immaginare, pensandoci su: se leggi qualcuno che non ti fa venire il cimurro ma trovi almeno in parte decente puoi decidere di continuare a leggerlo, se non ti passa davanti sicuramente non lo leggerai.

Insomma, la mia ipotesi è che questo passaggio sia stato fatto apposta per orientare ancora di più la base degli utenti…

Addizione pitagorica

Sappiamo tutti che l’ipotenusa di un triangolo rettangolo di cateti 3 e 4 è lunga 5. Cosa succede se invece che scrivere \( \sqrt (3^2 + 4^2) = 5 \) decidessimo la formula 3 ⊕ 4 = 5? Avremmo definito una nuova operazione, che possiamo chiamare addizione pitagorica. Che proprietà ha questa operazione? Innanzitutto è commutativa, come la normale addizione: \( a \oplus b = b \oplus a \). È anche associativa: \( ( a \oplus b ) \oplus c = a \oplus (b \oplus c) \), e quindi possiamo scrivere \( a \oplus b \oplus c \) senza parentesi, il che tra l’altro ci dà la lunghezza della diagonale maggiore di un parallelepipedo. E ovviamente – non ve lo devo mica dimostrare, vero? – abbiamo che \( a \oplus b \lt a + b \), a meno che uno tra i due operandi sia nullo.

Ma ci sono anche altri usi dell’addizione pitagorica, tanto che molti linguaggi di programmazione la implementano come la funzione hypot (ipotenusa, senza grande fantasia). Per esempio, se dobbiamo convertire un numero in coordinate cartesiane \(a, b\) nell’equivalente in coordinate polari \(r, \theta \) applichiamo le formule \( r = x \oplus y; \theta = \textrm{atan2}(y,x) \). Un altro uso è quello per calcolare il valore efficace, detto anche media quadratica, di due valori, che è dato dalla loro somma pitagorica scalata di un fattore \( \tfrac{1}{\sqrt 2} \); più in generale la media quadratica di \( n \) valori ha come fattore di scala \( \tfrac{1}{\sqrt n} \).

Una curiosità è che nella maggior parte dei casi pratici di operazioni fatte al computer la radice quadrata serve solo per calcolare l’addizione pitagorica. Soprattutto con i primi calcolatori, quindi, si è cercato di trovare un algoritmo meno complesso computazionalmente, e già che si era lì di trovarlo “robusto”. Se i due operandi sono molto grandi, infatti, il calcolo naïf può portare a un overflow. Nel 1983 hanno così descritto un metodo iterativo che sostituisce man mano ai due numeri di partenza altri due numeri con la stessa somma pitagorica ma col secondo che diventa sempre più piccolo: quando arriva praticamente a zero, per definizione il primo numero è il risultato. Oggi ci sono metodi molto più semplici, anche perché possiamo permetterci il lusso di avere tabelle di lookup molto grandi che riducono enormemente il numero di operazioni necessarie; ma volete mettere il divertimento dei due ricercatori?

Ritorno a casa (teatro)

foto dalla pagina corrispndente del Piccolo Teatro Ritorno a casa è stato ideato da Harold Pinter nel 1965, quindi l’anno scorso ha compiuto 60 anni e Massimo Popolizio ha portando in scena lo spettacolo, che in queste settimane è al Piccolo Teatro Grassi (con tutto esaurito). Che posso dire? Come afferma il libretto di scena, la nuova traduzione a cura di Alessandra Serra aggiunge dei tratti più da commedia a quelli di un’opera che nasce per essere politica, anche se Pinter ai tempi lo negò espressamente: basti pensare al “ci ha fregato” con cui lo spettacolo si chiude.
Personalmente ho trovato la prima parte piuttosto pesante, con l’interazione tra Max e Lenny – ma anche quella tra Teddy e Ruth – piuttosto pesanti. la recitazione si risolleva a partire dall’incontro tra Ruth e Joey, dove si intravede dove si sta andando a parare: da lì in poi l’affiatamento è molto maggiore. Tenuto conto che Popolizio ha costruito la rappresentazione su sé stesso, essendo anche il regista, non ha molto senso parlare degli altri attori, se non per dire che i movimenti fatti fare a Lenny e Joey, soprattutto al primo (passi per il secondo, che fa il pugile dall’inizio alla fine…) sono piuttosto incongrui. Popolizio mantiene bene la scena, per fortuna. La parte di Sam serve soprattutto come contraltare, e il suo lavoro è fatto bene.

La Stanza cinese ai tempi degli LLM

Nel 1980 il filosofo John Searle propose un esperimento mentale, chiamato in seguito “la Stanza cinese”, per mostrare che secondo lui non era possibile affermare che un computer potesse essere considerato cosciente. L’esperimento funziona così: Searle è chiuso in una stanza, con un manuale di istruzioni, carta e penna. La stanza ha due fessure (oltre, si spera, a un modo per dare al povero Searle da mangiare e da bere): da una vengono inseriti dei foglietti con dei simboli, che Searle prende. Consultando il manuale per sapere che fare, il filosofo traccia degli altri simboli su un foglio che poi fa passare dall’altra fessura. Supponiamo ora che i simboli siano in effetti ideogrammi in cinese, e che il manuale sia composto in modo tale che il foglio rimandato indietro contenga la risposta alla domanda datagli (sempre in cinese). Bene, conclude Searle, penserete mica che io conosca il cinese? Mi sono semplicemente limitato a eseguire un programma, esattamente come farebbe un computer. Quindi è ovvio che il computer non può essere cosciente.

Nel 1980 la Stanza cinese era appunto solo un esperimento mentale, e la risposta che veniva data era “non è Searle a sapere il cinese, ma il sistema Searle + manuale + stanza”: spostare insomma il punto di osservazione. Nel 2026 ci stiamo avvicinando ad avere qualcosa di davvero esistente, anzi molti direbbero che ce l’abbiamo già, allucinazioni a parte. E dunque? In un suo post, Se Gyges riprende le argomentazioni di Searle (che tra l’altro è morto lo scorso settembre) guardandole da un modo puramente computazionale. Il cinese è una lingua più compatta dell’inglese, per non parlare dell’italiano: possiamo immaginare che in 100 ideogrammi si possa esprimere una qualunque domanda. Sempre per comodità immaginiamo che vengano usati solo i 20000 ideogrammi più comuni. Con questi numeri viene fuori che il manuale (la lookup table di cui parlavo qualche settimana da sarebbe dell’ordine di 10^430 sequenze. Considerando che si ritiene che il nostro universo abbia un ordine di 10^80 atomi, ci occorrerebbero 10^350 altri universi come minimo per gestirlo. Questo significa che per avere qualche speranza di far funzionare la cosa il punto non è avere una stanza sufficientemente grande, ma ridurre la dimensione del manuale, e questo a sua volta significa non solo che il manuale deve avere una certa conoscenza del cinese (non necessariamente nel senso di avere un insieme di regole come i sistemi esperti che erano di moda ai tempi di Searle: abbiamo visto che ciò non è necessario) quanto nel ridurre la quantità di dati necessari da salvare. Ma anche in questo caso la struttura della “stanza” deve essere ottimizzata, con livelli vari di comprensione e una gestione dello spazio tale da minimizzare il tempo necessario per trovare cosa inviare come risposta. Gyges dice “questo assomiglierebbe sempre più a un cervello”; il mio punto di vista è un po’ diverso.

Io non sono così interessato a definire un modello fisico per la Stanza cinese e adattarlo a un LLM, quanto a vedere quali analogie ci sono. Quindi accetto senza problemi il fatto che gli strati nascosti delle reti neurali possano fare da manuale, e ovviamente – cosa che non è mai stata esplicitata nell’esempio sopra – non è scritto da nessuna parte che ci sia un unico modo di comporre simboli su un foglietto a partire da quelli che si trovano nel foglietto in ingresso: anzi, se non fosse così secondo me avremo dei forti problemi. Ma quello che mi pare succeda in questo momento è che il “manuale” è troppo compresso, il che vuol dire che il sistema parte troppo spesso per la tangente (le allucinazioni) per la banale ragione che confonde foglietti chiaramente diversi, o se preferite una spiegazione più tecnica perché la riduzione dimensionale dello strato interno, che è necessaria per creare i cluster relativi ai concetti, essendo puramente statistica può dare una grande quantità di falsi positivi. Sarà possibile trovare un modo per mantenere un “contesto globale”, cosa diversa da quella che stiamo facendo adesso? Se sì, dal mio punto di vista posso accettare che quel modello abbia una consapevolezza: ma per il momento la risposta è un secco no.

Quizzino della domenica: dadi riordinati

788 – combinatorica

Immaginate di lanciare cinque dadi (a sei facce e non taroccati), e di scrivere a vostra scelta un numero di cinque cifre con i valori ottenuti. Qual è la probabilità che siate in grado di ottenere un multiplo di 25?

due dei cinque dadi
(trovate un aiutino sul mio sito, alla pagina https://xmau.com/quizzini/p788.html; la risposta verrà postata lì il prossimo mercoledì. Problema da Ritangle 2025; immagine di j4p4n, da OpenClipArt.)


Saranno passati quindici anni…

Dal blog è possibile inviarmi un messaggio, come ho detto qualche volta. Stamattina me ne è arrivato uno da un improbabile indirizzo Dr. Lydia Williams (che non penso sia la portiera della nazionale australiana di calcio) con testo

Hi there,

I have spotted a broken link on your website.

Is this the right place to report it?

Best,
Lydia

Quindici anni fa, quando i blog erano di moda, mi era capitato di ricevere un messaggio di questo tipo, che nasce evidentemente per cercare un’interazione: di link 404 da me ce ne sono a bizzeffe, ma se uno fosse davvero così gentile da segnalarmeli, a parte che presumibilmente mi scriverebbe in italiano e non in inglese, mi direbbe anche qual è il link che non funziona. Mi stupisco che ci sia ancora qualcuno che lo faccia.

Matematici a fumetti (libro)

copertina Questo libretto nasce da un progetto della SUPSI (trovate tutto, anche il fumetto, sul loro sito): la matematica Silvia Sbaragli, con la collaborazione del disegnatore Andrea De Carli, ha immaginato che la ragazzina Ellie, con ben poca voglia di studiare matematica, usi l’ultima invenzione di suo zio Angelo e incontri i grandi matematici del passato. Le storie sono però una scusa per introdurre concetti matematici: l’ultima vignetta di ciascun incontro spiega infatti come funziona quello che è appena stato raccontato.
A me lo stile dei disegni non piace molto, ma ho apprezzato il metaumorismo che spunta qua e là, e spero che il libro possa piacere ai veri destinatari, cioè le ragazze (più che i ragazzi, secondo me)

Silvia Sbaragli e Andrea De Carli, Matematici a fumetti, Dedalo 2021, pag. 64, € 17, ISBN 9788822057068 – come Affiliato Amazon, se acquistate il libro dal link Bezos mi dà qualche centesimo dei suoi utili
Voto: 4/5

Errore HTTP 418

L’altro giorno ho aperto un sito e mi è arrivato un messaggio di errore “418 I’m a teapot”. Sono andato a cercare informazioni, e ho scoperto che quel codice di errore era stato ideato come pesce d’aprile nel 1998 (RFC 2324, Hyper Text Coffee Pot Control Protocol), con il significato “Il server si rifiuta di fare il caffè perché è una teiera”. Attenzione: se il server è una macchinetta del caffè che può erogare caffè e tè ma ha finito il caffè l’errore sarebbe diverso (503, server non disponibile). Il codice di errore è stato usato così tanto che l’RFC 9110 ha deciso di riservare quel codice, per evitare problemi futuri.

Ah, non confondete questo messaggio di errore con HTTP 451, “Unavailable For Legal Reasons”, che è stato definito apposta con quel numero…