Un paio di cose su Wikipedia

È un po’ che non scrivevo di Wikipedia: il tempo è poco e le cose da fare sono molte. Dovrei anche parlare della chiusura di Wikinews, ma sarà per un’altra volta. Per il momento segnalo due articoli piuttosto diversi ma che fanno capire come 25 anni sono un bel peso per l’enciclopedia.

Il primo articolo, pubblicato su Link, è in realtà fuorviante e lo segnalo solo perché è un classico esempio di una traduzione che non ha davvero molto senso. È vero che la Wikipedia in lingua inglese ha voci francamente bizzarre per non dire peggio, ma ogni edizione linguistica ha le sue regole interne e in quella italiana queste voci sono generalmente eliminate, così come quelle di eventi che probabilmente tra una settimana saranno dimenticati. Questo non vuol dire che non ci siano voci che uno non si aspetterebbe in un’enciclopedia, come per esempio “igiene anale” (la voce sull’orientamento dei rotoli di carta igienica è stata assorbita da quella sulla carta igienica su Wikipedia in lingua italiana, ma rimane in quella in inglese e in altre 19 edizioni linguistiche). Diciamo che molto spesso gli articoli di costume su Wikipedia sono semplici traduzioni e quindi essenzialmente anglocentrici.

Più interessante quest’altro articolo di Dariusz Jemielniak (uno che di Wikipedia ne sa, oltre che essere un accademico.) Il suo punto di vista è che Wikipedia è nata venticinque anni fa da nerd ventenni, massimo trentenni (io avevo già passato i quaranta, ma si sa che sono anzyano) e ora ci sono sempre loro, diventati ormai cinquantenni e quindi pompieri da incendiari che erano. Tutte le modifiche proposte per “semplificare” fruizione e contribuzione a Wikipedia sono così state bloccate, e questo sarebbe un male. Ora, posso assicurarvi che la prima versione del Visual Editor che si voleva rendere obbligatoria per modificare le voci era una cosa del tutto inusabile. (Ora funziona abbastanza bene, ma sono passati tredici anni…) Dal mio punto di vista il problema è appunto che le nuove feature introdotte dagli sviluppatori sono spesso in versione alfa, e sono introdotte nella speranza che vengano debuggate “sul campo”: ma gli editor abituali non hanno voglia di perdere tempo, e gli utenti casuali si trovano ancora più persi. Più interessante l’altro punto portato da Dariusz, e che riguarda direttamente i lettori. Visto che ormai le nuove generazioni non sono in grado di leggere direttamente un testo complesso ma hanno bisogno di un riassuntino, così come i capi e capetti, l’idea della Wikimedia Foundation era stata quella di creare i “Simple Article Summaries”, generati per mezzo dell’IA. La comunità anglofona ha avuto una reazione contraria così violenta che dopo un giorno la feature è stata eliminata.

Parliamone un po’. Sul fatto che un riassunto breve e semplice, almeno per le voci più lette, sarebbe utile penso che tutti siamo d’accordo. E del resto la Wikipedia delle origini era molto più ruspante. E possiamo anche immaginare che un LLM bene addestrato non farebbe molte allucinazioni e soprattutto possiamo sperare che userebbe solo il testo della voce per fare il riassunto, e non aggiungerebbe altre informazioni prese chissà dove. Ma siamo sicuro di volere passare a un modello IA, quando il valore aggiunto di Wikipedia è che nel bene o nel male il materiale è generato da utenti reali? Io potrei al più accettare un pulsante che ti porti fuori da Wikipedia (anche se su un server della Wikimedia Foundation) e mi creasse lì il riassunto: ma voglio che due cose essenzialmente diverse siano in posti essenzialmente diversi. Sono anch’io un vecchio bacucco? Probabile. Ma non ce lo ordina il dottore di usare Wikipedia: possiamo sempre andare da Elonio e dalla sua Grokipedia, se proprio vogliamo essere moderni.

I codici di Golay

La teoria dei codici a correzione di errore è molto ampia, perché ci sono vari tipi di errore possibile quando viene trasmessa una codifica (diciamo binaria) del dato, e il valore a priori della probabilità di un errore fa scegliere un metodo rispetto a un altro. Per esempio, i primi codici ASCII erano a 7 bit in modo da usare l’ottavo come codice di parità: in questo modo ci si poteva accorgere di un singolo errore, anche se non si sapeva su quale bit, e chiedere che il carattere venisse ritrasmesso. Naturalmente già quand’ero ragazzo io non valeva più la pena di testare per un errore la cui probabilità era infima, e così si passò alle codifiche che usavano tutti e otto i bit.

Ma cosa succede quando arrivano i segnali da una sonda spaziale? Come potete immaginare, il tasso di errore è molto più alto, e soprattutto farsi rispedire i dati non è in genere un’opzione usabile. Servono quindi altri tipi di codice: quello che per esempio è stato usato sulle sonde Voyager 1 e Voyager 2, che non avevano molta memoria a disposizione e quindi dovevano mandare subito via i dati ottenuti, è il codice di Golay. Esso trasforma un insieme di 12 bit in uno da 24. Raddoppiamo insomma il materiale da spedire: però se mandassimo due copie identiche potremmo al più accorgerci che c’è qualche errore, mentre in questo modo possiamo ricostruire qual era il messaggio originale se tra quei bit ce ne sono fino a tre sbagliati, e se ce ne sono quattro possiamo comunque sapere che c’è stato un errore. (Con più di quattro errori sbagliamo proprio a ricavare il messaggio originale, ma se ci sono così tanti errori possiamo fare davvero poco, a meno di creare codici enormi)

la matrice computazionale per il codice di Golay

codice di Golay (immagine di Parcly Taxel, da Wikimedia Commons)

Come funziona in pratica un codice di Golay? Si prendono i bit di input a dodici per volta, si costruisce un vettore (a dodici elementi) e lo si moltiplica per la matrice 12×24 mostrata qui sopra, ottenendo un nuovo vettore a 24 elementi che è quello che spediamo. (La moltiplicazione è binaria, il che significa che il risultato della moltiplicazione è da prendere modulo 2.) La cosa bella è che se prendiamo due qualunque tra i 4096 possibili vettori di input di 12 elementi e consideriamo gli output corrispondenti possiamo essere certi che ci saranno almeno otto bit diversi. Questa misura di diversità è la distanza di Hamming: come dicevo sopra, se l’output ci è arrivato corrotto per al massimo tre bit ci sarà un unico codice tra i 4096 di output per cui la distanza di Hamming è al massimo 3, e che è dunque quello effettivamente spedito: con quattro bit errati sappiamo che c’è stato un errore, ma non siamo in grado di scegliere tra i due codici vicini.

Si può persino fare (leggermente) meglio. L’ultimo bit dell’output è semplicemente un controllo di parità: se lo eliminiamo ci resta un codice che ha vettori di 23 but come output ed è un codice perfetto, nel senso che se associamo a ciascun codice di output tutti quelli che hanno distanza da lui al massimo 3 completiamo tutto lo spazio dei possibili 2^23 vettori di output. I codici perfetti sono piuttosto rari: il fatto che Golay ne riuscì a trovare uno anche abbastanza complicato nel 1949 la dice lunga sulla sua abilità.

Un’ultima curiosità: John D. Cook ha segnalato come Golay abbia anche ideato un codice ternario, dove i valori dei “trit” possono essere 0, 1, 2 (o −1, se lo volete bilanciato: tanto le operazioni in base 3 sono le stesse). In questo caso il codice esteso con il bit di parità trasforma sei trit in dodici, che hanno una distanza almeno 6 tra loro, mentre quello perfetto li trasforma in undici trit, che hanno una distanza di almeno 5. Peccato che non abbiamo computer ternari…

Pete Dello

Era il 1997. Fare una ricerca su Internet era persino più difficile di adesso: ora abbiamo l’enshittification e le allucinazioni prese per buone dai motori di ricerca, allora non c’era semplicemente materiale. Un giorno scoprii che la canzone Un angelo blu dell’Equipe ’84 era una cover (e fin qua nulla di strano) di un brano britannico, I Can’t Let Maggie Go, di una band di cui non avevo mai sentito parlare. Scrissi su Usenet un post con il testo che ero riuscito a capire della canzone (lo si trova ancora in rete), scrivendo nel titolo “Honeybus(?)”, e dopo qualche giorno ricevetti un’email dall’autore del brano, Pete Dello, che mi segnalò un errore (nel ritornello cantava “I see, I sigh”, non “I see, I say”), confermò che la band esisteva davvero, e che l’aveva lasciata subito dopo che quel brano era entrato in classifica, perché si sentiva troppo pressato e preferiva insegnare musica. (Leggo sull’obituary del Telegraph che passò a insegnare filosofia platonica).

Gli Honeybus ebbero vita breve e sfortunata: il singolo precedente, [Do I Figure] In Your Life, non entrò nemmeno in classifica. Oggettivamente non riesco a capire il motivo: il “pop barocco” suonato da loro era musicalmente molto interessante: come si può anche sentire nel brano She Sold Blackpool Rock, scritta dal compagno di band Ray Cane e di cui esiste anche una versione cantata in italiano. Ma la cosa più importante almeno per me è che Dello vide una citazione e pensò di scrivere a uno sconosciuto quale io ero un’email: non per lamentarsi che non conoscessi gli Honeybus ma per raccontarmi un po’ la loro storia. Non è facile trovare gente così, che non è interessata a restare sotto i riflettori, tanto che anche la sua morte è passata praticamente inosservata: è morto il 21 febbraio e l’ho scoperto per puro caso l’altro giorno.

(ho perso quella mail come tutte quelle fino al 2004 per colpa di un PC kaputt e di un CD-ROM illeggibile…)

non sappia la tua destra…

Il messaggio qui a sinistra mi è stato spedito da Google: ho controllato le header, il mittente è questo.

Received: from mail-sor-f69.google.com (mail-sor-f69.google.com. [209.85.220.69])
by mx.google.com with SMTPS id 5614622812f47-46aa03b09easor1978606b6e.9.2026.03.29.12.29.25

Come potete vedere, è (giustamente) finito nella cartella spam: ma non perché io avessi messo una regola, ma automaticamente in quanto “è simile a messaggi identificati in passato come spam”. Non è che la concorrenza interna in Google faccia qualche danno?

PS: ho controllato i settaggi di Google Play: io non ho chiesto l’invio di una qualsivoglia comunicazione.

Non è stato il bancomat a rendere obsoleti i bancari

Probabilmente vi sarete accorti anche voi che il numero di sportelli bancari, almeno nelle città, sta continuando a diminuire, e che anche quelli che sono rimasti aperti hanno un numero molto ridotto di impiegati. Naturalmente questo processo di riduzione non è avvenuto tutto di un colpo, ma si è consumato nel tempo. Ma a partire da quando? La risposta che probabilmente viene in mente è “da quando abbiamo a disposizione i bancomat, e quindi non dobbiamo più andare in banca a prelevare contanti. E invece no. David Oks mostra, dati alla mano, che anche dopo la diffusione dei bancomat il numero di bancari negli USA è continuato ad aumentare: meno di altri campi, ma comunque c’è stato un aumento del numero assoluto. Come mai? La spiegazine di Oks è che il numero di impiegati per sportello bancario si è ridotto, ma sono stati aperti molti più sportelli, perché era diventato più facile farlo. Inoltre le banche, oltre a risparmiare sul costo di una transazione al bancomat (un quarto di quello con un impiegato umano) potevano anche lucrare sulle commissioni interbancarie. Insomma, non è stata la tecnologia del bancomat a far fuori i bancari; questo nonostante il nome inglese degli sportelli automatici, ATM, sta per “Automated Teller Machine”, cassiere automatico.

Che cosa ha allora portato al taglio attuale dei posti di lavoro? Una tecnologia del tutto differente, dice Oks: l’iPhone (o in generale i furbofoni). Il punto è che il bancomat automatizza il lavoro del cassiere, ma questo è solo un ingranaggio di un sistema che ha bisogno di esseri umani in tutto il resto del processo: le banche hanno preso i cassieri, li hanno formati come consulenti finanziari e le cose sono andate avanti lo stesso. Con le app bancarie sul telefono, invece, tutta l’interazione con la banca può essere fatta attraverso il telefono, e non c’è più bisogno di una sede fisica per la banca. Del resto io ho anche un conto Revolut, e non credo che abbiano sportelli fisici da qualche parte in Europa, se non forse uno per nazione per dire che sono effettivamente una banca. Qualcuno potrebbe obiettare che l’home banking fatto al pc esisteva già da un pezzo; ma innanzitutto il telefono è per definizione ubiquo, e soprattutto ti permette di aggiungere un livello di sicurezza. Le operazioni con Revolut si fanno col telefono, non dal PC.

Che c’entra tutto questo con l’IA? Semplice. Al momento la stiamo usando per sostituire il lavoro umano, ma rimanendo all’interno dello stesso paradigma: pensate a Claude usato come programmatore junior. Ma prima o poi si ribalterà il paradigma e se ne costruirà uno basato sull’IA, che eliminerà tutto il lavoro umano attuale tranne quello che si trova agli estremi della catena: una piccola quantità di professioni ad altissimo livello e tanti lavori di bassa lega. Quando succederà? Non si sa. Tornando all’esempio dell’iPhone, Steve Jobs non l’aveva mica pensato per eliminare i bancari: il punto è proprio che per cambiare paradigma occorre una visione di tipo completamente diverso da quella attuale, non un semplice miglioramento continuo. Ma tenetene conto, quando leggete i commenti sulla “rivoluzione IA”; in realtà non c’è ancora stata.

Quizzino della domenica: La foresta della smemoratezza

793 – logica

Alice si trova nella Foresta della smemoratezza, e si è dimenticata qual è il giorno della settimana. Per strada incontra un Leone e un Unicorno che si stanno riposando all’ombra di un albero. Dovete sapere che il Leone mente di lunedì, martedì e mercoledì, mentre l’Unicorno mente di giovedì, venerdì e sabato; negli altri giorni dicono il vero. Naturalmente loro sanno qual è giorno della settimana, o se preferite la osa è irrilevante perché non lo fanno apposta a mentire in certi giorni.

Il Leone dice: “Ieri era uno dei giorni in cui mentivo”.
L’Unicorno dice: “Anche per me ieri era uno dei giorni in cui mentivo”

Che giorno è oggi?

i giorni della settimana
(trovate un aiutino sul mio sito, alla pagina https://xmau.com/quizzini/p793.html; la risposta verrà postata lì il prossimo mercoledì. Problema di Raymond Smullyan, da What Is the Name of This Book?)


The Mathematics Lover’s Companion (libro)

copertinaI libri che raccontano la matematica hanno un problema di base: i temi trattati sono sempre più o meno gli stessi, e quindi il povero autore deve trovare un modo per riuscire a distinguersi nel mare magnum di queste opere. Secondo me Schneierman ci è riuscito. Io con i miei soliti tempi mi ero comprato il volume non appena era stato pubblicato, e ne lo sono tenuto otto anni in libreria prima di leggerlo. Ora che finalmente ce l’ho fatta, posso dire di apprezzare le “note laterali” che affiancano il testo vero e proprio, e ho trovato alcune chicche che non conoscevo nonostante la mia non certo banale esperienza, come una nuova dimostrazione dell’infinità dei numeri primi e il modo di costruire terne pitagoriche usando numeri complessi. Anche lo stile di scrittura è piacevole: insomma un ottimo acquisto.

Ed Schneierman, The Mathematics Lover’s Companion : Masterpieces for Everyone, Yale University Press 2017, pag. 274, € 17,87, ISBN 9780300223002 – come Affiliato Amazon, se acquistate il libro dal link Bezos mi dà qualche centesimo dei suoi utili
Voto: 5/5

Addio a Sora

un esempio di video creato da SoraCome un fulmine a ciel sereno, OpenAI ha deciso di chiudere Sora, la sua app che permetteva di far generare all’IA. Come nelle peggiori storie non è stata data una spiegazione puntuale, ma non ci vuole molto a immaginare il motivo: costava troppo e non portava utili. Per la prima parte, il solito David Gerard segnala come un video di 10 secondi richiedesse l’equivalente di 40 minuti di uso continuo di una GPU, per un costo di un dollaro e trenta solo per la parte computazionale, oltre a quello necessario per selezionare i risultati migliori da presentare. Per quanto riguarda l’uso che veniva fatto, non so quanto ci fosse di davvero commerciale: mi sa poco, anche perché probabilmente costava meno girare un video e poi cambiare solo la faccia degli attori. Però la gente si dev’essere divertita molto: sull’ex-Twitter ho visto Gesù che vince una gara di nuoto camminando sull’acqua e il risultato del prompt «an Elaborate regency romance where everyone is wearing a live duck for a hat (each duck is also wearing a hat), a llama plays a flute, prestige drama». Apprezzabili per farsi una risata, ma oggettivamente non imperdibili.

Non credo che ci sarà un effetto valanga: come facevo notare all’inizio, i costi per generare un video sono di almeno un ordine di grandezza superiori a quelli anche solo di generazione di un’immagine, per non parlare dei testi. Però è un segnale da non sottovalutare: non possiamo aspettarci una crescita infinita dei sistemi IA se non si troverà un modo per farci veri soldi. Divertiamoci finché possiamo.