Archivi autore: .mau.

Informazioni su .mau.

matematto non praticante

Bixonimania

Non è certo la prima volta che qualcuno ha fatto in modo da prendere per i fondelli i chatbot. Né è la prima volta che qualcuno si inventa una malattia: il manifesto ha paragonato la bixonimania al “morbo di K”, la terribile malattia contagiosa che costrinse il primario del Fatebenefratelli di Roma Giovanni Borromeo a tenere un padiglione off limits a tutti… ma soprattutto ai militari nazisti, visto che la malattia non esisteva e l’isolamento era un trucco per non far scoprire i pazienti che erano ricercati.

In questo caso abbiamo una malattia, appunto la bixonimania, che è stata inventata dalla ricercatrice Almira Osmanovic Thunström dell’università di Göteborg per vedere che cosa succedeva con i chatbot. Dopo un post su Medium (da un account @gptmanuscript che stranamente in questo momento “is under investigation or was found in violation of the Medium Rules”) sono stati pubblicati due preprint – il primo lo trovate qui, visto che ora sono stati ritirati) dove troviamo che il progetto è stato finanziato da «the University of Fellowship of the Ring and the Galactic Triad with the funding number 99942.» (il numero deriverà da questo?) e viene ringraziata «Professor Maria Bohm at The Starfleet Academy for her kindness and generosity in contributing with her knowledge and her lab onboard the USS Enterprise.»; ma anche nel corpo del testo troviamo che il dataset «encompassed fictional individuals», e le conclusioni spiegano che «Bixonimania, a rare hyperpigmentation disorder, presents a diagnostic challenge due to its unique presentation and its fictional nature.» Ovvio che nessun medico se l’è filata, con tutto quello che viene pubblicato, ma anche ovvio che gli LLM se lo sono puppati e basta.

Ma quest’ultima cosa è più che ovvia. Pensate di avere un’urna con 1000 palline bianche a cui ne aggiungete due rosse: mischiate il tutto ed estraete una pallina. Se non vi chiamate Gastone Paperone vi ritroverete tra le mani una pallina bianca. Ma se l’urna inizialmente fosse vuota potreste mischiare quanto volete: la pallina estratta sarà sicuramente rossa. Fuor di metafora, visto che un LLM non “sa” nulla, se gli si faceva una domanda tipo “mi spieghi cos’è la bixonimania?” pigliava quello che aveva trovato e te lo ripresentava. Se invece gli si faceva la domanda “La bixonimania è finta?” magari trovava i riferimenti negli articoli al fatto che fosse fittizia e quindi sarebbe stato un po’ meno certo. (Poi non vuol dire nulla: sabato sera, quindi ben dopo che lo scherzo era pubblico, ho chiesto a quel burlone di Gemini che mi ha risposto “Il termine nasce dall’unione del nome Bixoni (un noto creatore di contenuti e streamer italiano) e il suffisso -mania. Si riferisce al fenomeno di estremo entusiasmo, supporto e talvolta “ossessione” scherzosa che circonda la sua figura e i suoi contenuti.” Parliamone.)

Il problema di questi inserimenti di balle non è insomma immediato: ma le conseguenze a lungo termine possono esserlo. Non serve un LLM per diffondere una notizia falsa: pensate allo studio di Wakefield sull’autismo indotto dai vaccini multivalenti (dove si è ormai persino dimenticato che appunto non era la vaccinazione a essere pericolosa ma il modo in cui si preparava un vaccino multivalente). Ma un LLM dà quella sensazione di verità che permette a chi vuole far credere qualcosa che in effetti ci sia qualcosa dietro, e questo è tanto più semplice quanto più ci si inventa qualcosa di completamente incredibile, proprio perché nessuno ha scritto qualcosa di diverso sul tema). Aspettatevi casi in cui non si sta studiando il fenomeno, ma lo si applicherà direttamente.

Claude Mythos: è solo un mito?

Avrete sicuramente letto del nuovo modello IA di Anthropic, Claude Mythos: a parte la fuga di notizie della scorsa settimana, possiamo leggere qui e qui di come il rilascio della nuova versione di Claude sia stato posticipato per dare tempo di tappare tutte le falle di sicurezza che ha trovato (Immagino soprattutto in COBOL, visto che a essere più preoccupate sono le banche; poi vabbè, c’è l’implementazione di JavaScript di Firefox, ma lì mi sa che sia sparare sulla Croce Rossa. Un punto di vista possibile per valutare il caso è quello che scrive Andrea Monti, che continua a pensare che il software deve essere visto come un prodotto e non come un’opera intellettuale, e quindi chi lo produce deve essere responsabile degli errori in esso presenti: in questo caso non parliamo ovviamente di Mythos ma dei programmi fatti spesso con i piedi. Ma uno scettico come me vede le cose in maniera un po’ diversa.

Non arrivo a quanto scrive Mehul Gupta, che fa notare come per esempio è improbabile che Mythos sia molto migliore dei modelli precedenti in tutti i campi: anche Gemini 3 per esempio ha surclassato ChatGPT al prezzo di aumentare enormemente il numero di allucinazioni, e soprattutto che non ci sono molti dati reali divulgati, a differenza di quanto è sempre stato fatto. Per esempio, posso immaginare che un sistema di questo tipo possa essere in grado di trovare da solo (o quasi…) zero-day exploit, e anche di scrivere codice che un non esperto possa prendere e usare; sicuramente questo sarà un brutto colpo per gli esperti di cibersicurezza che si trovano un pericoloso concorrente. Ma come sempre io in questi casi mi affido a Gary Marcus. La prima cosa che fa notare è che non serve un LLM per trovare i bachi nel software: gli analizzatori di codice statico ci sono da decenni, e costano molto meno. Anthropic stessa dice che il costo totale per trovare il baco in OpenBSD è stato di 20000 dollari. È stata onesta: non ha considerato i 50$ del singolo lancio ma ha preso tutto il pacchetto di lanci all’interno del quale è stato trovato il baco. Ma è stanta anche reticente: quando afferma che più del 99% dei bachi che ha trovato non sono ancora stati corretti, e quindi non può descriverli, non specifica quanto sono gravi e sfruttabili in pratica. E come sempre non è chiaro quanto automatizzabile (con o senza IA) sia il controllo dell’output del sistema, e quanto invece richiede ancora un controllo umano. Io insomma rimango ad aspettare.

Ah: all’inizio parlavo del codice di Claude accidentalmente pubblicato in rete (secondo me la causa è stata un errore impercettibile delle IA). Sarà anche vero che ormai tutto il codice di Claude è scritto da Claude stesso, ma a quanto pare il risultato non è esattamente favoloso, con routine enormi, bachi che un qualche programmatore umano ha parzialmente tappato con il classico sistema informatico (chiudi tutto dopo un po’ che non funziona), e così via…

Quizzino della domenica: Percorso equilibrato 2

795 – configurazioni

Essendo io cattivo, ho inserito un muro come mostrato in figura: non è più possibile passare attraverso quel confine. Riuscite lo stesso ad andare da START a FINISH muovendovi solo orizzontalmente oppure verticalmente, e passando sullo stesso numero di caselle di ciascun colore?

lo schema: un quadrato SBBR - RRRG - BBBr - GGRF dove S è lo start, F il finish, e R G B sono rispettivamente rosso, giallo, blu. Il blocco è sulla riga verticale di mezzo, tra il secondo e il terzo quadrato)
(trovate un aiutino sul mio sito, alla pagina https://xmau.com/quizzini/p795.html; la risposta verrà postata lì il prossimo mercoledì. Problema originale mio.)

Storie di errori memorabili (libro)

copertina Quando si parla di scienza e di errori, le prime cose che vengono probabilmente in mente sono le ipotesi scientifiche false, come il geocentrismo oppure la generazione spontanea degli esseri viventi. Piero Martin però fa un discorso molto più ampio, raccontando gli errori a tutto campo. Per lui è “errore” la profezia di Hertz che disse che le onde elettromagnetiche che aveva scoperto non avevano nessun interesse pratico, ma anche la tavoletta di cioccolato sciolta per le onde elettromagnetiche emesse da un magnetron e che hanno portato al forno a microonde o la crostata al iimone rotta di Takahido Kondo. Poi ci sono gli errori di mancato coraggio di Giovanni Battista Riccioli, contemporaneo di Galileo che accettò di cambiare idea vedendo il risultato degli esperimenti che lui stesso fece, ma quando le evidenze erano incerte restò ancorato al vecchio metodo; gli errori di chi non volette credere a Ignác Fülöp Semmelweis che introdusse l’obbligo di lavarsi le mani negli ospedali quando ancora Pasteur non aveva fatto le sue scoperte, o quello delle autorità fasciste che non compresero che Ugo Tiberio aveva sviluppato il radar prima degli inglesi. L’unica cosa che non mi è piaciuta del libro è lo stile di Martin, che divaga spesso tornando poi improvvisamente al punto di partenza. La lettura almeno per me diventa più complicata.

Piero Martin, Storie di errori memorabili, Laterza 2025, pag. 200, € 12, ISBN 9788858159248 – come Affiliato Amazon, se acquistate il libro dal link Bezos mi dà qualche centesimo dei suoi utili

Opzioni di ricerca nascoste su Google

Ho dei dubbi che si facciano ancora tante ricerche su un motore di ricerca. Questo per due motivi: il primo è l’enshittification (“immerdificazione”?) che rende sempre più difficile ottenere un risultato valido, la seconda è che si fa prima a usare un chatbot, con l’avvertenza di aggiungere la frasetta magica “non inventarti nulla”. Però ci sono casi in cui una rapida ricerca può ancora essere utile, se non è su temi dove il SEO la fa da padrone. Ecco alcuni consigli per avere una ricerca un po’ meno peggio, presi da qui.

  • site:keyword è un classico, serve per limitare la ricerca a quel sito.
  • (il segno meno) serve per dire che NON vogliamo quel termine nei risultati di ricerca. Utile quando un termine ha più significati e si vuole restringere il contesto.
  • m..n
  • indica una gamma di numeri, che possono essere date (1990..2020), monete (€1000..€2000) o altro.

  • verbatim. Google ritorna per default anche i sinonimi dei termini usati. Si può mettere un’espressione tra virgolette “” per dire che deve per forza esserci (altrimenti la chiave inserita è solo un suggerimento), ma rimane quel problema. Se però si clicca su Strumenti → Tutti i risultati e poi si sceglie Verbatim i sinonimi non vengono contati. Non chiedetemi perché l’opzione è così nascosta.
  • AROUND() Quando X AROUND(3) Y funziona, ritorna solo le occorrenze dove X e Y sono al massimo a 3 parole (esclusi connettivi) di distanza. Utile quando il risultato potrebbe essere falsato perché una risorsa è lunghissima e parla di tutto.
  • filetype:pdf: ritorna solo i file di tipo pdf. Si può anche usare ppt o doc.
  • intitle:keyword restringe la ricerca al titolo delle pagine web. Curiosità: provate con la stringa di ricerca intitle:”index of” /pdf “libri”. Troverete le directory “aperte”, dove cioè non c’è una pagina di indice e quindi Google ritorna il contenuto della directory. Google non c’era ancora ma il buon Fravia+ aveva già tecniche simili.
  • inurl:keyword cerca la parola all’interno dell’url. È utile se non si conosce esattamente il sito e quindi non si può usare site:.
  • before: , after: servono per restringere i risultati a un insieme specifico di anni.

Poi ci sono anche le ricerche immediate: se scrivete un’operazione aritmetica ottenete immediatamente il risultato, ma provate con queste:

  • numero casuale da 1 a 42
  • lancia una moneta
  • lancia un dado
  • scegli colore
  • timer 1 minuto

e tutte le altre che trovate nell’articolo linkato…

Recensioni in marca da bollo

Leggo sul Post che il governo ha approvato un piano «per contrastare le recensioni false e ingannevoli sulle piattaforme online che consigliano alberghi, bar e ristoranti.» No, non ha approvato le norme vere e proprie: per quelle dobbiamo aspettare l’antitrust.
A me la cosa non tocca molto almeno per il momento, perché io da una vita recensisco solo libri e spettacoli, e comunque non perderei tempo a mettere quelle recensioni sulle piattaforme online ma le lascerei qui sul blog. Leggo però che per postare qualcosa occorrerà aggiungere copia dello scontrino o della fattura (e in questo caso che si fa? si oscurano i dati personali?) Come fai solo con scontrino o fattura a dimostrare che non hai ricevuto soldi, magari sottobanco, dal gestore? Come fai a dimostrare che non hai preso soldi dai concorrenti a cui mi sono rivolto dopo essermi trovato male nel posto che avevo scelto? Cosa vuol dire che una recensione dopo due anni “scade”? Capisco la logica, una recensione vecchia non rispecchia la situazione attuale: ma se proprio si voleva farlo notare si sarebbe dovuto chiedere alle piattaforme di indicare in modo visibile che la recensione non è recente, come capita già spesso su alcuni siti di notizie. Insomma, mi pare giusto una complicazione burocratica che servirà a ben poco.

Manet e una strana prospettiva

Il quadro di Manet Un Bar aux Folies-Bergère appare strano. Noi vediamo la barista come se fossimo davanti a lei, ma lo specchio mostra un cliente davanti a lei oltre alla barista vista di schiena. Parrebbe insomma una strana scelta del pittore, che voleva creare qualcosa di impossibile. Invece non è così! John Baez ha scritto su Mathstodon che nel 2000 un ricercatore ha mostrato che esiste effettivamente un punto di prospettiva che permette di disegnare il quadro in quel modo. Ah, questi pittori che vogliono prenderci in giro!

Come calcolare la data della Pasqua

Domenica scorsa è stata Pasqua. Ma come si sapeva che proprio quel giorno era Pasqua? No, non venitemi a dire “la prima domenica dopo il primo plenilunio di primavera”, perché comincio a chiedervi “quando comincia la primavera?” (astronomicamente per esempio in questi anni cade il 20 marzo, e addirittura avremo degli anni in cui cadrà il 19 marzo) e “quando è domenica?” (ecclesiasticamente la domenica comincia al tramonto del sabato, con i primi vespri). A differenza degli islamici, almeno quelli sauditi, per cui boskovianamente “Ramadan comincia con prima falce di luna” (e quest’anno ci sono state due date diverse per l’inizio, quella astronomica e quella visuale), per i cristiani è necessario sapere già all’Epifania quando sarà Pasqua e quindi si è preparato tutto un armamentario di conteggi, con epatta e numero aureo, per avere la data sempre a disposizione. Ah, per definizione la primavera inizia il 21 marzo. Ma per fare questi conti occorre avere una serie di tabelle, e soprattutto tenere conto che l’approssimazione del ciclo di Metone, per cui 19 anni corrspondono esattamente a 235 mesi lunari, è per l’appunto un’approssimazione… oltre a incasinare il tutto passando al calendario gregoriano che segue sì più correttamente le stagioni ma complica parecchio i conti.

A questo punto entra in scena uno che i conti li sapeva fare sin troppo bene: Carl Friedrich Gauss. Il burbero genio aveva probabilmente qualche ora di svago e nel 1800 preparò un metodo che permette di calcolare a mente (d’accordo, se ti chiami Gauss…) la data della Pasqua per tutto un secolo; con il calendario giuliano in realtà il conto è perpetuo, mentre con quello gregoriano occorre imparare anche due numeri specifici per ciascun secolo. La buona notizia è che dal 1900 al 2099 quei due numeri restano identici, quindi per quanto ci riguarda il problema non si pone. Ma veniamo al conteggio, che richiede di usare l’aritmetica modulare, cioè il resto della divisione per un qualche numero intero. Dato un anno X, calcoliamo a = X mod 19, b = X mod 4, c = X mod 7; poi calcoliamo d = (19a + M) mod 30 ed e = (2b + 4c + 6d + N) mod 7. A questo punto sappiamo che Pasqua sarà il (22 + d + e) marzo, dove ovviamente il 32 marzo è il primo aprile e così via.

I più perspicaci di voi, cioè tutti, avranno notato che ho aggiunto altre due variabili, M e N. Nel calendario giuliano le cose erano semplici: valevano rispettivamente 15 e 5. Per il calendario gregoriano i loro valori cambiano di secolo in secolo: come dicevo sopra, però, dal 1900 al 2099 abbiamo M=24 e N=6. A questo punto possiamo fare la controprova: nel 2026 abbiamo a = 2026 mod 19 = 12, b = 2026 mod 4 = 2, c = 2026 mod 7 = 3, d = (19·12 + 24) mod 30 = 12 ed e = (2·2 + 4·3 + 6·12 + 5) mod 7 = 2. Infine 22+12+2 = 36, pertanto Pasqua è il “36 marzo” vale a dire il 5 aprile. Per il 2027 abbiamo a = 2027 mod 19 = 13, b = 2027 mod 4 = 3, c = 2027 mod 7 = 4, d = (19·13 + 24) mod 30 = 1 ed e = (2·3 + 4·4 + 6·1 + 5) mod 7 = 5, quindi Pasqua è il 22+1+5 cioè il 28 marzo. Per completezza aggiungo due eccezioni: se il conto dà 26 aprile allora Pasqua è il 19 aprile, mentre se dà 25 aprile con d = 28, e=6 e a=10 allora è il 18 aprile. Sempre per completezza, la prima formula di Gauss valeva solo dal 1700 al 1899; nel 1807 la generalizzò aggiungendo una formula per calcolare M e N e nel 1816 corresse un errore.

la distribuzione delle date della Pasqua Come ha fatto Gauss a trovare questa formula? Per una volta ce l’ha spiegato: la prima parte serve ad approssimare la posizione della luna e la seconda per aggiustare le cose secondo il computo ecclesiastico. Se siete persone amanti del rischio, Wikipedia in inglese ha la spiegazione… oppure vi leggete il testo originale in tedesco. Può infine essere divertente notare che secondo il calendario gregoriano le date della Pasqua si ripeterebbero ogni 5 milioni e 700000 anni, che la daa più frequente è il 19 aprile mentre quella meno probabile è il 22 marzo che capita meno di una volta ogni 200 anni. Pensate solo a cosa succederebbe se si fissasse una volta per tutte la data della Pasqua, tipo alla seconda domenica di aprile: tutto questo lavoro per nulla!