Archivi autore: .mau.

Informazioni su .mau.

matematto non praticante

Death on Omega Station (ebook)

copertina [Disclaimer: Ho ricevuto il libro grazie al programma Early Reviewer di LibraryThing] Certo, l’ambientazione è fantascientifica. Però il libro è fondamentalmente un hardboiled, il che non è poi così strano visto che French è stato un supervisore di scene del crimine. Da questo punto di vista il libro è una certezza: uno sa perfettamente come si dipanerà la storia, e quindi può concentrarsi sui particolari. In effetti il testo scorre piacevolmente, soprattutto nelle parti in cui il TrovaVerità terrestre e l’assistente alieno da lui nominato cominciano a trovare un loro modus operandi. Il libro probabilmente non vincerà il Pulitzer, ma è una lettura amena.

John L. French, Death on Omega Station, eSpec Books 2025, pag. 100, € 5,19, ISBN 9781956463361 – come Affiliato Amazon, se acquistate il libro dal link qualche centesimo va a me
Voto: 4/5

forse devo cambiare motore di ricerca

quale pagina Stavo guardando le ultime modifiche su Wikipedia in italiano, e ho visto che un utente anonimo aveva chiesto chi aveva la tessera 653 della P2. Ho fatto qualche ricerca e alla fine ho scoperto che bastava trovare la pagina Wikipedia relativa.

Due minuti dopo Google Opinion Rewards mi ha chiesto “Di recente hai effettuato una delle seguenti ricerche su Google?” (ed è la prima volta che mi fa una domanda simile, in genere chiede in quale negozio sono andato). Inutile dire che una delle opzioni era “elenco iscritti p2”. Sono andato avanti e ho scoperto l’arcano: il tutto era un test A/B. Come vedete nella schermata, mi chiedeva se preferivo avere la pagina di risposta con il riassunto AI oppure senza. Per la cronaca, io faccio le ricerche aggiungendo la stringa “?udm=14” che ritorna solo e unicamente i risultati web, quindi niente immagini, niente video e soprattutto niente AI. Evidentemente un qualche sistema automatico si è accorto che io faccio il cattivone e ha provato a chiedere lumi, compreso un mio feedback che potete tranquillamente immaginare quale sia stato.

Il guaio è che ultimamente Google fa schifo, ma gli altri motori di ricerca fanno pena. Insomma, che faccio?

Come generare punti casuali dentro un triangolo

John D. Cook mostra alcuni metodi per generare punti casuali all’interno di un triangolo ABC dato. Possiamo immaginare di lavorare in coordinate cartesiane, per semplicità, e quindi avere A, B e C come coppie ordinate di valori.

Il metodo più semplice è quello di usare coordinate baricentriche: generate tre numeri casuali α, β e γ tra 0 e 1, normalizzateli per far sì che la loro somma sia 1, e date come risposta αA + βB + γC. Il metodo genera punti che stanno tutti all’interno del triangolo: ma non sono uniformi, come si vede dalla figura qui sotto presa dal blog di Cook. I punti centrali del triangolo sono più probabili di quelli vicino ai vertici.

un triangolo generato casualmente con coordinate baricentriche.

Il secondo metodo è quello del rejection sampling. Costruite il rettangolo circoscritto al triangolo, generate due numeri casuali per la coordinata x e quella y, e controllate se il punto corrispondente sta all’interno del triangolo: se sì, bene, altrimenti lo buttate via. È evidente che in questo modo i punti generati e accettati sono distribuiti in modo casuale, perché tutti quelli nel rettangolo lo sono: il costo computazionale è di due insiemi di operazioni per numero scelto.

C’è poi un terzo metodo, quello del parallelogramma. Costruite un parallelogramma aggiungendo al triangolo una sua versione speculare, e generate punti a caso al suo interno, con la formula P = A + r₁·(B-A) + r₂·(C-A) dove r₁ e r₂ sono numeri casuali in [0,1]. Ora, se il punto generato si trova nel triangolo di partenza, e quindi r₁ + r₂ ≤ 1, bene; altrimenti prendete la sua immagine riflessa nel triangolo di partenza, usando (1-r₁, 1-r₂). Di nuovo, la casualità è assicurata. Il tutto è raccontato anche su Stack Overflow.

Quale conviene tra il secondo e il terzo metodo? Dipende. Se siete fanatici e sapete dove cercare – oppure siete molto intelligenti e l’avete trovato da soli – il parallelogramma è la scelta migliore. Ma se avete fretta di implementare una soluzione e dovete generare poche centinaia di punti il rejection sampling va più che bene: il costo è il doppio dell’altro metodo, e quindi sopportabile.

Due ultime note: nei commenti al post di Cook si fa notare come scegliere una distribuzione esponenziale anziché lineare dei numeri casuali fa funzionare anche il metodo delle coordinate baricentriche. Ma soprattutto ho provato a fare la domanda a Claude. Riporta i tre metodi (immagino perché addestrato su Stack Overflow) ma afferma che quello delle coordinate baricentiche è il metodo più elegante ed efficiente. Mai fidarsi degli LLM!

Gli LLM sono tarati per avere allucinazioni?

Qualche giorno fa Alberto Romero ha scritto un post che riprende un paper scritto da alcuni ricercatori di OpenAI, dal titolo “Why Language Models Hallucinate”. La tesi degli autori è che le allucinazioni degli LLM, cioè le risposte completamente inventate, sono il risultato del modo in cui i modelli sono addestrati, vale a dire per cercare di dare il maggior numero di risposte possibili. Questo significa che se non c’è una risposta chiaramente ricavabile dal materiale di addestramento – in altri termini, se i token che vengono man mano emessi arrivano da una distribuzione senza un picco chiaro, che corrisponde a una classificazione “forte” – il modello si comporta come lo studente tipico quando all’esame trova domande a risposta multipla su temi che non conosce: tira a indovinare. Se indovina, bene; altrimenti non perde nulla.

Prima di parlare dell’articolo in sé, Romero fa una meta-analisi di cosa può significare la pubblicazione di quell’articolo. Sui primi due punti (bisogna lavorare per eliminare le allucinazioni, anche al costo di un modello che a volte risponde “non lo so”; fino ad adesso non è stata data priorità al problema) mi trovo d’accordo, mentre non penso che la pubblicazione implichi che OpenAI sia vicinissima ad avere trovato una soluzione. Se fosse così, mi sarei aspettato prima un modello “dubbioso ma non allucinato”, e subito dopo la pubblicazione dell’articolo, visto che sarebbero stati in parecchi ad accorgersi della filosofia dietro un modello di quel tipo.

Entrando nel merito dell’articolo, i ricercatori affermano appunto che il problema delle allucinazioni non è tanto dovuto al materiale di ingresso che è “sporco”, cosa che può peggiorare i risultati ma non è fondamentale. Il problema è che anche se i dati di addestramento fossero perfetti l’LLM non risponderebbe mai “non lo so” a una domanda, perché è stato addestrato per predire la parola successiva anche se non ha al suo interno nessun pattern trovato nel testo e soprattutto perché in media l’accuratezza (misurata come percentuale di risposte esatte) comunque cresce, dato che non viene misurata “risposta corretta: +1; risposta errata: -1; nessuna risposta: 0” ma solo come risposte corrette sul totale. Ecco perché gli LLM bluffano sempre. Nella tabella qui sotto, presa dal loro blog, gli autori dell’articolo mostrano il confronto con un modello basato su GPT-5 che dice “non lo so”. La percentuale di risposte corrette cala un po’, ma quella di risposte sbagliate crolla.

risultati

Dal mio punto di vista, un chatbot meno sicuro di sé sarebbe sicuramente un vantaggio, perché perderei meno tempo a verificare le risposte che mi dà: ma ho il sospetto che il mio tipo di interazione sia molto minoritario.

La parte più divertente dell’articolo è però quella sull’indovinello del chirurgo… Ma ne parlo tra qualche giorno.

La storia del sito armani.it

Tra le storie pubblicate in morte di Giorgio Armani c’è quella sul dominio armani.it, che era stato inizialmente preso dal titolare di un timbrificio il cui nome era Luca Armani e poi è stato assegnato a quell’altra Armani, cioè la Giorgio Armani SpA.

A parte l’ovvio svarione sulle date – la causa legale è cominciata nel 1998, non nel 2008 – io ricordo qualcosa di diverso. Innanzitutto la storia nasce nel 1997, quando Luca Armani registra il dominio armani.it per il suo timbrificio e crea un sito web. Nel 1997 Internet cominciava a essere nota in Italia anche nel campo aziendale: la prima pubblicità cartellonistica che mi ricordi con indicato il nome del sito è quella di Invicta che era appunto del 1996 o 1997. In quegli anni i nomi a dominio .it erano assegnati con il contagocce: con l’eccezione dei provider internet che potevano averne fino a sette per i vari servizi di rete, gli aventi diritto potevano averne uno solo, e solo se erano aziende: ai privati cittadini non era ammesso registrarne uno. Questo lo so per certo, perché ero un membro della Naming Authority italiana che faceva quelle regole. La regola per l’assegnazione era “chi prima arriva e ha un diritto, si piglia il nome”. Evidentemente la Giorgio Armani SpA non aveva pensato che Internet servisse, come si vide anche per il sito armani.com – dove perse la causa contro il signor A. R. Mani, ma negli USA le regole sono diverse.

Quando la Giorgio Armani SpA citò a giudizio Luca Armani, quest’ultimo si affidò probabilmente a un avvocato che ne sapeva ancora meno del giudice. Per prima cosa, Luca Armani non aveva comprato il dominio ma l’aveva visto assegnato dalla Registration Authority (quella che oggi è il Registro .it). Ancora adesso non si può “vendere” un dominio, ma solo trasferirne la proprietà, dietro la foglia di fico di un pagamento per le spese sostenute nel gestirlo in passato. La prima cosa da fare sarebbe insomma stata chiedere che il procedimento venisse chiuso perché era da aversi contro la RA. Posso però immaginare che una strada del genere gli avrebbe immediatamente fatto perdere la titolarità… Ma c’è un secondo punto. L’avvocato (mal) consigliò Luca Armani di togliere dal sito Web tutto quello relativo al timbrificio e usarlo solo come sito personale. L’idea probabilmente era quella di evitare una sentenza legata al marchio notorio e all'”indebito vantaggio” di chiamarsi in quel modo, pur non essendoci un caso di concorrenza sleale. Non solo un avvocato appena esperto di cose di rete (e ne avevamo, nella NA) poteva smontare la cosa, come scrisse per esempio Alberto Monari – ricordate, siamo nel 1997, non anche solo nel 2005 – ma soprattutto in questo modo Luca Armani si mise da solo al di fuori delle regole per l’assegnazione del dominio, e quindi finì automaticamente dalla parte del torto. Insomma, l’analisi di Punto Informatico non sta in piedi.

Poi magari Luca Armani aveva chiesto qualche decina di milioni a Giorgio Armani per cedergli volontariamente il dominio: ma non penso sia andata così, anche perché gli avvocati della controparte avrebbero immediatamente colto l’occasione. Diciamo che è stata comunque una delle tante tristi pagine nella storia di Internet in Italia.

Quizzino della domenica: tutti primi

765 – algebretta

Data l’equazione a + b + c = d, dove a, b, c, d sono tutti numeri primi, qual è il minimo valore che può assumere d? Ricordo che 1 non è un numero primo (e che ovviamente non si possono usare numeri negativi…)

a + b + c = d
(trovate un aiutino sul mio sito, alla pagina https://xmau.com/quizzini/p765.html; la risposta verrà postata lì il prossimo mercoledì. Problema da MathWorld.)