Archivi autore: .mau.

Informazioni su .mau.

matematto non praticante

Quizzino della domenica: area di un triangolo

766 – geometria

Il matematico russo Vladimir Arnol’d disse che questo problema non aveva dato nessun problema (scusate il gioco di parole) agli studenti americani, mentre un gruppo di studenti moscoviti non riuscì a trovare la soluzione. Nel triangolo rettangolo in figura, l’ipotenusa AB è lunga 10 cm, mentre l’altezza CH è 6 cm. Qual è l’area del triangolo?

il triangolo del problema
(trovate un aiutino sul mio sito, alla pagina https://xmau.com/quizzini/p766.html; la risposta verrà postata lì il prossimo mercoledì. Problema da MathWorld.)

Intelligenze aliene (ebook)

copertina Non garantisco sulla correttezza di quanto Vetere scrive riguardo alla parte tecnica di addestramento degli LLM. A me pare di sì, ma un mio amico era molto perplesso. Però non è quello il punto fondamentale di questo libro, bensì il vedere cosa sta dietro a questi modelli da un punto di vista filosofico. L’appunto che gli faccio è che almeno nella prima metà il linguaggio sembra spesso da iniziati: se voleva parlare ai filosofi probabilmente andava bene, ma noi poveri laureati in materie scientifiche facciamo una faticaccia. Come dicevo, però, il risultato finale merita, anche perché non è così comune trovare approcci di questo tipo.

Guido Vetere, Intelligenze aliene : Linguaggio e vita degli automi, Luca Sossella 2025, pag. 192, € 9,49, ISBN 9791259980984 – come Affiliato Amazon, se acquistate il libro dal link qualche centesimo va a me
Voto: 4/5

Il riposizionamento di Esselunga

Esselunga ha sempre lavorato molto sui prodotti marchiati da lei (ho scoperto che si dice “marchio privato”. Il modo con cui lo fa è però piuttosto strano. Dopo aver cominciato nel 1979 con i surgelati marchiati Esselunga ha creato il marchio a primo prezzo Fidèl, che però si è rapidamente sputtanato (scusate il tecnicismo). A questo punto la catena si è riposizionata sul segmento alto, con i prodotti Esselunga Bio ed Esselunga Top: alcuni anni fa è tornata sul primo prezzo, tirando fuori dal cilindro la linea Smart facilmente riconoscibile dal colore giallo neon.

A differenza dei Fidèl, i prodotti Smart non erano spesso così male, soprattutto quelli legati al latte (che compra da Austria e Germania, dove evidentemente costa meno ma non può avere la bandierina “100% italiano” che è tanto di moda). Però mi sa che l’esperimento non è andato cosi bene, perché molti di quei prodotti sono stati rimarchiati semplicemente “Esselunga”, con confezioni color pastello e indicazioni di come i prezzi siano più bassi ma la qualità resti la stessa.

Ovviamente non c’è nulla di strano nell’avere più linee di prodotti posizionate in modo diverso: ma forse i nomi dovrebbero essere un po’ meno intercambiabili…

Death on Omega Station (ebook)

copertina [Disclaimer: Ho ricevuto il libro grazie al programma Early Reviewer di LibraryThing] Certo, l’ambientazione è fantascientifica. Però il libro è fondamentalmente un hardboiled, il che non è poi così strano visto che French è stato un supervisore di scene del crimine. Da questo punto di vista il libro è una certezza: uno sa perfettamente come si dipanerà la storia, e quindi può concentrarsi sui particolari. In effetti il testo scorre piacevolmente, soprattutto nelle parti in cui il TrovaVerità terrestre e l’assistente alieno da lui nominato cominciano a trovare un loro modus operandi. Il libro probabilmente non vincerà il Pulitzer, ma è una lettura amena.

John L. French, Death on Omega Station, eSpec Books 2025, pag. 100, € 5,19, ISBN 9781956463361 – come Affiliato Amazon, se acquistate il libro dal link qualche centesimo va a me
Voto: 4/5

forse devo cambiare motore di ricerca

quale pagina Stavo guardando le ultime modifiche su Wikipedia in italiano, e ho visto che un utente anonimo aveva chiesto chi aveva la tessera 653 della P2. Ho fatto qualche ricerca e alla fine ho scoperto che bastava trovare la pagina Wikipedia relativa.

Due minuti dopo Google Opinion Rewards mi ha chiesto “Di recente hai effettuato una delle seguenti ricerche su Google?” (ed è la prima volta che mi fa una domanda simile, in genere chiede in quale negozio sono andato). Inutile dire che una delle opzioni era “elenco iscritti p2”. Sono andato avanti e ho scoperto l’arcano: il tutto era un test A/B. Come vedete nella schermata, mi chiedeva se preferivo avere la pagina di risposta con il riassunto AI oppure senza. Per la cronaca, io faccio le ricerche aggiungendo la stringa “?udm=14” che ritorna solo e unicamente i risultati web, quindi niente immagini, niente video e soprattutto niente AI. Evidentemente un qualche sistema automatico si è accorto che io faccio il cattivone e ha provato a chiedere lumi, compreso un mio feedback che potete tranquillamente immaginare quale sia stato.

Il guaio è che ultimamente Google fa schifo, ma gli altri motori di ricerca fanno pena. Insomma, che faccio?

Come generare punti casuali dentro un triangolo

John D. Cook mostra alcuni metodi per generare punti casuali all’interno di un triangolo ABC dato. Possiamo immaginare di lavorare in coordinate cartesiane, per semplicità, e quindi avere A, B e C come coppie ordinate di valori.

Il metodo più semplice è quello di usare coordinate baricentriche: generate tre numeri casuali α, β e γ tra 0 e 1, normalizzateli per far sì che la loro somma sia 1, e date come risposta αA + βB + γC. Il metodo genera punti che stanno tutti all’interno del triangolo: ma non sono uniformi, come si vede dalla figura qui sotto presa dal blog di Cook. I punti centrali del triangolo sono più probabili di quelli vicino ai vertici.

un triangolo generato casualmente con coordinate baricentriche.

Il secondo metodo è quello del rejection sampling. Costruite il rettangolo circoscritto al triangolo, generate due numeri casuali per la coordinata x e quella y, e controllate se il punto corrispondente sta all’interno del triangolo: se sì, bene, altrimenti lo buttate via. È evidente che in questo modo i punti generati e accettati sono distribuiti in modo casuale, perché tutti quelli nel rettangolo lo sono: il costo computazionale è di due insiemi di operazioni per numero scelto.

C’è poi un terzo metodo, quello del parallelogramma. Costruite un parallelogramma aggiungendo al triangolo una sua versione speculare, e generate punti a caso al suo interno, con la formula P = A + r₁·(B-A) + r₂·(C-A) dove r₁ e r₂ sono numeri casuali in [0,1]. Ora, se il punto generato si trova nel triangolo di partenza, e quindi r₁ + r₂ ≤ 1, bene; altrimenti prendete la sua immagine riflessa nel triangolo di partenza, usando (1-r₁, 1-r₂). Di nuovo, la casualità è assicurata. Il tutto è raccontato anche su Stack Overflow.

Quale conviene tra il secondo e il terzo metodo? Dipende. Se siete fanatici e sapete dove cercare – oppure siete molto intelligenti e l’avete trovato da soli – il parallelogramma è la scelta migliore. Ma se avete fretta di implementare una soluzione e dovete generare poche centinaia di punti il rejection sampling va più che bene: il costo è il doppio dell’altro metodo, e quindi sopportabile.

Due ultime note: nei commenti al post di Cook si fa notare come scegliere una distribuzione esponenziale anziché lineare dei numeri casuali fa funzionare anche il metodo delle coordinate baricentriche. Ma soprattutto ho provato a fare la domanda a Claude. Riporta i tre metodi (immagino perché addestrato su Stack Overflow) ma afferma che quello delle coordinate baricentiche è il metodo più elegante ed efficiente. Mai fidarsi degli LLM!

Gli LLM sono tarati per avere allucinazioni?

Qualche giorno fa Alberto Romero ha scritto un post che riprende un paper scritto da alcuni ricercatori di OpenAI, dal titolo “Why Language Models Hallucinate”. La tesi degli autori è che le allucinazioni degli LLM, cioè le risposte completamente inventate, sono il risultato del modo in cui i modelli sono addestrati, vale a dire per cercare di dare il maggior numero di risposte possibili. Questo significa che se non c’è una risposta chiaramente ricavabile dal materiale di addestramento – in altri termini, se i token che vengono man mano emessi arrivano da una distribuzione senza un picco chiaro, che corrisponde a una classificazione “forte” – il modello si comporta come lo studente tipico quando all’esame trova domande a risposta multipla su temi che non conosce: tira a indovinare. Se indovina, bene; altrimenti non perde nulla.

Prima di parlare dell’articolo in sé, Romero fa una meta-analisi di cosa può significare la pubblicazione di quell’articolo. Sui primi due punti (bisogna lavorare per eliminare le allucinazioni, anche al costo di un modello che a volte risponde “non lo so”; fino ad adesso non è stata data priorità al problema) mi trovo d’accordo, mentre non penso che la pubblicazione implichi che OpenAI sia vicinissima ad avere trovato una soluzione. Se fosse così, mi sarei aspettato prima un modello “dubbioso ma non allucinato”, e subito dopo la pubblicazione dell’articolo, visto che sarebbero stati in parecchi ad accorgersi della filosofia dietro un modello di quel tipo.

Entrando nel merito dell’articolo, i ricercatori affermano appunto che il problema delle allucinazioni non è tanto dovuto al materiale di ingresso che è “sporco”, cosa che può peggiorare i risultati ma non è fondamentale. Il problema è che anche se i dati di addestramento fossero perfetti l’LLM non risponderebbe mai “non lo so” a una domanda, perché è stato addestrato per predire la parola successiva anche se non ha al suo interno nessun pattern trovato nel testo e soprattutto perché in media l’accuratezza (misurata come percentuale di risposte esatte) comunque cresce, dato che non viene misurata “risposta corretta: +1; risposta errata: -1; nessuna risposta: 0” ma solo come risposte corrette sul totale. Ecco perché gli LLM bluffano sempre. Nella tabella qui sotto, presa dal loro blog, gli autori dell’articolo mostrano il confronto con un modello basato su GPT-5 che dice “non lo so”. La percentuale di risposte corrette cala un po’, ma quella di risposte sbagliate crolla.

risultati

Dal mio punto di vista, un chatbot meno sicuro di sé sarebbe sicuramente un vantaggio, perché perderei meno tempo a verificare le risposte che mi dà: ma ho il sospetto che il mio tipo di interazione sia molto minoritario.

La parte più divertente dell’articolo è però quella sull’indovinello del chirurgo… Ma ne parlo tra qualche giorno.