Per una volta, me n’ero accorto da solo: ma persino Google Search mi ha voluto avvisare (per la prima volta in vita sua). Il punto è che il post in questione l’ho scritto più di un mese fa, e se l’erano filato in pochi, come al solito.
Cosa può essere successo? La mia ipotesi è quella dell’effetto lemming. Qualche persona ha casualmente cliccato sul mio post, quindi è salito di posizione nella pagina della ricerca e così la massa (si fa per dire, io non sono certo un influencer) ha continuato a cliccarci.
Quizzino della domenica: Ninfee
733 – probabilità
Una rana si trova in uno stagno dove ci sono quattro ninfee in fila, che numeriamo 1, 2, 3, 4. Inizialmente si trova sulla ninfea 2. Se la rana si trova sulla ninfea 1 oppure 4, se ne sta lì bella tranquilla. Se è sulla ninfea 2 può spostarsi sulla 3 con probabilità 1/2 e sulla 1 con probabilità 1/2; se è sulla ninfea 3 può spostarsi sulla 4 con probabilità 2/3 e sulla 2 con probabilità 1/3. Qual è la probabilità che la rana termini i suoi salti sulla ninfea 1?
(trovate un aiutino sul mio sito, alla pagina https://xmau.com/quizzini/p733.html; la risposta verrà postata lì il prossimo mercoledì. Problema di Michael Coffey, da The Fiddler; immagine da FreeSVG.)
On Progress in Physics and Subjectivity Theory (libro)
Che “N. Otre Le Vant” fosse uno pseudonimo mi era chiaro. Che cosa significasse l’ho capito solo quando a pagina 263 ha scritto che il suo nome era “not relevant”. L’anno scorso l’autore mi ha contattato chiedendo se fossi interessato a leggere i suoi pensieri sul perché la fisica non sta facendo progressi da vari decenni. Risposi che avrei letto il libro ma mi ci sarebbe voluto un po’ di tempo perché ero impegnato con la curatela dei libri di matematica: diciamo che ci ho messo MOLTO tempo. L’ebook che mi è arrivato è molto personalizzato: a parte il footer, all’inizio c’è proprio una sezione con il mio nome-e-cognome, un ottimo tipo di filigrana :-)
Il libro è scritto sotto forma di dialogo tra Alice (il Watson, la spalla) e Bob (il pensiero dell’autore) ed è formato da tre parti: nella prima l’autore presenta lo stato dell’arte in fisica, afferma che ci si trova in un punto morto e che sarebbe meglio assumere che “everything we think we know about the world is wrong”; nella seconda presenta la sua teoria della soggettività, dove afferma che è il nostro cervello che man mano crea la parte del mondo che gli serve; la terza e più lunga prova a definire come si potrebbe ottenere un progresso in fisica, indipendentemente dalla teoria della soggettività. Questa terza parte è per me la più debole, perché dà tante informazioni che però mostrano che non c’è un vero principio unificante. Nella seconda parte, anche senza accettare la teoria, ho trovato parecchi spunti interessanti, tipo quando dice “Se una soluzione sembra troppo perfetta, senza problemi, il motivo è che probabilmente qualcosa ci ottenebra e ci impedisce di vedere i problemi”, e che “se le probabilità parlano di informazione per definizione incompleta, non possiamo considerarle qualcosa di fondamentale, ma un costrutto umano: utile ma per l’appunto un costrutto”. Sono meno convinto del suo affermare che se le costanti naturali sono “incredibilmente vicine all’esperienza umana” (sì, anche la costante di Planck. In fin dei conti è 10 elevato alla -35 metri: con gli infiniti numeri a disposizione un esponente 35 è poca roba): per me il fatto che i numeri siano infiniti è giusto un espediente.
Alla fine dei conti, però, la lettura è stata piacevole, nonostante a volte l’autore cercasse la battuta per il gusto della battuta. Credo che sia sempre utile
(N. Otre Le Vant, On Progress in Physics and Subjectivity Theory, 2024, pag. 330, € 19,34, ISBN 9798876965103)
Voto: 4/5
Gli è tutta una bolla!
In questi giorni è difficile stare dietro a tutte le notizie su quanto succede nel mondo degli LLM, soprattutto se uno nella vita dovrebbe fare dell’altro. Torno sulla storia di DeepSeek per commentare questo articolo di Georg Zoeller, che vede le cose da un punto di vista non solo tecnico ma economico.
Già il titolo è emblematico, anche se confesso che ho dovuto chiedere al mio socialino di nicchia che significasse “Chinese Quant”. (Sono gli analisti quantitativi: come penso sappiate DeepSeek è un progetto collaterale di una società di trading) Il punto chiave è “The Greatest Growth Hack of All Times”, che è ancora più perfido della mia “bolla” ma ha in comune il fatto che tutta la pubblicità su queste AI è stata montata ad arte solo per far crescere il valore delle azioni. Che significato ha per esempio che la capitalizzazione di borsa di Nvidia fosse arrivata a mille miliardi di dollari, quasi la metà del PIL italiano? (ok, non dovrei mischiare mele con pere, ma è per dare un’idea). Col senno di poi avremmo dovuto accorgerci che il continuo cambio di nomi e acronimi, e lo stillicidio di prodotti lanciati e lasciati poi marcire perché c’era il nuovo sistema ancora più potente, per non parlare dei consumi sempre più esagerati significava che in realtà l’unico piano che c’era era far crescere artificialmente un mercato che non aveva nessuno sbocco reale, come ben sa chi ha provato a usare davvero in pratica questi sistemi e non solo a giocare con i chatbot. Il mantra era “solo i BigTech possono stare sul mercato delle AI”.
Zoeller continua presentando un sistema text-to-speech, Kokoro-82M, il cui addestramento è costato una cifra dell’ordine di 400$ e che dà risultati “sufficientemente buoni in molti casi”. Dovrei chiedere ai miei vecchi amici di Loquendo che ne pensano. Chiaramente un sistema di questo tipo mina alla base i modelli di prezzo dei grandi text-to-speech aziendali. DeekSeek fa lo stesso: usa il sistema Chain-of-Thought Prompting che OpenAI aveva ideato l’anno scorso per migliorare la sua capacità di “ragionamento”. (In due parole, il Chain-of-Thought prevede che la risposta sia generata come un processo dove viene costruita man mano, usando il testo generato per migliorare le previsioni su come continuare. La cosa non è affatto stupida, anche noi umani facciamo così, e i risultati si vedono). Ma soprattutto DeepSeek nella sua versione R1 mostra che il fossato che le grandi società avevano creato – vedi il mantra sopra – era facilmente superabile. Ok, non “facilmente” nel senso che lo puoi fare con il tuo Mac a casa (anche se spuntano già i modelli distillati usando R1 che possono girare su una workstation appena un po’ carrozzata), ma che era alla portata di un’azienda di media grandezza come progetto collaterale. Inoltre il fatto che il modello (non i dati di training) sia stato rilasciato con la liberale licenza MIT dà un duro colpo ai sistemi americani che formalmente partivano da Open Source (per avere manodopera gratuita) ma erano molto attenti a non pubblicare le loro migliorie se non con un ritardo sufficiente a farli stare due o tre passi avanti. Ora non si potrà più fare nulla del genere. Se davvero il progetto open-r1 prenderà piede, anche il dataset sarà davvero open source, e ne vedremo delle belle.
Per quanto riguarda le conclusioni dell’articolo, ho dei dubbi che l’EU riderà per non essersi lanciata subito nella corsa alle AI ma si sia messa a legiferare (cosa che di per sé non trovo sbagliata, eh. Ma non doveva essere l’unica), mentre sono più d’accordo sul fatto che Nvidia alla fine non perderà molto, perché la potenza di calcolo servirà comunque. Lo stesso per la sua previsione che le allucinazioni non potranno essere eliminate semplicemente aggiungendo potenza di calcolo, e che il pendolo si sposterà di nuovo su sistemi di ambito più limitato ma più facili da far funzionare bene. Ma la cosa più importante è quella che leggo tra le righe, quando Zoeller scrive del “fundamentally unsafe patters of using a single input for both data and instruction into LLMs”, che porta ai problemi di prompt injection nel bene (superare i blocchi inseriti per esempio in DeepSeek cambiando l’input o dando istruzioni particolari) e nel male (pensate a come si possono usare questi trucchi da parte degli scammer). Il tutto senza che almeno per quanto io veda qualcuno si stia preoccupando. Io non sono certo un esperto di intelligenza artificiale, ma vedo che le persone che danno davvero informazioni utili sono molto poche, e soprattutto manca un livello di mezzo non troppo tecnico per far capire le conseguenze di quello che succede. È chiaro che è più facile guardarsi reel su reel di TikTok, ma se non si dà la possibilità di farsi un’idea cosa si spera?
E dunque questo DeepSeek?
E insomma il nuovo arrivato questa settimana è DeepSeek, sistema LLM che formalmente è nato come progetto collaterale di un’azienda cinese di asset management, i cui algoritmi (ma non il materiale di addestramento…) sono open source, ha un costo di addestramento che è tra uno e due ordini di grandezza inferiore a quello di OpenAI o1, epperò funziona “good enough”, che era già una volta un mantra per i servizi internet ma ormai è diventata la bibbia – anche perché. diciamocelo, non è per nulla scontato che questi sistemi diano risposte direttamente utilizzabili, anzi.
Anch’io ho provato a usarlo. Chiedendogli chi è Maurizio Codogno, senza dargli nessun contesto, ha tirato fuori qualche frase adulatoria e senza un vero contenuto:
Maurizio Codogno is an Italian mathematician, blogger, and science communicator. He is known for his work in popularizing mathematics and making it accessible to a broader audience. Codogno has written extensively on mathematics, often focusing on its applications and relevance in everyday life. He is also a prolific blogger, contributing to various platforms where he shares insights, explanations, and commentary on mathematical topics.
Codogno has authored several books and articles aimed at demystifying complex mathematical concepts for non-experts. His efforts in science communication have made him a respected figure in the Italian scientific community and beyond. If you have specific questions about his work or contributions, feel free to ask!
(sì, io preferisco usarlo direttamente in inglese per togliere un passaggio). Rispetto ai miei tentativi con il primo ChatGPT ha evitato di parlare del mio omonimo ex calciatore, che è quello che ha la voce su Wikipedia, e soprattutto non si è inventato titoli di libri che non ho mai scritto. Ma quello che mi ha stupito di più è stata la risposta a una variante quesito proposto il mese scorso da Mike Loukides in questo articolo: “Sai dimostrare che se tutte le cifre di un numero primo sono 1 allora il numero di cifre deve essere un numero primo?” Chiunque abbia letto Martin Gardner lo sa, e immagino che nel corpus di addestramento ci sia qualcosa del genere: però la domanda posta così non è immediata. Io ho fatto leggermente di peggio: ho chiesto
A repetitium is a number which is written using a single digit, like 666. Can you find a necessary condition for a repetitium to be a prime number, and explain me which steps you did to arrive at the conclusion?
scegliendo apposta un termine inesistente per definire quelli che in letteratura sono detti repunits, dando come esempio un numero la cui cifra ripetuta non è 1, e chiedendo di trovare una condizione necessaria senza esplicitarla. Potete vedere la risposta di DeepSeek qui. Nulla da eccepire, il che da un certo punto di vista è inquietante: d’altra parte afferma di essere il LLM più performante nel test MATH-500.
Secondo il Financial Times, Deep Seek afferma di essere stato addestrato usando 2048 schede grafiche Nvidia H800, con un costo di 5,6 milioni di dollari e 671 miliardi di parameteri: molto meno dei rivali. Sempre secondo il FT, OpenAI ha accusato DeepSeek di avere usato GPT-4 come punto di partenza per distillare i suoi contenuti… comportamenti illeciti un po’ come le accuse di violazione di copyright nei confronti di OpenAI, insomma. Più che altro, quello che io noto è che la mia preoccupazione riguardo al set di training generato automaticamente non è condivisa, e che in questo modo si arriva a un risultato “good enough” con una frazione del costo di addestramento. (Poi, leggendo qui, c’è anche chi sospetta che quei dati siano appositamente sottostimati).
Ovviamente DeepSeek ha scelto di sparigliare il mercato, che fino a questo momento era tenuto saldamente in mano dai soliti noti. Questo significa tra l’altro che la bolla AI (e quella delle utility energetiche…) potrebbe scoppiare molto prima di quanto si pensasse. Peggio ancora, il Post cita il blog Stratechery, dove Ben Johnson ritiene che in DeepSeek ci siano anche migliorie importanti, almeno rispetto all’efficienza (anche se pensa che o1 sia ancora migliore come capacità). Da questo punto di vista continuo a credere che abbiamo raggiunto un plateau, e per passare dal good enough al “good without ifs and buts” :-) occorrerà qualche nuova idea. Staremo ad aspettare: in fin dei conti se ora è più facile entrare nel mondo LLM magari a qualcuno l’idea arriverà…
Aggiornamento: (9:00): Sicuramente se uno non ha fatto un account DeepSeek non vede nulla, non ho fatto prove con un account diverso. Allego quindi screenshot (cliccabili per ingrandire) della conversazione.
Arrotondamenti comodi
Nel volumetto della collana Matematica sui sistemi di numerazione ho parlato di basi di numerazione piuttosto esotiche, anche se a volte con una certa utilità. Oggi aggiunto qualche informazione in più che ho da poco scoperto leggendo il blog di John D. Cook.
Come probabilmente sapete, gli arrotondamenti non sono mai una cosa semplice, soprattutto se dovete fare una serie di operazioni consecutive. Generalmente si arrotonda per difetto se la cifra successiva a quella che arrotondiamo è 0, 1, 2, 3, 4 e si arrotonda per eccesso se è 6, 7, 8, 9 oppure 5 seguito da qualcos’altro. E se siamo proprio a metà, quindi dobbiamo arrotondare il “semintero” 42,5? Wikipedia (e i libri di testo dei miei figli concordano) afferma che se la cifra precedente il 5 è pari arrotondiamo per difetto e quindi abbiamo 42, altrimenti arrotondiamo per eccesso e da 43,5 otteniamo 44. Il tutto sperando che i numeri che arrotondiamo siano distribuiti casualmente e quindi non abbiamo un bias di arrotondamento
Sarebbe bello avere una regola più semplice, almeno se dobbiamo arrotondare a un numero intero, vero? Nel caso dei numeri seminteri non possiamo farci molto, ma in generale entra in gioco la base ternaria bilanciata, quella dove le cifre possibili sono 1, 0 e −1 (che per comodità scriviamo T, spostando il segno meno in alto…) e quindi per esempio 42 si scrive 1TTT03bil, cioè 81 − 27 − 9 − 3. È facile dimostrare che la più grande parte frazionaria positiva è 0,11111…3bil mentre la più piccola parte frazionaria negativa è 0,TTTTT…3bil. Se fate i conti, scoprirete che il limite della somma vale rispettivamente 1/2 e −1/2. Quindi arrotondare in questo caso equivale semplicemente a troncare.
Cook aggiunge anche che in generale, se usassimo una base di numerazione dispari anziché la nostra base 10, non avremo il problema del doppio arrotondamento. Supponiamo di avere 9876,5432i e di doverlo arrotondare alla prima cifra decimale. Avremmo così 9876,5 perché la parte seguente del numero comincia con 4. Se però ora arriva un contrordine e ci viene detto di arrotondare a un numero intero, allora dobbiamo arrotondare per difetto (la cifra precedente al 5 è pari) e troviamo 9876. Peccato che se avessimo subito arrotondato a un numero intero avremmo trovato 9877. Non è bello, vero? Beh, in una base dispari questo non può capitare, perché n + 1/2 non è esprimibile come numero dallo sviluppo finito e quindi siamo certi che gli arrotondamenti sono tutti nella stessa direzione. D’accordo, non sarà una buona ragione per cambiare base di numerazione, ma è comunque carino, no?
MATEMATICA – Lezione 51: Sistemi di numerazione
@matematica
Conoscete tutti i numeri romani, anche se magari fate fatica a leggere l’ora in un orologio che li usa, e vi chiedete come mail il quattro si scrive IIII e non IV come insegnatovi a scuola. Ma non credo conosciate i numeri etruschi. E sapete contare con i numeri greci? Questa è la prima parte del volume: se a scuola eravate curiosi, probabilmente sapevate già alcune delle informazioni. Ma sono certo che la seconda parte vi lascerà attoniti. Base 10 e base 2 sono troppo banali: qui presento altre basi di numerazione, come quella tre bilanciata che i russi hanno cercato di usare nei propri calcolatori, oppure basi frazionarie, algebriche o addirittura irrazionali. E la cosa più incredibile è che la maggior parte di queste basi hanno anche un’applicazione pratica!
I miei giochi matematici consistono per una volta in problemi difficili; il personaggio raccontato da Veronica Giuffré è John Horton Conway, un matematico sicuramente diverso dagli stereotipi.
Maurizio Codogno, Matematica – Lezione 51: Sistemi di numerazione, allegato a Gazzetta dello Sport e Corriere della Sera, €6.99 più il prezzo del giornale.
Statistiche 2024 per le Notiziole
Anno | Nr.articoli | Media caratteri per articolo | Caratteri tot per articolo | Media commenti | Commenti totali |
---|---|---|---|---|---|
2024 | 427 | 1,646 | 702,834 | 2.1 | 882 |
2023 | 493 | 1,641 | 808,582 | 2.5 | 1,245 |
2022 | 483 | 1,333 | 643,773 | 3.1 | 1,476 |
2021 | 496 | 1,374 | 681,463 | 3.0 | 1,477 |
2020 | 486 | 1,583 | 769,022 | 3.3 | 1,590 |
2019 | 514 | 1,395 | 717,012 | 2.5 | 1,275 |
2018 | 498 | 1,373 | 683,422 | 3.1 | 1,539 |
2017 | 498 | 1,398 | 695,784 | 3.6 | 1,792 |
2016 | 508 | 1,333 | 676,801 | 4.4 | 2,247 |
2015 | 411 | 1,513 | 621,552 | 4.6 | 1,872 |
2014 | 359 | 1,494 | 536,143 | 4.0 | 1,449 |
2013 | 450 | 1,324 | 595,623 | 4.2 | 1,889 |
2012 | 447 | 1,414 | 631,800 | 4.9 | 2,189 |
2011 | 490 | 1,457 | 713,904 | 6.1 | 3,002 |
2010 | 585 | 1,261 | 737,162 | 5.2 | 3,016 |
2009 | 929 | 1,364 | 1,266,525 | 5.8 | 5,400 |
2008 | 1,070 | 1,498 | 1,602,358 | 5.0 | 5,369 |
2007 | 990 | 1,225 | 1,212,164 | 3.3 | 3,247 |
2006 | 745 | 1,146 | 853,112 | 2.3 | 1,715 |
2005 | 606 | 995 | 602,640 | 1.8 | 1,095 |
2004 | 612 | 1,010 | 617,928 | 1.2 | 730 |
2003 | 521 | 776 | 404,143 | 0.3 | 174 |
2002 | 214 | 725 | 155,056 | 0.0 | 0 |
2001 | 40 | 680 | 27,175 | 0.0 | 0 |
Sempre grazie al plugin del povero Wolly, eccovi le statistiche dei miei post per il 2024 (e il 2023, che non avevo mai pubblicato). Dal calo dei post si vede il peso del lavoro sulla collana matematica: dal calo dei commenti si vede che i bloga sono morti.