Archivi autore: .mau.

Informazioni su .mau.

matematto non praticante

E dunque questo DeepSeek?

@aitech

E insomma il nuovo arrivato questa settimana è DeepSeek, sistema LLM che formalmente è nato come progetto collaterale di un’azienda cinese di asset management, i cui algoritmi (ma non il materiale di addestramento…) sono open source, ha un costo di addestramento che è tra uno e due ordini di grandezza inferiore a quello di OpenAI o1, epperò funziona “good enough”, che era già una volta un mantra per i servizi internet ma ormai è diventata la bibbia – anche perché. diciamocelo, non è per nulla scontato che questi sistemi diano risposte direttamente utilizzabili, anzi.

Anch’io ho provato a usarlo. Chiedendogli chi è Maurizio Codogno, senza dargli nessun contesto, ha tirato fuori qualche frase adulatoria e senza un vero contenuto:

Maurizio Codogno is an Italian mathematician, blogger, and science communicator. He is known for his work in popularizing mathematics and making it accessible to a broader audience. Codogno has written extensively on mathematics, often focusing on its applications and relevance in everyday life. He is also a prolific blogger, contributing to various platforms where he shares insights, explanations, and commentary on mathematical topics.

Codogno has authored several books and articles aimed at demystifying complex mathematical concepts for non-experts. His efforts in science communication have made him a respected figure in the Italian scientific community and beyond. If you have specific questions about his work or contributions, feel free to ask!

(sì, io preferisco usarlo direttamente in inglese per togliere un passaggio). Rispetto ai miei tentativi con il primo ChatGPT ha evitato di parlare del mio omonimo ex calciatore, che è quello che ha la voce su Wikipedia, e soprattutto non si è inventato titoli di libri che non ho mai scritto. Ma quello che mi ha stupito di più è stata la risposta a una variante quesito proposto il mese scorso da Mike Loukides in questo articolo: “Sai dimostrare che se tutte le cifre di un numero primo sono 1 allora il numero di cifre deve essere un numero primo?” Chiunque abbia letto Martin Gardner lo sa, e immagino che nel corpus di addestramento ci sia qualcosa del genere: però la domanda posta così non è immediata. Io ho fatto leggermente di peggio: ho chiesto

A repetitium is a number which is written using a single digit, like 666. Can you find a necessary condition for a repetitium to be a prime number, and explain me which steps you did to arrive at the conclusion?

scegliendo apposta un termine inesistente per definire quelli che in letteratura sono detti repunits, dando come esempio un numero la cui cifra ripetuta non è 1, e chiedendo di trovare una condizione necessaria senza esplicitarla. Potete vedere la risposta di DeepSeek qui. Nulla da eccepire, il che da un certo punto di vista è inquietante: d’altra parte afferma di essere il LLM più performante nel test MATH-500.

Secondo il Financial Times, Deep Seek afferma di essere stato addestrato usando 2048 schede grafiche Nvidia H800, con un costo di 5,6 milioni di dollari e 671 miliardi di parameteri: molto meno dei rivali. Sempre secondo il FT, OpenAI ha accusato DeepSeek di avere usato GPT-4 come punto di partenza per distillare i suoi contenuti… comportamenti illeciti un po’ come le accuse di violazione di copyright nei confronti di OpenAI, insomma. Più che altro, quello che io noto è che la mia preoccupazione riguardo al set di training generato automaticamente non è condivisa, e che in questo modo si arriva a un risultato “good enough” con una frazione del costo di addestramento. (Poi, leggendo qui, c’è anche chi sospetta che quei dati siano appositamente sottostimati).

Ovviamente DeepSeek ha scelto di sparigliare il mercato, che fino a questo momento era tenuto saldamente in mano dai soliti noti. Questo significa tra l’altro che la bolla AI (e quella delle utility energetiche…) potrebbe scoppiare molto prima di quanto si pensasse. Peggio ancora, il Post cita il blog Stratechery, dove Ben Johnson ritiene che in DeepSeek ci siano anche migliorie importanti, almeno rispetto all’efficienza (anche se pensa che o1 sia ancora migliore come capacità). Da questo punto di vista continuo a credere che abbiamo raggiunto un plateau, e per passare dal good enough al “good without ifs and buts” :-) occorrerà qualche nuova idea. Staremo ad aspettare: in fin dei conti se ora è più facile entrare nel mondo LLM magari a qualcuno l’idea arriverà…

Aggiornamento: (9:00): Sicuramente se uno non ha fatto un account DeepSeek non vede nulla, non ho fatto prove con un account diverso. Allego quindi screenshot (cliccabili per ingrandire) della conversazione.

prima schermata

seconda schermata

terza schermata

Arrotondamenti comodi

@matematica

Nel volumetto della collana Matematica sui sistemi di numerazione ho parlato di basi di numerazione piuttosto esotiche, anche se a volte con una certa utilità. Oggi aggiunto qualche informazione in più che ho da poco scoperto leggendo il blog di John D. Cook.

Come probabilmente sapete, gli arrotondamenti non sono mai una cosa semplice, soprattutto se dovete fare una serie di operazioni consecutive. Generalmente si arrotonda per difetto se la cifra successiva a quella che arrotondiamo è 0, 1, 2, 3, 4 e si arrotonda per eccesso se è 6, 7, 8, 9 oppure 5 seguito da qualcos’altro. E se siamo proprio a metà, quindi dobbiamo arrotondare il “semintero” 42,5? Wikipedia (e i libri di testo dei miei figli concordano) afferma che se la cifra precedente il 5 è pari arrotondiamo per difetto e quindi abbiamo 42, altrimenti arrotondiamo per eccesso e da 43,5 otteniamo 44. Il tutto sperando che i numeri che arrotondiamo siano distribuiti casualmente e quindi non abbiamo un bias di arrotondamento

Sarebbe bello avere una regola più semplice, almeno se dobbiamo arrotondare a un numero intero, vero? Nel caso dei numeri seminteri non possiamo farci molto, ma in generale entra in gioco la base ternaria bilanciata, quella dove le cifre possibili sono 1, 0 e −1 (che per comodità scriviamo T, spostando il segno meno in alto…) e quindi per esempio 42 si scrive 1TTT03bil, cioè 81 − 27 − 9 − 3. È facile dimostrare che la più grande parte frazionaria positiva è 0,11111…3bil mentre la più piccola parte frazionaria negativa è 0,TTTTT…3bil. Se fate i conti, scoprirete che il limite della somma vale rispettivamente 1/2 e −1/2. Quindi arrotondare in questo caso equivale semplicemente a troncare.

Cook aggiunge anche che in generale, se usassimo una base di numerazione dispari anziché la nostra base 10, non avremo il problema del doppio arrotondamento. Supponiamo di avere 9876,5432i e di doverlo arrotondare alla prima cifra decimale. Avremmo così 9876,5 perché la parte seguente del numero comincia con 4. Se però ora arriva un contrordine e ci viene detto di arrotondare a un numero intero, allora dobbiamo arrotondare per difetto (la cifra precedente al 5 è pari) e troviamo 9876. Peccato che se avessimo subito arrotondato a un numero intero avremmo trovato 9877. Non è bello, vero? Beh, in una base dispari questo non può capitare, perché n + 1/2 non è esprimibile come numero dallo sviluppo finito e quindi siamo certi che gli arrotondamenti sono tutti nella stessa direzione. D’accordo, non sarà una buona ragione per cambiare base di numerazione, ma è comunque carino, no?

MATEMATICA – Lezione 51: Sistemi di numerazione

copertina Conoscete tutti i numeri romani, anche se magari fate fatica a leggere l’ora in un orologio che li usa, e vi chiedete come mail il quattro si scrive IIII e non IV come insegnatovi a scuola. Ma non credo conosciate i numeri etruschi. E sapete contare con i numeri greci? Questa è la prima parte del volume: se a scuola eravate curiosi, probabilmente sapevate già alcune delle informazioni. Ma sono certo che la seconda parte vi lascerà attoniti. Base 10 e base 2 sono troppo banali: qui presento altre basi di numerazione, come quella tre bilanciata che i russi hanno cercato di usare nei propri calcolatori, oppure basi frazionarie, algebriche o addirittura irrazionali. E la cosa più incredibile è che la maggior parte di queste basi hanno anche un’applicazione pratica!
I miei giochi matematici consistono per una volta in problemi difficili; il personaggio raccontato da Veronica Giuffré è John Horton Conway, un matematico sicuramente diverso dagli stereotipi.

Maurizio Codogno, Matematica – Lezione 51: Sistemi di numerazione, allegato a Gazzetta dello Sport e Corriere della Sera, €6.99 più il prezzo del giornale.

Statistiche 2024 per le Notiziole

Anno Nr.articoli Media caratteri per articolo Caratteri tot per articolo Media commenti Commenti totali
2024 427 1,646 702,834 2.1 882
2023 493 1,641 808,582 2.5 1,245
2022 483 1,333 643,773 3.1 1,476
2021 496 1,374 681,463 3.0 1,477
2020 486 1,583 769,022 3.3 1,590
2019 514 1,395 717,012 2.5 1,275
2018 498 1,373 683,422 3.1 1,539
2017 498 1,398 695,784 3.6 1,792
2016 508 1,333 676,801 4.4 2,247
2015 411 1,513 621,552 4.6 1,872
2014 359 1,494 536,143 4.0 1,449
2013 450 1,324 595,623 4.2 1,889
2012 447 1,414 631,800 4.9 2,189
2011 490 1,457 713,904 6.1 3,002
2010 585 1,261 737,162 5.2 3,016
2009 929 1,364 1,266,525 5.8 5,400
2008 1,070 1,498 1,602,358 5.0 5,369
2007 990 1,225 1,212,164 3.3 3,247
2006 745 1,146 853,112 2.3 1,715
2005 606 995 602,640 1.8 1,095
2004 612 1,010 617,928 1.2 730
2003 521 776 404,143 0.3 174
2002 214 725 155,056 0.0 0
2001 40 680 27,175 0.0 0

Sempre grazie al plugin del povero Wolly, eccovi le statistiche dei miei post per il 2024 (e il 2023, che non avevo mai pubblicato). Dal calo dei post si vede il peso del lavoro sulla collana matematica: dal calo dei commenti si vede che i bloga sono morti.

Forse Asus ha qualche problema

Ricordate che la scorsa settimana avevo scritto che mi avevano chiamato (e poi scritto) da Asus perché c’era stato un problema con il mio ordine e quindi non procedere al pagamento?

Bene. A questo punto avevo cominciato a cercare quel PC sui negozi fisici, avevo trovato NextHS che ce l’aveva in pronta consegna, ma non nel negozio milanese: sarei dovuto andare a Monza o a Seregno. Vabbè, meglio che niente: solo che Anna nei giorni scorsi non stava tanto bene e quindi avevamo deciso di aspettare fino a venerdì. Mercoledì mi arriva mail da Asus: “il suo ordine è stato processato, il computer arriverà venerdì” e in effetti il PC è qui con me.

Posso dire che Asus ha qualche problema di gestione? (e per fortuna non l’avevo preso subito, altrimenti mi vedevo bene col reso)

Quizzino della domenica: Successione dal SAT

732 – aritmetica

@matematica

Il SAT è un test americano per l’ammissione ai college. La domanda seguente è stata posta nel primo SAT che si è avuto nel 1926.
Data la successione che comincia con 750, 21, 264, 183, 210, quali sono i due numeri successivi, e perché?

la successione
(trovate un aiutino sul mio sito, alla pagina https://xmau.com/quizzini/p732.html; la risposta verrà postata lì il prossimo mercoledì. Problema da Mind Your Decisions.)

The God Frequency (ebook)

@libri

[Disclaimer: Ho ricevuto il libro grazie al programma Early Reviewer di LibraryThing]
Il guaio di questo libro è che vorrebbe essere hard SF ma non ce la fa. Per me, la fantascienza hard è quella in cui si parte da ipotesi probabilmente impossibili e si comincia a costruire una cornice il più possibile scientifica che a partire da queste ipotesi crei un mondo plausibile. Qui troviamo invece pesanti spiegazioni su come funzionano i CB (o come si chiamino ora le trasmissioni radio amatoriali): pare quasi di leggere un manuale. Hemme avrebbe potuto tirar fuori qualche spiegazione più o meno scientifica su come funziona la Frequenza di Dio, ma non l’ha fatto; i personaggi sono piatti, e interagiscono esattamente come da manuale; persino la conclusione non ha in realtà molto senso, neppure date le premesse portate avanti nel testo. Peccato, perché l’idea da cui il libro è partito poteva avere sviluppi interessanti.

(Douglas Hemme, The God Frequency, self published, pag. 214, € 3,83, ISBN (cartaceo) 9798991467124 – se acquistate il libro dal link qualche centesimo va a me)
Voto: 2/5

Sulla liquidità dei gatti

Se avete dei gatti, saprete perfettamente che riescono a passare attraverso pertugi davvero minuscoli, e infilarsi in scatole di dimensione minima. Scherzando, si dice spesso che i gatti sono liquidi. Beh, come si può leggere su Scientific American c’è stato un fisico che ha preso sul serio la battuta, forse per avere una scusa di non fare lavoro serio. Nel 2014 Marc-Antoine Fardin scrisse un articolo per il Journal of Rheology dal titolo “On the Rheology of Cats”.

Ma cosa vuol dire calcolare la liquidezza di un gatto? Ovviamente non lo versi da nessuna parte. Fardin ha così pensato di usare il numero di Debora, che definisce quanto un materiale ci mette a rilassarsi in una posizione stabile. Per definizione il vetro (che come sapete non è un vero solido…) ha numero di Debora 1; un solido ideale perfettamente elastico avrebbe numero di Debora infinito, e un liquido viscoso ideale lo avrebbe uguale a zero. Bene: secondo le sue misurazioni il valore dipende dall’età del gatto (quando mai un cucciolo sta fermo?) e dal luogo (avete mai messo un gatto su un trasportino?), ma con esemplari standard se per esempio un gatto si infila in una piccola scatola in cinque secondi e viene osservato in quella posizione per un minuto – esempio del tutto plausibile – il numero di Debora è De = 1/12 = 0,0833… il che mostra un indubbio comportamento da fluido.

Un’ultima curiosità: perché il numero di Debora si chiama così? Dalla Bibbia, Giudici 5,5: La sacerdotessa Deborah profetizzò “Si stemperarono i monti davanti al Signore, Signore del Sinai, davanti al Signore, Dio d’Israele.” E se i monti si sciolgono, nemmeno loro sono davvero solidi!