Archivi categoria: 2025

post di argomento matematico del 2025

Gli LLM “normali” e la matematica

All’inizio della settimana ho scritto su MaddMaths! (come, non leggete la mia rubrica “il matematico non praticante” che tengo lì? Male, nolto male) un articolo sulla medaglia virtuale d’oro ottenuta da Google DeepMind alle Olimpiadi della matematica. Già lì esprimevo i miei dubbi: vedo che non sono il solo, leggendo questo articolo di Emily Riehl su Scientific American.

Dall’articolo ho scoperto che le voci che anche OpenAI avrebbe raggiunto un punteggio da medaglia d’oro sono solo voci, o almeno non c’è stato un riconoscimento ufficiale da chi gestisce l’IMO: nulla di strano, in un ambiente dove l’hype è al momento più importante dei risultati. Ma la cosa più interessante è un’altra. Non è tanto il fatto che questi modelli tirano fuori un certo numero di risposte e poi scelgano (non ho idea come) quella più robusta: non penso, a differenza di Riehl, che questo equivalga a lavorare in squadra, visto che il modello sottostante è lo stesso. Quello che conta davvero è che si è tenuto un torneo parallelo informale ospitato da MathArena e che ha coinvolto (si fa per dire) i modelli disponibili commercialmente. Risultato? Nessuno è arrivato nemmeno alla medaglia di bronzo (che viene data a metà circa dei partecipanti alle olimpiadi reali). Il migliore è stato Gemini 2.5 Pro con 13 punti su 42, molti meno della soglia di 19 punti necessaria per la medaglia di bronzo. (Un esercizio risolto correttamente vale sei punti, ma se ne può ottenere qualcuno per una risposta errata ma con alcuni passi corretti). Il tutto spendendo più di 400 dollari :-)

Il mio commento finale? non è diverso da quello che avevo scritto su MaddMaths!. Questi sistemi ne hanno ancora di parametri da macinare. Questo non vuol dire prenderli sottogamba, e del resto ricordo che i sistemi di dimostrazione automatica dei teoremi sono ormai usati regolarmente, il che significa che nessuno ha un pregiudizio aprioristico. Semplicemente manca ancora molto per avere qualcosa di più di un aiuto.

Ultimo aggiornamento: 2025-08-07 16:22

Il triangolo magico

Il triangolo di lato 10 mostrato nella figura qui sotto ha la prima riga con i cerchi colorati di rosso, giallo o blu. Non sono colorati proprio a caso: ho preso le prime cifre decimali di pi greco e usato il rosso se sono uguali a 0 modulo 3, in giallo se sono 1 mod 3, in blu se sono 2 mod 3. Ma questo non importa. Supponete ora di colorare tutto il triangolo in questo modo: se i due cerchi soprastanti sono dello stesso colore si usa quel colore, mentre se sono di colore diverso si usa il terzo colore. Bene: io non ho fatto la prova, ma sono certo che il cerchio più in basso sarà rosso. Come mai?

Il triangolo di partenza

Il trucco è guardare solamente i due cerchi estremi nella prima riga, e applicare alla coppia le regole che ho definito qui sopra. Quei due cerchi sono rossi, quindi anche quello in basso dovrà essere rosso. Semplice, no? Gary Antonick ne aveva parlato sul NYT: la proprietà è stata scoperta da Steve Humble, che insegna didattica della matematica all’università di Newcastle, e dimostrata e generalizzata da Ehrhard Behrends. qui la regola non vale Notate che la regola non funziona sempre: nel triangolo di lato 3 mostrato qui a destra è immediato notare che se il cerchio in mezzo nella prima riga fosse blu e non giallo allora quello in bssso sarebbe giallo e non blu. Con il lato 2 e quello 4 invece funziona, così come con il lato 10: più in generale Behrends ha mostrato che perché valga quella proprietà il lato del triangolo deve essere della forma 3k+1. Voi come lo dimostrereste? Qui c’è il mio approccio (non ho letto l’articolo citato sul NYT, ma mi stupirei se la dimostrazione fosse essenzialmente diversa dalla mia).

Continua a leggere

1 + 2 + 4 + 8 + … = -1

Dopo la manipolazione delle serie infinite della scorsa settimana, eccovene un’altra che vi lascerà sicuramente perplessi. Prendiamo la somma infinita 1 + 2 + 4 + 8 + …, dove ogni termine è il doppio del precedente. Qual è la sua somma? Non sembrano esserci dubbi; tutti i termini sono positivi, ciascuno è maggiore del precedente, se ci fermiamo all’n-simo termine la somma parziale è 2n+1−1… insomma la somma è infinita. Anche se facciamo la somma di Cesaro, quella che ci permette di dire che la somma della serie non assolutamente convergente 1 − 1 + 1 − 1 + 1 − … è 1/2 (non ve ne ho mai parlato?) la somma della nostra serie originale è infinita. Eppure…

Eppure Eulero aveva fatto questo ragionamento. Immaginiamo che questa somma abbia un valore $S$. Avremmo allora per definizione $S = 1 + 2 + 4 + 8 + …$, e quindi $2S = 2 + 4 + 8 + 16 + …$. Se ora sommiamo 1 a entrambi i membri dell’equazione otteniamo $2S + 1 = 1 + 2 + 4 + 8 + 16 + … = S$. Spostando le $S$ a sinistra e i numeri a destra, ricaviamo per l’appunto $S = -1$. E in effetti Eulero (che sapeva benissimo che la serie andava all’infinito…) pensava che i numeri negativi fossero maggiori di tutti i numeri razionali.

Il tutto vi sembra solo uno sporco trucco, come nella “dimostrazione” per cui 1 = 2 ottenuta dividendo a un certo punto entrambi i membri di un’equazione per zero? Non necessariamente, se passiamo dall’aritmetica a qualcosa di più avanzato. Come potete per esempio leggere su Wikipedia, consideriamo la serie di potenze $f(z) = 1 + 2z + 4z^2 + 8z^3 + 16z^4 + …$. (Uso la $z$ e non la $x$ perché lavorerò nel campo dei numeri complessi); intorno al punto 0 il suo raggio di convergenza (cioè il cerchio più grande per cui per tutti tutti i punti al suo interno, esclusi al più quelli sulla circonferenza, la serie converge) è 1/2, perché per z=1/2 la funzione è 1 + 1 + 1 + 1 + … che va all’infinito. Esiste però un teorema dell’analisi complessa che dice che se eliminiamo i punti in cui la funzione assume per l’appunto un valore infinito possiamo associare un unico valore finito per la funzione a tutti gli altri punti del piano complesso; questo valore coincide pertanto con quello della serie di partenza dove essa converge. La serie di potenze equivale alla funzione $f(z) = \tfrac{1}{1-2z}$, e se ora prendiamo $z=1$ otteniamo per l’appunto −1 come risultato. Per completezza, Eulero usò un approccio simile, anche se chiaramente solo sui numeri reali, per arrivare alla sua formula; e lo stesso tipo di calcolo è stato usato anche da Ramanujan, quando disse che $1 + 2 + 3 + 4 + … = \zeta(1) = -\tfrac{1}{12}$. La matematica è pluralistica, anche se sono in molti a credere che non sia così e che ci sia un’unica possibile soluzione per qualunque problema: in realtà quello che importa è avere un ambiente coerente (che non potremo dai dimostrare essere tale, ma quella è un’altra storia) e siamo a posto.

Ultima curiosità: la voce di Wikipedia dice anche che se vediamo la serie come composta di numeri 2-adici $(1_{2p}, 10_{2p}, 100_{2p}, 1000_{2p}, ….)$ allora la somma è comunque $-1$, perché la somma è $…1111111_{2p}$ e se sommiamo 1 tutti gli 1 si annullano e resta appunto zero; ma non ho ancora trovato il tempo per spiegare cosa sono i numeri p-adici, quindi avete il diritto di non capire cosa ho scritto :-)

Qual è la probabilità che due numeri presi a caso siano primi tra loro?

Prendete due numeri naturali a caso: per esempio 42 e 2025. Come vedete, in questo caso i numeri hanno un fattore in comune, per la precisione 3. Se invece avessimo scelto 42 = 2×3×7 e 2035 = 5×11×37 non ci sarebbe stato nessun fattore in comune, e quindi sono primi tra loro. Se vi piace la matematica, una domanda sorge spontanea: qual è la probabilità che se scegliamo due numeri a caso essi siano primi tra loro?

La domanda è più insidiosa di quanto possa sembrare a prima vista. Come è possibile scegliere un numero a caso, visto che ce ne sono infiniti? La probabilità di sceglierne uno è zero, come ci insegna Kolmogorov. I matematici però non si lasciano fermare da queste quisquilie, e hanno trovato un modo ragionevole per scegliere un numero a caso: calcolare il limite per $n \to \infty$ di cosa succede se scegliamo due numeri a caso tra 1 e $n$. Questo è un semplice trucco formale: i conti li si fa lo stesso all’infinito…

Vediamo ora i conti effettivi. Preso un numero primo $p$, la probabilità che due numeri casuali abbiano entrambi un fattore $p$ è $1\!/\!p^2$, e quindi quella che non abbiano quel fattore è $1 – 1\!/\!p^2$. Dato che la probabilità è indipendente dal numero primo scelto, la probabilità che due numeri non abbiano fattori primi in comune è

$$ P = (1 – 1\!/\!2^2)(1 – 1\!/\!3^2)(1 – 1\!/\!5^2)(1 – 1\!/\!7^2)(1 – 1\!/\!11^2)\cdots $$

Ma sappiamo che possiamo scrivere $1\!/\!(1-x) = 1 + x + x^2 + x^3 + \cdots$. Sostituendo queste successioni infinite nella formula sopra ricaviamo

$$ P = \left( (1 + 1\!/\!2^2 + 1\!/\!2^4 + \cdots)(1 + 1\!/\!3^3 + 1\!/\!3^4 + \cdots) \cdots \right) ^{-1}. $$

Qui arriva il colpo di genio, che elimina uno dei due livelli di infinito nel prodotto qui sopra. Un qualunque numero è sempre esprimibile in un unico modo come prodotto di numeri primi. Questo significa che tutti e soli i quadrati dei numeri naturali si troveranno una e una sola volta come demoninatore, scegliendo opportunamente i fattori, (Chiaramente non si può ottenere un numero che non è un quadrato perfetto, se moltiplichiamo solo quadrati perfetti). Dunque la somma vale

$$ P = (1 + 1\!/\!2^2 + 1\!/\!3^2 + 1\!/\!4^2 + 1\!/\!5^2 + \cdots )^{-1} $$

Non si direbbe abbiamo fatto un grande passo avanti, vero? Ma qui possiamo farci aiutare da zio Eulero, che nel 1735 risolse il “Problema di Basilea” e dimostrò che la somma degli inversi dei quadrati dei numeri naturali vale $\pi^2\!/\!6$. (Oggi chiamiamo quella somma $\zeta(2)$, usando la zeta di Riemann, ma quella è un’altra storia). Pertanto la probabilità che cerchiamo è il suo inverso, cioè $6/\pi^2$, pari a circa il 61%.

L’avreste mai detto, che pi greco sarebbe spuntato

L’alacre castoro

Non so se avete mai visto il nome scritto in italiano – credo ci fosse nelle traduzioni dei giochi matematici di Martin Gardner – ma se avete un po’ di dimestichezza con l’informatica teorica dovreste sapere che cos’è il Busy Beaver. O meglio non dovreste essere sicuri di saperlo, perché ci sono due diverse definizioni. Quella originale, proposta da Tibor Rado come funzione Sigma, rappresenta il massimo numero di 1 che una macchina di Turing a n stati con due simboli (0 e 1) che termina la sua computazione può stampare. Rapido ripasso: una macchina di Turing è composta da un nastro infinito, una testina che può leggere un simbolo per volta, e un insieme di stati che sono il suo programma, perché dicono cosa può fare (scrivere un simbolo, eventualmente cancellarlo anche se nel nostro caso si suppone che il nastro contenga infiniti 0, spostarsi a sinistra o a destra ed entrare in un nuovo stato). Ci sono macchine di Turing che non terminano mai la computazione: per esempio se partiamo con un nastro pieno di zeri e abbiamo lo stato “se trovi scritto 0, scrivi 1 e vai a destra” avremo un nastro che si riempirà di 1 dal punto di partenza a destra verso l’infinito. Queste macchine non sono così interessanti, quindi per il Busy Beaver si richiede che la macchina termini l’elaborazione. La seconda definizione, indicata come BB(n), non conta gli uni scritti ma il numero massimo di passi che una macchina di Turing con n stati può compiere prima di fermarsi: anche in questo caso si richiede che la macchina effettivamente si fermi.

Possiamo trovare i primi valori di queste funzioni, come al solito, su OEIS. Per quanto riguarda la funzione Sigma, abbiamo

$$\Sigma(1) = 1; \Sigma(2) = 4; \Sigma(3) = 6; \Sigma(4) = 13; \Sigma(5) = 4098.$$

I primi valori di BB() sono invece i seguenti:

$$ BB(1) = 1; BB(2) = 6; BB(3) = 21; BB(4) = 107; BB(5) = 47176870.$$

Il valore di BB(5) è stato congetturato nel 1990 e dimostrato nel 2024: per verificarlo si sono dovute studiare 88664064 macchine di Turing e decidere se si fermano oppure no. La macchina “vincente” ha questa definizione:

         0       1
A       1RB 	1LC
B 	1RC 	1RB
C 	1RD 	0LE
D 	1LA 	1LD
E 	--- 	0LA

La tabella si legge in questo modo: la colonna di sinistra indica in che stato si trova la macchina, la colonna centrale cosa succede se c’è scritto 0 sotto la testina e quella di destra cosa succede se c’è scritto 1; le triplette di caratteri dicono cosa scrivere (0 oppure 1), se andare a destra (R) o sinistra (L), e infine in quale stato posizionarsi. Non è mai possibile arrivare nello stato E e vedere uno 0, quindi quella casella è vuota.

E quali sono i valori successivi delle due successioni? Non solo non lo si sa ma non lo si potrà nemmeno sapere. Nel caso di Σ, sappiamo che Σ(6) > 10^^15. La notazione con doppio cappello, indicata a volte con l’esponente a sinistra ( 1510 ), è la tetrazione, la generalizzazione di moltiplicazione ed elevamento a potenza. Come 3×5 = 3+3+3+3+3 e 3^5 = 3×3×3×3×3×, 3^^5 = 3^(3^(3^(3^3)))). 10^^15 è insomma un numero così grande che è praticamente inconcepibile. Ma BB(6) è molto, molto, molto più grande: Scott Aaronson riporta che BB(6) > 2^^^5, dove il triplo cappelletto indica la pentazione, cioè il passo successivo alla tetrazione. Questo risultato surclassa il vecchio limite che era “solo” 10^^10000000. Quanto è grande quel numero? Aaronson spiega che se avessimo 10^^10000000 granelli di sabbia potremmo riempire 10^^10000000 copie dell’universo osservabile. Sì, lo stesso numero, tanto il valore è così grande che non ci si accorge della differenza. Numeri oltre ogni comprensione umana, insomma!

Ultimo aggiornamento: 2025-07-18 23:02

Riusciranno i torinesi ad attraversare piazza Baldissera?

Leggo su Urbanfile che finalmente a Torino hanno messo mano alla sistemazione di Piazza Baldissera. Per i non torinesi: quando ero giovane e vivevo a Torino, piazza Baldissera era uno snodo abbastanza importante, con la stazione ferroviaria di Torino Dora, la ferrovia per Milano che correva sopraelevata e un sovrappasso in direzione ovest-est con la buffa caratteristica di avere una rotonda al suo interno. Poi ci sono stati i lavori per il passante, il sovrappasso è stato buttato giù mentre si interravano i binari e si facevano diventare corso Principe Oddone e corso Venezia delle arterie a tre corsie (prima ne avevano una…). Il tutto creando una grande rotonda ed eliminando i semafori preesistenti.

Il piccolo guaio, come scrissi al tempo sul Post (copia qui), è che gli urbanisti non avevano mai sentito parlare del paradosso di Braess: aggiungere capacità a una strada può portare ad aumentare il tempo di percorrenza (per chi ha studiato un po’ di teoria dei giochi, ciò è dovuto all’esistenza di un equilibrio di Nash subottimale: in altre parole, a nessuno singolarmente conviene tornare ai vecchi percorsi ma bisognerebbe che ci si mettesse tutti d’accordo.) E in effetti i chilometri di coda a quella rotonda erano diventati la norma, tanto che alla fine si era addirittura ristretto l’accesso da corso Venezia per ridurre un po’ il traffico da quella direzione. Le code c’erano comunque, garantisco.

Finalmente, dopo anni di polemiche e di studi del Politecnico, sono partiti i lavori. Torneranno i semafori, che spergiureranno essere “intelligenti” e adattarsi alle condizioni del traffico – non ci credo, ma tanto di traffico ne arriva da tutte le parti – e soprattutto tornerà il tram, che non farà la rotonda come per esempio in largo Grosseto ma taglierà la piazza a metà come in piazza Derna: anche gli ingegneri ci arrivano. (Nota: l’articolo di Urbanfile è sbagliato. Il tram che tornerà è il 10, non l’1, e da via Cecchi finirà in via Stradella come faceva già prima dei lavori, non in corso Venezia).

Certo che se qualcuno ci avesse pensato prima si sarebbero risparmiati dei bei soldi: ma si sa che la matematica non conta nulla!

Numbers for Masochists

ho perso Il primo giorno in seconda liceo, il nuovo professore di matematica si è presentato dicendo a ciascuno di noi un numero di due cifre e chiedendo di fattorizzarlo (a mente, ovvio). Questo è abbastanza banale: se volete allenarvi potete andare su questo sito, dove in un minuto dovete indicare quanti più numeri primi possibile. (Ci ho provato mentre scrivevo questo post e sono cascato solo in fondo, ma era già un numero di tre cifre).

Tutto questo è però da dilettanti. Nel 2023 Hilarie Orman e Richard Schroeppel hanno preparato un manuale (mai uscito dallo stato di bozza) dal titolo “Numbers for Masochists: A Guide to Mental Factoring” che spiega come fattorizzare a mente numeri fino a 100000 (centomila, ho messo il numero corretto di zeri). Gli autori dicono subito che è una cosa essenziamente inutile, ma non si sa mai cosa uno voglia fare per perdere tempo. Alcune tecniche le conoscevo, altre (quelle per trovare fattori primi grandi, generalmente) mi erano ignote; ma credo che la parte più interessante sia quella dove gli autori raccontano la matematica che sta dietro ad alcune di queste regole mentali, soprattutto quella delle formule quadratiche. Tanto il manuale si può liberamente scaricare: potete poi decidere voi se ne vale o no la pena.

Due sviluppi matematici inaspettati

Oggi parlo brevemente di due sviluppi matematici (occhei, il secondo è più legato all’intelligenza artificiale) che hanno dato un risultato che non ci si aspettava. I due sviluppi hanno in comune che il matematico intervistato dallo Scientific American per far capire di più (hahaha) i lettori è sempre lo stesso: Ken Ono, un pezzo grosso nella teoria dei numeri, che ha condotto in prima persona il primo sviluppo e partecipato al secondo.

Il primo sviluppo parla di una definizione dei numeri primi. A scuola ci hanno insegnato che un numero è primo se non ha divisori propri. (Il numero stesso e 1 sono divisori impropri: così ci togliamo una volta per tutte il commento “ma perché 1 non è considerato primo?”). Quello che Ono ha scoperto, insieme a William Craig e Jan-Willem van Ittersum, è una definizione alternativa di numero primo che non parla di divisioni, ma si basa sulle partizioni di un numero. Una partizione di un numero naturale n è semplicemente un modo di suddividerlo in parti (sempre numeri naturali) che una volta sommate tra di loro danno il numero di partenza. Per esempio ci sono 11 partizioni di 6: (1,1,1,1,1,1), (2,1,1,1,1), (2,2,1,1), (2,2,2), (3,1,1,1), (3,2,1), (3,3), (4,1,1), (4,2), (5,1), (6). Ordunque, Ono e i suoi colleghi hanno dimostrato che esistono infinite funzioni legate alle partizioni che permettono di dire se un numero è primo. Se per esempio prendiamo un numero n e calcoliamo

$$(3n^3−13n^2+18n−8)M_1(n)+(12n^2−120n+212)M_2(n)−960M_3(n)$$

dove le $M_i$ sono le funzioni di partizione di MacMahon, che sono abbastanza note a chi lavora sulle partizioni, otterremo zero se e solo se n è un numero primo. A che serve tutto questo? Da un punto di vista pratico, a nulla. Calcolare le $M_i$ è molto più complicato di fattorizzare un numero, che è già un compito non banale. Insomma, se vi stavate preoccupando che gli algoritmi di crittografia basati sulla difficoltà di fattorizzazione fossero da buttare via potete dormire sonni tranquilli. Quello che è importante, però, è avere trovato una correlazione tra due campi della matematica apparentemente slegati tra di loro: e si sa che in questi casi da cosa nasce cosa.

Il secondo sviluppo vede invece una versione di o4-mini (il modello più recente di OpenAI) addestrato esplicitamente su problemi di teoria dei numeri. Un gruppo di matematici, ancora una volta guidato da Ono, ha preparato un insieme di domande “difficili” e su cui non dovevano esserci esempi risolti in letteratura, tanto che i matematici non solo hanno firmato un NDA ma è stato loro imposto di usare Signal per comunicare tra di loro, in modo che non potessero esserci fuoriuscite di dadi. Secondo Ono, anche se alla fine i trenta matematici hanno trovato dieci domande a cui il modello non ha saputo rispondere, i progressi dell’IA sono stati incredibili. Ono racconta di un problema aperto di teoria dei numeri che è stato risolto in una decina di minuti, con il modello che termina l’esposizione con “Non è necessaria la citazione perché il numero misterioso è stato calcolato da me!” Come ha commentato Yang Hui He, “C’è la dimostrazione per induzione, la dimostrazione per contraddizione e la dimostrazione per intimidazione. Se dici qualcosa con sufficiente autorità, la gente s’intimorisce. Penso che o4-mini abbia imparato la dimostrazione per intimidazione: afferma tutto con grande sicurezza”. Non ho visto le domande, e anche se le avessi viste non penso che le avrei capite, o se per questo avrei capito l’output del modello – no, non lo chiamo “ragionamento”. La mia idea è che in un certo senso il risultato sia combinatorio: è vero che non esiste un testo specifico da copiare per trovare la risposta, ma le tecniche sono comunque standard e quindi gli esempi trovati in letteratura sono utilizzabili da un sistema automatico per costruire la risposta. Un livello superiore e una velocità molto maggiore rispetto a quello che facevo io all’università nel risolvere gli esercizi di algebra, ma la logica è ancora la stessa.

Ultimo aggiornamento: 2025-07-02 11:39