Archivi categoria: 2025

post di argomento matematico del 2025

Come approssimare un arco di circonferenza

Approssimazione di un arco

Come si può misurare la lunghezza di un arco di circonferenza? Semplice: si misura l’angolo al centro relativo e il raggio della circonferenza e si fa la proporzione, sapendo che tutta la circonferenza ha ovviamente lunghezza $2πr$.

Nel libro del 1803 di Peter Nicholson Carpenter’s New Guide viene però data una costruzione approssimata. Dato l’arco (non troppo grande) $\overset{ \huge\frown}{AB}$, si divida in quattro parti il segmento $AB$ con i punti $C_1, C_2, C_3$ come in figura. Se la circonferenza di centro $A$ che passa per $C_1$ interseca l’arco dato in $D$, allora il segmento $C_3D$ è approssimativamente lungo la metà dell’arco. Nicholson avverte che questa costruzione si può usare solo per archi inferiori a un quadrante.

In questo caso, come nel 1981 ha mostrato il matematico britannico Ian Cook, l’errore massimo che si commette è dello 0,6%, che per un carpentiere è ampiamente all’interno delle tolleranze ammesse. Il tutto senza goniometri. Niente male, no?

(fonte: Futility Closet)

tf–idf

Non avevo mai sentito parlare di questa funzione, il cui nome completo è “term frequency–inverse document frequency”. Eppure è una funzione del tutto naturale nel caso si voglia trovare documenti “simili” a quello di partenza in una collezione di testi.

L’idea sottostante è a posteriori ovvia. Se ho un documento in cui una parola appare molto spesso, altri documenti in cui questa parola compare spesso dovrebbero essere simili. Ma ci accorgiamo subito che questa euristica non funziona: connettivi come “che”, “perciò” oppure articoli e forme dei verbi ausiliari appariranno spesso in praticamente ogni documento. La funzione tf-idf relativa a una parola P tiene conto di tutto questo: è direttamente proporzionale alla probabilità che P appaia nel testo, ma inversamente proporzionale alla probabilità che P appaia nella collezione completa di testi. In altri termini, la funzione assume un valore tanto maggiore quanto la parola è in genere meno usata rispetto a quanto lo sia nel testo iniziale; una parola usata sempre più o meno allo stesso modo ha i due fattori che si elidono a vicenda.

In formule, abbiamo che tf-idf è il prodotto di due funzioni: tf, la frequenza del termine nel nostro documento, e idf, l’inverso della frequenza in tutti i documenti. Più precisamente,

$$\mathrm{tf_{i,j}} = \frac{n_{i,j}}{|d_j|},$$

dove $n_{i,j}$ è il numero di occorrenze del termine $i$ nel documento $j$ e il denominatore (il numero di parole nel documento) serve per perequare i valori per i documenti di lunghezza variabile, e

$$\mathrm{idf_{i}} = \log_{10} \frac{|D|}{|\{d: i \in d\}|},$$

dove $|D|$ è il numero di documenti nella collezione e al denominatore c’è il numero di documenti che contengono il termine $i$. (Per definizione ce n’è almeno uno, altrimenti non calcoleremmo idf, e quindi il denominatore non può mai essere nullo).

Il tutto funziona? Diciamo che funzionicchia. Già il concetto di idf è più euristico che altro, perché applica la legge di Zipf che come sappiamo non è scolpita nel granito; e visto che a quanto pare le raccomandazioni di libri simili nelle librerie online pare basarsi anche su tf-idf direi che ci sono ampi margini di miglioramento. Secondo Wikipedia in inglese la formula è stata anche applicata in altri campi, con risultati deludenti. Però è sempre meglio una cattiva formula che nessuna formula, e spesso si può usare il sistema “al rovescio”, per esempio cercando di scoprire se alcune delle lettere paoline siano o no state effettivamente scritte dall’apostolo. L’idea è che in questo modo brutale non si può riconoscere lo stile ma almeno si verifica che la terminologia non sia cambiata troppo, e si ha un punteggio numerico e non una sensazione come si faceva un tempo. Insomma, è comunque una freccia all’arco dei filologi.

Numeri “perfetti allo specchio”

Sappiamo che un numero è perfetto se è la somma dei suoi divisori propri. Per esempio, 496 è perfetto perché 1 + 2 + 4 + 8 + 16 + 31 + 62 + 124 + 248 = 496. Prendiamo ora il numero 10311: la somma dei suoi divisori è 1 + 3 + 7 + 21 + 491 + 1473 + 3437 = 5433 ≠ 10311. Ma se scriviamo questi divisori da destra a sinistra, otteniamo 7343 + 3741 + 194 + 12 + 7 + 3 + 1 = 11301 che è appunto 10311 scritto alla rovescia.

Numeri come questo si chiamano “Picture perfects numbers”, che io traduco come “numeri perfetti allo specchio”, e sono così poco noti che non hanno nemmeno una voce su Wikipedia in inglese :-), anche se OEIS ha una successione con l’elenco dei (sette…) numeri perfetti allo specchio conosciuti: 6, 10311, 21661371, 1460501511, 7980062073, 79862699373, 798006269373.

Una curiosità: Jens Kruse Andersen ha scoperto che se il numero p = 140z10n89 è primo, dove z è una stringa (anche nulla) di zero e n un’altra stringa (anch’essa eventualmente nulla) di 9, allora 57p è un numero perfetto allo specchio. Peccato che non si siano mai trovati numeri primi di questa forma…

Ultimo aggiornamento: 2025-08-27 22:35

Ultrafinitismo

Una corrente filosofica della matematica, l’intuizionismo, afferma che non possiamo usare l’infinito nei nostri teoremi, perché non potremmo mai ottenerlo. Un corollario di questa affermazione è che almeno ad oggi (e probabilmente per sempre, ma chi lo può sapere?) non possiamo dire “nello sviluppo decimale di pi greco c’è una successione di 1000 cifre 0 consecutive, oppure tale successione non c’è”: in altre parole, il principio del terzo escluso vale solo quando abbiamo un numero finito di possibilità, e quindi in linea di principio possiamo controllarle a una a una. Non sono moltissimi i matematici che seguono tale corrente, principalmente perché le cose che si possono dimostrare sono molte di meno: ma comunque è una posizione rispettata.

Leggo però da New Scientist che esiste una corrente filosofica ancora più talebana: gli ultrafinitisti. Per costoro, non solo l’infinito non esiste, ma non esistono nemmeno i numeri “troppo grandi”, nel senso di quelli che non potremo mai computare nemmeno in linea di principio, data la finitezza del nostro universo. Attenzione: questa teoria è del tutto diversa da quella del “grossone” di Yaroslav Sergeyev, dove si dà un valore specifico – diciamo N – all’infinito ottenuto con tutti inumeri naturali e a questo punto possiamo per esempio dire che i numeri pari sono N/2. Gli ultrafinitisti non solo non ammettono l’esistenza del grossone, ma affermano che non esiste nemmeno la parte intera del primo numero di Skewes, che è exp(exp(exp(79))). Questo numero non potremo mai calcolarlo non dico esattamente ma con una precisione inferiore all’unità, quindi la sua parte intera non esiste.

Detto tutto ciò, e aggiunto che credo che siano i fisici i più interessati, termino notando che anche Wikipedia segnala che le fondazioni dell’ultrafinitismi sono troppo vaghe per ottenere qualcosa di davvero utile…

La magia di Moessner

Cominciamo con qualcosa di facile. Prendiamo i numeri naturali:
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, …
Cancelliamo ora ogni secondo numero:
1, 3, 5, 7, 9, 11, 13, …
Facciamo infine le somme parziali:
1, 4, 9, 16, 25, 36, 49, …
Abbiamo così ottenuto la successione dei quadrati perfetti. Nulla di strano: sappiamo che i quadrati sono la somma dei numeri dispari, lo si vede disegnando gli gnomoni.

Ma ora andiamo più in là. Ripartiamo dai numeri naturali:
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, …
ma stavolta togliamo ogni terzo numero:
1, 2, 4, 5, 7, 8, 10, 11, 13, 14, 16, 17, 19, 20, …
Facciamo anche stavolta le somme parziali:
1, 3, 7, 12, 19, 27, 37, 48, 61, 75, 91, 108, 127, 147, …
Togliamo ogni secondo numero:
1, 7, 19, 37, 61, 91, 127, …
E rifacciamo infine le somme parziali:
1, 8, 27, 64, 125, 216, 343, …
Abbiamo ottenuto la successione dei cubi!

Come arrivare alle quarte potenze? Semplice: aggiungiamo come passo iniziale quello di eliminare ogni quarto numero prima di sommare.
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 , …
1, 2, 3, 5, 6, 7, 9, 10, 11, 13, 14, 15, …
1, 3, 6, 11, 17, 24, 33, 43, 54, 67, 81, 96, …
Ora si fa il passaggio di cancellare ogni terzo numero e poi fare le somme parziali:
1, 3, 11, 17, 33, 43, 67, 81, …
1, 4, 15, 32, 65, 108, 175, 256, …
E finalmente si cancella ogni secondo numero e si fanno ancora una volta le somme parziali:
1, 15, 65, 175, …
1, 16, 81, 256, …
Et voilà!

Questa struttura aritmetica è stata trovata da Alfred Moessner, che nel 1951 scrisse un articolo intitolato “Eine Bemerkung über die Potenzen der natürlichen Zahlen” (un’osservazione delle potenze dei numeri naturali) e dimostrato lo stesso anno da Oskar Perron. Non so chi abbia deciso di chiamarlo “la magia di Moessner”, e non più banalmente il teorema di Moessner – nome comunque usato, come si vede su Wikipedia – ma secondo me un po’ di magia c’è davvero…

PS: se si eliminano i numeri triangolari, si ottiene invece la successione dei fattoriali!

Gli LLM “normali” e la matematica

All’inizio della settimana ho scritto su MaddMaths! (come, non leggete la mia rubrica “il matematico non praticante” che tengo lì? Male, nolto male) un articolo sulla medaglia virtuale d’oro ottenuta da Google DeepMind alle Olimpiadi della matematica. Già lì esprimevo i miei dubbi: vedo che non sono il solo, leggendo questo articolo di Emily Riehl su Scientific American.

Dall’articolo ho scoperto che le voci che anche OpenAI avrebbe raggiunto un punteggio da medaglia d’oro sono solo voci, o almeno non c’è stato un riconoscimento ufficiale da chi gestisce l’IMO: nulla di strano, in un ambiente dove l’hype è al momento più importante dei risultati. Ma la cosa più interessante è un’altra. Non è tanto il fatto che questi modelli tirano fuori un certo numero di risposte e poi scelgano (non ho idea come) quella più robusta: non penso, a differenza di Riehl, che questo equivalga a lavorare in squadra, visto che il modello sottostante è lo stesso. Quello che conta davvero è che si è tenuto un torneo parallelo informale ospitato da MathArena e che ha coinvolto (si fa per dire) i modelli disponibili commercialmente. Risultato? Nessuno è arrivato nemmeno alla medaglia di bronzo (che viene data a metà circa dei partecipanti alle olimpiadi reali). Il migliore è stato Gemini 2.5 Pro con 13 punti su 42, molti meno della soglia di 19 punti necessaria per la medaglia di bronzo. (Un esercizio risolto correttamente vale sei punti, ma se ne può ottenere qualcuno per una risposta errata ma con alcuni passi corretti). Il tutto spendendo più di 400 dollari :-)

Il mio commento finale? non è diverso da quello che avevo scritto su MaddMaths!. Questi sistemi ne hanno ancora di parametri da macinare. Questo non vuol dire prenderli sottogamba, e del resto ricordo che i sistemi di dimostrazione automatica dei teoremi sono ormai usati regolarmente, il che significa che nessuno ha un pregiudizio aprioristico. Semplicemente manca ancora molto per avere qualcosa di più di un aiuto.

Ultimo aggiornamento: 2025-08-07 16:22

Il triangolo magico

Il triangolo di lato 10 mostrato nella figura qui sotto ha la prima riga con i cerchi colorati di rosso, giallo o blu. Non sono colorati proprio a caso: ho preso le prime cifre decimali di pi greco e usato il rosso se sono uguali a 0 modulo 3, in giallo se sono 1 mod 3, in blu se sono 2 mod 3. Ma questo non importa. Supponete ora di colorare tutto il triangolo in questo modo: se i due cerchi soprastanti sono dello stesso colore si usa quel colore, mentre se sono di colore diverso si usa il terzo colore. Bene: io non ho fatto la prova, ma sono certo che il cerchio più in basso sarà rosso. Come mai?

Il triangolo di partenza

Il trucco è guardare solamente i due cerchi estremi nella prima riga, e applicare alla coppia le regole che ho definito qui sopra. Quei due cerchi sono rossi, quindi anche quello in basso dovrà essere rosso. Semplice, no? Gary Antonick ne aveva parlato sul NYT: la proprietà è stata scoperta da Steve Humble, che insegna didattica della matematica all’università di Newcastle, e dimostrata e generalizzata da Ehrhard Behrends. qui la regola non vale Notate che la regola non funziona sempre: nel triangolo di lato 3 mostrato qui a destra è immediato notare che se il cerchio in mezzo nella prima riga fosse blu e non giallo allora quello in bssso sarebbe giallo e non blu. Con il lato 2 e quello 4 invece funziona, così come con il lato 10: più in generale Behrends ha mostrato che perché valga quella proprietà il lato del triangolo deve essere della forma 3k+1. Voi come lo dimostrereste? Qui c’è il mio approccio (non ho letto l’articolo citato sul NYT, ma mi stupirei se la dimostrazione fosse essenzialmente diversa dalla mia).

Continua a leggere

1 + 2 + 4 + 8 + … = -1

Dopo la manipolazione delle serie infinite della scorsa settimana, eccovene un’altra che vi lascerà sicuramente perplessi. Prendiamo la somma infinita 1 + 2 + 4 + 8 + …, dove ogni termine è il doppio del precedente. Qual è la sua somma? Non sembrano esserci dubbi; tutti i termini sono positivi, ciascuno è maggiore del precedente, se ci fermiamo all’n-simo termine la somma parziale è 2n+1−1… insomma la somma è infinita. Anche se facciamo la somma di Cesaro, quella che ci permette di dire che la somma della serie non assolutamente convergente 1 − 1 + 1 − 1 + 1 − … è 1/2 (non ve ne ho mai parlato?) la somma della nostra serie originale è infinita. Eppure…

Eppure Eulero aveva fatto questo ragionamento. Immaginiamo che questa somma abbia un valore $S$. Avremmo allora per definizione $S = 1 + 2 + 4 + 8 + …$, e quindi $2S = 2 + 4 + 8 + 16 + …$. Se ora sommiamo 1 a entrambi i membri dell’equazione otteniamo $2S + 1 = 1 + 2 + 4 + 8 + 16 + … = S$. Spostando le $S$ a sinistra e i numeri a destra, ricaviamo per l’appunto $S = -1$. E in effetti Eulero (che sapeva benissimo che la serie andava all’infinito…) pensava che i numeri negativi fossero maggiori di tutti i numeri razionali.

Il tutto vi sembra solo uno sporco trucco, come nella “dimostrazione” per cui 1 = 2 ottenuta dividendo a un certo punto entrambi i membri di un’equazione per zero? Non necessariamente, se passiamo dall’aritmetica a qualcosa di più avanzato. Come potete per esempio leggere su Wikipedia, consideriamo la serie di potenze $f(z) = 1 + 2z + 4z^2 + 8z^3 + 16z^4 + …$. (Uso la $z$ e non la $x$ perché lavorerò nel campo dei numeri complessi); intorno al punto 0 il suo raggio di convergenza (cioè il cerchio più grande per cui per tutti tutti i punti al suo interno, esclusi al più quelli sulla circonferenza, la serie converge) è 1/2, perché per z=1/2 la funzione è 1 + 1 + 1 + 1 + … che va all’infinito. Esiste però un teorema dell’analisi complessa che dice che se eliminiamo i punti in cui la funzione assume per l’appunto un valore infinito possiamo associare un unico valore finito per la funzione a tutti gli altri punti del piano complesso; questo valore coincide pertanto con quello della serie di partenza dove essa converge. La serie di potenze equivale alla funzione $f(z) = \tfrac{1}{1-2z}$, e se ora prendiamo $z=1$ otteniamo per l’appunto −1 come risultato. Per completezza, Eulero usò un approccio simile, anche se chiaramente solo sui numeri reali, per arrivare alla sua formula; e lo stesso tipo di calcolo è stato usato anche da Ramanujan, quando disse che $1 + 2 + 3 + 4 + … = \zeta(1) = -\tfrac{1}{12}$. La matematica è pluralistica, anche se sono in molti a credere che non sia così e che ci sia un’unica possibile soluzione per qualunque problema: in realtà quello che importa è avere un ambiente coerente (che non potremo dai dimostrare essere tale, ma quella è un’altra storia) e siamo a posto.

Ultima curiosità: la voce di Wikipedia dice anche che se vediamo la serie come composta di numeri 2-adici $(1_{2p}, 10_{2p}, 100_{2p}, 1000_{2p}, ….)$ allora la somma è comunque $-1$, perché la somma è $…1111111_{2p}$ e se sommiamo 1 tutti gli 1 si annullano e resta appunto zero; ma non ho ancora trovato il tempo per spiegare cosa sono i numeri p-adici, quindi avete il diritto di non capire cosa ho scritto :-)