Archivi categoria: matematica_light

AI e matematica: ci sono miglioramenti?

Alex Wilkins in questo articolo racconta dei progressi ottenuti nel 2024 dalle intelligenze artificiali nel campo della risoluzione di problemi matematici.
Come sapete, gli LLM non “comprendono” quello che hanno in input (o in output, se per questo) ma scelgono fondamentalmente la frase più probabile data la successione di parole in ingresso e le variabili nascoste che hanno a disposizione. Quindi se chiediamo a ChatGPT e ai suoi amici quanto fa 2 + 2 è estremamente probabile che la risposta sia 4; ma alla domanda “Add 34957 to 70764” rischiamo che la risposta sia 105621. (Non ho fatto la prova, ma immagino che chi sviluppa gli LLM abbia tenuto conto di questa particolare addizione e quindi ci sia del codice che faccia dare la risposta corretta.) Il guaio è che proprio perché gli LLM non capiscono quello che fanno è difficile per loro anche solo accorgersi che il problema è matematico e passarlo a un modulo “classico” che faccia i conti.

Pare però che quest’anno ci sia stato un miglioramento nelle performance di questi sistemi, partendo da Google Deepmind che sarebbe riuscita a prendere una medaglia d’argento alle olimpiadi della matematica – no, non vuol dire arrivare secondi, ma essere tra il 20% dei migliori – e arrivando al prossimo sistema O3 di OpenAI che avrebbe ottenuto il 75,7% di risposte corrette sul test “semiprivato” della ARC Challenge, studiato appunto per avere problemi facili per gli umani ma difficili per l’AI. Peccato che il costo per rispondere a ciascuna domanda è intorno ai 20$; O3 avrebbe anche raggiunto l’87,5%, sopra la soglia dell’85% che permetterebbe di vincere l’ARC Challenge, se non fosse per un piccolo particolare. Il costo per rispondere meglio alle domande è di 172 volte maggiore: in pratica per rispondere a una singola domanda O3 consuma 3500 euro di energia… e comunque le soluzioni in questo caso arrivavano per forza bruta, il che spiega il costo.

Diciamo insomma che questi sistemi ne hanno ancora da fare di strada…

Il rapporto argenteo

il rapporto argenteoInnanzitutto buon Natale, così non me lo dimentico :-)

Conoscete tutti il rapporto aureo, il numero che divide un segmento in due parti che hanno rapporto uguale a quello tra il segmento stesso e la parte maggiore: $\frac{a+b}{a} = \frac{a}{b} = \varphi$; o se preferite la soluzione positiva dell’equazione $x^2 = x + 1$. È molto meno noto il suo fratello, il rapporto argenteo (o numero argenteo) σ. Esso si definisce in modo simile: è il numero dato dall’uguaglianza $\frac{2a+b}{a} = \frac{a}{b} = \sigma$, o se preferite la soluzione positiva dell’equazione $x^2 = 2x + 1$.

Facendo i conti, il rapporto argenteo vale $1 + \sqrt{2}$, cioè circa 2,41421 o se preferite circa 70/29. In figura in alto vedete un rettangolo argenteo che contiene un altro rettangolo argenteo ottenuto togliendo i due quadrati verdi; da qui togliendo i due quadrati rossi si ottiene un terzo rettangolo argenteo.

il rapporto argenteo nell'ottagono regolare Il rapporto argenteo non è carino come quello aureo, ma ha comunque alcune interessanti proprietà. Se per esempio consideriamo l’iterazione $x \gets \tfrac12 (x^2+1) /(x-1)$ per $x_0 \in [2,3]$, abbiamo che σ è un punto fisso superstabile: cioè la derivata della funzione in quel punto è nulla, il che significa che la convergenza è estremamente rapida. Inoltre, lo sviluppo in frazione continua del numero argenteo è σ = [2; 2, 2, 2, 2, …] (confrontatela con quella del numero aureo ϕ = [1; 1, 1, 1, 1, …]), con 1/σ = [0; 2, 2, 2, 2, …]; il rapporto argenteo è un numero di Pisot (il secondo, dopo il rapporto aureo), il che significa che le sue potenze sono ottime approssimazioni di numeri interi.

Dall’iterazione $x \gets \sqrt{1 +2x \vphantom{/} }$ otteniamo poi il radicale innestato σ = $\sqrt{1 +2\sqrt{1 +2\sqrt{1 +\cdots}}} \;.$ Troviamo un rettangolo argenteo anche all’interno di un ottagono regolare, come mostrato in figura. Altre proprietà del numero argenteo: $1 =\frac{1}{\sigma -1} + \frac{1}{\sigma +1}$, $\sigma =\frac{\sigma +1}{\sigma -1}$, $ \sigma =2\sum_{n=0}^{\infty} \sigma^{-2n}$.

Un’ultima curiosità: nella figura qui sotto vediamo come dei rettangoli di rapporto tra i lati σ−1 (blu e verde), σ/(σ−1) (rosso e marrone) e σ (viola, giallo) tassellano un quadrato.

(Immagine dei rettangoli non proprio argentei di Zilverspreeuw, da Wikimedia Commons)

Ultimo aggiornamento: 2024-12-25 20:22

Utensili di plastica e allarmi per un errore aritmetico

utensili di plastica Avete presenti gli utensili di plastica neri? Un articolo pubblicato lo scorso ottobre sulla rivista Chemosphere ha sollevato pesanti dubbi sulla loro tossicità, e la notizia è balzata subito sulle prime pagine dei media americani. Da noi non ho visto nulla, ma non significa molto. Abbiamo avuto titoli come “Quegli utensili di cucina così carino potrebbero stare per avvelenarvi, dice uno studio. Ecco che dovete fare”, dal L.A. Times. Molti americani hanno buttato via i loro utensili.
Lo studio spiegava che quella plastica è riciclata a partire da rifiuti elettronici che arrivano soprattutto dalla Cina (paradossalmente, non si riesce a riciclare automaticamente la plastica nera perché le macchine che distinguono i vari tipi di plastica funzionano a infrarossi, e la plastica nera li assorbe), che provengono da apparecchiature trattate con ritardanti del fuoco.
Lo studio stima che usare utensili contaminati può causare un’assunzione media di 34700 nanogrammi al giorno di etere di decabromodifenile, noto come BDE-209. La dose di riferimento stabilita dalla agenzia per la protezione dell’ambiente americana è di 7000 nanogrammi per chilogrammo di peso per giorno. Un adulto di 60 kg non dovrebbe pertanto assumere più di 42000 nanogrammi al giorno, e solo con quegli utensili ci si arriva quasi.

Avete capito qual è il piccolo problema? Come scritto dal National Post, è un banale errore matematico. Se moltiplichiamo 7000 per 60 otteniamo 420000, non 42000. Quindi l’assunzione è sotto il 10% della dose di riferimento: qualcosa a cui fare attenzione, ma non così pericoloso come sembrava.
Eppure l’autore principale dell’articolo, che alla fine ha dovuto preparare una rettifica, continua a dire “è importante notare che [questo errore] non impatta i nostri risultati.” Se lo dice lui…

La parte più propriamente matematica è però quella finale dell’articolo, dove Joe Schwarcz, direttore del McGill University’s Office for Science and Society, fa una considerazione molto banale: perché mai bisognava indicare la dose di riferimento in nanogrammi? I numeri che escono sono molto grandi e poco riconoscibili. Se la dose di riferimento fosse stata indicata in [EDIT] 7 microgrammi per chilo di massa al giorno e quella trovata negli utensili a 34,7 microgrammi al giorno, ci si sarebbe subito accorti dell’errore…

(immagine presa da SVG Silh)

Ultimo aggiornamento: 2024-12-18 18:06

Risolto il problema del divano?

un divano che gira intorno a un angolo A chi non è capitato di dover far passare un mobile piuttosto grande attraverso una porta, e chiedersi come diavolo riuscirci? Douglas Adams ci aveva persino fatto una gag, nel suo libro Agenzia Investigativa Olistica Dirk Gently. Ma come sapete i matematici non hanno un grande senso dell’umorismo: quindi qualcuno ha provato a darne una formulazione matematica.

Qual è la più ampia superficie rigida che si può spostare attraverso un corridoio ad angolo retto, ossia a forma di L, con entrambi i lati del corridoio di larghezza 1?

Il problema circolava informalmente da tempo, ma solo nel 1966 Leo Moser ne diede una definizione formale. Nel 1968 John Hammersley, ispirandosi alla forma di una cornetta del telefono, elaborò una superficie di area circa 2,2074. Questo risultato fu migliorato nel 1992 da Joseph L. Gerver, che trovò una forma composta da 18 curve analitiche (mostrato più sotto) la cui area è circa 2,2195: un altro metodo di costruzione diverso aveva trovato una superficie della stessa area, ma non c’era la certezza che quello fosse davvero il massimo.

il divano di Gerver, forse ottimale

L’altra settimana però il mondo matematico è venuto a sapere che Jineon Baek ha postato su ArXiv un preprint dove dimostra che quello di Gerver è effettivamente il divano più grande che può girare intorno all’angolo del corridoio. L’unico problema è che la dimostrazione è lunga più di 100 pagine, e quindi ci vorrà un po’ di tempo prima di capire se non ci sono errorini. Vi farò comunque sapere!

(immagini di Claudio Rocchini (1) e TillmanR (2, da Wikimedia Commons)

Come simulare un dado da 9

un dado da 9?Quando si gioca ad alcuni giochi, spesso è necessario lanciare un dado non standard, per esempio perché deve dare un valore da 1 a 10 con la stessa probabilità. In quel caso si dice “lancia un d10”. Oggi non è molto difficile simulare uno di questi lanci: se su Google fate una ricerca “dice d10” avete immediatamente il risultato, oppure potete andare su un sito come Roll a Die. Una volta però non era così, e ad ogni modo c’è un sottile piacere a lanciare i dadi. Che fare, dunque? Esistono alcuni dadi con un numero non standard di facce, come si può vedere su questa pagina Wikipedia: devo dire che ho apprezzato il d1 :-) mentre ho dei dubbi sul fatto che il d9 funzioni davvero.

Tutto questo nasce da un post vecchio ormai di dieci anni che mi è capitato tra gli occhi e che “spiega” come avere dadi da d2 a d30. Solo che l’amico bara, perché per d9 dice “prendete un d10, e se esce 10 ripetete il lancio”. Così sono capaci tutti, e soprattutto è vero che la probabilità di non terminare l’operazione è zero, ma non è detto che non ci voglia molto tempo per arrivare ad avere un valore diverso da 10. Naturalmente si può fare molto di meglio. Avete qualche soluzione? Se volete fermarvi un attimo prima che io la posti è il momento giusto, mentre scrivo qualche riga per far passare lo spazio.

Se fosse stato un d11, ci sarebbero in effetti stati dei problemi: non ho idea di come riuscire ad avere un dado. Ma nove è un bel numero: è il quadrato di 3, e avere un d3 non è così difficile: basta prendere un dado qualunque e accoppiare i suoi risultati, per esempio rovesciandolo se viene un numero da 4 a 6: come sapete, la somma dei numeri sui due lati opposti di un dado è sempre 7. Lanciando due volte il dado così trattato, il primo valore dice se sommare 0, 3 oppure 6 al risultato del secondo dado. Ma non è questa l’idea che ho avuto.

Il mio primo pensiero è stato infatti che lanciando due dadi abbiamo trentasei possibili risultati, se siamo in grado di distinguere i due dadi (diciamo che sono R e B perché uno è rosso e l’altro blu). Se assegniamo i possibili risultati a gruppi di 4, ne avremo esattamente nove, come richiesto. Questo lo si può fare in modo molto semplice: per esempio potremmo dire che se B ha un risultato da 1 a 4 allora consideriamo il valore di R. Se invece B vale 5 o 6, prendiamo il valore di A, lo dimezziamo, arrotondiamo per eccesso e sommiamo 6. Lascio al lettore il facile esercizio di verificare che in questo modo abbiamo la nostra suddivisione perfetta. Una procedura come questa funziona anche solo con un dado, naturalmente da lanciare due volte, e quindi è relativamente semplice da implementare.

(immagine di Dozenalism, da Wikimedia Commons)

I mattoni di Eulero


Immagino che ai miei ventun lettori non serva spiegare cos’è una terna pitagorica: ma magari qualcuno capita qui per caso e non sa che è una terna di numeri naturali che sono i lati di un triangolo rettangolo. La terna pitagorica più famosa è (3,4,5), perché 3² + 4² = 5²; poi ce ne sono infinite, come per esempio (5,12,13) o (40,42,58). In altre parole, i primi due numeri della terna sono i lati di un rettangolo la cui diagonale è il terzo numero.

Bene. Che succede se vogliamo avere un parallelepipedo di lati interi e che abbia le diagonali sulle facce anch’esse intere? Otteniamo un mattone di Eulero. In formule, dobbiamo cercare tre numeri interi $a, b, c$ tali che

$ \begin{cases} a^2 + b^2 = d^2\\ a^2 + c^2 = e^2\\ b^2 + c^2 = f^2\end{cases} $

con $d, e, f$ anch’essi numeri naturali. Si sa che il più piccolo mattone di Eulero ha lati $(a, b, c) = (44, 117, 240)$ e diagonali delle facce $(d, e, f ) = (125, 244, 267)$.

Eulero trovò due formule parametriche che generano infiniti mattoni di Eulero, ma a differenza di quello che succede per le terne pitagoriche esse non generano tutti i mattoni possibili. Un modo per ottenere un mattone di Eulero a partire da una terna pitagorica $(u, v, w)$, dove $w$ è la diagonale del rettangolo di lati $u$ e $v$, è dovuta a Nicholas Saunderson: la terna $a=u|4v^2-w^2|, b=v|4u^2-w^2|, c=4uvw$ è quella voluta; le facce hanno infatti diagonali $d=w^3, e=u(4v^2+w^2), f=v(4u^2+w^2)$. Esistono però infiniti mattoni che non hanno questa struttura, come per esempio $(a, b, c) = (240, 252, 275)$ che ha come diagonali delle facce $(d, e, f ) = (348, 365, 373)$.

Uno potrebbe chiedersi a questo punto se esistono mattoni di Eulero perfetti, dove anche la diagonale principale del parallelepipedo è un intero: probabilmente no, ma non esiste una dimostrazione al riguardo. Sappiamo però che il lato più corto deve essere almeno lungo 5 × 1011 e la diagonale principale almeno 9 × 1015. Diciamo che se ne esistesse uno sarebbe un bel colpo… In compenso, se accettiamo di non avere angoli retti e quindi ottenere un parallelepipedo non rettangolo, allora sono stati trovati vari “mattoni storti perfetti”. Bisogna sapersi accontentare!

Numeri autobiografici… e oltre

Un numero autobiografico (in inglese “self-descriptive number”) è un numero che scritto in una base b è composto di b cifre, che lette da sinistra a destra indicano quante cifre di quel tipo ci sono nel numero stesso, a partire da 0 fino a b−1. Un esempio potrà chiarire un po’ meglio di che si parla. In base 10 consideriamo il numero 6210001000. La sua prima cifra è un 6, e quindi dice che contiene 6 zeri; la seconda cifra è 2, e quindi contiene due 1; terza e settima cifra sono 1, quindi c’è un 2 e un 6; tutte le altre cifre sono 0, quindi non ci sono quelle cifre nel numero.

Di per sé i numeri autobiografici non sono poi così interessanti. In base 2, 3 e 6 non esistono numeri interessanti. Dalla base 7 in su ce n’è uno solo; in base b la sua prima cifra da sinistra è b−4, la seconda è 2, la terza e quella in posizione b−3 sono 1 e le altre sono 0. Gli altri casi sono 12104, 20204 e 212005. Però Lee Sallows, il massimo esperto mondiale in oggetti autodescritti, ha presentato questo esempio:

A: 6434100200 - B: 7332301100 - C: 7324201100

Prendete una striscia qualunque, per esempio la C, e una posizione qualunque, per esempio quella corrispondente al 3. La striscia contiene in quella posizione un 4; allora nelle altre due strisce (A e B) ci sono in tutto quattro 3.

La soluzione proposta è unica, almeno in base 10 e con tre strisce? Non ne ho idea…

Ultimo aggiornamento: 2024-11-20 19:06