Archivi categoria: matematica_light

Dal caso all’ellisse

un poligono casuale Quello che vedete qui a sinistra è un poligono (intrecciato) di 100 lati. D’accordo, assomiglia più a uno scarabocchio, ma tecnicamente è un poligono. Supponiamo di costruire un nuovo poligono i cui vertici siano i punti di mezzo dei cento lati, e ripetere l’operazione a piacere. Cosa otterremo come limite? Beh, sempre un poligono di cento lati, mi direte: ma non è esattamente così. Il poligono ottenuto sarà sempre più piccolo, e il limite dei vari poligoni sarà un singolo punto, il baricentro di quelli iniziali.

Questo non è poi così interessante: cambiamo allora leggermente il nostro esperimento. Dopo ciascun passo scaliamo il poligono ottenuto in modo che i due vettori formati dalle coordinate $x$ e dalle coordinate $y$ dei punti abbiano norma 1, e il baricentro del poligono sia l’origine degli assi: ingrandiamo insomma man mano il poligono, e non pensiamo di arrivare all’infinito ma solo a un numero abbastanza alto di iterazioni. Quello che succede è che i vertici dei poligoni man mano ottenuti tenderanno a essere parte di un’ellisse, inclinata di 45 gradi rispetto agli assi cartesiani. Potete vedere all’opera l'”ellissizzazione” in questa pagina di Jason Davies.

Attenzione: i punti non tendono a una posizione fissa. Lo si vede bene se prendete un poligono di 10 lati e vi fate mostrare solo una posizione ogni due, per smussare il disegno: in pratica si nota una lenta rotazione dei punti. Come mai? Adam N. Elmachtoub e Charles F. Van Loan lo spiegano in questo articolo, dove vengono calcolati i semiassi dell’ellisse partendo dai vettori $x$ e $y$. Ma anche senza studiare la matematica, vedere “sbrogliarsi” il poligono e poi aggiustarsi lentamente è piuttosto ipnotico!

Approssimare il perimetro di un’ellisse

un'ellisse Se abbiamo un cerchio di raggio $r$, la sua circonferenza è $2\pi r$. Questo è facile. Se abbiamo un’ellisse di semiassi $a$ e $b$, il suo perimetro è $P(a,b) = 4aE(e^2)$, dove l’eccentricità $e$ è data da $\sqrt{a^2-b^2}/a$ ed $E$ è l’integrale $E(x) = \int_{0}^{\pi/2}(1-x \sin^2\theta)^{1/2}d\theta$. Un po’ meno facile, considerato poi che quell’integrale è un integrale ellittico del secondo tipo (poca fantasia nei nomi, concordo) e non è risolubile se non con metodi numerici.
Che si può fare, allora? Si può provare a cercare un’approssimazione e accontentarsi di quella. Il solito Ramanujan trovò questa formula:

$P = \pi(a+b)\left( 1 + \frac{3 \lambda^2}{10 + \sqrt{4-e\lambda^2}} \right)$

dove $\lambda = (a-b)/(a+b)$. Io non ho idea se questa formula sia davvero venuta a Ramanujan in sogno, ma è di una precisione incredibile. Tenete conto che queste formule in genere sono sempre meno precise man mano che l’eccentricità $e$ aumenta; John D. Cook mostra che se prendiamo l’orbita del pianeta nano Sedna che ha un’eccentricità 0,8549 (Plutone, per confronto, ha 0,2488 e la terra 0,0167) e un semiasse maggiore di 76 miliardi di chilometri, l’errore commesso con questa formula è di 53 chilometri.
La cosa ancora più bella di questa approssimazione è che l’errore relativo è limitato, e resta sempre sotto lo 0,0051% anche con un’eccentricità massima. Direi che ci si può accontentare!

(figura di ZetaZeti, da Wikimedia Commons)

Ultimo aggiornamento: 2024-09-25 19:35

OpenAI o1 saprà davvero “ragionare matematicamente”?

Mi pare che la notizia secondo cui OpenAI ha creato un chatbot che “sa fare ragionamenti matematici e scientifici” non abbia avuto grande eco. Può darsi che ciò sia dovuto al fatto che OpenAI o1 – questo è il nome in codice del nuovo progetto – è disponibile solo per un selezionato gruppo di utenti, oppure perché a nessuno interessa davvero avere un sistema che sappia risolvere problemi matematici.

Devo dire che l’articolo del NYT è parco di informazioni. Pare che OpenAI o1 usi l’apprendimento per rinforzo, quindi “premiando” le successioni di passi logici rispetto a un risultato ottenuto di colpo. L’idea degli sviluppatori è che in questo modo ci si avvicinerebbe di più al pensiero umano. Io personalmente non sono molto convinto di questo approccio, che continua a nascondere sotto il tappeto il problema di base degli LLM: non è che avere un approccio passo passo faccia sì che il computer abbia un’idea di quello che sta facendo: per lui continua a trattarsi di un’emissione di simboli secondo una certa logica sintattica e non semantica. Certo, è vero che fare passi più brevi aumenta la probabilità che l’output del singolo passo sia corretta: ma visto che il numero di passi aumenta alla fine la probabilità di un’allucinazione è la stessa.

Il modo migliore per far risolvere problemi di matematica è quello di accorgersi che si parla di matematica e passare a un altro sistema “classico”: se la domanda è “quanto fa 48 per 75?” ci dovrebbe essere un metasistema che si accorge di star facendo un’operazione aritmetica e quindi buttare via tutto l’apprendimento standard, facendo piuttosto partire un sistema classico. Perché è vero che probabilmente ChatGPT ha visto quell’espressione in fase di addestramento e quindi ha la risposta, ma è anche vero che alla domanda “quanto fa 10048 per 13275?” i risultati non possono essere che sbagliati. Eppure il pattern dovrebbe essere chiaro, e quindi passare a un sistema aritmetico dovrebbe essere possibile senza troppe difficoltà: il chatbot continuerebbe a non “pensare”, qualunque significato si dia a questa parola nel caso degli esseri umani, e si troverebbe in difficoltà con un testo del tipo “ci sono 10000 soldati e 48 comandanti, ciascuno dei quali pattuglia una zona rettangolare di lati 59 e 225 metri. Se le zone non si sovrappongono, qual è la superficie totale pattugliata?” (Ho appena provato: ChatGPT 4o si dimentica i 10000 soldati…)

In definitiva, questi chatbot saranno anche più bravi di noi, ma ne hanno ancora di strada da fare.

Ultimo aggiornamento: 2024-09-18 22:19

Il problema di Brocard

4! + 1 = 5²; 5! + 1 = 11²; 7! + 1 = 71²Il fattoriale di 4 è 24; se gli sommiamo 1 otteniamo 25, che è il quadrato di 5. Il fattoriale di 5 è 120; sommandogli 1 otteniamo 121, che è il quadrato di 11. Il fattoriale di 7 è 5040; sommandogli 1 otteniamo 5041, che è il quadrato di 71. E poi? Basta, almeno per quanto ne sappiamo.

Il problema di Brocard è stato posto da Henri Brocard nel 1876, ed è stato riscoperto indipendentemente da altri matematici, tra cui Ramanujan. La congettura è che questi siano gli unici casi in cui il fattoriale di un numero sia un’unità inferiore a un quadrato perfetto: sono stati esclusi altri risultati fino a $10^{12}$, ma non si è nemmeno riusciti a dimostrare che il numero di soluzioni possibili sia finito. (La cosa sarebbe un corollario della congettura abc, ma la “dimostrazione” di Shinichi Mochizuki non è stata accettata dalla comunità matematica).

Del resto Brocard, anche se la sua carriera matematica è stata nel campo della geometria, è noto anche per un’altra sua congettura: se $p$ e $q$ sono due primi dispari consecutivi (nel senso che non ci sono altri primi tra di esso: per esempio 89 e 97 sono primi consecutivi) allora ci sono almeno quattro numeri primi tra $p^2$ e $q^2$. Il mio commento su queste proposizioni ricicla quanto Gauss scrisse a W. M. Olbers: «Confesso che il teorema di Fermat, come proposizione isolata ha davvero scarso interesse per me, poiché potrei facilmente formulare una gran quantità di tali proposizioni, che non si potrebbero né provare né confutare». (Ma secondo me Gauss rosicava…)

Ultimo aggiornamento: 2024-09-11 08:37

Persi in una foresta

Nel 1956 Richard Bellman fece questa domanda, qui da me parafrasata: “Vi trovate in una foresta di cui sapete la forma e vi siete persi. Quanto è lungo il più breve percorso che nel caso peggiore vi porti fuori dalla foresta?” Per la cronaca, Bellman è stato uno dei guru della programmazione dinamica, quindi che abbia proposto un problema di ottimizzazione è normale. È anche chiaro che se fosse vissuto nella pianura padana e non in America il problema sarebbe stato ambientato col nebiun, che è molto meglio di una foresta per non sapere dove ci si trova: ma ormai il problema è noto come Bellman’s lost in a forest problem e ce lo teniamo così.

uscire da un quadrato

Il problema sembra semplice, ma non lo è affatto. Prendiamo per esempio un quadrato, per comodità [0,1]×[0,1]. Se sapessimo le coordinate dove ci troviamo e avessimo una bussola, potremmo uscire dalla foresta percorrendo un tratto di lunghezza al massimo 0,5 parallelo a un lato, come a sinistra nella figura. Se non conoscessimo le nostre coordinate ma avessimo la bussola, potremmo uscire percorrendo un tratto di lunghezza al massimo 1, come a metà in figura; magari andremmo nella direzione opposta a quella più vicina ma comunque usciremo. Se non sappiamo proprio nulla? Sicuramente la distanza minima nel caso peggiore è al massimo $\sqrt{2}$, come a destra in figura, ma magari c’è un modo più furbo… E invece no, si dimostra che per tutti i poligoni “grassi” (come spiegato qui) la soluzione ottimale è il diametro della figura. Questo vale tra l’altro per tutti i poligoni regolari dal quadrato in su (e per il cerchio, cosa che però si era già dimostrata in altro modo). E per il triangolo equilatero? Il testo che ho appena citato afferma che A. S. Besicovitch ha congetturato e Patrick Coulton e Yevgenya Movshovich hanno dimostrato che un certo percorso a zig zag in un triangolo equilatero di lato 1 ha lunghezza inferiore a 1: per la precisione, $3 \sqrt{21}/14 ≈ 0.981981$. Esistono altre figure per cui si è calcolata la “lunghezza di fuga” minima, ma il problema non è ancora completamente risolto.

Il tutto serve a qualcosa? Secondo il matematico Scott W. Williams, è “un problema milionario”, nel senso che le tecniche che presumibilmente porterebbero alla risoluzione potrebbero essere riciclate per ottimizzare le soluzioni di problemi nella vita reale…

Ultimo aggiornamento: 2024-09-04 15:48

I dadi di Lake Wobegon

facce del dado D: un 5 e cinque 3; facce del dado E e del dado F: due 1 e quattro 4bLa scorsa settimana abbiamo visto che è possibile costruire tre dadi non standard A, B, C tali che in media il dado C sia “migliore” di A, nel senso che lanciandoli è più facile che abbia il valore più alto; B sia “migliore” di A; C sia “migliore” di B. Ma si può fare di meglio, come Donald Knuth ha scritto nel Volume 4, Fascicolo 5 di The Art of Computer Programming.
Una premessa. Lake Wobegon è il paesino fittizio narrato da Garrison Keillor per radio e nei suoi libri: uno dei tormentoni radiofonici fa “Queste le notizie da Lake Wobegon, dove tutte le donne sono forti, tutti gli uomini sono belli, e tutti i bambini sono al di sopra della media.” Chiaramente le due prime affermazioni prendono in giro i romanzetti dove tutti gli uomini sono forti e le donne belle, e la terza prende in giro la matematica perché non è possibile che tutti stiano sopra la media… o no?
Considerate i tre dadi (sempre non standard) nella figura a fianco. Il primo ha un 5 e cinque 3, e gli altri due due 1 e quattro 4. Ora lanciamoli tutti insieme, e vediamo quando uno dei dadi ha un punteggio maggiore della media dei tre dadi (compreso sé stesso, quindi). Indico con (l,m,n} il risultato rispettivamente dei dadi D, E, F.

Per il dado D, il suo punteggio è maggiore della media nei casi (3,1,1), (3,1,4), (3,4,1), (5,*,*) (l’asterisco indica che qualunque valore va bene). Le probabilità rispettive sono 5/54, 10/54, 10/54 e 1/6; la loro somma è 17/27 che è maggiore di 1/2.

Per il dado E (ma lo stesso vale per il dado F), il suo punteggio è maggiore della media nei casi (3,4,*) e (5,4,1); le rispettive probabilità sono 5/9 e 1/27, che sommate danno 16/27 che è ancora maggiore di 1/2. In pratica, ogni dado se lanciato da solo ha un punteggio che statisticamente è maggiore della media della somma degli altri due!

John D. Cook spiega che l’apparente paradosso per cui A > (A+B+C)/3, B > (A+B+C)/3, C > (A+B+C)/3 si risolve notando che i tre eventi non sono disgiunti, e quindi quando uno è vero può anche esserne vero un altro.

Dadi non transitivi

facce del dado A: quattro 5 e due 1; facce del dado B: tre 4, due 3, un 6; facce del dado C: due 2, due 3, due 6 Qui a fianco vedete lo sviluppo di tre dadi non standard, nel senso che non hanno tutti i numeri da 1 a 6. Cosa c’è di interessante in questi dadi? Semplice. Immaginate di dire a un vostro (ancora per poco…) amico “scegli un dado qualunque, e io poi ne scelgo un altro. Poi lanciamo il nostro dado per 10 volte, e chi ha ottenuto il punteggio più basso per il maggior numero di volte pagherà la cena per entrambi”. Vediamo che succede.

Se l’amico ha scelto A, noi scegliamo C. In due casi su sei (se io faccio 6) vinco sicuramente; negli altri quattro casi vinco una volta su 3 (se lui fa 1). Probabilità di mia vittoria: 2/6 + (1/3)(4/6) = 5/9.

Se l’amico ha scelto B, noi scegliamo A. In quattro casi su 6 (se io faccio 5) vinco cinque volte su sei (lui non deve fare 6); negli altri due casi perdo. Probabilità di mia vittoria: (4/6)(5/6) = 5/9.

Se l’amico ha scelto C, noi scegliamo B. In un caso su sei (se io faccio 6) vinco quattro volte su sei e pareggio le altre due; in tre casi su sei (se io faccio 4) vinco quattro volte su sei e pareggio le altre due; nei restanti due casi vinco due volte su 6, pareggio due volte e perdo due volte. Probabilità di mia vittoria: (1/6)(4/6) + (3/6)(4/6) + (2/6)(2/6) = 5/9. (E a volte pareggio comunque!)

Dadi di questo tipo si chiamano non transitivi, perché non è possibile creare un ordine transitivo di valore tra i dadi.

È interessante notare che se invece che avere dadi a sei facce (tanto, ormai…) li prendiamo con Fm facce, dove Fm è un numero di Fibonacci, e chiamiamo $Pr(A\gt B)$ la probabilità che il dado A vinca sul dado B, possiamo trovare una configurazione di punti per cui
$Pr(A\gt B) = Pr(B\gt C) = F_{m-1}/F_m$
e
$Pr(C\gt A) = F_{m-1}/F_m \pm 1/F_m^2.$
Il “più o meno” nell’ultima espressione dovrebbe subito farvi venire in mente il rapporto aureo φ, e infatti si può anche dimostrare che la minima di queste tre probabilità deve essere minore di 1/φ, che è il risultato asintotico migliore.

Il risultato è indubbiamente carino, perché poco intuitivo: ma si può persino fare di meglio, come vedremo la prossima settimana!

Aggiornamento: 22:00) Carlo Mannucci ha stampato in 3D i dadi. Chi è interessato può trovare lo schema qui.

Ultimo aggiornamento: 2024-08-21 22:03

E allora cos’è una dimostrazione elegante?

La scorsa settimana ho detto quali dimostrazioni sono considerate in genere dai matematici “non eleganti”, aggiungendo che la comunità matematica è abbastanza d’accordo. Quando però bisogna definire cosa rende elegante una dimostrazione, le cose si fanno più difficili. Certo, Paul Erdős affermava che Dio (anzi, il Supremo Fascista) aveva un libro con tutte le dimostrazioni eleganti, e che a volte un matematico riusciva a darci un’occhiata; ma questo non significa molto. Alla fine ho deciso di provare a spiegare quali tipi di dimostrazione sono eleganti per me: almeno potrete commentare sui miei pessimi gusti.

(a) Una dimostrazione elegante è spesso minimale, nel senso che non c’è bisogno di avere una serie di lemmi oppure usare teoremi molto complessi per arrivare alla soluzione. Ecco un esempio di dimostrazione minimale ma non certo elegante:

Dimostrare che $\sqrt[3]{2}$ è irrazionale.
Dimostrazione: Supponiamo per assurdo che $\sqrt[3]{2} = p/q$ con $p,q$ interi positivi. Elevando al cubo e moltiplicando per $q^3$ otteniamo $q^3 + q^3 = p^3$, che è falso per l’Ultimo Teorema di Fermat.

(la dimostrazione standard è uguale a quella che mostra che $\sqrt{2}$ è irrazionale; dal mio punto di vista è elegante)

(b) Una dimostrazione che cambia le carte in tavola è elegante. Prendiamo per esempio il Teorema di Desargues, che afferma che se in un piano due triangoli sono in prospettiva, cioè le rette che uniscono le coppie di vertici corrispondenti si incontrano in un punto, allora i prolungamenti dei lati corrispondenti si incontrano in tre punti che sono allineati. Il metodo più semplice di dimostrarlo è passare alla terza dimensione; per due triangoli nello spazio la proprietà è facile da dimostrare, e quindi basta aggiungere un triangolo ausiliario fuori dal piano e applicare due volte il teorema nello spazio.

(c) Una dimostrazione che usa un campo della matematica diverso da quello in cui il problema è posto per semplificare il risultato è elegante. Prendiamo per esempio la formula del quadrato del binomio: $(a+b)^2 = a^2 + b^2 + 2ab$. Possiamo fare una “dimostrazione senza parole” (altra caratteristica di una dimostrazione elegante) in questo modo:

(d) Una dimostrazione che usa tecniche standard in modo non standard è elegante. Un esempio è questa dimostrazione dovuta a Cauchy:

Dati $n$ numeri reali positivi, la loro media geometrica $\sqrt[n]{a_1 a_2 \cdots a_n}$ è minore o uguale alla loro media aritmetica $\frac{a_1+a_2+\cdots+a_n}{n}$.
Dimostrazione: per induzione. Innanzitutto eleviamo alla potenza n-sima i due valori, ottenendo $\prod_{k=1}^{n}a_k$ e $\left(\sum_{k=1}^{n}\frac{a_k}{n}\right)^n$. Per $n = 2$ abbiamo che $a_1 a_2 \leq (a_1 + a_2)/2$ è equivalente a $(a_1 – a_2)^2 \geq 0$, banalmente vero. Ora, invece che dimostrare che se la proprietà vale per $n$ allora vale per $n+1$, dimostriamo (1) che se vale per $n$ allora vale per $2n$, e (2) che se vale per $n$ allora vale per $n-1$.
Per (1), $\prod_{k=1}^{2n}a_k = \left(\prod_{k=1}^{2}a_k\right)\left(\prod_{k=n+1}^{2n}a_k\right) \leq $ (per ipotesi induttiva) $\left(\sum_{k=1}^{2}a_k\right)\left(\prod_{k=n+1}^{2n}a_k\right) \leq \left(\sum_{k=1}^{n}\frac{a_k}{n}\right)^n \left(\sum_{k=n+1}^{2n}\frac{a_k}{n}\right)^n \leq $ (per il caso n=2 ) $ \left(\frac{\sum_{k=1}^{2n}\frac{a_k}{n}}{2}\right)^{2n} $ = $\left(\frac{\sum_{k=1}^{2n}{a_k}}{2n}\right)^{2n} $.
Per (2), se $A = \sum_{k=1}{n-1}\frac{a_k}{n-1}$ (cioè la media aritmetica dei primi $n-1$ numeri), abbiamo $\left(\prod_{k=1}{n-1}a_k\right)A \leq $ (per ipotesi induttiva) $ \left( \frac{\sum_{k=1}^{n-1}a_k + A}{n}\right)^n = \left(\frac{(n-1)A+A}{n}\right)^n = A^n$, da cui $ \prod_{k=1}^{n-1}a_k \leq A^{n-1}$, che è la nostra tesi.

Dite quello che volete, ma l’induzione all’indietro è un bel gambetto!

In generale concordo insomma con quanto scritto da Giovanni nei commenti al post precedente: credo che perché una dimostrazione si possa considerare elegante la semplicità gioca un ruolo minore rispetto alla creatività, o se preferite alla sorpresa di vedere arrivare la soluzione in una maniera inaspettata. Controprova: una dimostrazione che segua pedissequamente la strada più diretta, come ne si trova quando si sta studiando, non è sicuramente elegante. Voi che ne pensate?