Archivi categoria: mate-light 2024

OpenAI o1 saprà davvero “ragionare matematicamente”?

Mi pare che la notizia secondo cui OpenAI ha creato un chatbot che “sa fare ragionamenti matematici e scientifici” non abbia avuto grande eco. Può darsi che ciò sia dovuto al fatto che OpenAI o1 – questo è il nome in codice del nuovo progetto – è disponibile solo per un selezionato gruppo di utenti, oppure perché a nessuno interessa davvero avere un sistema che sappia risolvere problemi matematici.

Devo dire che l’articolo del NYT è parco di informazioni. Pare che OpenAI o1 usi l’apprendimento per rinforzo, quindi “premiando” le successioni di passi logici rispetto a un risultato ottenuto di colpo. L’idea degli sviluppatori è che in questo modo ci si avvicinerebbe di più al pensiero umano. Io personalmente non sono molto convinto di questo approccio, che continua a nascondere sotto il tappeto il problema di base degli LLM: non è che avere un approccio passo passo faccia sì che il computer abbia un’idea di quello che sta facendo: per lui continua a trattarsi di un’emissione di simboli secondo una certa logica sintattica e non semantica. Certo, è vero che fare passi più brevi aumenta la probabilità che l’output del singolo passo sia corretta: ma visto che il numero di passi aumenta alla fine la probabilità di un’allucinazione è la stessa.

Il modo migliore per far risolvere problemi di matematica è quello di accorgersi che si parla di matematica e passare a un altro sistema “classico”: se la domanda è “quanto fa 48 per 75?” ci dovrebbe essere un metasistema che si accorge di star facendo un’operazione aritmetica e quindi buttare via tutto l’apprendimento standard, facendo piuttosto partire un sistema classico. Perché è vero che probabilmente ChatGPT ha visto quell’espressione in fase di addestramento e quindi ha la risposta, ma è anche vero che alla domanda “quanto fa 10048 per 13275?” i risultati non possono essere che sbagliati. Eppure il pattern dovrebbe essere chiaro, e quindi passare a un sistema aritmetico dovrebbe essere possibile senza troppe difficoltà: il chatbot continuerebbe a non “pensare”, qualunque significato si dia a questa parola nel caso degli esseri umani, e si troverebbe in difficoltà con un testo del tipo “ci sono 10000 soldati e 48 comandanti, ciascuno dei quali pattuglia una zona rettangolare di lati 59 e 225 metri. Se le zone non si sovrappongono, qual è la superficie totale pattugliata?” (Ho appena provato: ChatGPT 4o si dimentica i 10000 soldati…)

In definitiva, questi chatbot saranno anche più bravi di noi, ma ne hanno ancora di strada da fare.

Ultimo aggiornamento: 2024-09-18 22:19

Il problema di Brocard

4! + 1 = 5²; 5! + 1 = 11²; 7! + 1 = 71² Il fattoriale di 4 è 24; se gli sommiamo 1 otteniamo 25, che è il quadrato di 5. Il fattoriale di 5 è 120; sommandogli 1 otteniamo 121, che è il quadrato di 11. Il fattoriale di 7 è 5040; sommandogli 1 otteniamo 5041, che è il quadrato di 71. E poi? Basta, almeno per quanto ne sappiamo.

Il problema di Brocard è stato posto da Henri Brocard nel 1876, ed è stato riscoperto indipendentemente da altri matematici, tra cui Ramanujan. La congettura è che questi siano gli unici casi in cui il fattoriale di un numero sia un’unità inferiore a un quadrato perfetto: sono stati esclusi altri risultati fino a $10^{12}$, ma non si è nemmeno riusciti a dimostrare che il numero di soluzioni possibili sia finito. (La cosa sarebbe un corollario della congettura abc, ma la “dimostrazione” di Shinichi Mochizuki non è stata accettata dalla comunità matematica).

Del resto Brocard, anche se la sua carriera matematica è stata nel campo della geometria, è noto anche per un’altra sua congettura: se $p$ e $q$ sono due primi dispari consecutivi (nel senso che non ci sono altri primi tra di esso: per esempio 89 e 97 sono primi consecutivi) allora ci sono almeno quattro numeri primi tra $p^2$ e $q^2$. Il mio commento su queste proposizioni ricicla quanto Gauss scrisse a W. M. Olbers: «Confesso che il teorema di Fermat, come proposizione isolata ha davvero scarso interesse per me, poiché potrei facilmente formulare una gran quantità di tali proposizioni, che non si potrebbero né provare né confutare». (Ma secondo me Gauss rosicava…)

Ultimo aggiornamento: 2024-09-11 08:37

Persi in una foresta

Nel 1956 Richard Bellman fece questa domanda, qui da me parafrasata: “Vi trovate in una foresta di cui sapete la forma e vi siete persi. Quanto è lungo il più breve percorso che nel caso peggiore vi porti fuori dalla foresta?” Per la cronaca, Bellman è stato uno dei guru della programmazione dinamica, quindi che abbia proposto un problema di ottimizzazione è normale. È anche chiaro che se fosse vissuto nella pianura padana e non in America il problema sarebbe stato ambientato col nebiun, che è molto meglio di una foresta per non sapere dove ci si trova: ma ormai il problema è noto come Bellman’s lost in a forest problem e ce lo teniamo così.

uscire da un quadrato

Il problema sembra semplice, ma non lo è affatto. Prendiamo per esempio un quadrato, per comodità [0,1]×[0,1]. Se sapessimo le coordinate dove ci troviamo e avessimo una bussola, potremmo uscire dalla foresta percorrendo un tratto di lunghezza al massimo 0,5 parallelo a un lato, come a sinistra nella figura. Se non conoscessimo le nostre coordinate ma avessimo la bussola, potremmo uscire percorrendo un tratto di lunghezza al massimo 1, come a metà in figura; magari andremmo nella direzione opposta a quella più vicina ma comunque usciremo. Se non sappiamo proprio nulla? Sicuramente la distanza minima nel caso peggiore è al massimo $\sqrt{2}$, come a destra in figura, ma magari c’è un modo più furbo… E invece no, si dimostra che per tutti i poligoni “grassi” (come spiegato qui) la soluzione ottimale è il diametro della figura. Questo vale tra l’altro per tutti i poligoni regolari dal quadrato in su (e per il cerchio, cosa che però si era già dimostrata in altro modo). E per il triangolo equilatero? Il testo che ho appena citato afferma che A. S. Besicovitch ha congetturato e Patrick Coulton e Yevgenya Movshovich hanno dimostrato che un certo percorso a zig zag in un triangolo equilatero di lato 1 ha lunghezza inferiore a 1: per la precisione, $3 \sqrt{21}/14 ≈ 0.981981$. Esistono altre figure per cui si è calcolata la “lunghezza di fuga” minima, ma il problema non è ancora completamente risolto.

Il tutto serve a qualcosa? Secondo il matematico Scott W. Williams, è “un problema milionario”, nel senso che le tecniche che presumibilmente porterebbero alla risoluzione potrebbero essere riciclate per ottimizzare le soluzioni di problemi nella vita reale…

Ultimo aggiornamento: 2024-09-04 15:48

I dadi di Lake Wobegon

facce del dado D: un 5 e cinque 3; facce del dado E e del dado F: due 1 e quattro 4 bLa scorsa settimana abbiamo visto che è possibile costruire tre dadi non standard A, B, C tali che in media il dado C sia “migliore” di A, nel senso che lanciandoli è più facile che abbia il valore più alto; B sia “migliore” di A; C sia “migliore” di B. Ma si può fare di meglio, come Donald Knuth ha scritto nel Volume 4, Fascicolo 5 di The Art of Computer Programming.
Una premessa. Lake Wobegon è il paesino fittizio narrato da Garrison Keillor per radio e nei suoi libri: uno dei tormentoni radiofonici fa “Queste le notizie da Lake Wobegon, dove tutte le donne sono forti, tutti gli uomini sono belli, e tutti i bambini sono al di sopra della media.” Chiaramente le due prime affermazioni prendono in giro i romanzetti dove tutti gli uomini sono forti e le donne belle, e la terza prende in giro la matematica perché non è possibile che tutti stiano sopra la media… o no?
Considerate i tre dadi (sempre non standard) nella figura a fianco. Il primo ha un 5 e cinque 3, e gli altri due due 1 e quattro 4. Ora lanciamoli tutti insieme, e vediamo quando uno dei dadi ha un punteggio maggiore della media dei tre dadi (compreso sé stesso, quindi). Indico con (l,m,n} il risultato rispettivamente dei dadi D, E, F.

Per il dado D, il suo punteggio è maggiore della media nei casi (3,1,1), (3,1,4), (3,4,1), (5,*,*) (l’asterisco indica che qualunque valore va bene). Le probabilità rispettive sono 5/54, 10/54, 10/54 e 1/6; la loro somma è 17/27 che è maggiore di 1/2.

Per il dado E (ma lo stesso vale per il dado F), il suo punteggio è maggiore della media nei casi (3,4,*) e (5,4,1); le rispettive probabilità sono 5/9 e 1/27, che sommate danno 16/27 che è ancora maggiore di 1/2. In pratica, ogni dado se lanciato da solo ha un punteggio che statisticamente è maggiore della media della somma degli altri due!

John D. Cook spiega che l’apparente paradosso per cui A > (A+B+C)/3, B > (A+B+C)/3, C > (A+B+C)/3 si risolve notando che i tre eventi non sono disgiunti, e quindi quando uno è vero può anche esserne vero un altro.

Dadi non transitivi

facce del dado A: quattro 5 e due 1; facce del dado B: tre 4, due 3, un 6; facce del dado C: due 2, due 3, due 6 Qui a fianco vedete lo sviluppo di tre dadi non standard, nel senso che non hanno tutti i numeri da 1 a 6. Cosa c’è di interessante in questi dadi? Semplice. Immaginate di dire a un vostro (ancora per poco…) amico “scegli un dado qualunque, e io poi ne scelgo un altro. Poi lanciamo il nostro dado per 10 volte, e chi ha ottenuto il punteggio più basso per il maggior numero di volte pagherà la cena per entrambi”. Vediamo che succede.

Se l’amico ha scelto A, noi scegliamo C. In due casi su sei (se io faccio 6) vinco sicuramente; negli altri quattro casi vinco una volta su 3 (se lui fa 1). Probabilità di mia vittoria: 2/6 + (1/3)(4/6) = 5/9.

Se l’amico ha scelto B, noi scegliamo A. In quattro casi su 6 (se io faccio 5) vinco cinque volte su sei (lui non deve fare 6); negli altri due casi perdo. Probabilità di mia vittoria: (4/6)(5/6) = 5/9.

Se l’amico ha scelto C, noi scegliamo B. In un caso su sei (se io faccio 6) vinco quattro volte su sei e pareggio le altre due; in tre casi su sei (se io faccio 4) vinco quattro volte su sei e pareggio le altre due; nei restanti due casi vinco due volte su 6, pareggio due volte e perdo due volte. Probabilità di mia vittoria: (1/6)(4/6) + (3/6)(4/6) + (2/6)(2/6) = 5/9. (E a volte pareggio comunque!)

Dadi di questo tipo si chiamano non transitivi, perché non è possibile creare un ordine transitivo di valore tra i dadi.

È interessante notare che se invece che avere dadi a sei facce (tanto, ormai…) li prendiamo con F_m facce, dove F_m è un numero di Fibonacci, e chiamiamo $Pr(A\gt B)$ la probabilità che il dado A vinca sul dado B, possiamo trovare una configurazione di punti per cui
$Pr(A\gt B) = Pr(B\gt C) = F_{m-1}/F_m$
e
$Pr(C\gt A) = F_{m-1}/F_m \pm 1/F_m^2.$
Il “più o meno” nell’ultima espressione dovrebbe subito farvi venire in mente il rapporto aureo φ, e infatti si può anche dimostrare che la minima di queste tre probabilità deve essere minore di 1/φ, che è il risultato asintotico migliore.

Il risultato è indubbiamente carino, perché poco intuitivo: ma si può persino fare di meglio, come vedremo la prossima settimana!

Aggiornamento: 22:00) Carlo Mannucci ha stampato in 3D i dadi. Chi è interessato può trovare lo schema qui.

Ultimo aggiornamento: 2024-08-21 22:03

E allora cos’è una dimostrazione elegante?

La scorsa settimana ho detto quali dimostrazioni sono considerate in genere dai matematici “non eleganti”, aggiungendo che la comunità matematica è abbastanza d’accordo. Quando però bisogna definire cosa rende elegante una dimostrazione, le cose si fanno più difficili. Certo, Paul Erdős affermava che Dio (anzi, il Supremo Fascista) aveva un libro con tutte le dimostrazioni eleganti, e che a volte un matematico riusciva a darci un’occhiata; ma questo non significa molto. Alla fine ho deciso di provare a spiegare quali tipi di dimostrazione sono eleganti per me: almeno potrete commentare sui miei pessimi gusti.

(a) Una dimostrazione elegante è spesso minimale, nel senso che non c’è bisogno di avere una serie di lemmi oppure usare teoremi molto complessi per arrivare alla soluzione. Ecco un esempio di dimostrazione minimale ma non certo elegante:

Dimostrare che $\sqrt[3]{2}$ è irrazionale.
Dimostrazione: Supponiamo per assurdo che $\sqrt[3]{2} = p/q$ con $p,q$ interi positivi. Elevando al cubo e moltiplicando per $q^3$ otteniamo $q^3 + q^3 = p^3$, che è falso per l’Ultimo Teorema di Fermat.

(la dimostrazione standard è uguale a quella che mostra che $\sqrt{2}$ è irrazionale; dal mio punto di vista è elegante)

(b) Una dimostrazione che cambia le carte in tavola è elegante. Prendiamo per esempio il Teorema di Desargues, che afferma che se in un piano due triangoli sono in prospettiva, cioè le rette che uniscono le coppie di vertici corrispondenti si incontrano in un punto, allora i prolungamenti dei lati corrispondenti si incontrano in tre punti che sono allineati. Il metodo più semplice di dimostrarlo è passare alla terza dimensione; per due triangoli nello spazio la proprietà è facile da dimostrare, e quindi basta aggiungere un triangolo ausiliario fuori dal piano e applicare due volte il teorema nello spazio.

(c) Una dimostrazione che usa un campo della matematica diverso da quello in cui il problema è posto per semplificare il risultato è elegante. Prendiamo per esempio la formula del quadrato del binomio: $(a+b)^2 = a^2 + b^2 + 2ab$. Possiamo fare una “dimostrazione senza parole” (altra caratteristica di una dimostrazione elegante) in questo modo:

(d) Una dimostrazione che usa tecniche standard in modo non standard è elegante. Un esempio è questa dimostrazione dovuta a Cauchy:

Dati $n$ numeri reali positivi, la loro media geometrica $\sqrt[n]{a_1 a_2 \cdots a_n}$ è minore o uguale alla loro media aritmetica $\frac{a_1+a_2+\cdots+a_n}{n}$.
Dimostrazione: per induzione. Innanzitutto eleviamo alla potenza n-sima i due valori, ottenendo $\prod_{k=1}^{n}a_k$ e $\left(\sum_{k=1}^{n}\frac{a_k}{n}\right)^n$. Per $n = 2$ abbiamo che $a_1 a_2 \leq (a_1 + a_2)/2$ è equivalente a $(a_1 – a_2)^2 \geq 0$, banalmente vero. Ora, invece che dimostrare che se la proprietà vale per $n$ allora vale per $n+1$, dimostriamo (1) che se vale per $n$ allora vale per $2n$, e (2) che se vale per $n$ allora vale per $n-1$.
Per (1), $\prod_{k=1}^{2n}a_k = \left(\prod_{k=1}^{2}a_k\right)\left(\prod_{k=n+1}^{2n}a_k\right) \leq $ (per ipotesi induttiva) $\left(\sum_{k=1}^{2}a_k\right)\left(\prod_{k=n+1}^{2n}a_k\right) \leq \left(\sum_{k=1}^{n}\frac{a_k}{n}\right)^n \left(\sum_{k=n+1}^{2n}\frac{a_k}{n}\right)^n \leq $ (per il caso n=2 ) $ \left(\frac{\sum_{k=1}^{2n}\frac{a_k}{n}}{2}\right)^{2n} $ = $\left(\frac{\sum_{k=1}^{2n}{a_k}}{2n}\right)^{2n} $.
Per (2), se $A = \sum_{k=1}{n-1}\frac{a_k}{n-1}$ (cioè la media aritmetica dei primi $n-1$ numeri), abbiamo $\left(\prod_{k=1}{n-1}a_k\right)A \leq $ (per ipotesi induttiva) $ \left( \frac{\sum_{k=1}^{n-1}a_k + A}{n}\right)^n = \left(\frac{(n-1)A+A}{n}\right)^n = A^n$, da cui $ \prod_{k=1}^{n-1}a_k \leq A^{n-1}$, che è la nostra tesi.

Dite quello che volete, ma l’induzione all’indietro è un bel gambetto!

In generale concordo insomma con quanto scritto da Giovanni nei commenti al post precedente: credo che perché una dimostrazione si possa considerare elegante la semplicità gioca un ruolo minore rispetto alla creatività, o se preferite alla sorpresa di vedere arrivare la soluzione in una maniera inaspettata. Controprova: una dimostrazione che segua pedissequamente la strada più diretta, come ne si trova quando si sta studiando, non è sicuramente elegante. Voi che ne pensate?

Che cosa NON È una dimostrazione elegante

"proof" Nei commenti al post dell’altra settimana “Che vorreste dai mercoledì matematici?” Giovanni chiede di ragionare su che cosa possa intendersi quando si dice che una dimostrazione è “elegante”. La risposta non è semplice: come sempre, l’eleganza è negli occhi di chi guarda e non ci sono definizioni su cui tutti siano d’accordo. Quindi, mentre ci penso ancora un po’, comincio a scrivere qualcosa sul tema opposto: quando una dimostrazione non è elegante. Qui in effetti c’è un po’ più di accordo tra i matematici. Premessa: una dimostrazione è una dimostrazione è una dimostrazione, parafrasando Gertrude Stein. Se l’unica dimostrazione che si riesce a trovare è brutta la si mantiene comunque: il bello della matematica è che non esisterà una via regia, ma perlomeno tutte le strade che ci fanno arrivare sono accettabili. Allora dov’è il problema?

Un caso tipico di dimostrazione non elegante è quella per enumerazione, soprattutto quando i casi sono tanti. La dimostrazione del teorema dei quattro colori è uno di questi casi: la soluzione non è stata solamente osteggiata perché fatta aiutandosi con un calcolatore, ma anche perché si sono dovute verificare una quantità finita ma molto grande di configurazioni, il che ha richiesto per l’appunto l’uso di un calcolatore per verificarle tutte. (Ora la dimostrazione al computer è stata verificata formalmente, quindi il problema dell’artificialità non si pone più). Ma anche prima dei computer c’erano esempi di questo tipo: la dimostrazione che non esistono quadrati greco-latini di ordine 6 è di questo tipo. Perché ai matematici non piacciono queste dimostrazioni? Per due motivi. Il primo è perché essi sono fondamentalmente pigri, ed enumerare tutte le possibilità stanca. Ma soprattutto il punto è che una dimostrazione di questo tipo non aggiunge davvero conoscenza. Avete presente la barzelletta – indubbiamente creata da qualche fisico – dove il matematico che sa come cuocere un uovo sodo a partire da un pentolino vuoto e si trova davanti un pentolino pieno d’acqua lo svuota “per ricondursi alle condizioni precedenti”? La “logica” è che non c’è nulla di interessante a partire dal pentolino pieno, e quindi tanto vale far finta di nulla.

Un altro tipo di dimostrazioni non eleganti sono quelle in cui si applicano pedissequamente le definizioni per arrivare al risultato. Avete presente gli esercizi che si trovano per primi in un libro di testo, anche universitario? Un Vero Matematico li odia. Certo, sono molto utili per farsi un’idea di come si declina in pratica un concetto; ma anche in questo caso non portano in realtà nulla di nuovo. Più o meno la stessa cosa avviene quando la dimostrazione richiede di fare molti conti, e poi magicamente il risultato si semplifica e la complessità del lavoro fatto svanisce come neve al sole. In questo caso però la situazione è l’opposto: il concetto non viene davvero declinato, e i conti sembrano nascondere quella che è la vera natura del problema.

Che cosa hanno in comune dimostrazioni di questo tipo? La mancanza di creatività. Chi non è matematico pensa che la matematica sia tutto tranne che creativa: le formule matematiche sono quelle, non è che possiamo dire che due più due fa cinque, e allora dov’è la creatività? Proverò a dare una risposta la prossima volta: ma sono abbastanza certo che almeno su questo punto molto generale la grande maggioranza dei matematici concordi. La creatività è una parte determinante della matematica, ed è quella che la fa apprezzare a chi l’ha scelta come professione o come hobby. Peccato che non venga non dico insegnata ma almeno fatta notare!

(Immagine da PNGtree)

Non correte subito a estrapolare!

L’immagine qui sopra è presa da questa presentazione di Paul Rowlandson (h/t Ed Southall); i dati sono quelli di ore di sole e temperatura media misurate a Heathrow ogni mese a partire dal 1941 fino al 2022
Come potete vedere nelle slide il cui link ho messo qui sopra, la risposta è sbagliata perché in generale non possiamo estrapolare un risultato con sicurezza, soprattutto quando cerchiamo un dato molto diversi da quelli di base. Come Rowlandson spiega, nessuno ci può assicurare che quella che con i dati storici sembra (più o meno…) una crescita lineare continui a esserlo, e non diventi sublineare oppure addirittura fermarsi a un asintoto. Questo senza neppure considerare gli errori che si possono avere in ogni caso anche con l’interpolazione, perché c’è sempre la possibilità di un outlier.
Ma allora non si può mai usare l’estrapolazione? Come spesso capita, la risposta è “dipende”. Come ho accennato all’inizio, estrapolare per dati vicini a quelli che abbiamo a disposizione; inoltre se siamo in grado di stimare un modello abbastanza preciso possiamo costruire una funzione di stima più adatta di una semplice retta (o nel nostro caso di un parallelogramma) e quindi avere una stima accettabile per un intervallo più ampio. Come sempre, ciò che conta è non applicare pedissequamente le formule imparate magari a memoria e capire invece cosa si sta facendo. La matematica non è un oracolo!

Poi naturalmente mi sarei più divertito se nella figura Laura avesse chiesto il dato con 500 ore di sole. Ho fatto rapido controllo e mentre in linea teorica un giugno potrebbe avere 450 ore di sole, non c’è abbastanza tempo per averne 500…
@matematica

Notiziole di .mau.

Pensieri slegati che scrivo quando mi capita