Archivi categoria: matematica_light

I dadi di Lake Wobegon

facce del dado D: un 5 e cinque 3; facce del dado E e del dado F: due 1 e quattro 4bLa scorsa settimana abbiamo visto che è possibile costruire tre dadi non standard A, B, C tali che in media il dado C sia “migliore” di A, nel senso che lanciandoli è più facile che abbia il valore più alto; B sia “migliore” di A; C sia “migliore” di B. Ma si può fare di meglio, come Donald Knuth ha scritto nel Volume 4, Fascicolo 5 di The Art of Computer Programming.
Una premessa. Lake Wobegon è il paesino fittizio narrato da Garrison Keillor per radio e nei suoi libri: uno dei tormentoni radiofonici fa “Queste le notizie da Lake Wobegon, dove tutte le donne sono forti, tutti gli uomini sono belli, e tutti i bambini sono al di sopra della media.” Chiaramente le due prime affermazioni prendono in giro i romanzetti dove tutti gli uomini sono forti e le donne belle, e la terza prende in giro la matematica perché non è possibile che tutti stiano sopra la media… o no?
Considerate i tre dadi (sempre non standard) nella figura a fianco. Il primo ha un 5 e cinque 3, e gli altri due due 1 e quattro 4. Ora lanciamoli tutti insieme, e vediamo quando uno dei dadi ha un punteggio maggiore della media dei tre dadi (compreso sé stesso, quindi). Indico con (l,m,n} il risultato rispettivamente dei dadi D, E, F.

Per il dado D, il suo punteggio è maggiore della media nei casi (3,1,1), (3,1,4), (3,4,1), (5,*,*) (l’asterisco indica che qualunque valore va bene). Le probabilità rispettive sono 5/54, 10/54, 10/54 e 1/6; la loro somma è 17/27 che è maggiore di 1/2.

Per il dado E (ma lo stesso vale per il dado F), il suo punteggio è maggiore della media nei casi (3,4,*) e (5,4,1); le rispettive probabilità sono 5/9 e 1/27, che sommate danno 16/27 che è ancora maggiore di 1/2. In pratica, ogni dado se lanciato da solo ha un punteggio che statisticamente è maggiore della media della somma degli altri due!

John D. Cook spiega che l’apparente paradosso per cui A > (A+B+C)/3, B > (A+B+C)/3, C > (A+B+C)/3 si risolve notando che i tre eventi non sono disgiunti, e quindi quando uno è vero può anche esserne vero un altro.

Dadi non transitivi

facce del dado A: quattro 5 e due 1; facce del dado B: tre 4, due 3, un 6; facce del dado C: due 2, due 3, due 6 Qui a fianco vedete lo sviluppo di tre dadi non standard, nel senso che non hanno tutti i numeri da 1 a 6. Cosa c’è di interessante in questi dadi? Semplice. Immaginate di dire a un vostro (ancora per poco…) amico “scegli un dado qualunque, e io poi ne scelgo un altro. Poi lanciamo il nostro dado per 10 volte, e chi ha ottenuto il punteggio più basso per il maggior numero di volte pagherà la cena per entrambi”. Vediamo che succede.

Se l’amico ha scelto A, noi scegliamo C. In due casi su sei (se io faccio 6) vinco sicuramente; negli altri quattro casi vinco una volta su 3 (se lui fa 1). Probabilità di mia vittoria: 2/6 + (1/3)(4/6) = 5/9.

Se l’amico ha scelto B, noi scegliamo A. In quattro casi su 6 (se io faccio 5) vinco cinque volte su sei (lui non deve fare 6); negli altri due casi perdo. Probabilità di mia vittoria: (4/6)(5/6) = 5/9.

Se l’amico ha scelto C, noi scegliamo B. In un caso su sei (se io faccio 6) vinco quattro volte su sei e pareggio le altre due; in tre casi su sei (se io faccio 4) vinco quattro volte su sei e pareggio le altre due; nei restanti due casi vinco due volte su 6, pareggio due volte e perdo due volte. Probabilità di mia vittoria: (1/6)(4/6) + (3/6)(4/6) + (2/6)(2/6) = 5/9. (E a volte pareggio comunque!)

Dadi di questo tipo si chiamano non transitivi, perché non è possibile creare un ordine transitivo di valore tra i dadi.

È interessante notare che se invece che avere dadi a sei facce (tanto, ormai…) li prendiamo con Fm facce, dove Fm è un numero di Fibonacci, e chiamiamo $Pr(A\gt B)$ la probabilità che il dado A vinca sul dado B, possiamo trovare una configurazione di punti per cui
$Pr(A\gt B) = Pr(B\gt C) = F_{m-1}/F_m$
e
$Pr(C\gt A) = F_{m-1}/F_m \pm 1/F_m^2.$
Il “più o meno” nell’ultima espressione dovrebbe subito farvi venire in mente il rapporto aureo φ, e infatti si può anche dimostrare che la minima di queste tre probabilità deve essere minore di 1/φ, che è il risultato asintotico migliore.

Il risultato è indubbiamente carino, perché poco intuitivo: ma si può persino fare di meglio, come vedremo la prossima settimana!

Aggiornamento: 22:00) Carlo Mannucci ha stampato in 3D i dadi. Chi è interessato può trovare lo schema qui.

Ultimo aggiornamento: 2024-08-21 22:03

E allora cos’è una dimostrazione elegante?

La scorsa settimana ho detto quali dimostrazioni sono considerate in genere dai matematici “non eleganti”, aggiungendo che la comunità matematica è abbastanza d’accordo. Quando però bisogna definire cosa rende elegante una dimostrazione, le cose si fanno più difficili. Certo, Paul Erdős affermava che Dio (anzi, il Supremo Fascista) aveva un libro con tutte le dimostrazioni eleganti, e che a volte un matematico riusciva a darci un’occhiata; ma questo non significa molto. Alla fine ho deciso di provare a spiegare quali tipi di dimostrazione sono eleganti per me: almeno potrete commentare sui miei pessimi gusti.

(a) Una dimostrazione elegante è spesso minimale, nel senso che non c’è bisogno di avere una serie di lemmi oppure usare teoremi molto complessi per arrivare alla soluzione. Ecco un esempio di dimostrazione minimale ma non certo elegante:

Dimostrare che $\sqrt[3]{2}$ è irrazionale.
Dimostrazione: Supponiamo per assurdo che $\sqrt[3]{2} = p/q$ con $p,q$ interi positivi. Elevando al cubo e moltiplicando per $q^3$ otteniamo $q^3 + q^3 = p^3$, che è falso per l’Ultimo Teorema di Fermat.

(la dimostrazione standard è uguale a quella che mostra che $\sqrt{2}$ è irrazionale; dal mio punto di vista è elegante)

(b) Una dimostrazione che cambia le carte in tavola è elegante. Prendiamo per esempio il Teorema di Desargues, che afferma che se in un piano due triangoli sono in prospettiva, cioè le rette che uniscono le coppie di vertici corrispondenti si incontrano in un punto, allora i prolungamenti dei lati corrispondenti si incontrano in tre punti che sono allineati. Il metodo più semplice di dimostrarlo è passare alla terza dimensione; per due triangoli nello spazio la proprietà è facile da dimostrare, e quindi basta aggiungere un triangolo ausiliario fuori dal piano e applicare due volte il teorema nello spazio.

(c) Una dimostrazione che usa un campo della matematica diverso da quello in cui il problema è posto per semplificare il risultato è elegante. Prendiamo per esempio la formula del quadrato del binomio: $(a+b)^2 = a^2 + b^2 + 2ab$. Possiamo fare una “dimostrazione senza parole” (altra caratteristica di una dimostrazione elegante) in questo modo:

(d) Una dimostrazione che usa tecniche standard in modo non standard è elegante. Un esempio è questa dimostrazione dovuta a Cauchy:

Dati $n$ numeri reali positivi, la loro media geometrica $\sqrt[n]{a_1 a_2 \cdots a_n}$ è minore o uguale alla loro media aritmetica $\frac{a_1+a_2+\cdots+a_n}{n}$.
Dimostrazione: per induzione. Innanzitutto eleviamo alla potenza n-sima i due valori, ottenendo $\prod_{k=1}^{n}a_k$ e $\left(\sum_{k=1}^{n}\frac{a_k}{n}\right)^n$. Per $n = 2$ abbiamo che $a_1 a_2 \leq (a_1 + a_2)/2$ è equivalente a $(a_1 – a_2)^2 \geq 0$, banalmente vero. Ora, invece che dimostrare che se la proprietà vale per $n$ allora vale per $n+1$, dimostriamo (1) che se vale per $n$ allora vale per $2n$, e (2) che se vale per $n$ allora vale per $n-1$.
Per (1), $\prod_{k=1}^{2n}a_k = \left(\prod_{k=1}^{2}a_k\right)\left(\prod_{k=n+1}^{2n}a_k\right) \leq $ (per ipotesi induttiva) $\left(\sum_{k=1}^{2}a_k\right)\left(\prod_{k=n+1}^{2n}a_k\right) \leq \left(\sum_{k=1}^{n}\frac{a_k}{n}\right)^n \left(\sum_{k=n+1}^{2n}\frac{a_k}{n}\right)^n \leq $ (per il caso n=2 ) $ \left(\frac{\sum_{k=1}^{2n}\frac{a_k}{n}}{2}\right)^{2n} $ = $\left(\frac{\sum_{k=1}^{2n}{a_k}}{2n}\right)^{2n} $.
Per (2), se $A = \sum_{k=1}{n-1}\frac{a_k}{n-1}$ (cioè la media aritmetica dei primi $n-1$ numeri), abbiamo $\left(\prod_{k=1}{n-1}a_k\right)A \leq $ (per ipotesi induttiva) $ \left( \frac{\sum_{k=1}^{n-1}a_k + A}{n}\right)^n = \left(\frac{(n-1)A+A}{n}\right)^n = A^n$, da cui $ \prod_{k=1}^{n-1}a_k \leq A^{n-1}$, che è la nostra tesi.

Dite quello che volete, ma l’induzione all’indietro è un bel gambetto!

In generale concordo insomma con quanto scritto da Giovanni nei commenti al post precedente: credo che perché una dimostrazione si possa considerare elegante la semplicità gioca un ruolo minore rispetto alla creatività, o se preferite alla sorpresa di vedere arrivare la soluzione in una maniera inaspettata. Controprova: una dimostrazione che segua pedissequamente la strada più diretta, come ne si trova quando si sta studiando, non è sicuramente elegante. Voi che ne pensate?

Che cosa NON È una dimostrazione elegante

"proof"Nei commenti al post dell’altra settimana “Che vorreste dai mercoledì matematici?” Giovanni chiede di ragionare su che cosa possa intendersi quando si dice che una dimostrazione è “elegante”. La risposta non è semplice: come sempre, l’eleganza è negli occhi di chi guarda e non ci sono definizioni su cui tutti siano d’accordo. Quindi, mentre ci penso ancora un po’, comincio a scrivere qualcosa sul tema opposto: quando una dimostrazione non è elegante. Qui in effetti c’è un po’ più di accordo tra i matematici. Premessa: una dimostrazione è una dimostrazione è una dimostrazione, parafrasando Gertrude Stein. Se l’unica dimostrazione che si riesce a trovare è brutta la si mantiene comunque: il bello della matematica è che non esisterà una via regia, ma perlomeno tutte le strade che ci fanno arrivare sono accettabili. Allora dov’è il problema?

Un caso tipico di dimostrazione non elegante è quella per enumerazione, soprattutto quando i casi sono tanti. La dimostrazione del teorema dei quattro colori è uno di questi casi: la soluzione non è stata solamente osteggiata perché fatta aiutandosi con un calcolatore, ma anche perché si sono dovute verificare una quantità finita ma molto grande di configurazioni, il che ha richiesto per l’appunto l’uso di un calcolatore per verificarle tutte. (Ora la dimostrazione al computer è stata verificata formalmente, quindi il problema dell’artificialità non si pone più). Ma anche prima dei computer c’erano esempi di questo tipo: la dimostrazione che non esistono quadrati greco-latini di ordine 6 è di questo tipo. Perché ai matematici non piacciono queste dimostrazioni? Per due motivi. Il primo è perché essi sono fondamentalmente pigri, ed enumerare tutte le possibilità stanca. Ma soprattutto il punto è che una dimostrazione di questo tipo non aggiunge davvero conoscenza. Avete presente la barzelletta – indubbiamente creata da qualche fisico – dove il matematico che sa come cuocere un uovo sodo a partire da un pentolino vuoto e si trova davanti un pentolino pieno d’acqua lo svuota “per ricondursi alle condizioni precedenti”? La “logica” è che non c’è nulla di interessante a partire dal pentolino pieno, e quindi tanto vale far finta di nulla.

Un altro tipo di dimostrazioni non eleganti sono quelle in cui si applicano pedissequamente le definizioni per arrivare al risultato. Avete presente gli esercizi che si trovano per primi in un libro di testo, anche universitario? Un Vero Matematico li odia. Certo, sono molto utili per farsi un’idea di come si declina in pratica un concetto; ma anche in questo caso non portano in realtà nulla di nuovo. Più o meno la stessa cosa avviene quando la dimostrazione richiede di fare molti conti, e poi magicamente il risultato si semplifica e la complessità del lavoro fatto svanisce come neve al sole. In questo caso però la situazione è l’opposto: il concetto non viene davvero declinato, e i conti sembrano nascondere quella che è la vera natura del problema.

Che cosa hanno in comune dimostrazioni di questo tipo? La mancanza di creatività. Chi non è matematico pensa che la matematica sia tutto tranne che creativa: le formule matematiche sono quelle, non è che possiamo dire che due più due fa cinque, e allora dov’è la creatività? Proverò a dare una risposta la prossima volta: ma sono abbastanza certo che almeno su questo punto molto generale la grande maggioranza dei matematici concordi. La creatività è una parte determinante della matematica, ed è quella che la fa apprezzare a chi l’ha scelta come professione o come hobby. Peccato che non venga non dico insegnata ma almeno fatta notare!

(Immagine da PNGtree)

Non correte subito a estrapolare!

L’immagine qui sopra è presa da questa presentazione di Paul Rowlandson (h/t Ed Southall); i dati sono quelli di ore di sole e temperatura media misurate a Heathrow ogni mese a partire dal 1941 fino al 2022
Come potete vedere nelle slide il cui link ho messo qui sopra, la risposta è sbagliata perché in generale non possiamo estrapolare un risultato con sicurezza, soprattutto quando cerchiamo un dato molto diversi da quelli di base. Come Rowlandson spiega, nessuno ci può assicurare che quella che con i dati storici sembra (più o meno…) una crescita lineare continui a esserlo, e non diventi sublineare oppure addirittura fermarsi a un asintoto. Questo senza neppure considerare gli errori che si possono avere in ogni caso anche con l’interpolazione, perché c’è sempre la possibilità di un outlier.
Ma allora non si può mai usare l’estrapolazione? Come spesso capita, la risposta è “dipende”. Come ho accennato all’inizio, estrapolare per dati vicini a quelli che abbiamo a disposizione; inoltre se siamo in grado di stimare un modello abbastanza preciso possiamo costruire una funzione di stima più adatta di una semplice retta (o nel nostro caso di un parallelogramma) e quindi avere una stima accettabile per un intervallo più ampio. Come sempre, ciò che conta è non applicare pedissequamente le formule imparate magari a memoria e capire invece cosa si sta facendo. La matematica non è un oracolo!

Poi naturalmente mi sarei più divertito se nella figura Laura avesse chiesto il dato con 500 ore di sole. Ho fatto rapido controllo e mentre in linea teorica un giugno potrebbe avere 450 ore di sole, non c’è abbastanza tempo per averne 500…
@matematica

Facile come 1+1


C’è una battuta che gira da decenni nella quale si spiega che gli ingegneri trovano la formula 1 + 1 = 2 troppo poco elegante, e preferiscono usare delle semplici trasformazioni algebriche per giungere a

$\begin{align}
& \ln\left(\lim_{z\to\infty}\left(\left(\left( \overline{X}^T \right)^{-1} – \left( \overline{X}^{-1} \right)^{T}\right) + \frac{1}{z}\right)^2 \right) + \sin^2(p) + \cos^2(p) = \\
&\qquad = \sum_{n=0}^{\infty}\frac{\cosh(q)\cdot\sqrt{1 – \tanh^2(q)}}{2^n}
\end{align}$

(no, non si può applicare la stessa cosa ai matematici. Se a un matematico chiedete quanto fa 1 + 1, con buona probabilità vi risponderà semplicemente “dipende”).

Ho scoperto che due anni fa Neel Nanda ha studiato come un trasformatore ha “costruito” la formula per l’addizione modulo n di due numeri. Il risultato è quello che vedete qui nell’immagine in alto. Quello che è successo è che il modello di intelligenza artificiale ha “calcolato” la somma modulare di due numeri usando la trasformata di Fourier discreta e alcune identità trigonometriche. Evidentemente dal suo “punto di vista” (o forse avrei dovuto mettere le virgolette intorno a “suo”) quelle operazioni erano più facili da salvare rispetto a quelle che avremmo usato noi, oppure il materiale di addestramento aveva molte più istanze da usare. In ogni caso credo che la lezione sia abbastanza chiara: anche chi ritiene che i LLM “pensino” non può negare che il loro pensiero sia completamente diverso dal nostro… (a meno che non crediate che i nostro sistema neurale sappia usare DFT e trigonometria a manella)

Usare equamente una moneta iniqua


Probabilmente conoscete il quizzino che vi chiede di usare una moneta truccata, che se lanciata esce testa con probabilità $p$ compresa strettamente tra 1/2 e 1, per ottenere una probabilità del 50% esatto di vincita. La risposta, che si dice essere dovuta direttamente a John von Neumann (ma non ne sarei così certo) è la seguente: “Lanciate la moneta due volte: se il risultato è prima testa poi croce (nel seguito, TC) vince il primo giocatore; se è prima croce e poi testa (CT) vince il secondo giocatore; altrimenti si ricomincia da capo”. L’idea, come avrete capito, è di trovare due combinazioni simmetriche, in modo che la loro possibilità di uscita sia la stessa.

La fregatura è che potrebbero volerci molti lanci per avere la nostra successione TC oppure CT; se per esempio $p = \frac{3}{4}$, la probabilità di dover ripartire da capo dopo due lanci è il 62.5%. Esistono dei modi per ridurre il numero di lanci; possiamo per esempio dire che sopo il quarto lancio TTCC equivale a TC e CCTT a CT, dopo l’ottavo lancio TTTTCCCC equivale a TC e CCCCTTTT a CT, e così via. Ma il rischio di proseguire all’infinito c’è sempre, e uno si può giustamente chiedere se esiste una strategia di tip diverso che garantisca di riuscire a ottenere esattamente il 50% dopo un numero finito di lanci. Di per sé la cosa non è a priori impossibile. Immaginiamo di lanciare la moneta tre volte: uscirà TT con probabilità $p^2$, e se quindi avessimo una moneta con $p = \sqrt{2}/2$ questa probabilità sarà esattamente 1/2. Potrebbe insomma darsi che a seconda del valore di $p$ si possa trovare una combinazione legata a un numero finito di lanci che esca con probabilità 1/2?

La risposta è no, e lo si può vedere con un esempio pratico. Supponiamo che $p = \frac{2}{3}$ e immaginiamo di lanciare la moneta $n$ volte. Avremo allora $2^n$ possibili eventi, ciascuno con probabilità della forma $\frac{k}{3^n}$: il denominatore è dovuto al fatto che sia le teste che le croci hanno una probabilità della forma $\frac{h}{3}$ con $h$ che può valere 1 oppure 2. Poiché la somma di tutte le probabilità deve essere 1, cioè $\frac{3^n}{3^n}$, è immediato che non potremmo dividere gli eventi in due gruppi della stessa probabilità, perché se moltiplichiamo le probabilità per $3^n$ avremo un insieme di numeri interi la cui somma è un numero dispari.

Fine della storia? Ovviamente no. Un Vero Matematico non si sarebbe sporcato le mani con tutti questi conti. Avrebbe notato che per un qualunque numero di lanci di monete le combinazioni possibili sono in numero finito; pertanto l’insieme di tutte le combinazioni possibili con un qualunque numero di lanci sarà un’infinità numerabile. Peccato che i valori di probabilità tra 1/2 e 1 siano più che numerabili, e quindi ne resterà un’infinità (più che numerabile) che non potrà essere coperta da quei casi…

Non so voi, ma io (che non sono un intuizionista) trovo entrambi gli approcci interessanti, ciascuno a modo suo. Uno può sporcarsi le mani e usare argomenti alla portata di un ragazzino di terza media piuttosto sveglio, oppure usare i cannoni e sfruttare una teoria molto potente. Ma è questo il bello della matematica: non esiste una via regia, ma ci sono tante strade panoramiche!

(immagine da PNGwing)

Ultimo aggiornamento: 2024-07-17 12:25

Le elezioni legislative francesi

risultati delle elezioni francesi I risultati delle elezioni francesi hanno mostrato una disparità tra voti e seggi ottenuti in maniera ancora più eclatante di quello delle quasi contemporanee elezioni britanniche, dove il Labour hanno ottenuto 412 seggi con il 33,7% dei voti contro i 121 dei Tories col 23,7%; peggio ancora, Reform UK con il 14,3% dei voti ha cinque deputati, mentre i liberaldemocratici ne hanno 72 con il 12,2%. In Francia invece il Rassemblement National (l’estrema destra) con il 37,1% è arrivata solo terza con 142 seggi, preceduta sia dal Nuovo Fronte Popolare (188 seggi con il 26,3% di voti) e l’Ensemble macroniano (161 seggi con il 24,7% di voti). Cosa significa tutto questo? Che la scelta del sistema di voto è importante, e qui la matematica ha un ruolo importante, anche se alla fine quello che conta è sempre la parte sociologica.

Se abbiamo un sistema proporzionale puro assegniamo più o meno lo stesso numero di deputati a due partiti con la stessa percentuale di voti. Il “più o meno” è legato non tanto agli arrotondamenti quanto al fatto che non si ha un unico collegio nazionale ma tanti collegi locali; un partito con una forte connotazione locale prenderà più seggi di un partito con lo stesso numero di voti totali ma spalmati in tutta la nazione. Qua invece i sistemi sono diversi. Nel Regno Unito il sistema è uninominale secco: il candidato che prende più voti nel collegio vince. Punto. Quindi un candidato ben noto localmente può superare l’appartenenza partitica, per esempio; e soprattutto ci sono molti collegi dove c’è una maggioranza molto forte di un partito e quindi non sono di solito contendibili. Pare che ci siano stati accordi ufficiosi di desistenza tra Labour e LibDem, nel senso che i primi non hanno fatto molta campagna elettorale nei collegi del sud dove i secondi erano più forti e si è verificato l’opposto nel nord dell’Inghilterra, ma questi accordi non sono mai stati formalizzati.

Il sistema francese per le legislative è completamente diverso, e De Gaulle l’ha studiato per evitare gli stalli della Quarta Repubblica e tarpare le ali agli schieramenti estremi. Innanzitutto se nessuno raggiunge la maggioranza assoluta al primo turno si ha un ballottaggio; ma a differenza di cosa succede per esempio in Italia con i sindaci non è detto che gli sfidanti al secondo turno siano solo due. Infatti un candidato che ha ottenuto voti per almeno il 12,5% degli iscritti alle liste elettorali (attenzione, non dei voti validi!) ha comunque diritto di accedere al secondo turno. Cosa succede però in pratica? Che spesso i candidati arrivati terzi o quarti si ritirano “spintaneamente” nel caso il loro partito preferisca vedere vincente il candidato arrivato secondo al primo turno, e gli elettori francesi sono abituati a seguire questa logica. Quest’anno l’affluenza è stata molto alta (il 66%, venti punti in più di due anni fa) e quindi ci sarebbero stati molti più ballottaggi a tre o a quattro; ma molti candidati di sinistra e parecchi di centro-destra hanno scelto di non andare al ballottaggio, e soprattutto l’affluenza è stata ancora praticamente uguale; così le proiezioni che davano una maggioranza al RN si sono rivelate del tutto sbagliate.

La matematica gioca insomma un ruolo importante nelle scelte del sistema elettorale: ho già scritto in passato del paradosso dei gelatai con la sua versione 2.0, ma in questo caso le regole del gioco sono ancora diverse. L’unica cosa che dobbiamo sempre ricordare è che la matematica favorisce un certo tipo di situazione, ma all’atto pratico dipende sempre tutto dalle scelte specifiche: come accennavo sopra, i votanti francesi tendono ancora a seguire il ragionamento gollista ed evitare i voti agli schieramenti estremi, anche se il risultato stavolta è un parlamento spaccato che il generale non si sarebbe mai aspettto.

Ultimo aggiornamento: 2024-07-10 11:53