Media aritmetica e geometrica
Ci sono tanti tipi di medie, un po’ come ci sono tanti tipi di pane o modelli di automobile. In tutti questi casi la diversità rispecchia gli usi diversi: a dirla tutta pane e auto, a differenza delle medie, possono anche essere scelte per ragioni legate al giusto, ma non sottilizziamo. Qualche anno fa avevo scritto qualcosa sulle medie nel mio blog personale; magari lo farò anche qua, ma per il momento mi limito a qualche considerazione didattica sui due tipi di media più usuali, quella aritmetica e quella geometrica.
La media aritmetica tra due numeri è semplice da calcolare: li si somma e si divide il risultato per due, perché i numeri sono due. La media geometrica è in un certo senso il passo successivo: invece che sommare i numeri li si moltiplica, e invece che dividere per due si estrae la radice quadrata. Naturalmente se i numeri invece che due fossero genericamente n la cosa è simile: nel caso della media aritmetica li si somma tutti e si divide il risulato per n, per la media geometrica si estrae la radice n-sima del loro prodotto. Quello che forse non sanno in molti è che la media aritmetica è sempre maggiore di quella geometrica, tranne nel caso in cui tutti i numeri di partenza siano uguali, e quindi lo siano anche le due medie. Come lo si dimostra?
Iniziamo con il caso semplice di due soli elementi. La prima dimostrazione che vi do è puramente algebrica, ed è quella che probabilmente viene fatta a scuola ammesso che venga appunto dimostrato. Per fare la dimostrazione introduco un nuovo operatore: il punto interrogativo “?”. Se scrivo a ? b intendo che può verificarsi uno dei seguenti casi:
- a > b
- a ≥ b
- a < b
- a ≤ b
A questo punto posso fare tutte le operazioni algebriche standard che non modificano l’operatore nascosto dal punto interrogativo, fino a quando riesco ad arrivare a un risultato chiaro e finalmente capire quale dovevo usare fin dall’inizio. Per completezza, anche se non lo userò in questi esempi, c’è anche l’operatore “¿” che naturalmente è quello complementare a “?”; in pratica, se a ? b allora 1/a ¿ 1/b (provateci!)
Com’è allora la dimostrazione? Beh, abbiamo (a+b)/2 ? √(ab), cioè a+b ?2 √(ab). Eleviamo al quadrato e abbiamo (a+b)2 ? 4ab, cioè (a–b)2 ? 0; a questo punto sarete tutti d’accordo che il nostro punto interrogativo è in realtà un ≥, e l’uguaglianza si ha solo quando a=b.
La dimostrazione non è difficile, ma è noiosa, come sempre capita quando si lavora algebricamente. Eccovi allora una seconda dimostrazione, questa volta geometrica, che balza subito alla vista. Nella figura qui a fianco abbiamo un triangolo rettangolo ABC inscritto in una semicirconferenza. È noto che i triangoli AHC e CHB sono tra loro simili, oltre che simili ad ABC; abbiamo pertanto che a/c=c/b, cioè che c è la media geometrica tra a e b (tecnicamente si parla di medio proporzionale, ma è la stessa cosa). Ma la media aritmetica tra a e b è semplicemente il raggio del cerchio; a questo punto è immediato vedere che c è sempre minore del raggio, tranne quando a è uguale a b (e a c). Semplice ed economico.
E se i numeri da mediare sono più di due? La dimostrazione geometrica nel caso n-dimensionale mi sa che non sia molto applicabile: accontentatevi per il momento di una pseudodimostrazione fisica che fa fine e non impegna, almeno fintantoché non la si voglia formalizzare per bene. Nel disegno più in basso vediamo vari punti su una semiretta, e la loro media aritmetica è indicata con un triangolino che fa da fulcro. Sì, lo so che la leva non sarebbe in equilibrio: fate finta che i punti si alleggeriscano man mano che si allontanano dal centro. Ora, se non tutti i punti hanno lo stesso valore, ce ne sarà almeno uno a sinistra e uno a destra del fulcro; e ce ne sarà (almeno) uno a distanza minima ma positiva da esso. Prendete questo punto e uno dall’altro lato, e spostateli della stessa distanza verso il fulcro in modo che (almeno) il più vicino lo raggiunga. La media aritmetica, se sostituiamo ad a e b rispettivamente a+x e b–x, non cambia; quella geometrica invece cresce, come il lettore desideroso di fare i conti può facilmente verificare da solo osservando che se 0 ≤ a ≤ b e 0 ≤ a ≤ (a+b)/2 allora ab ≤ (a+x)(b–x). Se proprio il lettore non sa come farlo, provi a introdurre una nuova variabile c pari alla media aritmetica tra a e b, e riscriva tutto in termini di c…
Se mi dite che questa dimostrazione non è troppo matematica, avete ragione. Passo quindi a una dimostrazione puramente algebrica, che purtroppo prevede una serie di formulacce che devo scrivere in LaTeX perché i font standard HTML non mi bastano. Vi chiederei però di seguire almeno i passaggi logici, fidandovi che i conti da me fatti siano corretti: questa dimostrazione, che secondo il libro di Paul Zeitz che sto continuando a leggere è di Cauchy, è infatti peculiare.
Il primo passo è usare l’induzione. Ma attenzione: non dimostrerò il teorema per tutti i valori di n, ma solo per le potenze di 2. Il caso base, cioè n=2, l’abbiamo visto sopra. Ora immaginiamo che la disuguaglianza valga per 2n termini, e vediamo cosa succede se ne abbiamo 2n+1. Con “semplici passaggi algebrici”, e applicando due volte l’ipotesi induttiva e una volta la disuguaglianza base, otteniamo
(io ve l’avevo detto che facevate meglio a fidarvi!)
Adesso arriva l’idea fantastica: torniamo indietro! Più precisamente, mostriamo che se la disuguaglianza è vera per n termini allora lo è anche per n-1. Per semplicità faccio un caso specifico, quello di n=4, ma ovviamente il ragionamento è generalizzabile. Se sappiamo che (a+b+c+d)/4 ≥ 4√(abcd) e vogliamo dimostrare che (a+b+c)/4 ≥ 4√(abc), la strada più semplice che dovrebbe venirci alla mente è di sostiture a d la media aritmetica degli altri elementi, cioè (a+b+c)/3. In effetti avremo che (a+b+c)/4 ≥ 4√(abc(a+b+c)/3); elevando alla quarta potenza il tutto, semplificando il fattore (a+b+c)/3 ed estraendo la radice cubica siamo a posto.
La dimostrazione non è così difficile se si sa cosa fare, e in effetti era stata lasciata come “esercizio guidato”; personalmente sono rimasto stupito dall’idea di Cauchy di fare grandi balzi per poi tornare indietro, e credo che questo sia l’unico esempio di induzione-e-retroazione in una dimostrazione. Voi che ne pensate?
Leave a comment