Media, mediana e moda per un settenne
Oggi in uno dei millemila socialcosi (chi mi conosce può intuire quale) abbiamo un po’ discusso su una frase che ha una sua certa qual storia: “Il problema della democrazia è squisitamente statistico. La metà degli elettori ha un’intelligenza sotto la media”. Essendo io un noto rompiscatole, ho subito commentato “no, non la media, ma la mediana”, al che la controrisposta è stata “Lo so, ma non l’avrebbero capito. Sono stato poi sfidato a dire come avrei spiegato la differenza tra media e mediana ai miei bimbi: ho subito detto che i tremezzenni non hanno ancora nemmeno chiaro il concetto di media, ma che avrei potuto spiegare la cosa a un bambino di sette anni. Provo a farlo adesso, aggiungendo per soprammercato un terzo tipo di “media”, la moda: se avete figli vostri o di vostri amici di quell’età potrete stabilire da soli se ho ragione o no, ma spero almeno che per voi la cosa sia più chiara. Per la cronaca, avevo già parlato di queste cose cinque anni e mezzo fa; inutile dire che l’approccio di oggi sarà piuttosto diverso.
Siamo a scuola, in una classe. Tutti i bambini hanno delle caramelle: c’è chi ne ha una sola, chi lo zaino pieno. Scenario 1: la maestra, fautrice dell’uguaglianza sociale, sequestra tutte le caramelle, mette i bimbi in fila, e comincia a distribuirne una per uno. Quando ha finito, tutti i bambini hanno un numero di caramelle pari alla media della distribuzione di caramelle. Scenario 2: la maestra, che vuole spiegare le dinamiche marxiane, inizia a prendere il bambino che ha meno caramelle e lo mette a sinistra, mentre mette a destra quello che ne ha di più. (Se ce n’è più di uno, ne prende uno a caso). Continua a fare la stessa cosa con i bambini restanti, finché ne rimangono solo uno o due. Il numero di caramelle che hanno è la mediana della distribuzione di caramelle. Scenario 3: la maestra, che non perde l’occasione di partecipare a un televoto, divide la classe in tanti gruppetti in modo che in ciascuno di essi tutti i bambini abbiano lo stesso numero di caramelle. Va poi dal gruppetto più numeroso: il numero di caramelle che hanno i bimbi di quel gruppo è la moda della distribuzione di caramelle.
Do subito la risposta ad alcuni dubbi che probabilmente vi sono venuti in mente se avete più di sette anni (ma anche se avete sette anni e siete molto attenti)– “ma nello Scenario 1 potrebbero esserci dei bimbi con una caramella più degli altri!”. Vero: in effetti la media può avere anche un valore frazionario, nonostante tutti i numeri di partenza siano interi. Quello che conta davvero è che la media sta a significare “siamo diventati tutti uguali”
– “Cosa succede se nello Scenario 2 alla fine rimangono due bambini con un numero diverso di caramelle?” Li si manda uno da una parte e l’altro dall’altra, e si definisce la mediana come valore di mezzo tra i due. Quello che conta davvero è che la mediana divide in due parti uguali il gruppo di partenza.
– “Cosa succede se nello Scenario 3 ci sono più gruppetti con lo stesso numero di bambini?” Succede semplicemente che la distribuzione si chiama multimodale. La moda è l’unico tipo di media che non deve essere univoco.
Se poi qualcuno ha l’animo del matematico, probabilmente si è chiesto “ma perché media, mediana e moda debbono avere valori diversi? Non può darsi che siano metodi diversi per ricavare lo stesso risultato?” Domanda intelligente, e non scherzo. Purtroppo la maggior parte della gente che ha sentito la frase “distribuzione di probabilità” e riesce a dargli un senso pensa solo alla curva a campana di Gauss, dove in effetti i tre tipi di media coincidono; ma con un po’ di attenzione è possibile scegliere i valori iniziali per ottenere risultati diversi. Nel disegno qui a fianco potete vedere una distribuzione dove i tre valori sono tutti diversi. Non c’è nessuna relazione particolare tra di essi: è possibile costruire una distribuzione dove l’ordine relativo sia uno qualunque dei sei possibili in cui si possono mettere i tre elementi.
L’esempio di cui sopra dovrebbe anche aiutare a capire quando scegliere un tipo o l’altro di media: tutto dipende da cosa ci interessa davvero. Se io mi sto allenando per una maratona e ho la tabella dei kilometri percorsi ogni giorno, oppure se sto raccogliendo da una settimana o due legna per il camino, mi interesserà probabilmente il valore medio: insomma la media è più correlata alle quantità. Se invece pensiamo a una popolazione, la misura più naturale dovrebbe essere la mediana, come nell’esempio iniziale. Scrivo “dovrebbe” e non “deve”, perché in pratica vi fregano sempre, come quando parlano di “reddito medio degli italiani”. Lo fanno perché è facile calcolarlo – basta prendere il reddito totale e dividerlo per il numero di persone – ma è una misura che è ancora più imbecille del mezzo pollo di Trilussa. Non ci credete? Provate ad essere in un salone con una ventina di persone tra cui Berlusconi (o Marchionne, se non volete parlare di politica), e di calcolare il vostro reddito medio e quello mediano: il primo avrà ben poco valore pratico. Infine la moda serve più che altro a sapere chi è di moda, o se preferite su quale risultato puntare se dovete sceglierne uno solo tra tutti i possibili. Negli esempi qui sopra ce ne facciamo poco, ma quando si hanno migliaia o milioni di casi le cose cambiano, e ci fanno capire che per esempio se stiamo misurando le altezze degli italiani e scopriamo che nel grafico ci sono due picchi forse è meglio fare due grafici, uno per i maschi e uno per le femmine, che risultano più “puliti” e facilmente utilizzabili.
Bene: le cose sono più chiare? Che dicono i settenni?
Leave a comment