Il libro di Will Kurt “Bayesian Statistics the Fun Way” è un’introduzione interessante alle finezze del teorema di Bayes e soprattutto al suo significato pratico. Per chi non si ricordasse la formula del teorema, è questa: $$ P(A|B) = \frac{P(B\!|\! A)\cdot P(A)}{P(B)}$$ dove $P(A)$ indica la probabilità di un evento $A$ (chessò, ho il raffreddore) e $P(A\!|\! B)$ la probabilità dell’evento $A$ sapendo che c’è stato l’evento $B$ (ho il raffreddore tutte le volte che il giorno prima è piovuto). Se proprio non vi resta in mente la formula, vi svelo un trucchetto: immaginando che tutte le probabilità in gioco siano maggiori di zero – anche perché altrimenti non c’è molto da calcolare… – si può scrivere la formula come $$ P(A\!|\!B) \cdot P(B) = P(B\!|\!A) \cdot P(A)$$, che è più simmetrica. In ogni caso, noi cerchiamo di aggiornare la probabilità del nostro evento $A$ (che avevamo a priori) una volta che abbiamo una nuova informazione $B$ (che per definizione conosciamo), e lo facciamo rovesciando la logica, cioè sapendo qual è la probabilità di $B$ nota $A$.
Come dicevo, Will Kurt fa un esempio con il Lego, esempio che trovate in questo suo vecchio post e che ora vi racconto. Partiamo con alcuni mattoncini ($1 \times 1$, anche se i pezzi in realtà sono più grandi, ma non so come chiamare l’unità minimale) come in figura:

Abbiamo una superficie $6 \times 10$ di mattoncini di tre colori, che rappresentano il nostro spazio di probabilità: c’è un rettangolo $4 \times 10$ blu, uno $2\times 10$ rosso e uno $3 \times 2$ giallo posato sopra gli altri due (purtroppo con le mie capacità grafiche è difficile mostrarlo bene, ma il fatto che siano leggermente spostati sulla destra dovrebbe essere un indizio). Calcolando le probabilità dello strato di base, abbiamo $P(\rm{blu}) = \frac{2}{3}$ e $P(\rm{rosso}) = \frac{1}{3}$. Chiaramente $P(\rm{blu}) + P(\rm{rosso}) = 1$, visto che lo strato di base ha solo mattoncini blu e rossi.
Ora entrano in scena i mattoncini gialli. È vero che $P(\rm{giallo}) = \frac{1}{10}$, perché ci sono sei mattoncini gialli su 60. Ma nel nostro spazio degli eventi noi non consideriamo l’evento “c’è un mattoncino giallo”, anche perché altrimenti la probabilità totale sarebbe maggiore di 1. Ripeto: gli eventi per noi sono solo quello che si trova sullo strato di base. Consideriamo ora la probabilità condizionata di avere un mattoncino giallo sopra uno blu oppure rosso, indicandola come $P(\rm{giallo\!|\! blu})$ o $P(\rm{giallo\!|\! rosso})$ rispettivamente. Come possiamo calcolare $P(\rm{giallo\!|\! rosso})$? Semplice: separiamo il blu dal rosso e consideriamo solo la parte rossa, come in figura. Abbiamo che l’area rossa è come prima $2\times 10 = 20$, quella gialla è $2\times 2 = 4$, e pertanto $P(\rm{giallo\!|\! rosso}) = \frac{4}{20} = \frac{1}{5}$.

E se invece volessimo calcolare $P(\rm{rosso\!|\! giallo})$? Banale, mi direte. Ci sono sei mattoncini gialli di cui quattro sono sopra il rosso: se dall’alto vediamo un mattoncino giallo sappiamo che la probabilità che sotto ce ne sia uno rosso è $\frac{2}{3}$. Non ci crederete, ma questo è proprio il teorema di Bayes! Intuitivamente, insomma, il teorema non è niente di che, e possiamo anche intuire che il reverendo Bayes lo considerasse talmente ovvio da non scriverne nemmeno. Vediamo ora come tirare fuori la formula mostrata all’inizio, formalizzando la nostra intuizione.
Partiamo calcolando il numero di mattoncini gialli a partire dalla probabilità di trovarli:
$$ \rm{NumGialli} = P(\rm{giallo}) \cdot \rm{TotNum} = \frac{1}{10} \cdot 60 = 6 $$
Cosa vuol dire “Quattro mattoncini gialli sono sul rosso”? Per prima cosa dobbiamo calcolare quanti sono i mattoncini rossi, con una formula simile a quella sopra:
$$ \rm{NumRossi} = P(\rm{rosso}) \cdot \rm{TotNum} = \frac{1}{3} \cdot 60 = 20 $$
Sappiamo poi che il rapporto dei mattoncini gialli sopra quelli rossi è $P(\rm{giallo\!|\! rosso})$; moltiplicandolo per il numero dei mattoncini rossi troviamo quanti sono i mattoncini gialli sui rossi:
$$ \rm{NumGialliSuiRossi} = P(\rm{giallo\!|\! rosso}) \cdot \rm{NumRossi} = \frac{1}{5} \cdot 20 = 4 $$
Infine dobbiamo calcolare il rapporto tra i mattoncini rossi coperti da quelli gialli e il totale di quelli gialli:
$$ P(\rm{rosso\!|\! giallo}) = \frac{\rm{NumGialliSuiRossi}}{\rm{NumGialli}} = \frac{4}{6} = \frac{2}{3} $$
Da qui possiamo usare le tre formule precedenti per scrivere i due termini della frazione usando le probabilità e il numero totale di mattoncini; quest’ultimo fa il piacere di eliminarsi e otteniamo il teorema di Bayes. Diciamocelo, però: la formalizzazione non è così facile da vedere, ed è forse per questo che il teorema rimane spesso piuttosto oscuro, anche se come abbiamo visto non c’è nulla di davvero complicato.
Ultimo aggiornamento: 2025-12-10 22:22