Supponete che qualche giorno prima della partita di andata dei quarti di finale della Champions League vi arrivi una email che dice “ho sviluppato un algoritmo che prevede correttamente i risultati sportivi. Per dimostrarGlielo, ecco quali sono le quattro squadre che passeranno alle semifinali:” e un elenco di quattro squadre. La mail termina con “per favore, non divulgate la notizia, per ovvie ragioni”. Voi non ci fate molto caso: quando però le partite si sono concluse, vi arriva una seconda email, che dice “Le quattro squadre che hanno passato il turno sono state proprio quelle da me previste. Perché Lei si possa sincerare della potenza dei miei algoritmi, Le dico quali saranno le finaliste”; e stavolta ci sono due nomi. Fate mente locale, vi ricordate che effettivamente l’interlocutore aveva ragione – e dire che non avreste scommesso un euro su una delle squadre – e aspettate incuriositi. Anche stavolta le predizioni si sono rivelate corrette: arriva una terza mail che dice “Se Lei vuole sapere il nome della squadra che vincerà la Champions League, invii cento euro a questo numero di conto corrente. Mi raccomando, però: non diffonda la notizia, altrimenti le quote crollerebbero.” Che fareste? Mandereste all’anonimo i soldi, pronti a scommetterne ben di più? Se avete risposto sì, forse è meglio che continuiate a leggere; altrimenti la lettura non sarà così importante ma spero sia comunque piacevole.
Il nostro anonimo interlocutore aveva infatti iniziato a spedire 128.000 email – tanto non gli costava nulla – divise in sedici gruppi, ciascuno dei quali aveva una quaterna diversa di semifinaliste previste. Una volta visti i risultati, il secondo gruppo di spedizioni è stato fatto solo agli 8000 destinatari che avevano ricevuto la predizione corretta (suppongo che le probabilità che passi il turno una squadra oppure l’altra siano le stesse, ma il ragionamento vale lo stesso); il terzo messaggio con la richiesta di denaro, infine, solo ai 2000 per cui anche i risultati delle semifinali erano stati previsti correttamente. La maggior parte delle persone ha ricevuto solo la prima mail con le previsioni errate, ma voi eravate tra i duemila “fortunati”, e con buona probabilità sgancerete al nostro ignoto amico cento euro per un’ulteriore predizione assolutamente casuale. Se anche solo la metà dei polli ci casca, sono 100000 euro in saccoccia senza troppa fatica: niente male, vero?
Purtroppo l’evoluzione non ha insegnato a noi umani come trattare le probabilità, soprattutto le probabilità a posteriori. Quello dell’esempio è un caso limite: prima dell’invio della prima email avete una possibilità su 64 di ricevere tutti e sei i risultati corretti, e quando vi arriva la lettera con la richiesta di un piccolo contributo tendete a pensare ancora a quella probabilità, mentre quella a posteriori è ovviamente la certezza nel vostro caso (e l’impossibilità negli altri 63 casi… la probabilità è come l’energia, nulla si crea e nulla si distrugge). Ma ci sono anche altri casi in cui le probabilità a posteriori sono sovrastimate e non sottostimate. Il caso classico che viene fatto è quello del test per l’Aids. Supponiamo che il test rapido abbia una probabilità su 100 di dare un falso positivo (una persona sana che risulti aver contratto l’infezione), e che il vostro stile di vita assai morigerato sia tale che a priori avete una possibilità su 1000 di essere infetti. Andate a fare il test, e vi richiamano dicendo che il test rapido è risultato positivo e quindi occorre sottoporvi a un test più accurato. Quant’è la probabilità a posteriori (cioè dopo la positività al test rapido) che voi siate effettivamente infetti? il 99%? No, è molto meno. Su un milione di persone con il vostro stile di vita, infatti, solo 1000 sono statisticamente infette. Il test darà risultato positivo su questi 1000 e sull’1% degli altri 999000, cioè su 9990 persone (che arrotondo a 10000 per fare meglio i conti). Quindi ci sono 1000 infetti su quasi 11000 positivi all’esame, pari a meno del 9%. In altre parole: c’è da preoccuparsi (siamo passati da una probabilitàa priori dello 0,1% a quasi il 9%) ma non avete ancora un piede e mezzo nella fossa!
Tutti questi conti sono ben noti da secoli ai matematici, e la formula che calcola le probabilità a posteriori a partire da quelle a priori e dai risultati si chiama Teorema di Bayes. Il fatto che sia ben nota non cambia però le carte in tavola: continua a risultare poco intuitiva, e quindi anche persone con una buona conoscenza scientifica ci possono cascare.
C’è anche un altro fenomeno relativo alle probabilità che fa prendere lucciole per lanterne, anche se più che matematico è probabilmente di natura psicologica, ed è l’aggiustamento probabilistico a posteriori. Inizio con un esempio che di matematico non ha nulla: le centurie di Nostradamus. Adesso non sono molto di moda, ma negli anni ’70 del secolo scorso c’erano vari studiosi che invariabilmente mostravano come Nostradamus avesse previsto i vari fatti accaduti: una volta verificatisi tali fatti, i riferimenti nel testo del veggente erano infatti inequivocabilmente chiari. Purtroppo le previsioni per il futuro non sono mai state così chiare, un po’ come quelle degli astrologi: o magari è tutto un complotto delle società di assicurazione che non vogliono finire in rovina, e quindi stanno attente a eliminare tutti i possibili metodi per conoscere davveo il futuro.
Spostandoci ìn un ambito piu matematico ancorché qualitativo, prendo un esempio purtroppo tragico: il terremoto abruzzese di questi giorni, e la coda di polemiche perché le previsioni di Gioacchino Giampiero Giuliani non sono state tenute in considerazione. Guardiamo le cose da un punto di vista strettamente matematico. La probabilità a priori che ci sia un terremoto di intensità distruttiva in un giorno specifico in una zona specifica (diciamo con l’epicentro in un raggio di quindici km da un punto indicato) è molto bassa, per fortuna: e lo è anche se ci si trova in una zona sismica, e comincia a diventare significativo – ma non ancora elevato, sempre per fortuna – in presenza di alcuni segnali. Immaginiamo che Giuliani avesse effettivamente previsto il terremoto del 6 aprile all’Aquila, ma non avesse detto nulla perché in fin dei conti era già sotto inchiesta per procurato allarme. Resta il fatto che il 28 marzo aveva affermato che il terremoto sarebbe stato il giorno successivo (sette giorni prima della data effettiva) a Sulmona (cinquanta chilometri in linea d’aria dall’Aquila). Chi dice “ci aveva azzeccato” è come chi pensa di aver vinto alla lotteria perché la differenza tra il numero del suo biglietto e quello vincente è solo 14: non esattamente un gran risultato. Eppure, proprio perché l’evento è così raro e distruttivo, si pensa inconsciamente che un’approssimazione di questo tipo sia accettabile. Visto che non possiamo riprodurre a piacere i terremoti, non abbiamo un modo di valutare aprioristicamente la probabilità che da una serie di segnali si giunga a un sisma. D’altra parte, mentre in linea di principio ha senso avere qualche allarme a vuoto, non possiamo nemmeno averne troppi; non tanto per l’effetto “al lupo al lupo”, quanto per gli ovvi problemi organizzativi.
La morale di tutto questo è semplice: fate sempre attenzione quando valutate delle probabilità, e non fidatevi degli argomenti spannometrici!
Ultimo aggiornamento: 2009-04-11 07:00
E’ sempre bello leggere cose che hai studiato ed ami distribuite (ora ci vuole) alla portata di tutti. ;)
Grazie per questo post: ce ne vorrebbero di più, a tutti i livelli. Gli scolari andrebbero esposti fin da piccoli a qualche idea elementare di calcolo delle probabilità, proprio per evitare di cadere come pere cotte in queste trappole.
Solo un appunto minimo.
Nell’esempio del test per l’AIDS non accenni ai falsi negativi, cioè assumi che chi è infetto risulti sempre positivo al test, ma suppongo che tu l’abbia fatto apposta per semplificare le cose.
Bellissima, ora giro il post in e-mail a tutti i miei amici e colleghi che “Hai visto, avevano previsto il terremoto”. Purtroppo temo che nessuna argomentazione scientifica riuscirà a vincere superstizione e creduloneria.
Hai da dire tu a questi: “Può essere che il radon diventi in futuro un indicatore dei terremoti, adesso non lo è”; quelli ti rispondono: “La solita spocchia della comunità scientifica ufficiale che non vuole ammettere di essere stata battuta da un Giuliani qualsiasi”
Beh, non mi risulta che il signor Giuliani avesse detto a metà dei media che ci sarebbe stato il terremoto e all’altra metà che non ci sarebbe stato… (comunque ovvio che azzeccarci per caso è sempre possibile).
L’esempio che hai fatto con la malattia e il falso positivo me lo ricordo da un libro di Massimo Piattelli Palmarini, letto ormai quasi 20 anni fa, che credo come titolo inglese sia “Inevitable Illusions: How Mistakes of Reason Rules Our Minds”. Lui li chiamava “tunnel mentali”.
L’argomento vale anche sulla molteplicità delle persone, non solo su quella delle azioni di una sola.
Cioè: il successo di un Berlusconi o di un Giuliani (per dire) non è motivo valido per prendere a modello l’uno o l’altro.
Se non capisci come ha avuto successo, non puoi escludere di avere davanti solo il risultato di una selezione casuale del genere mostrato da .mau. nel post.
@Daniele: sì, ho saltato i falsi negativi – che tanto non avrebbero cambiato i numeri finali – per semplificare la vita al lettore. Per la stessa ragione ho supposto che la probabilità che una squadra o l’altra passasse il turno fosse identica.
@Paolo: quello del test antiaids è un esempio noto, sono sicuro di averlo letto anche su un libro di Gigerenzer e su uno di Motterlini.
@vb: capisco che ormai devi parlare ai grillini, ma se io inizio una sezione dicendo «C’è anche un altro fenomeno», magari è appunto un po’ diverso dalla prima sezione, no? (oltre naturalmente a quanto risposto da “scettico sempre”: c’è anche il fenomeno per cui noi tendiamo a non ricordarci delle previsioni errate e tenere a mente solo quelle che a posteriori si sono avverate)
@Gewurz: non so perche’ non si insegna la probabilita’ (compreso il teorema di Bayes) a scuola. Non e’ particolarmente difficile e certamente e’ utile. Primo esercizio: calcolare la probabilita’ che esca il 34 sulla ruota del lotto di Milano sapendo che non esce da N settimane, in funzione di N.
Ai legulei di passaggio: dite che c’e’ qualche speranza di far pagare quelli che avrebbero dovuto costruire in modo antisismico e non l’hanno fatto? Un collega giapponese, stupito di tanti crolli per un terremoto relativamente modesto, ha commentato “probabilmente erano tutti edifici antichi”. Non ho saputo che dire.
La probabilità che esca o non esca un numero è sempre la stessa.
Circa le previsioni nello spazio, si possono sempre prevedere se si ha una buona vista e si dispone degli strumenti giusti come occhiali, cannocchiali, telescopi, radar, sonar, ecc. Non si tratta di previsioni, ma semplicemente di riuscire a vedere una realtà già presente, soltanto più lontana che altri non riescono a vedere perché non hanno gli strumenti per vedere.
Diverso il caso delle previsioni nel tempo. La matematica è uno strumento importante in quel caso, più della vista. Ma non credo nel calcolo delle probabilità come metodologia per fare previsioni. Certamente il calcolo delle probabilità offre uno strumento per fare delle previsioni affette da un margine di errore più o meno grande.
@Piero: »La probabilità che esca o non esca un numero è sempre la stessa.
No :-) Se nell’urna del lotto metti più copie dello stesso numero, oppure raffreddi la pallina prima di infilarla cosicché chi la pesca se ne possa accorgere, la probabilità cambia.
Detto in altri termini, la correlazione è importante, anche se non ti dà certezze. Se ad esempio si scoprisse che nella metà dei casi in cui il radon ha un picco in una zona c’è un terremoto il giorno dopo, allora ha senso preparare un’evacuazione. Di nuovo, bisogna però vedere qual è la correlazione: se putacaso i terremoti fossero sempre il giorno dopo un picco di radon, ma il radon avesse di quei picchi trenta volte l’anno, la cosa servirebbe a poco.
@.mau.: credo che Piero supponesse di trovarsi davanti un’estrazione onesta. Ovviamente puoi usare il calcolo delle probabilita’ anche alla rovescia, per scoprire una truffa: quando io ho seguito CdP, uno degli esercizi cominciava con “Sei in una bisca clandestina” e finiva con “Qual e’ la probabilita’ che la roulette numero 3 sia quella truccata?”.
@Barbara: anche in un’estrazione onesta, a seconda di cosa è estratto e del costo relativo può aver senso basarsi sulle probabilità. Facevo l’esempio della correlazione “nella metà dei casi in cui il radon supera un certo picco, entro ventiquattr’ore si ha un terremoto”.
bella la storia sulle previsioni di calcio!
non mi era mai capitata.. ma e’ vera?
c’e’ da dire che a quelli paganti dei 2000 “finalisti”, il nostro amico avrebbe inviato a meta’ una squadra ed all’altra metà l’altra.
nella tua ipotesi dei 1000 (50% di “redemption”!) paganti quindi ci sarebbero stati alla fine anche 500 vincenti!!
questi 500 “fortunelli”, oltre ad aver pensato di aver ben speso quei 100, sono sicuro che saranno prontissimi ad offrirsi come testimoni a discarico in un eventuale denuncia per truffa! no? :-)
cosi’ e’ la vita..
@Andrea: no, non è vera, e non l’ho nemmeno inventata io (anche se non mi ricordo dove l’abbia letta… penso da qualche americano, visto che l’esempio originale era con le World Series). In effetti i cinquecento vincenti sarebbero degli ottimi testimonial :-)
@ .mau.
una cosa simile l’ho letta sul libro di Nassim Taleb “Giocati dal caso”, e riguardava le previsioni sull’andamento delle borse. Credo che sia proprio di orgine americana.
Per quanto riguarda la previsione dei terremoti da parte di Giuliani la situazione è un pò più complessa e molto meno campata in aria di quello che sembra.
Vi posto un link dove è possibile raggiungere una relazione di Giuliani ed alcuni commenti ad esso:
http://www.earthquake.it/blog/2009/la-teoria-del-ricercatore-giuliani/#more-127
Boschi di certo non può dire però che non sapeva.
@Ike: ho dato una scorsa alla relazione di Giuliani e ho semplicemente visto che ci sono delle variazioni nel livello di radon (nulla di strano), e che si afferma che c’è un’alta correlazione: però non ci sono dati per verificare indipendentemente la correlazione.
A sostegno dell’ipotesi dell’origine americana, la truffa compare anche in un racconto di Ellery Queen…
@ .mau.
io non voglio difendere Giuliani, ma nemmeno bollare a priori la questione come stregoneria o effetto del caso. Del resto studi scientifici sul radon ce ne sono, e indicano chiaramente una correlazione. Non che sia una correlazione lineare, ma certo se non si studia il fenomeno nemmeno si potrà mai arrivare a modellizzarlo. Quindi credo sia stato giusto non evacuare o lanciare allarmi basandosi solo su ciò che diceva Giuliani.
Il 28 ha lanciato l’allarme ma il 29 pomeriggio qui c’è stato un terremoto(non fortissimo 4° Richter). Da considerare inoltre che la rete di rilevazione non è certo capillare. Quattro centraline in tutto l’Abruzzo. Mi sembra una di quelle occasioni dove si possa fare ricerca multidisciplinare (Matematica, fisica, chimica geologia biologia) che porti vantaggi a tutti e con spese limitate.