Quando il caso non sembra casuale

Ti sei appena comprato l'ultimo modello di iDop™ Shuffle. Il lettore musicale ti promette una selezione assolutamente casuale dei brani, per farti apprezzare musica sempre diversa. Tutto felice, tu lo carichi con mille brani e inizi a sentirti le tue canzoni preferite: ma dopo qualche ora ti fermi di botto. "Questo brano me l'ha già fatto sentire!" Vai a vedere le statistiche implementate nel dispositivo, e scopri che effettivamente il quarantaduesimo brano che stai ascoltando era già apparso come selezione.

Prima di correre a riportare il tuo iDop™ a riparare, però, forse è meglio che facciamo un po' di conti insieme. Supponiamo che la selezione sia davvero perfettamente casuale. La probabilità che la seconda canzone che abbiamo ascoltato fosse uguale alla prima sarà evidentemente 1/1000, e quindi la probabilità che arriviamo alla seconda canzone senza doppioni sarà tutto quello che avanza, vale a dire 999/1000. Passiamo alla terza canzone: la probabilità che non fosse di nuovo né la prima né la seconda sarà 2/1000. Per calcolare la probabilità che nel nostro ascolto casuale siamo arrivati fino a qua, dobbiamo essere arrivati alla seconda e poi non essere stati fregati al terzo brano con un doppione; visto che le due richieste sono indipendenti, dobbiamo fare il prodotto dei due valori, ottenendo pertanto (999/1000)*(998/1000)... e così via, man mano che si ascoltano nuove canzoni.
Andando avanti così, possiamo ricavare una formula che ci dia la probabilità di non avere doppioni arrivati alla k-sima canzone. Ricordando che n! ("enne fattoriale") è il prodotto dei numeri da 1 a n, la formula è

1000!
----------
k! * 1000k

A questo punto basta vedere qual è il primo valore di k per cui il valore sia minore di 1/2, e scoprire così dopo quante canzoni è più probabile che ci sia capitato di sentire più di una volta lo stesso brano. Un tempo, avremmo dovuto farci i conti a mano, usando per il fattoriale la cosiddetta Formula di Stirling, un'approssimazione piuttosto precisa: si ha infatti che n! ~ √(2πk) * (n/e)n e sfruttando le tavole dei logaritmi si sarebbe potuto calcolare senza troppi patemi - si fa per dire - il risultato. Oggi la cosa è molto più semplice, e basta scrivere un programmino al calcolatore per ottenere rapidamente i valori cercati.
Facendo i conti, scopriamo che la probabilità scende sotto il 50% alla trentottesima canzone; alla cinquantesima canzone, siamo intorno al 29%, e la probabilità che non ci siano doppioni nelle prime cento canzoni è un misero 0.6%. Alla faccia della casualità della scelta! Questo paradosso è più noto con il nome di Paradosso del compleanno: prese a caso ventitré persone, la probabilità che due di esse compiano gli anni lo stesso giorno è leggermente maggiore del 50%.

Per capire come mai si ha questo paradosso, potrebbe essere utile vedere alcuni casi che sembrano simili a prima vista, ma non lo sono affatto. Iniziamo a vedere che non potevamo pretendere di ascoltare tutte e mille le nostre canzoni prima di risentirle. Se così fosse, dopo la 999.ma saremmo certi di conoscere quale sarebbe la successiva, vale a dire l'unica che manca; e peggio ancora, la 1001.ma dovrebbe essere per forza di nuovo la prima, come si può vedere considerando i brani dal secondo al millesimo e notando che l'unico non presente in questo elenco è quello suonato per primo.
Un altro punto da notare è che non è che ci sia una probabilità su due che la trentottesima canzone sia uguale a una delle precedenti. Quella probabilità è ovviamente 37/1000. Il conto che è stato fatto sopra è agnostico, e permette che ci sia una qualunque coppia di posizioni che corrispondono allo stesso brano; di coppie ce ne sono tante... Allo stesso modo, non possiamo pretendere di scegliere quale canzone verrà ripetuta, tra le trentasette presenti. Se mettiamo un vincolo così forte, le probabilità calano di nuovo, ovviamente a 1/37. In un certo senso, è proprio il nostro non aspettarci nulla di particolare che fa crescere così tanto la probabilità: provare per credere.

Un'ultima noticina: è anche possibile calcolare la probabilità che il tuo iDop™ suoni per due volte di fila lo stesso brano. Si può dimostrare che la probabilità che ciò non capiti mai diventerà sempre più piccola man mano che si continua ad ascoltare musica; dopo 694 brani la probabilità che sia capitato questo incidente è maggiore di quella che non sia capitato, mentre per arrivare al 90% di probabilità occorre avere ascoltato ben 2311 brani. Magari il vostro lettore non sarà più in garanzia: evitate di spendere soldi per far riparare qualcosa che funziona perfettamente!

P.S.: se non fosse chiaro, tutti i ragionamenti fatti partono dall'assunzione che venga usato un generatore perfettamente casuale (o comunque pseudocasuale, insomma quello che passa il convento per un calcolatore) per scegliere la successione dei brani. Non è affatto detto che un lettore "vero" usi una funzione di questo tipo: ad esempio, se si definisce una playlist questa viene suonata tutta, e non può capitare un caso come quello trattato.