Però Wordlebot non usa tutte le possibili parole inglesi di cinque lettere, 12974, ma solo un loro sottoinsieme che comprende quelle che sono effettivamente soluzioni possibili (2309) oltre a un paio di migliaia di altri termini. In Wordle infatti l’elenco delle soluzioni contiene solo quelle che dovrebbero essere le parole inglesi più comuni: che sia vero o no non lo so, posso solo dire che a volte devo cercare sul vocabolario il significato del risultato. Cosa succederebbe se il bot avesse a disposizione tutte le parole possibili e dovesse cercare una soluzione? Qui ci viene in aiuto la teoria dell’informazione, che ci permette di dare una misura quantitativa (l’entropia) alla nostra conoscenza. Più l’entropia è alta, più informazione abbiamo in media. La prima scelta migliore pare essere SOARE (arcaico per “giovane falco”), che ha circa 5,89 bit di entropia. Questo valore significa che dopo averla giocata il numero medio di possibili soluzioni si riduce di un fattore 25,89, anche se c’è chi afferma che ROATE sia meglio. Mi stupisce solo che questo acronimo sia presente tra le possibili parole inglesi… Da qua si può andare avanti a cercare una seconda parola. Se non possiamo sapere in anticipo il nostro punteggio con il primo tentativo, dopo SOARE si dovrebbe usare THILK (altra parola arcaica che può significare “this” o “that”) che aggiunte 4,11 bit di entropia; ma a questo punto esistono altre coppie leggermente migliori – so che una comincia con SLANE ma non so qual è la seconda parola.
Tutto bellissimo, ma c’è un ma. Un computer non ha problemi a scegliere quelle parole e verificare a una a una le scelte rimanenti. Noi esseri umani non vogliamo certo ricordarci a memoria tutto l’albero di combinazioni possibili a seconda del risultato del primo nostro tentativo; quindi sceglieremo una parola diversa, subottimale ma più semplice da gestire. Al momento per esempio il mio primo tentativo è STARE, che non sarà il massimo ma è abbastanza buona. La morale di tutto ciò? Ricordarsi che va bene la competizione, ma dovremmo ricordarci che in fin dei conti stiamo giocando, e non val la pena perdere tutto il divertimento!



Sei amiche (Ada, Bea, Cleo, Dina, Eli, Fede) giocano spesso a tennis nel campetto del condominio dove abitano. Dato che la loro forma fisica varia nel tempo e non sempre possono esserci tutte, hanno ideato un metodo per stilare una classifica relativa che si aggiorna a ogni gara. Partendo dall’ultima partita giocata e andando a ritroso, si prepara un ordine parziale dato dalle partite giocate: se una di queste partite non è coerente con l’ordine finora trovato viene scartata perché rispecchia un momento passato. Per fare un esempio pratico, immaginiamo che ci siano solo quattro amiche e le partite giocate siano state nell’ordine le seguenti, dove le lettere corrispondono alle amiche e la prima nella coppia dica chi ha vinto: CD, CA, BD, BC, AB. Andando a ritroso, abbiamo le seguenti classifiche parziali: AB, ABC, la coppia ABC / ABD (non sappiamo ancora ordinare C e D), una partita non considerata perché A è davanti a C, ABCD. Supponiamo che la partita successiva sia B contro D; se B vince non succede nulla, se vince D passerà davanti a B e si ricalcolerà tutta la classifica.
La scorsa settimana ho parlato del 
Il mio amico Ugo mi segnala 