La precisione del Perlone 2015

Il blog Perle Complottiste ha assegnato, come ogni anno, il suo premio Perlone 2015 per le migliori “perle” trovate su Internet. Quest’anno ha vinto Beppe Grillo con il 41,15% dei voti, seguito da Giulietto Chiesa con il 25,77%, mentre Rosario Marcianò è terzo con il 15,38% e Massimo Mazzucco e Maurizio Blondet sono appaiati all’ultimo posto con l’8,85% dei voti. Questi dati sono coerenti con un numero di votanti pari a 904, per cui il numero totale di voti sarebbe rispettivamente 372, 233, 139, 80. Il numero di voti è anche coerente con i 747 dell’edizione 2007. Bene, dov’è il problema?

Semplice. Se hai un intorno di 1000 voti, hai tre cifre significative. Il conteggio è stato fatto con quattro cifre, ma la quarta è puramente casuale. Per dire, se Grillo avesse avuto un voto in meno la percentuale sarebbe stata il 41,03%, e con un voto in più il 41,26%. Quindi sarebbe bastato usare una cifra dopo la virgola, che è l’unica sensata: la seconda è puramente casuale (in senso lato, chiaramente è il risultato di un processo deterministico). Certo, non è un errore di quelli tragici: però rappresenta comunque una scarsa attenzione, o se si preferisce una fiducia troppo fideistica sui numeri.

11 comments

    • avrei usato una cifra decimale, quindi tre cifre significative che ha senso con un numero stimato di voti intorno a 10^3. Nessuna cifra decimale (quindi due cifre significative) fa perdere precisione, ma in quel contesto sarebbe comunque stato accettabile, soprattutto visti i divari. Come ho scritto, usare due cifre decimali non è poi un problemone, ma semplicemente una fiducia fideistica mal riposta nel potere dei numeri.

      (poi devo dire che quella coppia appaiata in fondo mi aveva fatto pensare a un numero di votanti molto più basso, ma i conti poi non tornavano)

    • non ho capito la domanda, allora. A me le percentuali vanno benissimo: è chiaro che in questo modo non vuoi fare sapere quanti hanno votato, ma è una tua scelta. Diciamo che se io avessi fatto il concorso avrei detto qualcosa tipo “hanno votato 904 persone e ha vinto beppegrillo™ con 372 voti (il 41,1%), seguito da …”. Da loro mi sarei aspettato “il 41,1% dei voti” oppure “oltre il 41% dei voti”.

  1. .mau., non voglio sapere il metodo, voglio sapere i risultati:
    Loro hanno scritto 41,15% 25,77% 15,38% 8,85% 8,85% .
    Tu che cosa avresti scritto?

    • ripeto il mio commento precedente.

      Diciamo che se io avessi fatto il concorso avrei detto qualcosa tipo “hanno votato 904 persone e ha vinto beppegrillo™ con 372 voti (il 41,1%), seguito da …”

      Questo mi sembrava sufficientemente chiaro. O avrei dovuto aggiungere “seguito da Giulietto Chiesa con il 233 voti (il 25,8%), mentre Rosario Marcianò è terzo con 139 voti (il 15,4%) e Massimo Mazzucco e Maurizio Blondet sono appaiati all’ultimo posto con 80 voti (l’8,8%).”?

    • sono sempre tre le cifre significative. Nelle percentuali relative i leading zero contano.

        • perché? Il significato di “cifra non significativa” è che dai dati a disposizione puoi usarne una qualunque e non puoi dire quale sia quella migliore. Ma non fare l’errore di immaginare che tutti i numeri per cui si calcolano le cifre significative siano assolute.