GaS mi ha segnalato un interessante articolo, che trovate su arXiv, di un tipo (Boudewijn F. Roukema) che si è messo a spulciare i risultati ufficiali delle elezioni iraniane del mese scorso per fare delle analisi statistiche sui risultati dei singoli seggi elettorali e scovare eventuali brogl… pardon, situazioni molto improbabili.
L’analisi più semplice da fare è la verifica della legge di Benford. Ve la ricordate? Ne avevo parlato un bel po’ di tempo fa. In pratica, se viene dato un insieme di valori molto sparpagliati (su vari ordini di grandezza) e si guarda la prima cifra di tali valori, è molto più probabile che tale cifra sia un 1. Per dare un’idea, in una distribuzione ideale il 30% dei valori dovrebbe iniziare per 1 e solo il 5% per 9. Nel mondo reale le cose sono un po’ più complicate, e l’autore propone una versione modificata della legge adattata ai risultati totali delle elezioni, in modo da eliminare alcune distorsioni. Per gli amanti dei complotti ci sono però delle brutte notizie: i risultati sono abbastanza vicini ai valori teorici, tanto che l’analisi continua osservando la strana frequenza delle cifre iniziali 7 di un candidato outsider che ha preso in tutto poche centinaia di migliaia di voti, e cercando di estrapolare da quei pochi collegi elettorali una tendenza totale – che toglierebbe circa un milione di voti ad Ahmadinejad ma non cambierebbe di molto i risultati. Almeno questo è ciò che ho capito: non sono un grande esperto di statistica, e sono riuscito a seguire i ragionamenti di Roukema solo a grandi linee. Però l’idea che mi sono fatto è che i risultati presentati sono un po’ tirati per i capelli.
Che dire? Trovo molto interessante l’idea di applicare analisi statistiche ai voti di un’elezione per vedere eventuali brogli. Ma in casi come questo, dove i risultati dei vari candidati sono così diversi tra di loro, non credo la cosa abbia un grande valore pratico. Se io dovessi fare dei brogli di questo tipo, sposterei direttamente in ciascuna circoscrizione elettorale metà dei voti del candidato M al candidato A; un’operazione di questo tipo non dovrebbe lasciare strascichi statistici verificabili, che io sappia.
Ultimo aggiornamento: 2009-07-01 13:22
ciao .mau. penso sia la prima volta che commento, ma ti leggo sempre (saró la 22esima lettrice:)!). Io sono una statisca, quindi queste cose mi piacciono abbastanza. Sinceramente non ho avuto tempo e voglia di leggermi le analisi fatte sul tema elezioni in Iran, ma c’é un blog di un prof. americano molto bravo che analizza spesso dati elettorali e comunque discute punti interessanti della statistica.
http://www.stat.columbia.edu/~cook/movabletype/archives/2009/06/statistical_tes.html
http://www.stat.columbia.edu/~cook/movabletype/archives/2009/06/iran_vote_count.html
ecco, un piccolo contributo.
@Ilaria: il tempo mi sa che è quello che manca a tutti noi :-(
Non ho idea se lasci strascichi, ma a naso torna… elimini le differenze (es: territorio, sesso dei votanti, etc). Fai l’impiccio su dati gia’ aggregati. Pero’ io aggiungerei un pizzico di caos all’operazione… un +-5% d’errore sufficientemente casuale nell’operazione di spostamento. Cosi’ il cut&paste e’ sfumato… e addio la statistica.
Nun c’e’ un cazzo da fa’… anche il meccanismo stesso del voto e’ fallato, it doesn’t scale. Serve una piazza, 300 persone, un pezzo di carta (no voto elettronico), un riparo per scriverlo in privato, un’urna, conta pubblica con i candidati alle spalle dello scrutatore, e nessuno si muove finche’ ci sono dubbi sul risultato. Chi vuole riconta’, si accomoda e riconta, uno alla volta, con ordine (e telecamere puntate sull’urna e postazione di scrutinio)… tanto sono solo 300 schede… forza su’, suicidatevi tutti… che dobbiamo rimanere solo in 300 :)
@mfp: a quanto ho letto, in Iran il numero di schede consegnate in certi distretti è maggiore dei votanti. I altri termini votano anche i morti. Io per questo tipo di casi non scomoderei la scienza statistica, anche se il discorso è molto interessante in generale, nel caso particolare non mi inventerei soluzioni complicate :-).
Testesso: assolutamente, KISS for ever.
http://www.lastknight.com/2009/03/23/1411/ ( http://xkcd.com/538/ )
Pero’ alla luce delle tempistiche e le risorse a disposizione valuterei seriamente l’idea di rimanere con le mani nel sacco qualche minuto in piu’ per inserire errore statistico… altrimenti poi succede come nel 2006 in Italia, dove le schede bianche (o nulle, non ricordo) erano – per la prima volta dal dopoguerra ad oggi – tutte allineate tra loro e mediamente di 5 punti piu’ basse, come se qualcuno ne avesse utilizzate il piu’ possibile per rimpinguare i voti per i suoi mandanti.
Vado di fretta, ma segnalo:
http://www.fivethirtyeight.com/2009/06/statistical-evidence-does-not-prove.html
@mestesso: in Iran nelle presidenziali ogni cittadino può votare presso qualsiasi seggio, anche del capo opposto del paese. Considerando che le liste elettorali sono spesso basate sui certificati di nascita, non tengono conto di:
a) persone che cambiano distretto o provincia di residenza,
b) lavoratori e studenti fuori sede (o pendolari che votano nel luogo di lavoro/studio),
c) villeggianti (in Iran a giugno molti vanno in vacanza, soprattutto sul Caspio dove infatti l’affluenza è stata molto alta).
Ecco perché può capitare che in distretti o persino intere province voti più del 100% degli iscritti alle liste elettorali.
Tra l’altro, in qualsiasi paese si stampano più schede elettorali di quelle che si ritengono necessarie, per non rischiare di rimanere senza.