Tag Archives: statistiche

Partner e statistica

C’è un tipo di sondaggio che fa capire abbastanza facilmente perché i sondaggi non potranno mai funzionare: quello che misura il numero di partner sessuali di maschi e femmine. Il risultato finale è schiacciante: i maschi affermano di avere avuto molti più partner delle femmine, tipicamente il doppio. Ne parla anche questo articolo di Pagina99, dove Stefano Casertano spiega (bene) perché questo risultato è matematicamente implausibile. Visto che mi è stato chiesto di parlarne, provo ad aggiungere qualcosa, concentrandomi non tanto sui risultati quanto sul procedimento, per vedere se è possibile accorgersi che c’è qualcosa che non va senza dover fare chissà quali conti.

Continue reading Partner e statistica

Più errori del previsto (negli USA)

mehta-polls-11Non parlo del referendum qui da noi perché si sta ancora votando. Però credo valga la pena di vedere ancora una serie di statistiche sulle elezioni USA, anzi sui sondaggi prima delle elezioni USA, prese dal solito FiveThirtyEight e preparate da Dhrumil Mehta. Come potete vedere cliccando sulla figura qui a destra, che mostra tutti i sondaggi delle tre settimane prima del voto, l’errore sulla media nazionale è stato di due punti percentuali, quindi meno della forchetta di tre punti che è tipica dei sondaggi. Ma passando ai singoli stati le cose sono molto diverse, con errori medi che arrivano anche a dieci punti percentuali. Interessante, vero?

In realtà le cose non sono mai così chiare come sembrano. Per prima cosa, il 3% di errore (3,16% per i pignoli) non è un numero magico ma quello massimo che si ottiene nel 95% dei casi quando si ha un campione statisticamente corretto di 1000 persone e una popolazione sufficientemente grande, dell’ordine dei milioni, per poter assumere una distribuzione degli errori sotto forma di gaussiana. Se cominciamo a fare la media delle percentuali ottenute, il campione aumenta e quindi la forchetta si riduce: per esempio con cinque sondaggi e quindi 5000 intervistati si dovrebbe scendere all’1,41% e con dieci sondaggi all’1%. Inoltre i sondaggi sono stati fatti in date diverse, e mischiandoli così non si può vedere l’eventuale trend mentre ci si avvicina al voto. Ma anche tenendo conto di questo, possiamo dire con una certa sicurezza che la stragrande maggioranza dei sondaggi non era stata fatta su un campione rappresentativo. E questo non è affatto bello (per i sondaggisti in particolare, ma anche per le tecniche statistiche in generale).