Archivi categoria: povera_matematica

Verifiche sperimentali

È dall’anno scorso (o sono già due anni? il tempo passa così in fretta…) che Striscia la notizia afferma che la trasmissione concorrente Affari tuoi – per gli amici, “il gioco dei pacchi” – sia truccata, nel senso che Rai1 farebbe in modo che i pacchi corrispondenti alle somme maggiori vengano lasciati per ultimi. Lunedì scorso, ad esempio, c’era un matematico, o almeno era definito così nella didascalia, che snocciolava cifre sulle ultime 48 puntate del gioco. Non so perché proprio 48: forse perché “arriva Lancillotto, ariva Lancillotto, succede un quarantotto e tutto a posto vaaaa”?
Ma il meglio deve ancora arrivare. Leggo oggi, chiaramente da Leggo che su queste notizie fonda la sua esistenza, che domani mattina Codacons e Adusbef “effettueranno una perizia pubblica sulle probabilità che si realizzano nel gioco”. Davanti a un notaio “estrarranno per 30 volte i 20 premi finali per verificare le regole della probabilità statistica”. Proprio così: verifica delle regole.
Io me li vedo, quelli: se gli capitasse di lanciare una moneta trenta volte e vedessero che è uscita testa solo quattordici volte, sarebbero pronti a fare un esposto alla Zecca. D’altra parte mi ricordo che quando venne ideato il Superenalotto e per alcune settimane nessuno riuscì a fare 6 una di queste “associazioni” presentò un esposto alla magistratura per l’impossibilità di ottenere il montepremi.

Ultimo aggiornamento: 2006-12-14 11:08

un milione di chilometri

Ieri su Repubblica (cartacea) c’era una pagina che magnificava il nuovo orario ferroviario, con Trenitalia che inventa gli Eurostar City (praticamente, un Intercity rimesso a nuovo che paghi più dell’Intercity) e via discorrendo. Ma quello che mi ha stupito è lo strombazzamento, anche nel titolo, che con il nuovo orario ci saranno “un milione di chilometri percorsi in più”. Sembrano tanti, vero? Ma se appena uno fa un po’ di conti scopre che sono da dividere per i 365 giorni in un anno, ottenendo meno di 3000 Km al giorno; visto poi che i treni in genere vanno a coppie, i percorsi in più sono di 1500 Km, più o meno otto coppie di treni a media percorrenza. Occhei, uno può anche accontentarsi; ma forse evitare i titoli coi numeroni potrebbe essere più onesto.

Ultimo aggiornamento: 2006-12-08 19:41

uccidete la statistica

Il potere dei media, non so all’estero ma sicuramente in Italia, è qualcosa di preoccupante. A luglio era uscito il libro Il broglio, che affermava che il crollo del numero di schede bianche nelle ultime elezioni politiche era dovuto a un tentativo di frode elettorale degli allora governanti, che avrebbero modificato il programma di conteggio per spostare gran parte di quei voti a Forza Italia. Bene: al tempo il libro non se l’era filato nessuno. Adesso Diario ha tirato fuori un DVD sul tema, e subito “scoppia il caso”. Buon per il settimanale di Deaglio, che se la passa sempre in cattive acque e che potrà avere un po’ di ossigeno finanziario.
C’è però una cosa che non mi torna in come la storia è stata presentata. Come “prova del fatto perpetrato” è stato detto che non solo il numero totale di schede bianche era crollato, ma era anche “tutto uniforme”, a differenza di quanto capitava negli anni scorsi. Grazie al Mantellini, ho recuperato la percentuale di schede bianche per regione – esclusa la Val d’Aosta, che però in questo caso non è una grande perdita – nelle elezioni 2001 e 2006. Ecco i valori:
pie 3.5 1.0
lom 2.8 0.8
taa 4.8 1.6
ven 3.0 1.1
fri 2.4 1.2
lig 2.8 0.8
emi 2.3 0.9
tos 2.6 0.9
mar 4.3 1.3
umb 3.4 0.9
laz 3.0 0.8
abr 5.7 1.5
mol 8.1 1.8
cam 8.0 1.4
pug 6.1 1.4
bas 8.0 2.0
cal 9.9 2.0
sic 5.0 1.8
sar 5.5 1.1

Purtroppo manca una seconda cifra decimale e quindi i conti sono leggermente approssimati, ma ho comunque provato a calcolare il rapporto del numero di schede bianche per ciascuna singola regione e la sua varianza. Se non ho sbagliato i conti, la media è un calo di un fattore 3.7 con una varianza di 0.9; valore questo assolutamente standard. Insomma, se brogli ci sono stati sono stati fatti con la supervisione di qualcuno che di statistica ne capiva abbastanza :-)
Il problema, dal punto di vista di un matematico, è l’opposto del solito: qui i dati sono giusti, ma le presunte conseguenze non seguono affatto dalle tesi. Insomma, è ovvio che i valori sono tutti compattati, se il totale è stato ridotto quasi a un quarto…

Ultimo aggiornamento: 2006-11-27 18:29

“share in termini scientifici”

Fedele (Confalonieri?) alla sua linea, oggi Leggo ha dedicato una sua pagina alla sconfitta di Mediaset nei dati di ascolto della prima serata di martedì. A quanto pare, Raiuno con Capri ha stracciato l’ultima puntata di Distretto di polizia 6, con un milione di telespettatori in più. Ma niente paura: ecco parola per parola la replica di Pietro Valsecchi, produttore della fiction di Mediaset. «Per parlare di share bisogna farlo in termini scientifici, altrimenti la cosiddetta supremazia Rai è solo in termini di teste, in numero di spettatori. Ma gli spettatori non sono tutti uguali. Se in una barca ci sono 25 pescatori ma pescano solo in cinque, in una gara di pesca quella barca saràmeno efficace di un’altra con meno pescatori in cui tutti sono attivi.»
Se per qualcuno dei miei lettori tutto questo è arabo, non si preoccupi. Molto semplicemente, è un anno che Mediaset ha unilateralmente deciso di non considerare più il pubblico totale, ma solo la fascia di telespettatori dai 14 ai 65, che si suppone comprino più merci e quindi dovrebbero piacere ai pubblicitari. Non so se sia una causa o un effetto, ma in quella fascia Mediaset è sicuramente più forte.
In pratica, viene usato uno dei più tipici sistemi per taroccare i numeri: usare dati veri ma non confrontabili. Volete un altro esempio di questi giorni? La notizia per cui a Milano ci sono stati più omicidi che a Napoli. Il dato è verissimo numericamente, ma se già prendiamo il numero di abitanti delle due province scopriamo che la percentuale di morti è a sfavore della città campana. Anche qua è bastato scegliere il numero giusto, e la tesi è subito pronta…

Ultimo aggiornamento: 2006-11-23 18:33

i genovesi e l’obitorio

[copertina]
La fama si vede quando i lettori ti inviano notizie da fare risaltare nel tuo blog :-)
Pietro si rifà a questo articolo del Corsera che racconta di come a Genova sembra che per il 30% dei morti non arrivi nessuno a richiedere la sepoltura, e mi allega questa scansione della pagina del giornale da cui si vede come le percentuali di “morti non reclamati” in altre grandi città italiane sia molto minore (ma di un ordine di grandezza, il che è una differenza enorme).
Notato nulla di strano? Io vedo innanzitutto una stranezza di base: nella lista non ci sono Roma e Palermo: soprattutto la seconda, con una popolazione simile a quella di Genova, sarebbe stata un interessante confronto. In secondo luogo, il 30% indicato per Genova è una pura percentuale, senza valori assoluti di riferimento: valori che tra l’altro sono molto variabili da città a città (Bologna ad esempio con i due quinti della popolazione torinese ha un numero di salme pari due volte e mezzo quelle dei subalpini) il che mi fa pensare che questi numeri siano dati più o meno a caso, anche perché non corrispondono certo al numero totale di morti: nel comune di Torino, ad esempio, i morti del 2005 sono stati 9481. Insomma, mi sa tanto che quelle mostrate nell’articolo siano cifre tirate a caso “perché un po’ di numeri fanno sempre bene”.
Detto tutto questo, io personalmente mi aspetto che a Genova – ma anche a Trieste, insomma in posti dove la popolazione ha un’età media maggiore e ci sono più anziani soli – il numero di persone che non hanno nessuno che si prenda cura di loro dopo che sono morti sia un po’ più alto, anche se non così alto. Però numeri non ne faccio :-)

Ultimo aggiornamento: 2006-11-12 19:01

17 ore al giorno

Secondo City di oggi, a settembre gli italiani avrebbero passato in media 17 ore al giorno sul web. Non ci riesco neppure io…

Ultimo aggiornamento: 2006-11-09 12:32

RC auto

Stamattina la free press marciava tutta compatta parlando della “giungla delle tariffe RCA” (una bella frase, che va bene ad ogni occasione) e lamentandosi che mentre un tranquillo quarantenne aostano può pagare 185 euro, a un neopatentato napoletano potrebbe toccargli di pagare più di 9000 euro (l’anno, sì).
City aveva però una tabellina con le tariffe maggiori e minori in alcune città: non certo il massimo per fare i conti, ma già sufficiente per capire una cosa. In tutte le quattro città evidenziate, la tariffa peggiore per il neopatentato era quella della compagnia Dialogo. Però in due delle città (Milano e Torino, per la cronaca) Dialogo era anche la società con il miglior preventivo per il quarantenne tranquillo, che pagava un decimo della tariffa del diciottenne. Così ad occhio, mi sa tanto che il modello scelto dalla compagnia è “io voglio solamente assicurare chi credo mi darà poche grane: così posso ridurre all’osso la mia struttura e fare tariffe ancora più basse per chi mi piace come assicurato”. Solo che la RCA è obbligatoria, e quindi occorre definire anche le tariffe per i “cattivi”: ecco dunque che queste ultime tariffe sono rese ad arte improponibili, per evitare che a qualcuno venga in mente di assicurarsi.
Possiamo discutere sull’eticità di un comportamento simile: però è chiaro che se non si tiene in mente questa condizione al contorno, i numeri della statistica sono completamente falsati. È un po’ il pollo di Trilussa all’ennesima potenza: se ci sono dieci persone, nove che guadagnano 1000 euro e uno 91000 euro, la media è di 10000 euro a testa…

Ultimo aggiornamento: 2006-10-26 11:39

fare le somme è difficile

Massimo Morelli mi segnala questo commento (di tal Luca Trevisan, immagino un cervello emigrato) sui dati apparsi sulla rivista Lancet a proposito del numero reale di morti civili in Iraq dall’inizio della seconda guerra del Golfo. Secondo la rivista, tali morti si possono stimare in 600.000, anche se con una forchetta piuttosto ampia (Lancet dà sempre i risultati con un intervallo di confidenza, che tecnicamente è la cosa più corretta da fare ma spesso viene usata in maniera assurda… non divaghiamo). Il blog di cui sopra riprende un articolo del National Review in cui l’autore Mark Goldblatt dice “anche ammesso che questa stima fosse vera, bisogna tenere conto che prima della guerra morivano 150.000 persone l’anno a causa delle sanzioni: quindi in realtà le morti dovute alla guerra sono solo (!) 100.000. E se poi il numero reale di morti fosse quello più basso della forchetta del Lancet, la guerra ha salvato delle vite! A questo ragionamento il bloggatore di cui sopra controbatte “Col cavolo! la guerra ha fatto terminare le sanzioni, e quindi quei morti non ci sarebbero stati. Quindi il vero conto delle morti a causa della guerra è di oltre un milione!”
A parte il fatto che c’è tutta una diatriba politica sottostante – se non ricordo male, il NR è di destra profonda persino per gli USA – chi ha ragione? Dipende.
Premesso che non è affatto bello parlare di morti così come se fossero eventi statistici, in un certo senso Goldblatt ha ragione. Se si guarda l’equivalente mediorentale del Calendario Atlante De Agostini, si vede un incremento della mortalità pari alla differenza dei due valori. Se si guarda il fatto che la guerra ha terminato le sanzioni, si vede un incremento della mortalità pari alla somma dei due valori. Cominciate a capire perché ai numeri si può far dire quello che si vuole?
Aggiornamento: Massimo mi fa notare che ho letto male la statistica del Lancet. Mea culpa, che non sono andato a leggere l ‘articolo di partenza (richiede registrazione, bugmenot.com è il tuo amico). Visto che i 600.000 morti non sono quelli degli ultimi tre anni, ma quelli in più rispetto a tre anni fa, diventa immediatamente ovvio che non è proprio possibile mettersi a fare la differenza, come Goldblatt tentava di fare. Avrei dovuto immaginare che si trattava di un “metodo Tremonti”…

Ultimo aggiornamento: 2006-10-15 18:10