Archivi categoria: povera_matematica

“al netto dei ritardi”

Sul forum di MilanoTrasporti è stato segnalato questo articolo de L’Inkiesta che racconta di come sia possibile usare il passante ferroviario per attraversare Milano velocemente e soprattutto gratuitamente, visto che i controlli sono inesistenti non solo a bordo ma anche ai tornelli. Sulla mancanza di controlli sono perfettamente d’accordo: venerdì scorso ho preso il passante da Repubblica a Segrate con la mia bici (per la quale ho regolamente pagato un altro biglietto), e la controllora sul treno mi ha semplicemente detto “su questo treno non c’è il posto per bici, la metta dove trova spazio”.

Quello su cui non sono d’accordo – e che mostra che Fabrizio Marino qualche problema con la matematica ce l’ha – è questa frase:

La frequenza di ogni linea è di trenta minuti per direzione, ma utilizzando la rete per spostarsi solo all’interno della città, grazie a tutte le coincidenze di linee presenti, è possibile arrivare ad una frequenza di passaggio di un treno ogni 6 minuti. Al netto dei ritardi ovviamente.

Certo, i ritardi ci sono sempre, magari anche solo di un minuto, più spesso di cinque o sei. Peccato che la cosa non abbia nessuna importanza per chi usa il passante “per spostarsi solo all’interno della città”. Mi spiego. Dal punto di vista del pendolare che prende il treno a Novara, Varese, Lodi o Treviglio per arrivare a Milano, se il treno ha un ritardo di quindici minuti lui si trova a stare un quarto d’ora in più sul treno (o ad aspettarlo in banchina, nel caso salga in una stazione intermedia: visto che i treni hanno una frequenza di una corsa ogni mezz’ora uno arriva in stazione all’ora giusta). Dal punto di vista di uno come me che usa il passante all’interno della città, non mi cambia nulla se il treno che prendo è quello di Novara in orario o quello di Varese in ritardo di un quarto d’ora: sempre un treno è. Se dunque i ritardi sono più o meno coerenti – e la mia frequentazione mi permette di dire che solitamente lo sono – io continuerò ad avere una frequenza di un treno ogni sei minuti. Se i ritardi non sono coerenti posso essere sfigato e avere un po’ più di sei minuti di attesa, ma in media i treni continueranno a passare ogni sei minuti. Insomma, anche in questo caso si verifica la solita fonte di incomprensione matematica: bisogna capire qual è il corretto punto di vista da cui fare i conti.

Il vero problema del passante è al limite la possibilità che i treni vengano soppressi: in quel caso sì che le attese si allungano, anche se comunque meno di quanto capiti ai poveretti che devono prendere il treno da fuori… ma questo con la “povera matematica” c’entra poco o nulla.

Ultimo aggiornamento: 2015-03-26 12:32

la crisi dei percentili

Ieri ho portato Jacopo dalla pediatra per una congiuntivite, e mi è stato fatto notare che eravamo solo sette mesi in ritardo per la visita di controllo dei cinque anni. Vabbè. Jacopo viene visitato, ed è tutto ok: mentre la dottoressa segna peso e altezza al computer mi dice che è al venticinquesimo percentile e si affretta ad aggiungere “ma non si preoccupi: i bambini non sono mica tutti uguali”.

A parte che Jacopo partiva dal terzo percentile e quindi arrivare al venticinquesimo è un risultatone, ci ho messo un bel po’ di tempo per intuire cosa significasse quell’affermazione. Con ogni probabilità la pediatra è abituata a sentire gente che si preoccupa perché il proprio virgulto “è troppo piccolo” e quindi “bisogna dargli qualcosa perché cresca di più”, cosa che non ha nessun senso, visto che i percentili sono calcolati non in assoluto ma relativamente alla popolazione tutta. Insomma tutta questa storia mi ricorda le battute “chi vuole essere volontario faccia un passo avanti”, col malcapitato che senza esattamente capire cosa sta succedendo si ritrova cooptato perché tutti gli altri hanno fatto un passo indietro.

Al limite, quello che potrebbe avere un certo interesse è notare come nel tempo ci si sia spostati da un percentile all’altro, perché questo significa che è successo qualcosa. Ma il genitore medio è pronto ad accettare il concetto di derivata?

Ultimo aggiornamento: 2015-03-17 13:52

Potere d’acquisto e conti sbagliati

Da ieri tra i miei contatti Facebook sta girando questo articolo di Marco Ottanelli [ah: usare il javascript per impedire di copincollare il testo è scocciante e inutile]. Ottanelli parte da una tabella dei prezzi medi dei prodotti di ortofrutta rilevati a fine gennaio 1985 a Montecatini e fa un confronto con i prezzi medi riscontrati al supermercato, mostrando come – con la strana eccezione dell’aglio – i prezzi medi siano più bassi oggi che trent’anni fa. La tabella la potete vedere qui. La tesi di Ottanelli è dunque (sì, ho copincollato. Come dicevo, certe tecniche sono scoccianti e inutili)

La favola della bestia nera, l’Euro, e le leggende metropolitane sul suo fattore di impoverimento della gente, si rivelano, ad una analisi sperimentale, del tutto false, scorrette, bugiarde.
I prezzi al dettaglio di alcune delle più diffuse frutta e verdura sono calati vistosamente, o, per meglio dire, il potere d’acquisto che oggi abbiamo è vistosamente più alto del passato. Oggi, con il potere d’acquisto di cui siamo capaci, a parità di spesa, porteremmo a casa il 20, 30, 50% di prodotto in più, e laddove c’è stato un reale aumento, esso è di pochi spiccioli, come già detto, e forse legato a qualche fattore momentaneo.

Tutto vero? Macché. Attenzione: non sto dicendo nulla sull’effettivo miglioramento o peggioramento del potere d’acquisto; mi spiegherò meglio dopo. Quello che sto dicendo è che il ragionamento di Ottanelli è sbagliato a priori. Il problema non è tanto la disparità delle rilevazioni oppure l’avere a disposizione troppo pochi dati per eliminare le distorsioni statistiche che possono sempre esserci: in fin dei conti non è che ci sia bisogno di un risultato così specifico. (Ah, nota a margine: nel caso di conti fondamentalmente spannometrici come questo, si può tranquillamente arrotondare la percentuale di differenza al singolo punto, è inutile usare due cifre decimali) Il punto fondamentale è che lui ha confrontato i prezzi attuali con quelli del 1985 rivalutati per l’inflazione. Il risultato pratico è dunque stato verificare come il costo dei prodotti ortofrutticoli si è comportato rispetto al tasso di inflazione globale: insomma sappiamo che oggi spendiamo (relativamente!) meno per frutta e verdura rispetto a trent’anni fa. Se volessimo calcolare il potere relativo di acquisto, dovremmo come minimo controllare il reddito medio attuale e quello del 1985 e usare quello come punto di riferimento: ma in realtà sarebbe più corretto prendere i dati sul reddito e sulla dimensione delle famiglie allora e oggi, e soprattutto non usare il valore medio ma la distribuzione del reddito. Se ci sono pochi ricconi che sono diventati estremamente più ricchi, il reddito medio magari è cresciuto, ma quello della gente normale si è ridotto…

Come dicevo sopra, io non posso dire nulla di come sia cambiato il potere di acquisto, anche solo limitato ai prodotti ortofrutticoli, in questi trent’anni: quella tabella semplicemente non mi dà dati sufficienti. Quello che però posso dire è appunto che la tabella non ha senso. Purtroppo è troppo facile mettere insieme una serie di numeri per supportare una tesi: basta appunto cucinarli :-) in una certa maniera. Ricordate: la matematica serve per fare modelli, ma non dà mai risposte dirette. Garbage in, garbage out.

Ultimo aggiornamento: 2015-03-04 14:06

Dare i numeri con i libri

Ho letto questa anticipazione sul mercato dei libri 2014, e non ho esattamente capito perché l’Associazione Italiana Editori abbia deciso di presentare i conti in quel modo.

Affermare che la spesa per libri “resta stabile” inserendo nel totale quanto pagato per gli e-reader (non so cosa siano i “collaterali”, quindi non li conto) è piuttosto peculiare: perché allora non si contano anche i soldi spesi per acquistare le librerie, intese come mobilio? Sugli altri numeri (i titoli totali cartacei e digitali e le percentuali dei vari canali) sospendo il giudizio per mancanza di dati più specifici: vedrò in giornata se il comunicato complessivo spiegherà meglio cosa è successo. Così però la sensazione è che le carte in tavola siano state messe apposta per far sembrare la situazione più rosea di quanto sia davvero. D’accordo che bisogna pensare positivo, però…

[vedi anche Luca De Biase, che fa giustamente notare come dopo una grossa crisi i lettori forti si siano stabilizzati e si sta perdendo il lettore occasionale (“consultatori di ricette e guide turistiche”)… il che, aggiungo io, è correlato al fatto che il canale di vendita GDO si sia ridotto fortemente. Non so però se questo sia un vantaggio o no per le librerie indipendenti]

Strane requisitorie

Oggi parlano tutti della requisitoria del PM Maria Navarro nel processo per il naufragio della Costa Concordia, soprattutto per l’appellativo “incauto idiota” appioppato al comandante Schettino. Sul mio socialino preferito mi hanno spiegato che le definizioni precedenti (“abile idiota” e “incauto ottimista”) sono formule giuridiche standard; resto comunque perplesso dalla crasi fatta dal pubblico ministero.

Ma Roberto Lucchetti mi ha fatto notare come nella requisitoria ci sia una frase ancora più sconcertante, almeno per chi ha un minimo di formazione matematica: «menzogne paradossali, il rapporto tra Schettino e la verità non appartiene a geometrie euclidee». Si apre ora il concorso “da’ un senso a quella frase”. Inizio io con un paio di esegesi:

– Quando Schettino si trova in una data situazione, per lui è possibile affermare più di una verità che va in parallelo ai fatti.

– Schettino era convinto che la somma degli angoli di un triangolo fosse molto minore di 180 gradi, e quindi ha sbagliato manovra.

Ultimo aggiornamento: 2015-01-26 16:34

ottimismo

[ottimismo] Quello che vedete qui a fianco è il codice di una raccomandata che ho ricevuto da uno dei millanta servizi nati dopo la liberalizzazione del servizio (in questo caso, Nexive). Con buona probabilità, 88763 è il numero progressivo della raccomandata spedita via loro, e i dodici zero che precedono sono tenuti da parte per le successive raccomandate.

Facciamo un po’ di compiti spannometrici. Abbiamo un numero di diciassette cifre. Se processassero tre raccomandate al secondo, 24 ore su 24, 365 giorni l’anno, in un anno avrebbero quasi cento milioni di raccomandate, cioè un numero di nove cifre. Per sforare le diciassette cifre, e quindi arrivare a diciotto, occorrerà loro un miliardo di anni a quel flusso di dati. Certo, magari il campo è così lungo perché si aspettano di usare parte delle posizioni per codificare chissà che cosa, proprio come nell’H3R iniziale. Però sarebbe stato molto più semplice usare caratteri diversi come segnaposto, per semplicità di lettura da parte di un essere umano (il codice a barre corrispondente è irrilevante). Non trovate?

Ultimo aggiornamento: 2014-09-19 10:13

statistiche per fare bella figura

Lunedì Andrea Monti mi ha segnalato questo articolo di Repubblica, insieme alle sue considerazioni al riguardo. Lasciate pure perdere l’articolo originale, a meno che non siate interessati al gossip; chi vuole proprio sapere qual è stato l’esperimento condotto farà meglio a leggere l’articolo originale. Per chi ha fretta, l’esperimento, condotto su 60 volontari trentini, ha misurato la loro propensione a “vendere” i loro dati personali – in forma anonima e aggregata – ottenuti dall’uso del loro smartphone, scoprendo che il valore percepito è molto basso, e gli unici dati che sembrano avere un minimo interesse sono quelli degli spostamenti effettuati. Magari un’altra volta parlerò dei risultati: adesso mi sembra più interessante guardare la metodologia usata.

Io non ho certo le competenze statistiche necessarie per fare un’analisi completa dei risultati, ma c’è una cosa che mi ha lasciato molto perplesso, anche se devo dire che non è certo il primo caso che mi è capitato di vedere. Andrea ha perfettamente ragione quando fa notare che il campione usato non è assolutamente rappresentativo per tutta una serie di motivi: è stato scelto con lo snowballing, cioè chiedendo agli sperimentatori di cercare nuovi amici; si limita a una sola piattaforma software e a un gruppo di persone di una certa categoria sociale; e soprattutto è davvero limitato – 60 persone non sono certo un campione statisticamente valido. Differiamo solo nelle conclusioni: io sono più ottimista di lui e ritengo che quel paper ha un interesse sociologico, anche se solo qualitativo e non certo quantitativo. (Lasciamo stare l’articolo su Repubblica, se non per apprezzare che ha vari link tra cui quello al paper originale: un risultatone rispetto al tipico articolo che si può leggere sull’italica rete) Insomma, si può vedere che a quanto pare esistono alcune persone che non sembrano attribuire un grande valore ai propri dati personali, ancorché anonimizzati.

Ma resta il problema di base: perché un articolo deve avere tutta quella messe di parametri statistici, quando il campione di base è così ridotto? Qual è il valore aggiunto? Sarei lieto se qualche statistico si palesasse qui nei commenti e mi dimostrasse che ho torto, ma per quanto mi riguarda quei numeri non hanno un vero valore se non quello di intimidire chi non è abituato a trattarli… o se preferite bisogna inserirli perché l’articolo venga accettato da una qualche rivista; questo non è certo l’unico paper che spenda e spanda tutti questi dati, quindi potrebbe benissimo essere una necessità pratica per la pubblicazione.

Ultimo aggiornamento: 2014-08-13 15:43

Scalfari e le percentuali

Lo so, parlare male dei nonagenari non è bello: ma nessuno impone a Eugenio Scalfari di scrivere ogni domenica la sua articolessa su Repubblica. Gennaro mi segnala la chicca sul suo editoriale di ieri. Ovviamente non mi interessa parlare delle sue previsioni elettorali – io in genere le sbaglio molto di più, per esempio avevo pensato a una differenza tra Pd e M5S di tre-quattro punti percentuali – ma delle sue conoscenze matematiche. Secondo il barbuto fondatore del quotidiano romano, infatti,

Gli ultimi sondaggi segnalano circa il 40 per cento di probabili astenuti. Sommati ai voti che presuntivamente prenderanno i Cinque Stelle si arriva al 60 per cento. E sommati al populismo di Berlusconi, che dopo vent’anni di malgoverno spera ancora in un 20 per cento di allocchi che lo votino, siamo all’80 per cento del popolo sovrano che, se abboccherà a queste manipolazioni, rinuncerà ad utilizzare la propria sovranità.

Peccato che ovviamente non si possano sommare le percentuali di voto ai partiti (che sono calcolate sui voti validi, quindi su chi ha votato e non ha lasciato la scheda bianca né l’ha annullata) con quella di astensione. Se insomma secondo Scalfari M5S e FI avessero preso il 20% dei voti, questo corrisponderebbe al 12% del corpo elettorale; quindi la somma sarebbe stata il 64%, qualunque cosa ciò significhi. D’altra parte, come Gennaro fa notare, con i conti scalfariani sarebbe restato un 20%: togliendo il 6% della Lega e un 10% per Tsipras, NCD e altri rimasugli, il PD avrebbe solo il 4% dell’elettorato…
Calcoli di questo tipo me li aspetto dal facebookaro medio, non certo su uno dei due quotidiani più venduti in Italia. No, meglio: me li aspetto anche lì, ma non vorrei proprio vederli.

[la rete non dimentica] Post Scriptum: il facebookare modio di cui sopra ha cancellato il suo post. Peccato che mi fossi premunito di salvarlo, in ottemperanza all’aurea norma TRASPARENZA INNANZI TUTTO!!!1!!!11! che ci viene ricordato a ogni piè sospinto.

Ultimo aggiornamento: 2014-05-28 19:12