Archivi categoria: matematica_light

Si fa presto a dire media – parte 2

Non penserete mica di esservela cavata, con le medie? Ne sono state definite di tutti i tipi, sempre per la solita ragione che in alcuni casi conviene usare una definizione diversa da quella abituale. Eccovi allora qualche altro tipo di media più esoterica: non garantisco che vi serviranno nella vita di tutti i giorni, ma magari vi permetterà di fare bella figura in società!
La media geometrica è l’evoluzione della media aritmetica, nel senso che invece che avere somma e divisione si usano il prodotto e l’estrazione di radice. Limitandoci a due termini a e b, la loro media geometrica è data da sqrt(ab); inutile dire che se i termini fossero stati N, avremmo
usato la radice N-sima. Il nome di questa media credo derivi dal fatto che se abbiamo un rettangolo di lati a e b, il quadrato della stessa area ha appunto come lato sqrt(ab); quindi ti permette di dire qual è il “segmento medio” quando pensiamo all’area di una figura. Se vogliamo vedere la cosa in un altro modo e nascondere le radici quadrate, possiamo dirla così: se a è la media aritmetica tra m e n, allora n-a = a-m. Se g è la media geometrica tra m e n, allora n/g = g/m.
La media armonica è più complicata da spiegare, visto che è “l’inverso della media aritmetica degli inversi”. Nel caso di due elementi, la formula si semplifica un po’, visto che da 1/((1/2)((1/a)+(1/b))) si può arrivare a scrivere 2ab/(a+b); la fregatura è che nessuno si ricorda mai la formula “semplice”, e quindi si deve tutte le volte manipolare quella “complicata”, ma sicuramente più logica. Mi sarebbe piaciuto poter dire che la media armonica serve per trovare la “nota di mezzo” tra due, ma un po’ di conti fanno subito vedere che non è sempre vero. La media armonica tra un do e quello successivo sulla scala, ad esempio, è un fa e non un fa diesis; la media armonica tra un do e il sol superiore è però effettivamente un mi bemolle, il che ci rende un po’ più felici. Ma niente paura: esiste davvero un tipo di misura per cui la media armonica è quella naturale. Supponiamo che abbia guidato per 10 chilometri alla velocità media di 30 Km/h e per altri 10 chilometri alla velocità media di 60 Km/h: quale sarà la velocità media complessiva? 45 all’ora? No. La media aritmetica sarebbe stata la risposta giusta se avessi guidato per dieci minuti alle due velocità: allora avrei percorso complessivamente 15 chilometri in venti minuti, e i conti sarebbero tornati. Invece ho impiegato venti minuti per fare il primo tratto e dieci per fare il secondo tratto; in tutto sono stato in auto per mezz’ora e ho percorso 20 km, con una media complessiva di 40 Km/h, che guarda caso è la media armonica di 30 e 60. Questa differenza è tra l’altro alla base di un problemino matematico semplice ma fuorviante. Immaginiamo che io voglia percorrere i 200 Km tra Milano e Bologna alla velocità media di 80 Km/h, ma visto il traffico sull’Autosole sia costretto a fare i primi 100 chilometri ai quaranta all’ora. Se d’improvviso dopo Parma sono spariti tutti, a che velocità devo andare per il resto del percorso per raggiungere la media che volevo fare all’inizio?
vari tipi di mediaAnche gli ingegneri, poi, non volevano essere da meno e si sono inventati ancora un altro tipo di media, che chiamano media quadratica oppure valore efficace. Questo tipo di media è utile ad esempio nel caso si voglia calcolare la media di tensione della corrente alternata. La fregatura della corrente alternata è che a volte la tensione è positiva e a volte negativa: se si fa la media aritmetica viene fuori zero, e chiunque si sia preso una scossa capisce che c’è qualcosa che non va. Un approccio naïf potrebbe essere quello di prendere il valore assoluto di tensione e fare la media di quello; ma gli ingegneri – nonostante affermino il contrario – non amano le semplificazioni e hanno così pensato a un approccio più complicato. Per calcolare la media quadratica si prendono i vari valori, li si eleva al quadrato (capito il motivo del nome?), si fa la media dei nuovi valori ottenuti e si estrae la radice quadrata del tutto. In effetti, a dirla così, la cosa sembra davvero un’inutile complicazione: ma gli ingegneri hanno un asso nella manica e dicono che questo tipo di media tiene anche in conto quanto i dati sono dispersi… ma di questo ne parlerò un’altra volta, anche perché dire il vero non è che la cosa mi convinca troppo.
Quello che invece è interessante notare è che non solo se si prendono due numeri positivi tutte queste medie sono diverse tra loro – a meno che i due numeri siano uguali tra loro, ma allora a che ti serve farne la media? – ma sono sempre in un ben preciso ordine di grandezza relativa. Nella figura qui riportata, potete vedere cosa succede: dati due numeri (quelli in grigio in alto: rispettivamente 6 e 24) la media minore è quella armonica H, che nel nostro caso vale 9.6; segue la media geometrica G, che vale 12; poi c’è quella aritmetica A, che è 15; infine si ha la media quadratica E, che vale sqrt(306) e cioè quasi 17.5. Anche se in questo esempio le varie medie sembrano essere tutte ugualmente distanziate tra di loro, questo è un caso; quello che come dicevo non è casuale è l’ordine relativo tra le medie, che è sempre lo stesso. Addirittura per quanto riguarda la media aritmetica e geometrica, che sono le due più usate, la cosa assume il nome pomposo di disuguaglianza aritmetico-geometrica.
Ci sono ancora due tipi di media che si possono trovare leggendo i giornali; anch’esse hanno in fin dei conti diritto di esistenza, e quindi mi pare giusto parlarne un po’. La media pesata si usa… quando si vogliono confrontare mele con pere. No, non è così, ma l’idea è abbastanza simile. Supponiamo di volere calcolare il reddito medio degli italiani, partendo dal reddito medio degli abitanti delle varie regioni. La prima idea potrebbe essere quella di fare la media dei vari redditi. Però la Provincia Autonoma di Bolzano, con meno di mezzo milione di abitanti, ha un reddito quasi triplo della Sicilia, che di abitanti ne ha dieci volte tanto; fare una semplice media funziona peggio dell’esempio di Trilussa del mezzo pollo. Se non ci credete, provate a pensare a due gruppi, uno con dieci persone che non hanno un euro e uno con una singola persona che possiede ben dieci euro; la media non è certo di cinque euro a testa!statistiche su base giornaliera
Il trucco per ottenere un dato sensato è moltiplicare il reddito medio delle singole regioni per il numero di abitanti della regione stessa, fare la media (aritmetica) dei risultati, e dividere il totale per il numero complessivo degli abitanti italiani. Abbiamo pertanto dato un “peso” ai singoli valori, peso calcolato sul numero di abitanti. Scritto così sembra chissà che cosa, ma concettualmente non è che sia poi così complicato: se il reddito medio degli altoatesini è di 40000 euro, e il numero di cittadini è mezzo milione, questo significa che è come se ciascuno di loro avesse quel reddito. Facendo quindi la moltiplicazione otteniamo il reddito totale della Provincia Autonoma, che si può sommare a quello delle altre regioni perché “sono tutte mele” (non c’è la parola “media”). Ma visto che la media dobbiamo alla fine farla, ecco che dopo occorre fare una divisione. Detto in un altro modo, la media pesata è una banale media, dove non si prende un singolo rappresentante per ogni elemento del nostro insieme, ma li si prende tutti, ovviamente dando loro lo stesso valore perché è l’unico che conosciamo. Il bello della media è che è vero che la distribuzione dei redditi tra le singole persone è molto disuguale, ma per fare i conti possiamo fare finta che siano tutti uguali: basta ricordarsi di prenderli però tutti, e non limitarsi a un solo rappresentante.
statistiche su base settimanale La media mobile si può trovare spesso nelle pagine di economia. Prendiamo il valore di un’azione quotata in borsa. Soprattutto se l’azione non è una delle più trattate, da un giorno all’altro ci sono spesso delle variazioni consistenti, che però alla lunga più o meno si annullano. Oppure consideriamo il numero di copie vendute da un giornale – o il numero di lettori del mio blog. Un quotidiano sportivo vende molte più copie il lunedì, mentre per un quotidiano economico il lunedì è una giornata morta; i miei pochi lettori durante il weekend hanno generalmente qualcosa di meglio da fare che vedere se ho scritto qualcosa… o più probabilmente durante la settimana sono così scazzati che pur di fare qualcosa si mettono a leggermi. In ogni caso, il valore di un singolo giorno ha un’importanza relativa, se voglio sapere la tendenza sul lungo periodo. Bene, il sistema più semplice per ridurre l’influsso di valori spuri è quello di calcolare la media su un numero prefissato di valori: sette giorni nel caso del giornale, magari un intero mese per il titolo azionario. Nel primo caso, la variabilità delle quotazioni è semplicemente nascosta dal grande numero di dati usati; nel secondo caso il ragionamento logico che si fa ha una sua correttezza formale, perché confronti dati coerenti, anche se si spostano (ecco il perché la media si chiama “mobile”!) nel tempo. Le due tabelle disegnate qui sopra mostrano il numero di accessi al mio blog nelle ultime sei settimane; converrete che è molto più semplice vedere qual è la tendenza guardando la media mobile settimanale a sinistra, piuttosto che con il grafico giornaliero a destra. Abbiamo ancora una volta di fronte a noi il potere della media: eliminare dettagli inutili per la nostra analisi, e permetterci di concentrarci su quello che ci interessa realmente.
Per calcolare la media mobile su una finestra di N valori, occorre salvarsi tutti gli ultimi N+1 valori. Il procedimento banale consiste nel sommare gli N numeri e poi dividere per N, ma nel caso N sia grande il calcolo potrebbe dimostrarsi tedioso. Un sistema molto più semplice è prendere il valore della media attuale, e sommargli un N-simo della differenza tra il valore attuale e quello a distanza N. Chi ha voglia di fare i conti può vedere come il conto equivale a buttare via il valore più vecchio e mettere al suo posto quello appena trovato, che poi è l’operazione che si vede capitare se ritagliamo una finestrella da un pezzo di carta, la posizioniamo sul foglio con i nostri dati e la spostiamo di una posizione a destra. Come sempre, nulla di complicato, almeno fino a che non te lo nascondono dietro una serie di paroloni!
Per il momento questo è tutto. Non mi sono dimenticato che ho promesso anche di parlare della varianza e di tutte le belle cose correlate, però preferisco non mettere troppa carne al fuoco. Commenti e segnalazioni di errori, imprecisioni e incomprensibilità sono come sempre i benvenuti.

Ultimo aggiornamento: 2007-10-08 14:29

Si fa presto a dire media – parte 1

(come sempre, correzioni e suggerimenti sono i benvenuti)
Calcolare qual è la media di un insieme si direbbe un’operazione abbastanza tranquilla, e che non dovrebbe dare problemi di sorta: in fin dei conti, si sente parlare persino sui giornali di medie qua, medie là, e così via… Beh, è vero che non ci sono chissà quali concetti complicati dietro di essa, però è anche vero che non sempre la media per così dire naïf è la cosa che vorremmo davvero sapere; e quindi possiamo essere tranquillamente fregati da chi sa giocare con i numeri. Ecco dunque un po’ di informazioni che potranno aiutarvi a districarvi in mezzo alla media!
Innanzitutto, qual è il significato per così dire “filosofico” della media? È un valore che viene tirato fuori a partire da insieme di valori distinti. In genere questi valori sono monodimensionali: li possiamo insomma mettere in riga, come ad esempio le altezze dei ragazzi in una classe, simularli con tante barrette verticali e tirare fuori il nostro numerino. Non è detto che si possano fare proprio sempre delle barrette: se ad esempio calcoliamo la velocità media di un viaggio, abbiamo infiniti istanti di tempo su cui fare la media, e così sfruttiamo il trucco di usare spazio e tempo complessivi che sono stati percorsi invece che la velocità istantanea. Però avremmo potuto anche misurare la velocità ogni secondo e ritornare a vedere le nostre barrette. Esiste anche una media calcolata su dati multidimensionali. Un esempio non è tanto l’altezza media del territorio di una nazione (possiamo suddividerla in tanti pezzetti quadrati della stessa dimensione, e poi mettere i quadratini in fila invece che sparsi per il territorio), quanto il punto medio di una scarica di pallini contro un bersaglio.
media, mediana e modaIn tutti i casi, però, capita una cosa molto importante: si perde informazione. Non c’è nulla di male, intendiamoci: la ragione principale per prendere la media è proprio il fatto che non riusciamo oppure non vogliamo gestire troppa informazione, e ci accontentiamo di una specie di Bignami. La cosa a cui dobbiamo stare attenti, però, è che non esiste il metodo giusto per prendere un unico valore, come vedremo tra poco.
Chi fa statistica, in effetti, distingue ben tre tipi di media (in inglese, “average”); non è un loro vezzo, ma una necessità. Parleranno pertanto di media, mediana e moda: in inglese, i nomi sono rispettivamente mean, median e mode. La media è quella che tutti noi ci si aspetta, vale a dire la media aritmetica: si fa la somma dei elementi tra cui fare la media, si divide il risultato per il numero degli elementi stessi, e quello che esce fuori è la media. La mediana si calcola invece mettendo in fila tutti gli elementi, e prendendo il valore di quello di mezzo; se il numero di elementi presenti è pari, e quindi non c’è “quello di mezzo”, si prendono i due “più di mezzo” e si fa la loro media aritmetica. Resta infine la moda, detta anche norma, che è la meno intuitiva; eppure il suo significato è logico. Quando si dice che una cosa è “di moda”? Quando la usano tutti. Allo stesso modo, la moda di un gruppo di elementi è il valore che capita più spesso. Nel caso ci siano due o più valori con lo stesso numero di occorrenze, generalmente si dice che la moda non è definita; d’altra parte, se esiste, è sicuramente un valore tra quelli osservati, mentre la media non è detto lo sia e la mediana lo è sicuramente solo nel caso di un numero dispari di elementi in totale. Tanto per aggiungere un disegnino, nella figura di destra ho preso alcuni numeri (1, 1, 1, 2, 3, 4, 6, 12 e 15), li ho messi in fila belli ordinati, e ho indicato quali sono la loro media, mediana e moda.
Così a pelle ci si potrebbe chiedere che senso hanno mediana e moda, che possono essere ben lontane da quella che naturalmente associamo alla media, come possiamo ad esempio vedere nella figura qua a fianco, dove la moda è addirittura uno dei valori estremi della nostra distribuzione. Il punto è che ci sono alcuni tipi di misurazioni che conducono in maniera naturale a questi valori, solo che non ci facciamo mai caso.
Ad esempio, quando si vuole sapere se un bambino è più grande o più piccolo della media, non si guarda l’altezza media dei bambini ma si piglia la mediana, per due ottime ragioni: la prima è che i dati troppo lontani dalla norma vengono automaticamente resi irrilevanti, la seconda è che interessa appunto sapere quanti bambini sono più alti o più bassi (oppure più o meno pesanti). Addirittura il concetto di mediana si espande: perché limitarsi a dividere il nostro campione in due sole parti? Abbiamo così i
quartili (si divide il nostro gruppo in quattro parti), i decili (la divisione è in dieci parti), o i percentili (cento parti). Quindi se ti dicono che il tuo test è risultato nel novantasettesimo percentile, magari hai sbagliato metà delle domande e non puoi sapere cosa hanno fatto gli altri: però sai che solo il 3% ha fatto meglio di te, di poco o di tanto che sia.
Per la moda, pensate a quando vi dicono “il vostro biglietto è stato sorteggiato alla lotteria di Tu-campa-cavallo-al-colle. Ci sono dieci premi: uno di 10000 euro e nove di 1 euro”. Ora, è vero che la vostra vincita media è leggermente superiore ai 1000 euro; ma credo sarete d’accordo con me quando affermo che quello che potete aspettarvi è di avere vinto un euro, cioè la moda dei valori dei premi. Insomma, la moda ti serve quando non ti interessa un dato prettamente teorico come la media, ma vuoi sapere cosa ti puoi statisticamente aspettare per davvero. È roba per la gente coi piedi ben piantati in terra!
(nella prossima parte, racconterò di altri tipi di media: geometrica, armonica, mobile e pesata… Chissà se parlerò mai di cose turpi tipo varianza e skew che sono le damigelle d’onore della media!)

Ultimo aggiornamento: 2007-09-19 15:33

La prova del nove

(Trovate questo post tra le mie pagine di matematica light!)
Mi capita relativamente spesso di essere in giro con amici o conoscenti, parlare di operazioni matematiche elementari, e sentirmi chiedere “ma la prova del nove
funziona davvero?” Sono insomma chiare due cose: il concetto è rimasto così impresso agli alunni delle elementari che affiora anche dopo più di trent’anni, e – a parte il nome – il suo funzionamento è sempre stato visto come qualcosa di esoterico e più vicino ad Harry Potter (“accio novem!”) che a una vera proprietà matematica. D’altra parte, ci credo: a nessuna maestra alle elementari verrebbe in mente di spiegare il perché la regola funziona, ammesso che almeno loro lo sappiano. Ma finalmente potrete soddisfare la vostra pluridecennale curiosità.
provadel9.PNGInnanzitutto, forse è meglio ricordare cos’è la prova del nove. Quando si fa una moltiplicazione (247*53=13091, tanto per fare un esempio pratico) a ogni numero presente nell’operazione sostituiamo quello formato dalla somma delle sue cifre; se la somma così ottenuta ha più di una cifra, sommiamo quelle cifre e si prosegue fino a che non arriviamo a una singola cifra. Nel nostro esempio, avremo pertanto 2+4+7=13, 1+3=4; 5+3=8; 1+3+0+9+1=14, 1+4=5. A questo punto, facciamo il prodotto delle cifre dei fattori, e se serve sommiamo le cifre del risultato per arrivare ad averne una sola (4*8=32, 3+2=5). Se questa cifra è diversa da quella del risultato dell’operazione, vuol dire che abbiamo sbagliato da qualche parte; se invece è la stessa, forse siamo riusciti a fare il conto correttamente. Come ausilio pratico, si mettono i quattro numeri all’interno di una croce, come mostrato nella figura qui sotto. Non garantisco che
la posizione dei numeri nella croce, come indicata nella figura qui a sinistra, sia quella che ci insegnavano a scuola: qualche dettaglio ormai l’ho perso anch’io!
Per quali operazioni funziona la prova del nove? Addizioni, sottrazioni – basta ricordarci di sommare un 9 se il minuendo ha la somma delle cifre minore del sottraendo, come in 23-7 – e moltiplicazioni. Con le divisioni no, anche se puoi usare il trucco di rifare il calcolo “alla rovescia”, cioè vederle come moltiplicazioni, e applicare così la regola. Ad esempio, se dobbiamo verificare 31415/926 = 33 con resto 857, facciamo la prova con 33*926, cioè 6*8 = 48 e quindi 3, gli sommiamo la somma delle cifre di 857, vale a dire 2, e controlliamo se il risultato 5 è uguale alla somma delle cifre di 31415… e per fortuna lo è.
Passato lo choc di avere visto tutte queste operazioni aritmetiche tutte in una
volta, provo a spiegare perché la prova del nove funziona, e soprattutto perché a volte non funziona. Il punto di partenza è quella che tecnicamente si chiama “aritmetica modulare” e che facciamo tutti quando diciamo che “le undici del mattino più tre ore sono le due del pomeriggio”. Immagino che chi mi sta leggendo o sa già cos’è l’aritmetica modulare, oppure verrà a chiedermelo e io mi metterò a scrivere qualcosa di più completo al riguardo: per il momento mantengo la prima ipotesi. In pratica, la prova del nove non è altro che fare l’operazione modulo 9, sostituendo cioè ai numeri trovati il loro resto quando li si divide per nove. Le operazioni in aritmetica modulare funzionano per addizioni, sottrazioni e moltiplicazioni: quello che ci resta da capire è come mai il resto modulo 9 di un numero è uguale alla somma delle sue cifre, il che però è facile. Infatti 1 diviso per nove fa 0 con resto di 1; 10 diviso 9 fa 1 con resto di 1; 100 diviso 9 fa 11 con resto di 1; e così via. Quindi se riprendiamo il nostro 247 e lo scriviamo come 2*100 + 4*10 + 7 scopriamo che il suo resto diviso per 9 è 2+4+7… esattamente la somma delle sue cifre.
provadel9.PNGÈ stato pesante, lo so. Ma adesso viene fuori il bello. Perché si fa la prova “del nove” e non “del sette” oppure “del quindici”? Dal punto di vista matematico, è esattamente la stessa cosa: sempre di aritmetica modulare di tratta. Solo che sommare le cifre di un numero è molto più semplice di calcolare il suo resto modulo 7 oppure 15 (provateci voi, se siete dei temerari). Così ci si limita a fare un calcolo facile, accettando il fatto che non tutti gli errori vengono trovati. Infatti, se ad esempio si sostituisce uno 0 con un 9 la somma finale delle cifre del numero non cambia; ma quel che è più preoccupante è che se ci sbagliamo e scambiamo tra di loro due cifre (10391 invece che 13091) la somma delle cifre è per definizione la stessa, e chiunque sia appena un po’ dislessico – oppure sbagli semplicemente a incolonnare i prodotti parziali – rischia grosso.
Ma io una soluzione ce l’avrei anche: adottare la prova dell’undici. La logica che sta dietro è esattamente la stessa, solo che si calcola il resto della divisione per 11 e non di quella per 9. Calcolare questo resto è un po’ più complicato, ma nemmeno poi troppo: il metodo consiste nel sommare e sottrarre alternativamente le cifre del numero dato, partendo da destra e andando a sinistra. Se si va sottozero, basta naturalmente aggiungere 11. I resti che possiamo ottenere saranno i numeri da 0 a 10; nell’operazione di cui sopra avremo per la precisione 7-4+2=5, 3-5=9 (previa l’aggiunta di 11); 1-9+0-3+1 = 1; 9*5=45; 5-4=1. A parte vedere se si è
bravi anche a fare le sottrazioni, il che non sarebbe poi così male, il vero vantaggio è quello di potere accorgersi di avere scambiato di posto due cifre, oppure non essersi spostati bene a sinistra quando si è fatta la moltiplicazione. Se avessimo ad esempio allineato a destra i due prodotti parziali 741 e 1235, la somma sarebbe stata 1976, e la prova del nove ci avrebbe detto nulla di strano: la somma delle cifre è sempre 5. La prova dell’undici, in compenso, avrebbe fatto subito suonare un campanello d’allarme: avremmo avuto come risultato 7 (6-7+9-1) e non 1. E scusate se è poco!

Ultimo aggiornamento: 2007-07-27 17:17

un teorema sul sudoku

(Una versione più ampia e spero più completa di questa notiziola si trova sul mio sito. Commenti sempre benvenuti!)
È un po’ che non scrivo di “matematica leggera”: però lo spunto che GaS mi ha mandato in un messaggio privato mi pare interessante, e spero che anche per voi sia lo stesso.
Il punto di partenza è questa recensione – che non è mia, mi affretto a precisare – dove viene enunciato il seguente teorema: Se nello schema iniziale di un sudoku appaiono solo sette numeri diversi (ripetuti quanto si vuole: magari lo schema ha 24 numeri preinseriti, ma solo sette di questi ), allora il sudoku non ha una soluzione unica. (e quindi, aggiungo io, non apparirà mai sui giornali).
Per uno che è abituato a masticare un po’ di matematica, la dimostrazione è immediata, quindi è inutile che me la scriviate: mi fido. Sono più interessato a sentire commenti di persone che si divertono a risolvere i sudoku, ma sono convinti di non capire nulla di matematica. Non ci sono premi, ma nemmeno gogne pubbliche; il vantaggio di moderare i commenti è che non debbo necessariamente renderli pubblici. Se qualcuno non si fida delle sue capacità, posso anche dargli un aiutino, basta che me lo chieda privatamente.
Perché tutto questo? beh, mi piacerebbe sfatare qualche mito. Perché diciamocela tutta: la matematica è come qualsiasi altra cosa. Ci sono cose difficili se non impossibili, e cose alla portata di tutti. L’importante è non darsi per vinti in partenza.

Ultimo aggiornamento: 2007-06-21 18:14

la “precisione” della matematica

Tra i commenti a un post precedente, hronir ha scritto:
Una delle cose che piu’ mi impressiona(va) dei matematici (all’universita’) era proprio questa loro mania di precisione. Ricordo una sessione di open-day per gli studenti delle superiori, in cui un trio di matematiche, cercando di invogliare gli studenti ad iscriversi alla loro facolta’, ne elogiavano entusiaste quel suo tratto essenziale di insegnarti la “precisione” nelle cose. […] Tutt’ora ho un’idea della matematica moooolto lontana da una cosa “da precisini” che poteva intuirsi dalla matematica del liceo. E del resto, se penso a interi settori come la geometria (algebrica, topologica, metrica, proiettiva, differenziale…), la teoria dei gruppi, la teoria della misura… la matematica del liceo non c’entra niente, e’ mera computazione!
Ora, è indubbiamente vero che la “matematica”, così come si vede a scuola, è completamente diversa non solo dalla matematica “di ricerca” ma anche semplicemente da quella universitaria. Io, che spesso faccio conti per iscritto o a mente, sono effettivamente fuori dai canoni del Vero Matematico. Però la storia della “precisione” è un po’ più complicata, e non può essere liquidata così. Lo spiega molto bene Ian Stewart (immagino), nel libro Darwin’s Watch: Science of Discworld III, che prima o poi recensirò. Ecco la sua citazione, graziosamente tradotta dal vostro affezionato blogghettaro:
Lo sviluppo di nuove idee matematiche tende a seguire un modello ideale. Se i matematici dovessero costruire una casa, partirebbero dai muri a pianterreno, librantisi senza supporto mezzo metro sopra la soletta catramata… o dove sarebbe dovuto esserci la soletta catramata. Non ci sarebbero porte o finestre, solo buchi della forma giusta. Una volta arrivati al primo piano, la qualità dei muri sarebbe migliorata enormemente, le pareti interne sarebbero intonacate, porte e finestre sarebbero tutte al loro posto, e il pavimento sarebbe sufficientemente robusto per poterci camminare su. Il secondo piano sarebbe ampio, ben rifinito, pieno di tappeti, con quadri sui muri, mobili a iosa, tutti bellissimi anche se di stili che fanno tra loro a pugni, sei tipi diversi di tappezzeria in ogni stanza… L’attico, in compenso, sarebbe poco arredato ma elegante – design minimalista, nulla fuori posto, tutto quello che c’è con uno scopo ben preciso. A questo punto, e solo a questo punto, i matematici tornerebbero al pianterreno, scaverebbero le fondamenta, le riempirebbero di cemento, metterebbero la soletta incatramata, ed estenderebbero in giù i muri fino a raggiungere le fondamenta.
Alla fine di tutto questo si avrebbe una casa che si regge in piedi, ma che per buona parte della sua esistenza sarebbe sembrata altamente improbabile. Però i costruttori, tutti eccitati nel far crescere i muri fino al cielo e decorare gli interni, sarebbero stati troppo impegnati per accorgersene, fino a che gli ispettori edili non avrebbero piantato il naso nelle falle strutturali.

La metafora a me pare davvero bella e azzeccata. Chi fa matematica – e non penso solo ai matematici di professione, ma anche semplicemente a chi si diverte a risolvere i problemini matematici… – non sa assolutamente dove andrà a finire, ma non si preoccupa più di tanto della cosa: la cosa principale è trovare il risultato, nella metafora costruire il primo piano. Se poi in effetti si fa matematica sul serio, si iniziano a buttare giù risultati su risultati (il secondo piano), senza preoccuparsi più di tanto di metterli insieme organicamente: quello al limite è un passo successivo, dove si sfronda tutto quello che non serve direttamente (l’attico). Il guaio è che la matematica che ti insegnano a scuola è appunto l’equivalente logico dell’attico. Capisco che alcune di queste cose ti dovrebbero servire nella vita – anche se già sulla risoluzione delle equazioni di secondo grado avrei dei dubbi – e non è che si possa stravolgere i programmi di studio. Ma se devo essere sincero comprendo anche il disagio, per non dire lo spavento, di chi si trova queste costruzioni perfettine e senza sbavature. Ci credo che poi resti questa idea della mania di precisione; purtroppo ci sono cascate anche le tre matematiche citate da hronir. Non tutti sono perfetti.
E le fondamenta, starà pensando qualcuno? Beh, il matematico tipico non si preoccupa più di tanto, visto che sa che prima o poi ci sarà qualcuno che gliele farà :-)

Ultimo aggiornamento: 2007-03-29 11:51

È morto Paul Cohen

(Nota: se sei arrivato qua con un motore di ricerca, ti conviene guardare la versione riveduta…)
Ho trovato casualmente la notizia qui, ma non sono riuscito a trovare nessuna conferma in giro. (beh, no, wikipedia lo indica)
Cohen è noto tra i matematici per avere dimostrato che l’ipotesi del continuo è indipendente dagli assiomi usuali per l’aritmetica… Occhei, ricominciamo da capo.
Poco più di cento anni fa, Georg Cantor ha deciso che l’infinito matematico non era una semplice convenzione, ma che esisteva davvero. Detto in altre parole, si poteva dare una definizione sensata dell’infinito: un insieme che può essere messo in corrispondenza biunivoca con una sua parte propria. I numeri interi sono insomma infiniti perché possiamo dire che i numeri pari sono tanti quanti gli interi, associando a ogni intero n il numero 2n. Poi, con l’argomento diagonale, Cantor si è accorto che i numeri reali sono più degli interi, e quindi che esisteva più di un infinito: per la precisione ce ne sono infiniti.
A questo punto restava un dubbio: l’infinito corrispondente ai numeri reali è quello “subito dopo” quello corrispondente ai numeri interi, oppure ce ne sono altri in mezzo? L’affermazione per cui l’infinito dei numeri reali è immediatamente successivo a quello degli interi prese il nome di ipotesi del continuo, e fu posta da David Hilbert in cima alla sua famosa lista dei 23 problemi matematici per il XX secolo. (A Hilbert le teorie di Cantor erano piaciute tantissimo, ecco il perché di questa posizione di onore). Il problema rimase inattaccato per vari decenni, fino a che nel 1940 Kurt Gödel, non pago di avere dimostrato che la matematica o è incompleta o incoerente, riuscì a provare che l’ipotesi del continuo non era falsa: insomma, se gli altri assiomi matematici standard sono coerenti, aggiungere l’ipotesi del continuo lascia tutto l’insieme coerente. Gödel tra l’altro era convinto che l’ipotesi del continuo fosse vera; peccato appunto che nel 1963 Paul Cohen dimostrò che anche l’opposto dell’ipotesi del continuo non era falsa. (Notate la tripla negazione della frase…) Il risultato pratico è che uno può decidere di fare matematica accettando l’ipotesi del continuo oppure negandola: piena libertà! Che poi – almeno a quanto ne sappia – nessuno si preoccupi più di tanto della cosa tranne qualche logico matematico non significa nulla…

Ultimo aggiornamento: 2007-03-25 20:24

Sintassi, semantica, grammatica

Adesso non venite a lamentarvi che questa non è matematica, ma informatica. Lo so benissimo, anche se dal mio punto di vista le differenze sono relativamente minori (ho dato esami di informatica a matematica, e viceversa). Però sono notoriamente pigro, la parte principale di questo testo l’ho buttata giù al volo perché mi è stata chiesta, e non vedo perché non riciclarmela in altro modo… senza contare che può anche servire per chi non è interessato né alla matematica né all’informatica. E poi, se dobbiamo dirla tutta, sintassi e semantica si usano anche in logica matematica, quindi non è che io sia così fuori tema!
Si sente spesso parlare di sintassi, semantica e grammatica di un linguaggio di programmazione. Se uno si ricorda ancora cosa faceva a scuola, i nomi – almeno grammatica, su… – non sono nuovi; e in effetti il loro significato deriva più o meno direttamente proprio da quello che usano i linguisti. Vediamo qual è il loro significato, partendo proprio da quello che hanno nelle lingue reali.
Partiamo dalla semantica. In linguistica, la semantica è lo studio del significato delle parole e delle frasi in una lingua; detto in parole povere, “che cosa vuol dire quello che c’è scritto?” Nei linguaggi di programmazione, capita esattamente lo stesso: la semantica di un algoritmo è quello che l’algoritmo fa… ammesso naturalmente che non ci siano dei bachi. Similmente, nella logica matematica la semantica è l’interpretazione di una formula. Per fare un esempio, se scrivo ∀x (∃y: y=x+1) la sua semantica è “per tutti gli x possiamo trovare un y che vale x+1”. Se vogliamo rimanere più terra terra, se scrivo 2+2=4 la sua semantica è “due più due è uguale a 4”.
La sintassi indica come bisogna scrivere la frase perché sia corretta; ad esempio scrivere “qual’è” è sintatticamente scorretto, mentre “qual è” è corretto. In un linguaggio di programmazione come il perl, una regola sintattica è ad esempio che le variabili devono iniziare con $, gli array con @ e gli hash con %, o che una componente di un array è $a[x] mentre una di un hash è $a{x}. La parte più importante da tenere a mente è che la sintassi è una convenzione: non c’è nessuna ragione teorica perché gli elementi degli array stanno tra quadre e quelli di un hash tra graffe, esattamente come non c’è nessuna ragione teorica perché in italiano si accentino solo le parole tronche e non anche le sdrucciole come ad esempio in spagnolo. Notate che la sintassi è facilmente riconoscibile anche da uno stupido com’è un calcolatore: se uno scrive un programma, può capitargli che gli compaia il messaggio di errore “syntax error”, ma non certo “semantic error”! Anche nella logica matematica, le formule sintatticamente corrette sono quelle che hanno un senso, anche se magari non sono vere. Ad esempio, tra i numeri interi la formula ∀x∈N (∃y∈N: y=x/2), che dice “per ogni numero intero ce n’è un altro pari alla sua metà”, è sintatticamente corretta ma falsa, visto che ad esempio 1/2 non è un intero. La formula ∀=x/N (y∈N: y∃x∈2) non vuol dire nulla, e quindi non è sintatticamente corretta.
La grammatica, infine, è l’insieme delle regole per comporre le frasi (soggetto – verbo – complementi…) , a partire dalle varie parti che la compongono e che hanno dei ruoli diversi (verbo, nome, preposizione…). Nei linguaggi di programmazione il concetto di grammatica è molto più specializzato, perché esiste un insieme di regole formali che permettono di generare tutti i programmi sintatticamente corretti, applicando man mano delle trasformazioni. Anche nella logica matematica ci sono queste regole formali, però stranamente non viene dato loro un nome specifico, almeno per quanto ne so.
Ricapitolando, la semantica dà il significato, la sintassi il modo corretto di scrivere, e la grammatica dà le regole per scrivere correttamente. Vista così, la cosa non è nemmeno troppo complicata; ma basta relativamente poco e arriva uno come Gödel a mischiare le cose (perché il Numero di Gödel usato nel suo teorema di incompletezza non è poi altro che un modo di trovare una formula il cui signficato semantico riprende la formula stessa, invece che essere al di fuori del sistema). Ma credo di avervi già perso, stavolta…

Ultimo aggiornamento: 2007-03-11 22:24

coniglipolli

Chi ha la mia ormai non più verdissima età forse si ricorderà che la sua antologia scolastica conteneva una poesia – molto sperimentale… – che parlava di “coniglipolli”. Questa poesia era una specie di araba fenice, e non ci si ricordava nemmeno l’autore: non possiamo che ringraziare la rivista Rudi Mathematici, che dopo avere lanciato un accorato appello è riuscita a scoprire che è un’opera di Elio Pagliarani da “La merce esclusa”. Nel sito di RM potete leggere la poesia, che garantisco merita davvero; io mi limito a un suo riassunto e a una considerazione matematica.
conigliopollo.png La poesia espone un problema aritmetico, di quelli che vengono dati a scuola dalla maestra e che probabilmente sono la causa principale della disaffezione, quando non addirittura dell’odio, per la matematica. Ecco il testo.
Un ragazzo vede conigli e polli in un cortile. Conta 18 teste e 56 zampe. Quanti polli e conigli ci sono nel cortile?
Il metodo di soluzione esposto nella poesia prevede di considerare un conigliopollo, animale con due teste e sei zampe. Diciotto teste sono quelle di 9 coniglipolli, che hanno in tutto 54 zampe: quindi ce ne avanzano due. Come facciamo? Nessun problema: introduciamo anche il coniglio spollato, animale ottenuto togliendo un pollo da un coniglio e quindi con 1-1 = zero teste e 4-2 = due zampe. In tutto quindi abbiamo 9 coniglipolli e un coniglio spollato; vale a dire (“ed ora i conigli coi conigli e i polli coi polli”, come scrive Pagliarani) 9+1=10 conigli e 9-1=8 polli. Et voila.
Ora, dal punto di vista prettamente matematico abbiamo semplicemente fatto un cambio di variabili: X=x+y, Y=x-y. Niente di che. Ma a pensarci un attimo su, l’idea è semplicemente stupenda. Esci completamente dalla realtà – quanti coniglipolli hai mai visto in vita tua? – e in questo modo trasformi quello che, diciamocela tutta, è un noioso esercizio in una scena surreale che ha l’enorme vantaggio di farti calcolare la risposta in un attimo, persino a mente se ne hai voglia. La matematica, in fin dei conti, è anche questo: la ricerca di un modo per risolvere i problemi semplificandoli, un po’ come nella barzelletta con la pentola d’acqua da fare bollire dove il matematico se trova la pentola già piena d’acqua la butta via “per ritornare al caso precedente”.
Peccato che questa cosa non s’ha da fare; sempre dalla poesia, “non che violasse le leggi è che dissero basta / la famiglia gli amici gli esempi dei libri di testo”. Eppure mi chiedo cosa penserebbero gli alunni se una maestra proponesse loro il problema mostrando questa soluzione… forse non avremo dei matematici in più, ma magari almeno ci sarebbe un po’ meno gente spaventata dalla matematica.
(Grazie a Layos per il disegno del conigliopollo!)

Ultimo aggiornamento: 2007-03-01 17:20