Archivi autore: .mau.

Informazioni su .mau.

matematto non praticante

È settembre

Lunedì sono rientrato in ufficio, dopo tre settimane di ferie. Mi sono avviato alla macchinetta del caffè, ho aperto l’app, cercato di connettermi… niente da fare. Provo ad andare alla macchinetta dell’altro piano: idem. Mi stufo, tiro fuori il badge da esterno e vado al bar Fibercop nell’altra parte del complesso. Anche i miei colleghi confermano: la macchinetta (che a quanto pare è stata cambiata) non funziona né con la chiavetta né con l’app, ma solo con le monete. Poi nel pomeriggio il collega mi offre un caffè, e a lui l’app funzionava. Bene, mi dico, è settembre anche per le macchinette.
Stamattina sono arrivato in ufficio, mi connetto: di nuovo nulla. Non ci sto a pensare troppo e me ne vado al bar “interno ma non per noi”. Dopo pranzo ritorno e funziona. Ma a questo punto mi viene in mente che però non avevo usato il codice salvato “per la macchinetta preferita” ma avevo scansionato il QRCode: e in effetti essendo la macchina diversa il codice era diverso.

(Ora devo solo ricordarmi che il default di zucchero in questa macchinetta è zero, e non “medio” come in quella precedente. Ce la posso fare)

tf–idf

Non avevo mai sentito parlare di questa funzione, il cui nome completo è “term frequency–inverse document frequency”. Eppure è una funzione del tutto naturale nel caso si voglia trovare documenti “simili” a quello di partenza in una collezione di testi.

L’idea sottostante è a posteriori ovvia. Se ho un documento in cui una parola appare molto spesso, altri documenti in cui questa parola compare spesso dovrebbero essere simili. Ma ci accorgiamo subito che questa euristica non funziona: connettivi come “che”, “perciò” oppure articoli e forme dei verbi ausiliari appariranno spesso in praticamente ogni documento. La funzione tf-idf relativa a una parola P tiene conto di tutto questo: è direttamente proporzionale alla probabilità che P appaia nel testo, ma inversamente proporzionale alla probabilità che P appaia nella collezione completa di testi. In altri termini, la funzione assume un valore tanto maggiore quanto la parola è in genere meno usata rispetto a quanto lo sia nel testo iniziale; una parola usata sempre più o meno allo stesso modo ha i due fattori che si elidono a vicenda.

In formule, abbiamo che tf-idf è il prodotto di due funzioni: tf, la frequenza del termine nel nostro documento, e idf, l’inverso della frequenza in tutti i documenti. Più precisamente,

$$\mathrm{tf_{i,j}} = \frac{n_{i,j}}{|d_j|},$$

dove $n_{i,j}$ è il numero di occorrenze del termine $i$ nel documento $j$ e il denominatore (il numero di parole nel documento) serve per perequare i valori per i documenti di lunghezza variabile, e

$$\mathrm{idf_{i}} = \log_{10} \frac{|D|}{|\{d: i \in d\}|},$$

dove $|D|$ è il numero di documenti nella collezione e al denominatore c’è il numero di documenti che contengono il termine $i$. (Per definizione ce n’è almeno uno, altrimenti non calcoleremmo idf, e quindi il denominatore non può mai essere nullo).

Il tutto funziona? Diciamo che funzionicchia. Già il concetto di idf è più euristico che altro, perché applica la legge di Zipf che come sappiamo non è scolpita nel granito; e visto che a quanto pare le raccomandazioni di libri simili nelle librerie online pare basarsi anche su tf-idf direi che ci sono ampi margini di miglioramento. Secondo Wikipedia in inglese la formula è stata anche applicata in altri campi, con risultati deludenti. Però è sempre meglio una cattiva formula che nessuna formula, e spesso si può usare il sistema “al rovescio”, per esempio cercando di scoprire se alcune delle lettere paoline siano o no state effettivamente scritte dall’apostolo. L’idea è che in questo modo brutale non si può riconoscere lo stile ma almeno si verifica che la terminologia non sia cambiata troppo, e si ha un punteggio numerico e non una sensazione come si faceva un tempo. Insomma, è comunque una freccia all’arco dei filologi.

Parlo di pi greco al Circolo Filologico Milanese

Forse vi ricordate che a gennaio avevo parlato di trigonometria al Circolo Filologico Milanese (Via Clerici 10 – Milano: è a quattro passi dalla Scala).

Sabato prossimo alle 15 apro la stagione 2025-26. Questa volta parlo di pi greco, cosa che dovrebbe riuscirmi abbastanza facile visto che ci ho scritto su un libro (il link è quello del mio referral Amazon). Ma non si sa mai.

Con quella faccia da straniero

Sabato Anna e io siamo andati a visitare il Duomo di Milano (devo dire che il battistero e Santa Tecla, sotto il sagrato, sono molto più interessanti che il duomo stesso, che è un tantino esagerato). Bene: sia al controllo col metal detector all’ingresso del duomo che al Duomo Shop dove siamo entrati per chiedere dov’era il museo del Duomo mi hanno parlato in inglese. Quando ho detto alla guardia che poteva tranquillamente parlare in italiano, mi ha risposto “eh, ma il 99% della gente è straniera”.
Occhei, sabato avevo una maglietta Wikipedia che quindi non mi qualificava come italiano (ieri per esempio ne avevo una dei giochi matematici, e lì la mia nazionalità sarebbe stata più chiara). Ma ho così l’aria di uno straniero? Anche a Milano? (A Firenze mi è capitato quasi sempre anche quando chiedevo qualcosa, ma lì in effetti non parlo in vernacolo…)

Reunion (libro)

copertina 6 dicembre 1980: in un incidente d’auto nelle Hawaii rimane ucciso un giovane uomo, Mark David Chapman. Maggio 1998: dopo la morte di Linda, Paul McCartney decide che per ricordarla e raccogliere soldi per combattere il cancro al seno farà un concerto. Con chi? Coi suoi tre vecchi compagni: Ringo Starr, George Harrison e John Lennon. Ma i giovani saranno ancora interessati a tre quasi sessantenni?
In questa ucronia John non è stato assassinato, il progetto Anthology è tristemente naufragato prima di essere formalizzato (ovviamente perché John non voleva…) e i Fab Four, pur essendo comunque in buoni rapporti personali, non osano provare a suonare tutti insieme. Il libro racconta il dipanarsi del progetto, nel massimo segreto possibile, e il suo esito finale con un concerto a Central Park. L’appunto che posso fare a Burr è che è stato troppo didascalico. Diciamocelo: il libro l’avremo comprato noi beatlesiani puri e duri. È bello vedere tutti i riferimenti del passato, ed è anche bello vedere frasi di John che sarebbero potute essere tranquillamente sue: ma se metti i riferimenti come spiegazioni e non buttati lì nel discorso, un fan si scoccia pure… Fortuna che nella parte finale Burr si lascia andare e la storia finalmente va avanti per conto suo.

Gary Burr, Reunion : A Rock and Roll Fairy Tale, Adave 2024, pag. 226, € 9,71, ISBN 9798990055001 – come Affiliato Amazon, se acquistate il libro dal link qualche centesimo va a me
Voto: 4/5

La Biblioteca di Babele è online!

Tutti (o almeno tutti i miei ventun lettori) conoscono il racconto di Borges La biblioteca di Babele: una ipotetica biblioteca dove sono presenti tutti i possibili libri. Bene: sono lieto di segnalare che esiste un’implementazione web di questa biblioteca!

Nel 2022 Tom Snelling ha infatti messo in linea questo sito. Ovviamente il sistema funziona “on demand”, nel senso che viene generata e mostrata una singola pagina: come sapete, la biblioteca non può essere contenuta interamente nel nostro universo. Però non è una cattiva idea, no?

Napoli New York (film)

locandina Lo so, è già passato ieri su Sky Cinema, ma io l’ho visto al cinema la settimana scorsa :-) Gabriele Salvatores prende un soggetto inedito di Tullio Pinelli e un giovane Federico Fellini ancora neorealista e ci costruisce un film che continua a essere neorealista, oltre che stereotipale al massimo sia nelle prime scene napoletane che in quelle newyorchesi, anche se la mia sensazione è che parli a nuora perché suocera (gli italiani di oggi) comprenda. Le scene “qui non serviamo italiani” e il giornalista italoamericano Joe Agrillo (Antonio Catania) che vede la vicenda della sorella della giovanissima protagonista solo come un modo per tirare la volata elettorale al sindaco, così come l’arringa del difensore che cita la famosa descrizione degli italiani ad Ellis Island, non sono infatti così diverse da quello che vediamo oggi da noi. Detto questo, ho perso metà dei dialoghi: invece che sottolineare sottotitolare le battute degli americani avrebbero potuto farlo con quelle in napoletano stretto.
Nel cast, davvero bravi i due ragazzini Celestina (Dea Lanzaro) e Carmine (Antonio Guerra); il cuoco George (Omar Benson Miller) è una figura che all’inizio pare secondaria ma resta come collante, e naturalmente Pierfrancesco Favino favineggia nei panni del commissario di bordo Domenico Garofalo.