A giugno avevo scritto che un giudice americano aveva dato torto ad Anthropic in una causa perché aveva usato il testo dei libri per addestrare il proprio LLM. Di per sé ciò non sarebbe stato un problema, ma Anthropic si era presa la base dati dai server di libri piratati, e quello sì che non si poteva fare, perché si rubava il pane di bocca dagli autori.
La notizia di questi giorni è che è stato raggiunto un accordo extragiudiziale, e Anthropic pagherà un miliardo e mezzo di dollari agli autori. Quali, esattamente, non si sa: qui c’è una pagina dove chi pensa di essere stato piratato può inserire i suoi dati. Il valore per libro è intorno ai 3000 dollari: come scrive David Gerard, “Molti autori non saranno felici, pensando che 3000 dollari sono pochi: ma altri notano che è più di quanto abbiano mai ottenuto dal loro editore”. (Forse uno dei miei libri è arrivato a farmi guadagnare quei soldi: l’unica cosa che posso dire è che non ho mai pagato per farmi pubblicare). Teoricamente non ci dovrebbe essere differenza di valore tra un libro e l’altro, visto il loro uso: ma mi sa che la cosa funzionerà più o meno come la SIAE da noi, che applica la regola evangelica “a chi ha sarà dato, a chi non ha sarà tolto anche quello che ha”.
Ho appena controllato: libgen è giù, quindi non posso fare l’elenco dei miei libri ivi presenti :-( Non che la cosa sia così importante: in Italia tu cedi i diritti all’editore, quindi dovrebbe essere lui a fare domanda, e alla fine di quei 3000 dollari ne vedrei tra i 150 e i 200. Per quanto riguarda i libri autopubblicati, sono in CC-BY-SA e quindi utilizzabili liberamente…


David Spiegelhalter è probabilmente il più grande statistico britannico vivente, e in questo libro parla effettivamente della statistica. Ma lo fa da un punto di vista inaspettato, e diverso dal suo precedente “L’arte della statistica”. L'”arte dell’incertezza” è vista appunto come un’arte. Non ci sono formule matematiche, e Spiegelhalter cerca di spiegare cosa c’è davvero oltre le formule, e come l’incertezza possa essere di vari tipi (ci sono cose che in teoria sarebbero conoscibili ma non sono note, e cose future per cui non possiamo fare altro che fare supposizioni); ma soprattutto che nella statistica, e nel calcolo della probabilità che è alla sua base, il fattore personale è fondamentale. Il tutto è inframezzato da pensieri personali, dal suo coinvolgimento quando ci fu la necessità di dare delle stime per contagi e morti per Covid a come si sta comportando (dal punto di vista di uno statistico…) con il cancro alla prostata che gli è stato diagnosticato. Un testo che dovrebbe essere letto da tanti leoni da tastiera, anche se non credo lo faranno mai.