Archivi categoria: sfrucugliate

Fine della pubblicità comportamentale in Europa?

logo edpb Ho finalmente trovato il motivo per cui Facebook e Instagram hanno introdotto l’abbonamento a pagamento. A fine ottobre l’European Data Protection Board aveva emesso una “decisione urgente vincolante” che imponeva a Meta di abbandonare l’uso della pubblicità comportamentale, quella che cioè guarda cosa hai visitato per suggerirti pubblicità che dovrebbe interessarti. La cosa interessante è che la procedura che ha portato (dopo sette mesi…) alla decisione d’urgenza. La cosa buffa è che invece la procedura è partita dal Garante norvegese! In effetti Islanda, Liechtenstein e Norvegia fanno parte dello Spazio Economico Europeo e su alcuni temi, come appunto la protezione dei consumatori, seguono le stesse regole dell’Unione Europea, e quindi l’EDPB ha al suo interno anche quelle tre nazioni (non la Svizzera che pure fa parte del SEE; non parliamo del Regno Unito che dopo Brexit ha deciso di proteggersi per conto suo). La procedura imponeva entro due settimane di fare qualcosa, e Meta l’ha fatto.

A questo punto resta però da capire se la scelta “sei libero di pagare e non avere nessuna pubblicità, quindi nemmeno quella comportamentale” farà o no partire un’altra procedura. A rigor di logica probabilmente la soluzione immaginata dall’EDPB era il dover far chiedere se uno vuole la pubblicità comportamentale, un po’ come fa per esempio Microsoft condendotela in maniera insinuante “se non la vuoi avrai lo stesso numero di annunci pubblicitari, ma probabilmente non ti interesseranno”. Diciamo che il prossimo futuro ci potrebbe dare nuove soddisfazioni!

ChatGPT mi pare molto umano

Seguendo il metodo Mantellini, ho provato a chiedere a ChatGPT chi io sia, o meglio “Chi è Maurizio Codogno”. Ecco la trascrizione:


Io: Chi è Maurizio Codogno?
ChatGPT: Mi dispiace, non ho informazioni su una persona specifica con quel nome. Potrebbe fornirmi ulteriori dettagli su chi sia Maurizio Codogno?
Io: È uno scrittore
ChatGPT: Grazie per la precisazione. Purtroppo non ho informazioni dettagliate su tutti gli scrittori, ma posso dirti che ci sono diversi scrittori italiani di nome Maurizio Codogno. Alcuni di loro sono autori di libri di narrativa, altri di poesia o di saggi critici. Se hai informazioni più specifiche su un particolare Maurizio Codogno di cui vuoi sapere di più, posso provare a cercare informazioni più dettagliate per te.
Io: scrive saggi divulgativi
ChatGPT: Capisco. Ci sono effettivamente alcuni scrittori italiani di nome Maurizio Codogno che si occupano di divulgazione scientifica e tecnologica. Ad esempio, Maurizio Codogno è l’autore di libri come “Bit economy” e “L’innovazione spiegata a mia figlia”, che trattano di temi legati alla tecnologia e all’economia digitale in modo accessibile a un pubblico ampio. Potrebbe essere questo l’autore a cui ti riferisci? Se hai altre domande o informazioni che vorresti sapere, sarò lieto di aiutarti.
Io: no, questo Maurizio Codogno non ha scritto né “Bit economy” né “L’innovazione spiegata a mia figlia”
ChatGPT: Capisco. Ci sono diversi autori italiani di nome Maurizio Codogno che potrebbero scrivere saggi divulgativi su vari argomenti. Senza ulteriori informazioni sulle opere specifiche dell’autore di cui stai parlando, mi risulta difficile fornirti maggiori dettagli. Potresti fornire ulteriori dettagli sull’argomento specifico del saggio che l’autore ha scritto, in modo da poter aiutarti meglio?


Io non sono certo un esperto di AI, né di tecniche di comunicazione: ma da questo breve (e inconcludente) scambio ho notato alcune cose. Alcune me le aspettavo, altre no.

(a) ChatGPT potrà anche parlare in italiano (o se preferite, usare un modulo di traduzione italiano-inglese prima del suo modulo di “traduzione” nella sua struttura dati interna) ma non usa sicuramente molte fonti in italiano.

(b) ChatGPT non usa Wikipedia, e questo può essere comprensibile: mi sarei aspettato che dato che stiamo parlando in italiano avesse fatto un salto su it.wikipedia.org e tirato fuori il mio omonimo ex-calciatore, e invece nulla. Ma non usa nemmeno Wikidata (che ha informazioni in formato più facilmente processabile da una macchina, e dove “Maurizio Codogno” ritorna ben due risultati (l’ex calciatore e il sottoscritto). Questo invece mi pare molto più strano: mi sarei aspettato una richiesta di disambiguazione.

(c) Dopo che gli ho dato un’informazione generica ma corretta, e soprattutto facilmente parsificabile – se è uno scrittore, andiamo a cercare su una libreria online se ci sono dei suoi libri – la risposta è stata se possibile ancora più generica. “Ci sono alcuni scrittori” non ha molto senso, se non quello di prendere tempo. Lo stesso con “Alcuni di loro sono autori di libri di narrativa, altri di poesia o di saggi critici”. Mancano solo i libri per ragazzi e poi si è completata la suddivisione tipica degli scrittori.

(d) ChatGPT non usa nemmeno amazon come fonte per cercare un autore: anche amazon.com vende libri scritti da me, quindi non è un problema di corpus anglocentrico.

(e) Alla mia nuova affermazione “scrive saggi divulgativi” la risposta è stata fantastica. Dei due titoli indicati, in effetti Bing riporta una pagina web dove “Bit Economy” e “Maurizio Codogno” sono presenti insieme, ma non esiste nessun libro (o se per questo nessuna frase) intitolato “L’innovazione spiegata a mia figlia”. Evidentemente ChatGPT ha creato un titolo di libro plausibile per uno scrittore di saggi divulgativi. (Denis Guedj ha scritto “La matematica spiegata alle mie figlie”, e io avevo recensito sul blog il libro, ma direi che non può avere usato quell’informazione, altrimenti il titolo sarebbe stato corretto).

(f) Oltre che dire che “effettivamente” c’è qualche scrittore di nome Maurizio Codogno che si occupa di divulgazione scientifica e tecnologica, anche se non ne ha davvero idea (non perché sia un’AI e quindi non possa avere idee, ma banalmente perché ha tirato fuori titoli casuali di libri), ChatGPT ha cercato di estorcermi più informazioni.

Per curiosità ho provato a vedere se scrivendo direttamente in inglese le cose migliorassero. Ahimè, no, anzi… Ecco la trascrizione:


Io: Hello. Who is Maurizio Codogno?

ChatGPT: I’m sorry, but I don’t have any information on a person named Maurizio Codogno. Could you please provide more context or details about who they are and what they are known for? With more information, I might be able to help you better.

Io: He is a writer.

ChatGPT: I’m still not able to identify any well-known writers or authors with the name Maurizio Codogno. It’s possible that he may be a relatively unknown or emerging writer, or perhaps he writes under a pseudonym.

Without any further information, it’s difficult for me to provide more specific details about him or his work. However, if you have any additional information or context, please feel free to provide it and I’ll do my best to assist you further.

Io: He is a science communicator.

ChatGPT: Thank you for the additional information. Maurizio Codogno is an Italian science writer and communicator, with a background in physics and a Ph.D. in science communication. He has written several books on scientific topics, including “Cosmic Anatomy” and “Quantum Mechanics for Everyone”, which aim to make complex scientific concepts accessible to a wider audience.

Codogno is also known for his work as a science communicator, giving talks and presentations on a range of topics related to science and technology. He has worked with several organizations to promote scientific literacy and engage the public with science, including the European Space Agency and the Italian Association for Science Communication.

I hope this information is helpful!


L’inizio è lo stesso; la seconda domanda è più dubitativa che nella versione italiana. Non dice più che ci sono diversi scrittori di nome Maurizio Codogno, ma che potrebbe forse essercene qualcuno di emergente o che scrive con uno pseudonimo. Insomma, una risposta interlocutoria ma corretta. Peccato che quando gli dico che è un comunicatore scientifico, tiri fuori una biografia apparentemente plausibile ma in cui non c’è nulla di vero, a partire dal mio supposto background in fisica e dal mio dottorato in scienze della comunicazione. Per la cronaca, “Cosmic Anatomy” è il titolo di un libro di cent’anni fa e “Quantum Mechanics for Everyone” di un MOOC. Non credo esista nemmeno un’associazione dal titolo che è la traduzione italiana di Italian Association for Science Communication: anche SWIM ha il nome (inglese…) “Science Writers in Italy”.

Cosa esce fuori da questo esempio, pur non certo esaustivo? Innanzitutto, che nonostante i quasi sessant’anni da ELIZA il modo di interazione non è cambiato molto. No, questo è cattivo. ELIZA si limitava a riformulare le risposte dell’interlocutore, mentre ChatGPT le prende come punto di partenza per costruire frasi “nuove”, nel senso che aggiunge informazioni – false, ma pur sempre informazioni. Ma entrambi i sistemi sfruttano la sempiterna tecnica dei maghi veggenti cartomanti: fare in modo che sia l’interlocutore stesso a dargli le informazioni, che poi vengono frullate in modo che sembrino delle scoperte. ChatGPT ha in più la capacità di inventarsi cose quando non le conosce: in fin dei conti, se ci pensate, quando uno fa una domanda è tipicamente perché non conosce la risposta, e un testo plausibile può venire facilmente accettato (e qui si capisce perché Wikipedia non voglia articoli scritti da ChatGPT, anche se non ha problemi con tanti tipi di bot). Devo dire che questo suo approccio mi ricorda molto quello di mio figlio quando lo interrogo su qualcosa che non sa: si arrampica sugli specchi, cercando disperatamente un mio cenno di assenso quando riesce a trovare una risposta abbastanza corretta. (Io sono bastardo dentro: faccio finta di niente sia quando imbrocca la risposta che quando la sbaglia, e per questo mi odia).

C’è anche chi, come Cleo Nardo, nota che si può migliorare la probabilità di risposte corrette con il metodo flattery+dialogue: si dice a ChatGPT che ci sono due personaggi (il dialogo), di cui uno è bravo bello e buono (l’adulazione) e gli si chiede cosa risponderebbe questo personaggio a una domanda di un altro personaggio. In questo caso pare che il sistema dia un peso minore alle risposte sbagliate nella sua base dati, perché probabilmente hanno un peso minore quando si aggiungono tutti i dati apparentemente estranei dell’adulazione. Anche questo ha un parallelo con il comportamento umano, anche se per noi la cosa funziona alla rovescia: parlar bene di qualcuno può far dare una risposta errata.

Insomma, ChatGPT cerca di fare il furbo esattamente come un umano, e lo si può intortare più o meno allo stesso modo: come facciamo a non definirlo tale? :-)

Mai fidarsi delle immagini

Un’immagine vale mille parole, dicono. E l’immagine qui a fianco, presa da questo tweet, dice una cosa molto importante: che camminare non è affatto il modo migliore per sfruttare l’energia, anzi. Nel thread vengono date varie spiegazioni, a partire dalla nostra scarsa efficienza energetica, circa il 26%, e dal costo implicito di conservare e spostare il cibo che mangiamo, cosa che in effetti è un po’ più complicata che fare un elettrodotto. Poi siamo su Twitter, e quindi ci sono commenti che si intrecciano e risse più o meno dirette; lascio a voi la gioia di leggere il thread, soprattutto se amate le risse. Ma la figura riportata da quel tweet è davvero corretta?

Se uno va a vedere il sito da cui sarebbe tratta l’immagine, si trova un’immagine piuttosto diversa, come vedete qui a destra. Camminare e pedalare tornano in cima alla classifica, come del resto racconta la vulgata dell’energia pulita. Direi che è chiaro che il tweet e il sito dicono due cose diverse, o almeno l’immagine del tweet parrebbe essere taroccata; mai fidarsi di Twitter e della gente che sfrutta biecamente il mezzo per portare la propria verità. Eppure…

Eppure c’è qualcosa che non va. Sono andato su Internet Archive e ho cercato la prima occorrenza in cui quella pagina è stata salvata. Se aprite quella pagina noterete come l’immagine allegata sia quella del tweet, e non quella del post attuale! Per la cronaca, la seconda occorrenza salvata da Internet Archive ha l’immagine attuale: la prima è https://ecohungry.com/wp-content/uploads/2019/06/Energy-Efficiency-in-Transportation-1016×1024.jpg mentre la seconda è https://ecohungry.com/wp-content/uploads/2019/06/Energy-Efficiency-in-Transportation-1-1016×1024.jpg.

Il trucco è naturalmente nel testo dell’articolo: tra la prima e la seconda versione sono state aggiunte le righe «In this infographic we do not take into account the food needed to fuel each vehicle as that would make it incoherent.» Ecco perché camminare e pedalare non consumano energia :-) Morale della storia? Un’immagine varrà anche mille parole, ma può fuorviare esattamente come mille parole, se non di più. Ma soprattutto non è assolutamente possibile fidarci di qualcosa che leggiamo (oppure guardiamo, nel caso delle immagini): basta non accorgersi di una minuzia e il significato finale si rovescia.

I lanciacazzi che non ci sono mai stati

fake Se provate a fare una ricerca su Twitter con la parola “lanciacazzi”, trovate una pletora di risultati di gente che percula Repubblica, che nella sua diretta web avrebbe (involontariamente?) sbagliato a scrivere la parola “lanciarazzi”. Ma davvero?

Un primo segnale che c’è qualcosa di strano è che – a parte la perdita di risoluzione, non è mica vero che i copincolla digitali sono sempre lossless.. – ci sono solo due diverse immagini del ritaglio: quella che ho postato e un’altra in cui è stata sottolineata l’altra occorrenza della parola “lanciacazzi” nella seconda riga del lancio ma che è evidentemente derivata dalla prima. Avere una sola fonte è piuttosto strano. Se andiamo a vedere web.archive.org, la prima versione salvata scrive correttamente “lanciarazzi”. È vero che era passata più di un’ora dal supposto lancio: l’orario indicato in archive.org è infatti quello GMT, quindi il testo è stato preso alle 19:36. Ma mi pare strano che nessuno abbia visto la cosa e si sia affrettato a salvare una copia della pagina, preferendo fare un’immagine che di per sé è più facilmente manipolabile. Guardate infine il kerning (lo spazio) tra la c e la a nella parola. È inesistente: se scorrete in basso la pagina salvata da archive.org potete vedere che al titoletto “17.21 Bild: da Germania ok a fornitura di armi anticarro a Kiev” lo spazio in “anticarro” c’è eccome. Questo non è poi così strano: la r è più stretta della c, e quindi se uno sostituisce la lettera deve stringere in qualche modo. In definitiva, sono pronto a scommettere dieci euro che quell’immagine è un falso, fatto nemmeno troppo bene: sarebbe bastato salvare il sorgente, cambiare al suo interno la lettera e fare lo screenshot del risultato.

Vi rendete però conto che se la gente crede così facilmente a un banale falso non c’è neppure bisogno dei deepfake? Altro che fini analisti di guerra :-(

P.S. mentre stavo scrivendo il post si sono scomodati persino a Repubblica con un tweet che nega sia successo. A dirla tutta, non credo che una smentita come quella servirà a qualcosa: chi voleva credere ai lanciacazzi continuerà a farlo.

Ultimo aggiornamento: 2022-02-28 11:58

Facebook mi segnala…

segnalazione di Facebook
Stamattina Facebook mi ha segnalato che il Garante ha sanzionato Facebook per un’informazione scorretta. Il testo – che bisognava leggere subito: ho aperto una nuova finestra ed era già svanito… – si trova a https://www.facebook.com/legal/italy e dice:

AUTORITÀ GARANTE DELLA CONCORRENZA E DEL MERCATO
Le società Facebook Inc. e Facebook Ireland Ltd.
Non hanno informato adeguatamente e immediatamente i consumatori, in fase di attivazione dell’account, dell’attività di raccolta, con intento commerciale, dei dati da loro forniti. In tal modo hanno indotto i consumatori a registrarsi sulla Piattaforma Facebook, enfatizzando anche la gratuità del servizio.
Tale pratica è stata valutata scorretta, ai sensi degli artt. 21 e 22 del Decreto Legislativo n. 206/2005 (Codice del Consumo).
L’Autorità ha disposto la pubblicazione della presente dichiarazione rettificativa ai sensi dell’articolo 27, comma 8, del Codice del Consumo.
(provvedimento adottato nell’adunanza del 29 novembre 2018 e disponibile sul sito www.agcm.it)

“Naturalmente” non ci sono link specifici sui provvedimenti, ma solo un puntatore al sito AGCM. Se siete curiosi, l’adunanza si trova qui: sono d’accordo col fatto che Facebook non dice che userà i dati per scopi commerciali, non credo molto che il fatto che “induca ingannevolmente” gli utenti a registrarsi, “enfatizzandone la sola gratuità” cosicché “gli utenti consumatori hanno assunto una decisione di natura commerciale che non avrebbero altrimenti preso (registrazione al social network e permanenza nel medesimo)”, ma non è un mio problema.

Ma qui parliamo di due anni e mezzo fa. cosa è successo dopo la pubblicazione? Ho trovato una nuova istruttoria aperta più di un anno dopo (gennaio 2020). In quell’anno c’è stata una sospensiva (sulla sola pubblicazione) da parte dell’ineffabile Tar del Lazio; l’istruttoria è andata avanti e il 17 febbraio scorso c’è stata la nuova sentenza, dove si rimarca che Facebook Inc. e Facebook Ireland Ltd “non hanno pubblicato la dichiarazione rettificativa e non hanno cessato la pratica scorretta accertata: pur avendo eliminato il claim di gratuità in sede di registrazione alla piattaforma, ancora non si fornisce un’immediata e chiara informazione sulla raccolta e sull’utilizzo a fini commerciali dei dati degli utenti.” (e specifica che ciò deve essere fatto “alla luce del valore economico assunto per Facebook dai dati ceduti dall’utente, che costituiscono il corrispettivo stesso per l’utilizzo del servizio.” Se il Codacons legge questo estratto fa partire una class action per obbligare Facebook a pagare i suoi utenti per l’uso della piattaforma).

Non sono riuscito a vedere se la nuova dichiarazione rettificativa debba essere presente per venti giorni nelle home page mobili, come lo era la vecchia, e non posso controllare direttamente non avendo Facebook sul mio furbofono. Se qualcuno volesse verificare, gliene sarei grato. Interessante comunque che a metà febbraio, quando è stata pubblicata la delibera del garante, io non avessi visto nulla in giro. Voi?

eh, i sondaggi (italiani)

Come sapete, in Italia è vietato diffondere sondaggi elettorali nelle due settimane precedenti al voto. Come anche sapete, per qualche anno abbiamo visto corse di cavalli, qualificazioni di Formula 1, e financo conclavi che davano nomi stranamente simili a leader di partito e dati incongrui con quanto indicato ma compatibili con percentuali di voto. Poi c’è stata una stretta anche su quei post. Solo Fabrizio Rondolino ha sempre continuato imperterrito a postare, senza nemmeno far finta di nascondere i dati. Prima delle elezioni mi ero salvato una schermata – qui a fianco – e ora mi è venuta voglia di controllare cosa è successo. Vediamo:

In Campania il sondaggio diceva De Luca 48,5-52,5, Caldoro 28,5-32,5, Ciarambino 14-18; i risultati sono stati De Luca 69,5, Caldoro 18,1, Ciarambino 9,9.

In Liguria avevamo Toti 52-56, Sansa 36-40; i risultati danno Toti 56,1 e Sansa 38,9.

In Puglia, Fitto 39,5-43,5, Emiliano 36-40, Laricchia 14-18; invece Fitto 38,9, Emiliano 46,8, Laricchia 11,1.

In Veneto, Zaia 72-76, Lorenzoni 16-20, Cappelletti 1,5-5,5; i risultati danno Zaia 76,8, Lorenzoni 15,7, Cappelletti 3,2.

Nelle Marche, Acquaroli 48-52, Mangialardi 35-39, Mercorelli 7-11 contro Acquaroli 49,1, Mangialardi 37,3, Mercorelli 8,6.

In Toscana, Ceccardi 41,5-45,5, Giani 40,5-44,5, Galletti 8-12; alla fine, Ceccardi 40,4, Giani 48,6, Galletti 6,4.

Che possiamo dire? In Liguria, Veneto, Marche i sondaggi ci hanno più o meno preso, nel senso che siamo nei limiti della forchetta. Occhei, tecnicamente Zaia è al 77 contro un 76 teorico, ma non stiamo a sottilizzare. In Campania era stato indovinato il vincitore, ma i dati sono completamente sballati (De Luca +17%, Caldoro -10%, Ciarambino -4% sui limiti della forchetta). Nelle altre due regioni, che benignamente potremmo considerare definite Too close to call, gli errori sono stati comunque importanti: in Toscana abbiamo Ceccardi -1, Giani +4, Galletti -1,5 (sempre sugli estremi della forchetta, non sulla media; altrimenti a che serve dare una forchetta?) e in Puglia Fitto -0,5, Emiliano +7, Laricchia -3.

In pratica, Opinio può tecnicamente dire di avere indovinato tutti i risultati, nel senso che nei quattro casi in cui ha indicato un vincitore sicuro costui ha effettivamente vinto. Ma dal punto di vista del lettore digiuno di statistica i suoi risultati sono stati piuttosto mediocri, se non addirittura erronei. Chi è che sbaglia? Tutti, direi :-) Credo che sarebbe davvero necessario un corso accelerato di lettura dei dati, ma anche una taratura maggiore dei sondaggisti…

Ultimo aggiornamento: 2020-10-22 09:49

Ricardo Franco Levi, potrebbe trovarmi la risposta?

Leggo un comunicato stampa dell’Associazione Italiana Editori che recita testualmente (è un comunicato, spero che il mio blog non verrà oscurato per violazione di copyright per questa mia violazione):

“In relazione all’oscuramento in Italia da parte delle Autorità del sito Gutenberg.org, l’Associazione Italiana Editori (AIE) esprime grande apprezzamento per l’operato dell’autorità giudiziaria e la Guardia di Finanza per l’azione di contrasto alla diffusione non autorizzata di opere coperte da diritto d’autore”. È questa la posizione di AIE sul caso Project Gutenberg, che risulta inaccessibile da alcune settimane per violazione delle norme sul diritto d’autore.
“Le norme europee sul diritto d’autore sono tali da offrire garanzie a tutte le parti in causa. La legge esiste e deve essere rispettata – ha sottolineato il presidente di AIE, Ricardo Franco Levi -. Questo vale anche nel caso di un sito noto e apprezzato come Gutenberg.org”.

Io vorrei avere le certezze di Levi sulle garanzie offerte a tutte le parti in causa. Purtroppo dubito della cosa, considerando che il giudice romano non ha mai avvisato Project Gutenberg del provvedimento da lui richiesto: questo lo so, perché ho parlato con il CEO della fondazione che gestisce Project Gutenberg. In effetti trovare a chi scrivere è stata un’operazione molto complessa e non certo alla portata di chiunque: devo averci messo almeno tre minuti, compiendo astruse operazioni come cercare chi ha registrato il dominio e guglare quel nome-e-cognome. Ma non è questo che vorrei chiedere a Levi, ma una cosa più vicina alle sue competenze.

Supponiamo che io – Maurizio Codogno – avessi voluto leggere Una donna di Sibilla Aleramo (che è morta nel 1960, e quindi secondo le norme italiane sul diritto d’autore non entrerà nel pubblico dominio fino al 2031) e fossi finito a scaricarlo dalle pagine di Project Gutenberg. In questo caso io avrei commesso un reato, secondo l’articolo 171 “semplice” della legge 633/41. (Non entra in gioco l’articolo 171 ter, perché la duplicazione dell’opera sarebbe per uso personale e non a fine di lucro). Questo vale in genere per tutte e diciannove le opere (su più di sessantamila) di autori italiani legalmente disponibili negli USA ma non in Italia; e non avrei avuto nulla da eccepire se il giudice avesse bloccato tutte e sole quelle diciannove opere. Sarebbe più corretto perseguire chi le ha scaricate anziché impedire la possibilità di compiere il reato, ma non divaghiamo.

Ho scelto Una donna perché mi pare sia l’unica delle diciannove opere incriminate ad avere edizioni in commercio (anche in ebook) e per cui quindi non posso avere la scusa di non poterla acquistare legalmente. Guardando sull’OPAC SBN, mi pare di capire che dopo l’edizione Treves del 1919 e quelle Mondadori dal 1931 al 1944 i diritti (cartacei) sono passati a Feltrinelli. Mi chiedo però come mai esista anche un’edizione cartacea di StreetLib e due in ebook di Aliberti e KKien Publ. Int.

Dottor Levi, come presidente dell’AIE potrebbe chiedere agli editori in questione di rendere pubblici i contratti in questione – naturalmente oscurando la parte su indirizzi, compensi e tirature previste per l’edizione cartacea, che sono informazioni sensibili e non sono certo importanti in questo contesto – in modo che sia chiaro a tutti come bisogna procedere legalmente per pubblicare un libro? Per quanto riguarda le edizioni in ebook sarei davvero curioso di scoprire chi sono gli eredi di Sibilla Aleramo che hanno concesso i “diritti di riproduzione su supporto elettronico, magnetico, ottico e digitale che ne consentano la lettura, riproduzione, trasmissione e comunque la fruizione attraverso i media conosciuti dalle parti”; la mia speranza è che il contratto non sia infatti stato dato in esclusiva, e che quindi possiamo chiedere agli eredi in questione se ci danno una licenza che ci permetta di pubblicare il testo su Wikisource. Nel malaugurato caso in cui non riesca a trovare tali contratti, sarebbe così gentile da segnalare la cosa alla magistratura, perché faccia gli adeguati controlli? Grazie mille.

PS: Immagino che Ricardo Franco Levi non sia un lettore del mio piccolo blog. Però magari tra i miei ventun lettori c’è qualcuno che lo conosce e può segnalarglielo. Sono una persona fondamentalmente ottimista!

Repubblica Italiana contro Project Gutenberg: un case study

Questa storia comincia a metà aprile, con la FIEG che chiede all’AGCOM di chiudere Telegram perché è il mezzo con cui si diffondono illegalmente i quotidiani italiani. Niente da eccepire sulla richiesta di bloccare la diffusione illegale; potremmo chiederci perché scrivere titoloni sui giornali e non andare direttamente per vie legali, ma in effetti per loro il costo marginale è nullo; meno chiaro il rivolgersi all’AGCOM e non direttamente a un giudice.

Il giudice però alla fine a quanto pare è stato chiamato in causa da qualcuno: così ha sguinzagliato la Guardia di Finanza, ha aspettato i loro risultati e a metà maggio ha disposto quell’ossimoro legale che va sotto il nome di “sequestro preventivo mediante ‘oscuramento'”, come da articolo 321 del codice di procedura penale. L’oscuramento è stato chiesto nei confronti di una decina di canali Telegram e già che c’era di un paio di dozzine di siti web, che “in esecuzione di un medesimo disegno criminoso, in violazione dell’art. 16 L.633/1941, a fine di lucro (costituito dalla cessione dei dati personali a fine di pubblicità), distribuivano, trasmettevano e diffondevano in formato pdf, riviste, giornali e libri (beni tutelati dal diritto d’autore), dopo aver acquisito illecitamente numerosissimi files informatici con il relativo contenuto, comunicandoli al pubblico, immettendoli in un sistema di reti telematiche”. (Immagino abbiano lo stampino per questo testo. Riconosco solo il “comunicandoli al pubblico” che nasce con la direttiva copyright InfoSoc del 2001, quella che sarà sostituita dalla nuova direttiva che sta per essere recepita anche da noi.

[disegno criminoso]

Una grande vittoria contro la pirateria? Forse. Però qualcuno si è accorto che tra i siti warez più o meno noti c’era anche quello di quello di Project Gutenberg. Alla maggior parte di voi il nome non dirà nulla, ma per i vecchietti come me Project Gutenberg (d’ora in poi PG) ha un significato molto particolare. È stato infatti il primo progetto al mondo per rendere fruibili in modo digitale le opere nel pubblico dominio (o per cui gli autori hanno dato specifica licenza, ma questo non c’entra nella nostra storia). Hanno cominciato mezzo secolo fa, nel 1971, quando Internet non esisteva ancora e i computer praticamente nemmeno: si erano insomma portati molto avanti col lavoro. Io credo di aver saputo della loro esistenza a fine anni ’80, quando computer e reti di calcolatori cominciavano a esistere; avere un testo ASCII a disposizione e visualizzarlo sul monitor 80×25 a fosfori ambra era una gran cosa. Ma a parte l’amarcord, sottolineo ancora una volta che PG ha solo opere nel pubblico dominio, controllate a una a una. Insomma non ha nulla a che fare con gli altri siti indicati nell’elenco, se non perché anche da lì si scaricano libri.

Che fare, dunque? La risposta corretta sarebbe stata “cerchiamo un avvocato che faccia istanza di dissequestro parziale, mostrando come le ipotesi di reato indicate nel provvedimento non sussistano”. E in effetti avevo cominciato a fare così, dopo aver reso noto quanto stava succedendo. Purtroppo però c’è stato qualcuno che ha pensato di scrivere direttamente ai finanzieri dicendo loro che ci doveva essere stato un grande errore, e di far dissequestrare il sito di PG. I finanzieri avrebbero risposto “sì, è vero, PG non c’entra con gli altri siti, ma…”

Il “ma” è pare che la Guardia di Finanza non abbia nessun problema a far dissequestrare il sito di PG, ma abbia trovato 5 (cinque) libri sotto copyright, libri scritti da Sibilla Aleramo e Massimo Bontempelli. Una volta tolti quei cinque libri, è tutto a posto. Ma come, direte voi. Ho detto che PG ha solo libri in pubblico dominio, e adesso una banale ispezione trova libri sotto copyright? Sì, è così. Ma…

Mettetevi comodi, perché questo secondo “ma” vi aprirà nuovi mondi. Secondo la legge italiana (ed europea), il copyright su un’opera letteraria scade dopo 70 anni dalla morte dell’autore. Aleramo e Bontempelli sono morti nel 1960, quindi le loro opere entreranno nel pubblico dominio nel 2031. Ma secondo la legge statunitense, le opere pubblicate fino al 1978 hanno un copyright di 95 anni dalla data di pubblicazione. Questo significa che le opere pubblicate prima del 1924 di un autore morto dopo il 1950 sono PD-USA ma non PD-EU. Project Gutenberg ha insomma tutti i diritti di distribuire quelle opere: per esempio, Una donna dell’Aleramo è del 1906, e La vita operosa di Bontempelli del 1921. Né si vede perché debba togliere quei libri: il suo pubblico di riferimento è quello statunitense, e c’è un disclaimer che specifica che i libri potrebbero non essere di pubblico dominio al di fuori degli USA.

Tra l’altro, ci sono casi opposti. Il romanzo The Great Gatsby di Scott Fitzgerald è del 1925, e quindi – per i prossimi sei mesi – sotto copyright negli USA. Però Scott Fitzgerald è morto da più di settant’anni, e quindi il testo è scaricabile da un parallelo progetto australiano, per l’ottima ragione che lì almeno fino al 2005 la protezione era diversa e durante l’armonizzazione con gli USA ci fu una clausola specifica per non rimettere sotto copyright testi che erano diventati di pubblico dominio… cosa che non capitò in Italia quando il copyright fu portato da 50 a 70 anni dopo la morte dell’autore. Le malelingue affermano che fu Mondadori che voleva riprendersi l’esclusiva su Pirandello a bloccare tale clausola.

[Terms of Use di Project Gutenberg]

La mia ipotesi – non suffragata da alcuna prova, non ho certo accesso agli atti – è che i finanzieri si siano accorti che i capi di imputazione contro PG non stavano in piedi. Lasciando perdere il “medesimo disegno criminoso” che è giusto una coloritura, PG non ha fini di lucro, non chiede dati personali e non guadagna dalla pubblicità; né ha acquisito quei testi illecitamente. A questo punto però hanno provato a vedere se trovavano qualcos’altro, e si sono accorti di quei file che a posteriori mostravano quanto loro fossero nel giusto. L’ipotesi alternativa – che cioè fossero stati subito notati – è possibile ma a mio giudizio improbabile, perché in quel caso si sarebbero fatti due provvedimenti distinti – uno per PG e l’altro per i restanti siti – e soprattutto il primo non sarebbe stato “contro ignoti”: non c’è nessun problema a scoprire chi gestisce il progetto.

Il risultato finale? Beh, gli altri siti cambieranno nome e ripartiranno più piratanti che pria; Project Gutenberg rimarrà bloccato in saecula saeculorum, visto che nessun giudice citerà mai a giudizio gli americani (per cosa, poi? Loro non hanno fatto nulla di illegale: al più è chi scarica quei libri a essere colpevole). D’altra parte PG non ha nessun rappresentante legale in Italia, e ovviamente a questo punto si guarderanno bene dal cercarlo. Il GIP si accontenterà di avere mostrato che il potente braccio della legge ha fatto il suo dovere, almeno per chi non conosce il modo per bypassare questo oscuramento. (Per la cronaca: anche se la legge permetterebbe l’oscuramento di singoli file, e nel caso di PG la cosa sarebbe tecnicamente fattibile perché i loro URL sono statici, i provider non potrebbero comunque farlo legalmente, perché in tal caso controllerebbero il traffico internet).

Una soluzione rispettosa di diritti e di obblighi potrebbe essere che PG indichi sulle pagine dei singoli libri non PD-UE (ce ne sono anche di tedeschi, per esempio) che non possono essere scaricati dall’Italia; ma dubito che la nostra magistratura accetterebbe qualcosa del genere. Mi chiedo anche se ci siano margini per affermare che il blocco totale di un sito – che ricordo essere legale per la sua legislazione, e non stiamo parlando di stati canaglia – per impedire che un piccolo numero di file illegali in Italia sia una misura proporzionata. Ma non essendo io un esperto di legge non ho certo una risposta.

Per finire, un paio di chicche. In primo luogo, sarebbe simpatico sapere chi ha i diritti per le edizioni elettroniche di quei file. Sicuramente fino al 1960 nessun contratto di cessione dei diritti prevedeva anche quelli in formato elettronico; quindi bisognerebbe scoprire se gli eredi dei summenzionati autori hanno effettivamente ceduto quei diritti. Per quanto riguarda La vita operosa, ho fatto un controllo su Amazon. Non esistono edizioni digitali acquistabili; per quanto riguarda quelle cartacee, ce n’è una pubblicata nel 2014 da Unicopli (avranno ottenuto i diritti da Mondadori, che ha pubblicato per l’ultima volta il libro nel 1970?) e un’altra edizione di Nabu Press che, almeno a giudicare dal testo, si direbbe stampata direttamente a partire dall’edizione del Project Gutenberg. Che dite, chiediamo alla magistratura di oscurare Amazon finché non tolgono quei testi oppure dimostrano che non violano il diritto d’autore?

[Volete comprare il libro?]

P.S.: Tra gli altri che hanno parlato della storia, segnalo InfoSec, l’Osservatorio Balcani-Caucaso. The Submarine, Valerio Di Stefano, Il dubbio, LSDI, l’Associazione Italiana Biblioteche, Carlo Franza su un blog del Giornale. Se sapete di altre fonti (che non riprendano pedissequamente altri articoli…), segnalatemele e le aggiungerò.