Archivi categoria: wikipedia

Wikipedia e l’IA

L’altro giorno, parlando di Grokipedia, ho accennato al fatto che Wikipedia deve per forza fare i conti con l’intelligenza artificiale. Qui provo a spiegare come io vedo la situazione. Premetto che tutto quello che scrivo riflette esclusivamente il mio pensiero, non quello della comunità di Wikipedia in lingua italiana, di Wikimedia Italia o tanto meno della Wikimedia Foundation.

Il primo punto da considerare è capire perché usare l’IA. Attenzione: non sono luddista, e non ho nulla a priori contro il suo uso. Spero però che nessuno creda davvero che gli LLM siano creativi, riuscendo quindi a scrivere qualcosa di davvero nuovo e non rimasticato (pur molto bene): d’altra parte se ci riuscissero il testo sarebbe considerato una ricerca originale (RO) che in Wikipedia è assolutamente vietata, perché tutto deve essere verificato indipendentemente. (Nota: mentre sto scrivendo c’è una curiosa convergenza tra utenti destrorsi e sinistrorsi che stanno cercando di far passare il concetto che le ricerche originali si possono usare). E taciamo sul fatto che le “ricerche originali” degli LLM sono spesso cose che non stanno né in cielo né in terra: ultimamente abbiamo avuto l’utente LugAIno che scriveva testi più o meno casuali sulla città di Lugano. Aggiungiamo poi che c’è il gtrande rischio che il testo generato, specialmente se si parla di un argomento di nicchia, potrebbe essere troppo simile alla fonte originale e pertanto essere una violazione di copyright. Non sapere quali siano le fonti non ci permette nemmeno di scoprirlo.

Da qui si passa al secondo punto: Wikipedia richiede di inserire le fonti delle affermazioni indicate, cosa che di solito non si ha con gli LLM: ci sono delle eccezioni, come Copilot e Perplexity, ma anche se loro affermano di indicare da dove hanno preso le informazioni questo non significa molto. L’altra settimana per esempio, chiedendo a Perplexity quando una chiesa milanese era stata eretta come basilica minore, Perplexity mi “citò una fonte” secondo cui il decreto relativo era stato emesso nel luglio 2025… da papa Francesco.

Ciò detto, non c’è nessuna ragione intrinseca per vietare tout court l’uso dell’IA per migliorare le voci: quello che serve è che non si copincolli il testo creato ma lo si controlli e lo si corregga dove necessario. Alcuni esempi di uso dell’IA? Il recupero di fonti (reali…) che possono utilmente ampliare quanto già scritto; la revisione di un testo in modo che sia più scorrevole; la traduzione di quanto già presente in un’altra edizione linguistica di Wikipedia (ma in questo caso ricordatevi di citarla come fonte!). L’IA è molto brava a fare il lavoro sporco, proprio perché in pancia ha una quantità enorme di informazioni. L’importante è appunto non dimenticarsi che l’intervento umano continua a essere necessario.

Il Codice Urbani vale solo in Italia

La corte di appello di Stoccarda ha confermato che il Codice Urbani vale solo all’interno dell’Italia. Il codice Urbani è quello che afferma che un’opera anche fuori copyright perché vecchia di secoli può essere soggetta a “una tutela”; questo significa che se io voglio usare un’immagine dell’uomo vitruviano di Leonardo devo chiedere a chi gestisce l’immagine il permesso, e presumibilmente pagare per il diritto di usarlo. Bene: Ravenburger aveva prodotto un puzzle con l’uomo vitruviano, il ministero della Giustizia e le Gallerie dell’Accademia di Venezia hanno fatto causa, Ravensburger ha fatto una controcausa, e il risultato è che il puzzle può essere venduto tranquillamente al di fuori dell’Italia. La Corte non si è espressa sulla legalità del codice Urbani ripetto alla direttiva copyright, né poteva farlo; in pratica ha detto “non ci curiamo di cosa fate in Italia, affaracci vostri”.

Non credo che il nostro governo cambierà posizione: questo significa che noi italiani saremo cornuti e mazziati. Chissà se chiederanno anche di oscurare le immagini di Wikipedia se ci si connette dall’Italia…

Davvero tutte le foto sono artistiche?

È in corso di discussione alla Camera la proposta di legge 2224, presentata da due deputati di Fratelli d’Italia e due di Forza Italia, avente titolo “Modifiche alla legge 22 aprile 1941, n. 633, in materia di tutela del diritto d’autore relativo alle fotografie”. Cosa dice questa proposta? Facciamo prima un passo indietro, e vediamo cosa dice attualmente la legge sul diritto d’autore.

Ci sono due tipi di tutela delle fotografie (il termine è da intendersi in senso molto lato: ovviamente non c’è più bisogno di avere pellicola o simili per avere una foto, pensate alle foto fatte con il furbofono). Da un lato ci sono le fotografie artistiche, dove si sottintende un atto di creatività del fotografo: queste fotografie sono equiparate ai libri, nel senso che hanno la stessa tutela (il copyright scade settant’anni dopo la morte dell’autore). Dall’altro ci sono le fotografie che non hanno creatività e sono semplicemente di tipo descrittivo: questa categoria comprende anche i singoli fotogrammi cinematografici e le foto di opere d’arte. Queste immagini hanno una protezione che dura vent’anni. La proposta di legge si occupa solo di quest’ultimo tipo di fotografie, e porta da venti a settanta anni la loro protezione. In altre parole, non potremmo per esempio usare per altri sette-otto anni una foto che mostra una strada cittadina nei primi anni ’60 per mostrare come i centri storici erano intasati dalle auto.

Ribadisco: stiamo parlando di foto che per definizione del legislatore non hanno alcuna creatività, che dovrebbe essere il concetto su cui si basa tutto il diritto d’autore. A questo punto mi sa che il prossimo passo sarà la tutela degli scatti automatici, perché si dirà che c’è comunque l’autorialità di chi ha posizionato la fotocamera in quel punto e poi ha definito l’algoritmo che decide il momento in cui la foto viene scattata…

Ma c’è una cosa ancora più ironica. L’unico motivo che io vedo alla base di questa proposta di legge è che qualcuno ritiene che in questo modo i fotografi potrebbero guadagnare tanti soldi con i diritti di queste foto, che adesso possono essere usati dopo vent’anni che non sono pochi ma nemmeno troppi: come ho detto, le foto creative sono già tutelate dalla legge. Bene. Pensateci un attimo. Stiamo parlando di foto puramente descrittive, senza nulla di artistico. Se io avessi bisogno di un’illustrazione di questo tipo e dovessi pagare per usarla, farei molto prima a generare un’immagine con l’intelligenza artificiale. Il fatto stesso che questa immagine è una mera descrizione elimina a priori i problemi di una possibile violazione di copyright, e in questo modo non solo non pago nessuno ma non devo neppure aggiungere una didascalia indicante l’autore. Non so che ne pensiate voi, ma per me una legge come questa sembra solo un boomerang.

Doxxing su Wikipedia

Leggo su Slate che la Heritage Foundation, il think tank americano che sta gestendo il famoso Project 2025 che tanto piace a Trump, vuole “identificare e prendere di mira” gli utenti di Wikipedia che secondo loro “abusano della loro posizione” su Wikipedia. Il motivo del contendere dovrebbe essere il fatto che quegli utenti sono filopalestinesi.

Non entro sulla neutralità o meno delle voci in questione, che non ho nemmeno guardato. Sono almeno quindici anni che affermo che Wikipedia non può dare la verità, ma al più la verificabilità di quello che scrive (e sì, lo so che a volte non riesce nemmeno a fare quello). Quello che è proccupante è l’intimidazione degli utenti. Come sapete, anche quando nell’enciclopedia non si scrive come anonimi quello che si legge come autore è solo il nickname scelto: nel mio caso per esempio io mi firmo “.mau.”, con scarsissima fantasia. Il nickname, oltre che essere figlio della cultura di rete degli anni ’90, serve anche nel caso di testi che potrebbero generare reazioni anche sulla persona: chi scrive su argomenti delicati potrebbe quindi decidere di farlo sotto pseudonimo, cosa che non dovrebbe nuocere a Wikipedia perché si immagina che le affermazioni inserite abbiano le fonti a supporto e altrimenti verrebbero tolte, nome vero o falso che abbiano.

Io indico esplicitamente sulla mia pagina utente il mio nome e cognome, ma io non scrivo su temi caldi. Inoltre io sono da così tanti anni in rete e ho scritto pubblicamente così tante cose che trovare informazioni su di me è banale, e comunque parto sempre dal principio che tutto quello che scrivo potrà essere usato contro di me, e quindi sto attento a quello che scrivo. Ma appunto non è troppo difficile trovare informazioni su qualunque persona scriva in rete, se si cerca con sufficiente sforzo: tutto questo è il doxxing, e ne vediamo esempi tutti i momenti. Anche nel nostro piccolo circola una lista di “veri nomi di amministratori di Wikipedia in italiano” (con alcuni errori), tanto per dire.

Il fatto è che il doxxing è MOLTO pericoloso, sicuramente molto più della boutade di Musk che offre un miliardo di dollari a Wikipedia se cambierà il nome in Dickopedia. (Poi uno si può chiedere perché rosica così tanto, ma la gente è spesso strana). Io preferisco una Wikipedia poco perfetta a una Wikipedia ingessata, anche se la Heritage Foundation avesse ragione sulla mancata imparzialità di quelle voci: si comincia così e non si sa mai dove si finisce, anzi lo si sa benissimo.

L’arte s’ha da pagare

l'aceto balsamico con l'immagine del duca d'Este Bisogna dire che i giudici italiani sono coerenti. Anche nella causa per l’uso non autorizzato dell’immagine del duca d’Este su un aceto balsamico, la corte d’appello di Bologna ha dato ragione al ministero della Cultura: non importa se le immagini sono di opere ovviamente fuori copyright, e non importa nemmeno se sono semplici immagini e non gli originali: se la vuoi usare per scopi commerciali, devi avere l’autorizzazione relativa (e immagino sganciare soldi, che ce n’è sempre bisogno). Per fortuna io non ho scopi commerciali né diretti né indiretti, quindi posso lasciare l’immagine incriminata.

Avrei forse capito se l’autorizzazione fosse necessaria per evitare usi distorti, anche se si potrebbe partire con una discussione sulla possibilità o meno di parodia. Ma non pare il caso, visto che si afferma che questi beni, una volta usati per lucro, perderebbero il loro valore come beni riconosciuti e protetti dalla legge. Ma questo, almeno a mio parere, dovrebbe allora valere anche per gli usi non a fini di lucro. Peggio ancora, il Codice dei Beni Culturali nasce (lo dice esso stesso) per “preservare la memoria della comunità nazionale e del suo territorio e promuovere lo sviluppo della cultura”, in accordo all’articolo 9 della Costituzione.

Continuo a pensare che se questa è l’idea del MiC almeno siano coerenti e vietino tutti gli usi pubblicitari del patrimonio culturale italiano, a partire dai loro. Mi chiedo solo quando qualcuno verrà a bloccare l’uso di quelle immagini su Wikipedia, visto che la licenza prevede il riuso commerciale e – fatto salvo per le opere fotografate per Wiki Loves Monuments – non mi pare proprio sia stata richiesta un’autorizzazione e qiundi non importa se quelle immagini sono solo per motivi di studio e ricerca.

Ci sono giornalisti e giornalisti

L'IP che ha eliminato la data di morte di Schillaci Purtroppo pare che Totò Schillaci abbia avuto una recidiva del tumore al colon che l’aveva colpito. Purtroppo la mamma dei cretini è sempre incinta, e un utente anonimo oggi alle 15 aveva modificato la voce di Wikipedia sul protagonista di Italia 90, indicandone la morte. La falsa notizia è stata tolta un paio d’ore dopo da un altro utente anonimo, non prima che Repubblica scrivesse ” Addirittura il profilo di Wikipedia, come spesso accade, aveva proposto un aggiornamento di pessimo gusto annunciando la scomparsa nel 59enne proprio in data 8 settembre 2024.” (sì, la frase non ha senso: se il vandalo ha scritto oggi e l’articolo è di oggi, specificare la data non serve a nulla).

L’utente che ha inserito la morte di Schillaci è un siciliano non meglio identificabile, almeno con le informazioni pubbliche che io come tutti voi ho a disposizione. Invece si sa qualcosa di più dell’utente che ha tolto la data di morte, come potete vedere dall’immagine: si connetteva dalla sottorete pubblica del Messaggero, e presumibilmente è un giornalista. Per quel poco che può valere, voglio ringraziarlo pubblicamente.

Ultimo aggiornamento: 2024-09-08 19:03

Certe cose non cambiano mai

Per la quarta volta la Wikimedia Foundation non è stata accettata come membro osservatore WIPO. (Ne avevo già parlato due anni fa, quando si era provato a chiedere di entrare come osservatori i capitoli nazionali).
Per la quarta volta il veto è arrivato dalla Cina.
Direi che non c’è molto da aggiungere.

Ultimo aggiornamento: 2024-07-12 10:50

La grande bontà della SIAE

il logo SIAE Mi ero perso questo articolo di Capodanno, che raccontava di come un giudice di pace aveva dato torto alla SIAE in un caso in cui una rivista aveva pubblicato delle foto di opere di autori contemporanei ed era stata citata a giudizio perché non aveva pagato i diritti: nella sentenza il giudice ribadì “il principio cardine della legge sul diritto d’autore, in base alla quale è libero l’uso delle immagini ai fini di critica e discussione e purché non costituiscano concorrenza all’utilizzazione economica”.

Mi ero anche perso (occhei, non è che io legga più tanto spesso Repubblica questo articolo di mercoledì, dove il gruppo GEDI si lamentava perché giornali e riviste – ma anche i musei – faticavano a sapere quanto avrebbero dovuto pagare per l’uso delle immagini, e in caso il preventivo arrivasse era esorbitante.

Ora il presidente della SIAE Salvatore Nastasi annuncia che le cose cambieranno: «Nei prossimi giorni proporrò al consiglio di gestione della Società una soluzione che rispetti le norme ma che consenta di mettersi al passo coi tempi e in linea con le principali nazioni europee. Va infatti ricordato che in Europa ogni Paese tratta questo argomento in maniera diversa».

Vi siete accorti di una cosa? Nastasi non parla di legge, anche perché come citato sopra il testo della legge parla chiaro: se stai raccontando di una mostra (diritto di cronaca) e usi immagini che non possono in pratica essere rivendute come opere tu hai il diritto di farlo. Nastasi sta dicendo che la SIAE eviterà benignamente di chiederti i soldi, sapendo che citarti a giudizio porterebbe a un’ulteriore sconfitta: certo, tra un paio d’anni, ma gente tignosa ce n’è sempre. D’altra parte il punto è sempre lo stesso: gli autori, soprattutto quelli piccoli che ottengono solo le briciole e presumibilmente non vedono nemmeno un euro di questi diritti che finiscono in un unico calderone, ci guadagnano di più a essere citati in un articolo di giornale o nella brochure di una mostra oppure nel modo che la SIAE persegue attualmente?

D’altra parte è una vita che Wikipedia aspetta un decreto attuativo che specifichi quale sia la bassa risoluzione per le immagini ammessa dal comma 1 bis dell’articolo 70 della legge sul diritto d’autore, e immagino che finché ci sarà la SIAE potremo aspettare ancora una vita o due…