L’invecchiamento di Wikipedia


Questo è un frammento della voce attuale di Wikipedia sulla rete tranviaria di Nizza. Tutto bene, se non fosse per il fatto che la linea 2 è in funzione dal 2019 (sono un po’ più veloci di noi, mi sa).

Non è la prima volta che mi è capitato di trovare voci create e poi lasciate lì a vegetare senza aggiornamenti. È ovvio che nessuno è obbligato a mantenere a vita una voce: però casi come questo fanno capire che non bisogna mai dare per scontato quello che si trova scritto…

(L’altra faccia della medaglia è la cancellazione immediata dei cosiddetti “recentismi”, aggiunte su fatti del giorno che tra qualche mese saranno giustamente considerati inutili…)

Anglofilia

Per comprensibili motivi, io ricevo la rassegna stampa su Wikipedia e Wikimedia. È un po’ sgarrupata, nel senso che devo scartare tutti gli articoli che hanno semplicemente una foto (giustamente) accreditata a Wikimedia Commons, ma va bene così. In genere trovo dai 10 ai 20 articoli: oggi ce n’erano ben 71, quasi tutti dedicati al nuovo “portale enciclopedico” russo presentato ieri e quasi tutti copiati più o meno verbatim dal lancio Adnkronos. Le testate più oneste lo segnalano, le altre fanno finta di niente.

Gli unici fuori dal coro sono stati quelli di Tag43, che hanno intitolato “La Russia prende le distanze da Wikipedia, ecco Znanie”. Naturalmente Znanie in russo significa “conoscenza”, esattamente come l’inglese Knowledge. Solo che evidentemente lo stagista di Adnkronos ha preso un lancio in lingua inglese, l’ha tradotto e non ha pensato che forse i russi non avevano usato un nome inglese per il loro portale; e tutti gli altri stagisti dei quotidiani hanno copincollato il lancio d’agenzia senza farsi troppe domande, che presumo non siano compatibili coi miseri emolumenti che prendono. A questo punto però tanto valeva fare gli autarchici e scrivere che si chiamerà “Conoscenza”, no?

Io non ho nessuna idea di quale sia la linea editoriale di Tag43, ma ho molto apprezzato come hanno trattato questa notizia.

Come farsi aggiornare la voce Wikipedia su di sé

Emily St. John Mandel è una scrittrice canadese nota per i suoi libri Stazione Undici (credo che ne abbiano fatto anche una serie tv, ma è un campo in cui non mi addentro) e Mare della tranquillità. Qualche giorno fa ha scritto un tweet chiedendo chi poteva intervistarla… per poter far sì che nella sua voce su Wikipedia (in inglese, in quella italiana non era nemmeno scritto che era sposata) che era divorziata. In qualche ora Slate ha pubblicato un’intervista dal titolo che dice “Un’intervista del tutto normale con la scrittrice Emily St. John Mandel” e catenaccio “Solo per chiedere all’autrice di Station Eleven e Sea of Tranquility che ha fatto quest’anno, tutto qui”. E in effetti la voce di en.wiki è stata immediatamente aggiornata. In realtà non serviva nemmeno l’intervista: almeno fino ad oggi, la spunta blu di Twitter è una verifica dell’identità della persona, e quindi la prima fonte che attestava il divorzio è stato quel tweet, sostituito poi dal link all’intervista.

Per quanto la cosa vi possa sembrare stupida (e sicuramente è sembrata tale a Mandel), Wikipedia funziona così. Un’affermazione deve avere una fonte affidabile, e nessuno può sapere se l’utente che scrive “Emily St. John Mandel è divorziata” è effettivamente Mandel o qualcuno che vuole fare uno scherzo. Leggendo il thread su Twitter, però, mi sa che il contributore che le ha detto che “occorreva una fonte comparabile” ha fatto un po’ di casino: come ho scritto, quello che conta è una fonte affidabile che si possa citare con tranquillità.

Un’ultima curiosità: nell’intervista a Slate, Mandel scrive che vedersi ancora definita sposata (si è separata ad aprile dal marito, e il divorzio è stato concesso a novembre) “was kind of awkward for my girlfriend”. Ieri BBC ha scritto un articolo in cui affermavano che si erano offerti anche loro di intervistare Mandel. Com’è, come non è, nel loro articolo quella frase non c’è :-)

Inventori farlocchi del tostapane

Adam Atkinson mi ha segnalato questo articolo della BBC in cui si racconta come per dieci anni la voce inglese sul tostapane indicava come suo inventore una persona inesistente di nome Alan MacMasters. A quanto pare, durante una lezione universitaria il professore sconsigliò gli studenti di usare Wikipedia come fonte, facendo l’esempio della voce “toaster” dove si diceva che l’inventore era un tale Maddy Kennedy. L’Alan MacMasters reale era uno di quegli studenti, e un suo amico modificò la voce indicando come inventore appunto “Alan Mac Masters”. Il guaio è che poco dopo il Daily Mirror osannò MacMasters come un grande inventore scozzese, e le citazioni continuarono a crescere, anche perché MacMasters creò una voce sul suo inesistente omonimo con tanto di fotografia (ovviamente ritoccata per farla sembrare ottocentesca). MacMasters fu addirittura proposto come personaggio da raffigurare nelle banconote scozzesi, anche se a quanto pare la Bank of Scotland ebbe dei dubbi e lo scartò. Solo poco tempo fa un ragazzino ebbe dei dubbi sulla biografia di MacMasters e mise in moto le squadre wikipediane di verifica, che hanno scoperto la burla.

E in Italia? MacMasters non è mai stato inserito nella voce, ma nel 2018 un anonimo aggiunse il seguente capoverso:

nel 1897 Carlos Decambrè, inventò il ”tost” che si diffuse in tutta europa. questo tost veniva fatto con del pane normale, prosciutto,tacchino e diversi formaggi. Esso garantiva un buon pranzo per i nobili perchè all’epoca i salumi e i formaggi era cibo considerato da ricchi.

Peccato che le uniche occorrenze in rete del cognome Decambrè siano del tipo “Carlos Decambrè inventò il tostapane”, ovviamente senza fonti perché scopiazzature da Wikipedia senza chiaramente citarla. Questo a parte il fatto che se mi fosse capitato di vedere un’aggiunta sgrammaticata simile l’avrei cassata al volo perché senza fonti attendibili…

“contrafforte volante”?

Premetto che ho molti amici traduttori :-) (e un paio di loro sono anche tra i miei ventun lettori… ma ovviamente non sto parlando di loro). In un libro (tradotto dall’inglese) che ho appena letto ho trovato a un certo punto scritta l’espressione “contrafforte volante”. Ora, come penso molti di voi io so più o meno cos’è un contrafforte, ma l’ultima volta che ne ho sentito parlare sarà stato all’inizio del liceo, cioè 45 anni fa (per me che sono anzyano: your mileage may vary). Tra l’altro manco sapevo come si dica in inglese “contrafforte”: sono andato a cercare e ho scoperto che è “buttress”. Una rapida ricerca mi ha fatto trovare la voce di Wikipedia in inglese “flying buttress”: l’ho aperta, ho controllato qual è il nome della versione in italiano e ho scoperto che si dice “arco rampante”. (Ok, a questo punto il mio neurone ha tirato fuori il disegnino dei contrafforti ad archi rampanti, ma questa è un’altra storia)

La mia domanda è semplice. È possibile che un traduttore trovi scritto “flying buttress”, traduca parola per parola, e non si renda conto che il sintagma in italiano non ha senso? È possibile che non gli sia mai venuto in mente di usare Wikipedia in questo modo non standard ma utilissimo per la terminologia tecnica? (E comunque anche Wordreference riporta la traduzione).

Piano nazionale di digitalizzazione del patrimonio culturale

Fino al 15 giugno il Ministero della Cultura (MIC) ha indetto una consultazione pubblica sul Piano nazionale di digitalizzazione del patrimonio culturale:

la visione strategica con la quale il Ministero intende promuovere e organizzare il processo di trasformazione digitale nel quinquennio 2022-2026, rivolgendosi in prima istanza ai musei, agli archivi, alle biblioteche, agli istituti centrali e ai luoghi delle cultura statali che possiedono, tutelano, gestiscono e valorizzano beni culturali.

Ho letto le linee guida per la circolazione e il riuso delle immagini, e ho capito che la linea del MIC – “cacciateci i soldi” – non è cambiata di una iota. La cosa peggiore è che il piano pare essere un patchwork: le sue premesse sono assolutamente condivisibili, ma nella fase di assemblaggio qualcuno ha ben pensato di disattendere tali premesse per una presunta capacità di ottenere ricavi.

Tanto per essere chiari: non c’è nulla di male se il MIC vuole creare e vendere degli NFT a partire dalle opere che ha in cura. Io non riesco a capire perché uno vorrebbe mai avere un NFT, ma è evidente che c’è gente che invece li vuole; e allora che li si faccia e li si venda. Tanto quelli sono per definizione entità non copiabili, o se preferite uniche. I problemi sono altri. Per esempio,l’avere un sistema NC (non commerciale) per default sui contenuti in pubblico dominio, cosa che è incompatibile con i progetti Wikimedia e OpenStreetMap. Il tutto con una “licenza” (non lo è, e anche nelle linee guida la cosa viene rimarcata) “MIC Standard” che porterà a risultati parossistici. Mi spiego meglio. Se qualcuno chessò negli USA pubblica una traduzione non autorizzata del mio Matematica in pausa caffè, il titolare dei diritti (Codice Edizioni) può contattare le autorità statunitensi, bloccare la vendita e citare a giudizio il malcapitato editore. Questo perché le leggi sul diritto d’autore sono state (più o meno) armonizzate in tutto il mondo, e quindi i diritti di sfruttamento economico sono tutelati ovunque. Ma se lo stesso qualcuno usa commercialmente un’immagine del Colosseo con l’etichetta – esplicita o implicita – “MIC Standard”, il ministro può strillare quanto vuole ma non succederà nulla, perché dal punto di vista delle autorità USA quell’immagine è nel pubblico dominio. Insomma, gli unici eventuali guadagni arriverebbero dai nostri compatrioti, mentre all’estero potrebbero fare quello che vogliono.

Per quanto riguarda Wikipedia Commons, c’è persino una citazione esplicita:

Il download di riproduzioni di beni culturali pubblicati in siti web di terze parti non è sotto il controllo dell’ente pubblico che ha in consegna i beni (ad es. le immagini di beni culturali scaricabili da Wikimedia Commons, realizzate “liberamente” dai contributori con mezzi propri per fini di libera manifestazione del pensiero e attività creativa, e quindi nella piena legittimità del Codice dei beni culturali). Rimane nelle competenze dell’istituto culturale l’applicazione di corrispettivi per i successivi usi commerciali delle riproduzioni pubblicate da terze parti.

Rileggete questa frase. Ve la traduco in italiano corrente: Wikimedia Commons viene trattata alla stregua di una vetrina pubblicitaria dove l’unico lavoro da parte dello stato è farsi dare i soldi da chi prende da lì del materiale. Come forse immaginate, non è che la cosa ci piaccia più di tanto…

Ah: al MIC non piace proprio la CC0, la licenza che formalizza il rilascio di un oggetto o un’informazione nel pubblico dominio. Infatti (grassetto mio) si legge che

l’uso di dati e riproduzioni digitali del patrimonio culturale per finalità di studio, ricerca, libera manifestazione del pensiero o espressione creativa, promozione della conoscenza, che non abbiano scopo di lucro diretto è libero per legge;

Quindi anche i metadati – a differenza per esempio di Wikidata, dove tutti gli elementi presenti hanno licenza CC0 – sono sotto una licenza di tipo NC. La digitalizzazione dei metadati è insomma qualcosa che si può fare solo per offrirlo poi gentilmente al MIC che sicuramente ci farà tanti soldi. Che gioia, vero?

L’età dei personaggi pubblici


Magari qualcuno si può chiedere perché l’anno scorso GQ ha pensato di dedicare un articolo a Stefania Rocca per il suo… quarantaseiesimo compleanno. A parte Valentino Rossi, il 46 non è che dica molto, non è mica il quarantadue! Se questo qualcuno è curioso, però, magari dà un’occhiata all’URL dell’articolo e scopre che c’è scritto “stefania-rocca-50-anni-rock”. In effetti, ricordare il cinquantesimo compleanno ha molto più senso, su questo non ci piove. E in effetti si fa in fretta ad andare sull’Internet Archive e vedere che l’articolo originale si intitolava “Stefania Rocca, i primi 50 anni di un’anima rock”.

L’altra settimana, però, la signora Rocca e/o il suo agente hanno deciso che il passato era passato, e quindi l’età della signora Rocca è di soli 47 anni. Per posti come GQ ci devono essere argomenti molto convincenti per fare riscrivere un articolo pubblicato l’anno scorso; su Wikipedia la cosa potrebbe sembrare banale ma in realtà è un po’ più complicata, come potete vedere. Mi è stato riferito (ma potrebbe essere una malignità…) che l’agente in questione ha mandato alla Wikimedia Foundation un codice fiscale della signora Rocca dove risulta il 1975 come data di nascita… ma il codice fiscale in questione corrisponde a un maschio e non a una femmina.

Ad ogni modo, la signora Rocca non è certo l’unica persona a cercare di inserire su Wikipedia una data di nascita diversa da quella che era sempre stata considerata tale in passato. Il primo caso che mi viene in mente è quello del mago Silvan (simsalabim!), ma anche Elisabetta Sgarbi, come già scrissi, afferma di essere nata nel 1965 come anche riportato dalla Treccani: il talento della signora Sgarbi si notava fin da ragazza, considerando che ha conseguito la laurea in farmacia nel 1980… Avevo anche segnalato alla Treccani che nel sito c’era stato uno scambio di caratteri, e il 1956 che è la data di nascita della signora Sgarbi era diventato 1965, ma non mi hanno mai risposto. Non so se Wikipedia abbia più errori della Treccani, ma sicuramente correggerli è più semplice!

Cina, Wikipedia e copyright

Probabilmente non ve ne sarete accorti, visto che la notizia è passata solo su Wired (dove il titolista fa ancora fatica a distinguere Wikipedia da Wikimedia…) e CorCom: per il terzo anno consecutivo la Cina ha bloccato l’ingresso del movimento Wikimedia come osservatore in WIPO, l’agenzia delle Nazioni Unite che ha lo scopo di incoraggiare l’attività creativa e promuovere la protezione della proprietà intellettuale nel mondo. Dopo due anni in cui Wikimedia Foundation ha inutilmente cercato di essere accreditata, stavolta le richieste sono state fatte da alcuni capitoli nazionali (Francia, Germania, Messico, Svezia e Svizzera oltre all’Italia), e la richiesta esta stata portata al Comitato Permanente sul Copyright e i Diritti Connessi (SCCR) di WIPO. Niente da fare: come le altre volte, la Cina ha dichiarato he anche i capitoli Wikimedia locali sono complici nel diffondere disinformazione. Negli anni passati il dito veniva puntato contro Wikimedia Taiwan, indicato come eterodiretto dalla Foundation: quest’anno direi che non c’è nemmeno stato bisogno per i cinesi di cercare di spiegare quale disinformazione sul copyright cinese viene propagata da Svezia o Messico. A questo punto Nicaragua, Bolivia, Venezuela, Iran e Russia hanno colto la palla al balzo e fatto rinviare la decisione sull’accreditamento per mancanza di unanimità.

Anche ammettendo che Wikimedia Taiwan faccia opera di disinformazione assoldando persone che scrivano sulle varie edizioni linguistiche di Wikipedia, resta il punto di partenza. Qui stiamo parlando di un comitato che parla di copyright e diritti connessi – cosa che ci ha sempre visti coinvolti come Wikimedia Italia. Essere membri osservatori non ci avrebbe per definizione dato il diritto di voto, ma ci avrebbe permesso di far sentire meglio la nostra voce su temi di cui ci occupiamo da sempre. Invece nulla da fare, e questo per ragioni prettamente politiche e indipendenti dal tema istituzionale. Non che ci aspettassimo chissà cosa, ma resta un peccato…