La “conoscenza” di Google

Quando fate una ricerca Google, spesso trovate nella colonna di destra un risultato già pronto, molto spesso da Wikipedia. Per dire, se io mi cerco arriva il risultato che vedete qui a sinistra. (Your mileage may vary: probabilmente a voi potrebbe arrivare il calciatore mio omonimo). Generalmente quelle informazioni sono prese da Wikipedia, citando regolarmente la fonte; ci sono eccezioni come nel mio caso, visto che come sapete Wikipedia non ha una voce su di me e quindi le informazioni arrivano dal sito del mio editore, ma in genere funziona così. Google aveva anche cercato di creare una sua base di conoscenza, ma alla fine ha visto che era più semplice dare du’ spicci alla Wikimedia Foundation e sfruttare il lavoro dei wikipediani. Solo che ci sono alcuni problemi…

A volte capita qualcuno che si lamenta perché trova un insulto nel testo di quella colonna, insulto che però non appare da nessuna parte su Wikipedia. Non sto a spiegarvi come lo si può fare, anche se è un segreto di Pulcinella; in quel caso però la colpa è in effetti anche di Wikipedia. Ma ci sono casi peggiori. Nell’ultimo mese, per due volte sono stato contattato da qualcuno che trovava la sua foto con allegata la descrizione da Wikipedia di tutt’altra persona, e chiedeva di toglierla. Il primo caso è stato quello di un giornalista a cui corrispondeva la biografia di un avvocato del secolo scorso; la seconda persona è Mario Moroni, che se vi ricordate mi aveva intervistato un paio di mesi fa. Qui Wikipedia non c’entra proprio nulla; molto semplicemente, le voci mostrate non hanno immagini a corredo – ricordate che anche le immagini su Wikipedia devono avere una licenza libera, quindi spesso è impossibile averne qualcuna. E allora che fa Google? Cerca in giro e prende l’immagine più cliccata corrispondente a quel nome-e-cognome, nel migliore esempio di stupidità applicata.

Ma la cosa peggiore è che Moroni prima di me aveva contattato Google che gli aveva detto che la colpa era di Wikipedia; e dopo che lui aveva riportato la mia risposta gli hanno replicato che se non c’è una voce wiki su una persona inseriscono la descrizione dell’omonimo con la foto di quella persona perché non possono verificarla. Posso dire che c’è qualcosa che non funziona in questo approccio?

Wikipedia farà pagare le aziende che la sfruttano?

In questi giorni si è parlato molto del progetto di Wikipedia “per farsi pagare dai Big Tech”: potete per esempio leggere HDBlog oppure (in inglese) Wired. Ho sentito anche alcuni wikipediani che si sono lamentati perché in questo modo Wikipedia introduce una differenza tra utenti di serie A e di serie B. Io personalmente non sono così negativo su questa novità, anche se ho dei dubbi sulla sua utilità pratica. Provo a spiegarvi il perché.

Innanzitutto, forse conviene partire dalle fonti originali: qui c’è la presentazione ufficiale del progetto sul blog della Wikimedia Foundation, mentre queste sono le FAQ, quasi tutte tradotte in italiano al momento in cui sto scrivendo questo post. Vi ricordo innanzitutto che la licenza d’uso di Wikipedia permette il riuso del materiale anche a scopi commerciali, e quindi non si può forzare nessuno a fare nulla. A questo punto l’unico modello possibile è quello di fornire un servizio freemium. Vuoi qualcosa più comodo? Paghi. Ecco dunque l’idea alla base di Wikimedia Enterprise: i pochi grandi player che hanno bisogno di tanti dati possono decidere di pagare per averli in modo più rapidamente usabile. Se non riterranno che il gioco valga la candela, continueranno a fare come ora: immagino che l’idea della Wikimedia Foundation sia che ci sarà una pressione esterna (“guardate XXX! Con tutti i soldi che guadagna non vuole nemmeno spendere du’ spicci per l’accesso Enterprise a Wikipedia!”). La cosa ha senso: nessuno ci perde, visto che le informazioni saranno sempre disponibili e a noi comuni mortali i metodi attuali per ottenerle da Wikipedia sono sufficienti. Fin qui per le buone notizie.

E le notizie cattive? La prima l’ho accennata all’inizio. La comunità dei wikipediani non è per nulla convinta di questa svolta. Un paio di anni fa la Wikimedia Foundation chiese al movimento quali dovevano essere le priorità per Wikipedia nel prossimo decennio; la creazione di queste API rimase in fondo alla classifica. Perché allora è stata implementata praticamente per prima? Ufficialmente perché era l’unica proposta la cui preparazione dipendeva solo dalla WMF. È possibile che sia successo effettivamente questo, ma da un punto di vista politico non mi pare una grande idea. La seconda è che la manutenzione di questo nuovo sistema potrebbe distogliere risorse dal miglioramento di altre caratteristiche tecniche di Wikipedia che sarebbero più comode per chi le voci le crea e mantiene in ordine. Questo non dovrebbe capitare, di per sé: ma cosa succederà se ci si accorgesse che certe scelte implementative rendono più complicato gestire Wikipedia Enterprise?

Ad ogni modo, nel breve termine noi utenti non vedremo nulla di diverso dal solito: inutile insomma fasciarsi subito la testa!

Le mille insidie del copyright

Conoscete la rivista La difesa della razza? È stata pubblicata tra il 1938 e il 1943, e come potete capire dal nome nasceva come braccio militante della campagna fascista contro gli ebrei (e le altre razze inferiori, dai negri agli zingari). Gli articoli della rivista erano spesso scritti da giovani letterati che poi hanno fatto carriera: Giorgio Almirante dovreste ricordarvelo in tanti, ma per esempio ho trovato un articolo di Vincenzo Buonassisi che almeno quelli della mia età conoscevano come critico gastronomico televisivo.

Secondo la legge sul diritto d’autore, la rivista è nel pubblico dominio, essendo passati 70 anni dalla sua pubblicazione. E in effetti potete scaricarla in vari posti, dalla Biblioteca di storia moderna e contemporanea a Wikimedia Commons. Fin qua sembrerebbe tutto chiaro. Però volevamo prendere la rivista e trascriverla su Wikisource: almeno per quanto mi riguarda è un documento molto importante e sarebbe utile averlo in un formato che permetta di copincollare il testo. Bene, la cosa non si può fare.

Come mai? Semplice (si fa per dire). Una rivista è definita come “opera collettiva”, il che significa che gli autori mantengono i loro diritti sui loro articoli, e questi diritti restano fino a settant’anni dopo la loro morte. Pertanto la rivsta come un tutto è disponibile, ma i singoli articoli no. Ma per come è fatta Wikisource, le singole pagine della rivista corrispondono a un file separato, e quindi si entra nel campo delle opere singole. Favoloso, vero?

Quando il deadname non era ancora morto

Come probabilmente sapete, Caitlyn_Jenner nacque col nome Bruce Jenner, e con quel nome vinse la medaglia d’oro nel decathlon nelle olimpiadi di Montréal. La pagina di Wikipedia è per l’appunto con il nome Caiytlin (se uno digita “Bruce” viene rimandato alla voce con il nome femminile); quando finalmente sono state disponibili foto post-transizione con licenza libera esse sono state aggiunte; la voce usa generalmente il femminile per riferirsi a Jenner, e fin qua direi che è tutto ok.

Però la frase nell’incipit è “In carriera, prima della transizione, fu campione olimpico del decathlon ai Giochi di Montréal 1976, nonché detentore del record mondiale della specialità dall’agosto 1975 al maggio 1980.” Regolarmente qualcuno mette quella frase al femminile, e io regolarmente la rimetto al maschile. Perché? Perché in quegli anni non aveva ancora affermato pubblicamente di essere transgender, e perché scrivere “campionessa olimpica” e “detentrice del record mondiale” genererebbero equivoci. Certo, si potrebbe scrivere “campionessa olimpica del decathlon maschile” e “detentrice del record mondiale maschile”, ma io ritengo che siano frasi così arzigogolate da peggiorare comunque la situazione.

(Lo so, mi piglierò una bordata di insulti per questo post. Amen.)

Quei vigliacchi di Wikipedia


Occhei, il post è di più di un anno fa ma l’ho scoperto solo in questi giorni. La pagina Facebook in questione ha questa descrizione:

«Questa pagina ha lo scopo di migliorare la qualità di Wikipedia attraverso la segnalazione di notizie inesatte, di notizie non riportate, di notizie riportate in maniera non corretta. Non saranno accettati post che trattano di altri argomenti.»

Come vedete, però, dopo alcuni mesi l’anonimo creatore della pagina ha pensato di non segnalare più, perché «questi buffoni da quattro soldi, essendo anche vigliacchi, usavano le mie informazioni per correggere e migliorare le pagine!» Premesso che non ho idea se le pagine in questione siano state corrette a causa delle sue segnalazioni o semplicemente perché qualcuno si è accorto autonomamente degli errori, credo che sia la prima volta che mi capiti di vedere qualcuno che si lamenta perché gli errori sono stati corretti. Ma non preoccupatevi! Il post continua così:

«Sto raccogliendo tutte le “le carenze” in una pubblicazione che renderà note, tutte insieme, lacune e bugie.
Ovviamente l’azione legale va avanti perchè anche se cancellano e correggono, tutto rimane nella cronologia.»

Dopo più di un anno non si è visto ancora nulla: probabilmente il raccogliente è vittima dell’effetto Tristram Shandy, e ci mette due giorni a recuperare tutti gli errori inseriti in una singola giornata…

Non si può vincere contro gli impaginatori!


Stamattina Il Sole-24 Ore pubblica un articolo di Riccardo Oldani per i vent’anni di Wikipedia, con intervista alla presidente di Wikimedia Italia Iolanda Pensa. L’articolo termina con questo capoverso:

È dunque il caso di festeggiare per i 20 anni di Wikipedia. Chiunque volesse farlo, il 15 gennaio o nei giorni successivi, può anche regalare un contenuto a licenza libera, per esempio caricando una foto, inserendo una nuova voce o modificandone una esistente.
Lo fa anche Il Sole 24 Ore: questo articolo è rilasciato con la licenza libera Creative Commons Attribuzione – Condividi allo stesso modo 4.0. Buon compleanno Wikipedia!

e come wikipediani ringraziamo per il regalo. Però evidentemente gli impaginatori non erano della stessa idea, visto che come usuale l’articolo termina con Riproduzione riservata © come da articolo 65 della legge 633/41… Non preoccupatevi, però. È assolutamente legale che un’opera intellettuale abbia più di una licenza: in questo caso ogni utilizzatore può scegliere quella che preferisce. Perfino quando si scrive su Wikipedia si pubblica con più di una licenza: infatti, «Pubblicando, accetti le condizioni d’uso comprensive della informativa sulla riservatezza e accetti irrevocabilmente di pubblicare il tuo contributo sotto le licenze CC BY-SA 3.0 e GFDL.» È vero che in genere la doppia licenza serve solo per casi particolari, ma in questo caso appare chiaro che tutti coloro che riprendono quell’articolo lo faranno con CC-BY-SA 4.0. Resta però l’immagine buffa…

Vent’anni di Wikipedia

Il 15 gennaio 2001 entrò in rete il sito www.wikipedia.com (no, il nome del dominio non è un errore). Dopo vent’anni siamo ancora qui, nonostante già nel 2013 ci fossero uccelli del malaugurio. Perché funziona ancora? Mah, la storia è lunga e secondo me le risposte possono essere tante. Quello che vorrei far notare è che anche se a prima vista negli ultimi dieci anni l’aspetto dell’enciclopedia è rimasto lo stesso ci sono state molte migliorie dietro le quinte. Finalmente anche il mondo accademico ha generalmente superato la fase “Non usatela, perché è il MALE!” per arrivare a “Usatela pure, ma solo come punto di partenza” che mi pare molto più aderente alla realtà. Merito loro ad aver cambiato idea, ma probabilmente anche merito nostro che abbiamo cominciato a lavorare sul serio, cercando di inserire sempre le fonti usate per i testi e dando quindi la possibilità di permettere agli interessati di leggere altrove le informazioni. Pensateci un attimo: tutti i social network cercano di trattenerti per quanto possibile al loro interno, mentre Wikipedia fa di tutto per farti andare altrove! (Non che la cosa funzioni così tanto: io almeno mi trovo sempre impelagato a leggere voce dopo voce).

Se volete un resoconto (in inglese…) a più voci della storia di Wikipedia in questo ventennio potete andare su Medium: se volete sentire la mia brutta voce potete provare verso le 15:10 su InBlu2000 e forse anche intorno alle 21:30 su Radio Popolare.