Tante parole su Wikipedia

A otto anni dalla nascita di quello che al tempo era un progetto ausiliario per la creazione di un'enciclopedia "classica", Wikipedia è ormai una realtà incontrovertibile. Io non sono uno dei primissimi contributori dell'enciclopedia – avevo provato a vedere l'edizione in inglese subito dopo che era stata lanciata, ma non ero in grado di dare un contributo utile in un buon inglese, quindi lasciai perdere e non entrai nel primo nucleo di pionieri della versione in lingua italiana. Però ho comunque una certa qual anzianità: ho iniziato a contribuire nel luglio 2004, subito dopo le grandi diatribe sulla scelta di inserire tutti i comuni italiani e passare così da meno di 15000 a più di 22000 voci. Ho perciò visto buona parte dell'evoluzione dell'enciclopedia e credo di poter dire qualcosa al riguardo. Ho pensato così di raccontare qualcosa da un punto di vista un po' mio e un po' – se ci riesco – di una persona che Wikipedia la usa, vorrebbe magari saperne di più, ma non è per nulla interessato a sapere come funziona tecnicamente. Mi concentrerò sull'edizione in lingua italiana (it.wiki, per gli amici) che poi è quella che interessa maggiormente noi italiofoni, anche se confesso che a volte vado a consultare quella in lingua inglese, perché in certi casi la versione italiana non è ancora così completa.

Questo testo è nato dopo uno scambio di email con Fabio Metitieri, e con l'aiuto di Gianluigi Gamba, Mario Benvenuti e Frieda Brioschi; spero sia superfluo aggiungere che tutto quello che scriverò è a titolo puramente personale e non ha nulla di ufficiale.

L'evoluzione di Wikipedia

Vorrei innanzitutto rimarcare una cosa: in questi anni Wikipedia è cambiata moltissimo. È chiaro che si è ampliata a dismisura nel numero di voci presenti, ma quello non è che la punta dell'iceberg. Parlerò più diffusamente nel seguito di come it.wiki si ponga oggi rispetto alle aspettative che si hanno per un'enciclopedia; qui sotto racconto cosa essa fosse nel 2004, e come sono cambiate le cose. Qualche statistica la trovate anche qui.

Oggi la situazione è insomma molto diversa dal 2004, non solo per la Wikipedia in lingua inglese ma anche per quella in lingua italiana. Ma non è certo tutto oro quello che luccica! Ci sono ancora molte cose da fare per avvicinarsi al sogno di un'enciclopedia generalista perfetta: accenno ad alcune di esse.

Aggiungo subito che non ho alcuna ricetta per risolvere questi problemi: ritengo però che sia opportuno esplicitarli, e non lasciarli sottotraccia come capita spesso... sperando che non si finisca come al solito a fare interminabili e inconcludenti discussioni.

Wikipedia e le fonti

Ora che Wikipedia è così famosa, capita sempre più spesso che qualcuno la utilizzi come fonte: detto in parole povere, prenda una voce dall'enciclopedia e la ritenga verità assoluta. Se Enzo Jannacci aggiornasse oggi il testo della sua canzone Quelli che..., immagino che al posto di "l'ha detto il telegiornale!" canterebbe "l'ha detto Wikipedia!" Di per sé copiare dall'enciclopedia non è affatto vietato, anzi: peccato che troppo spesso la gente – anche i giornalisti, sì – "si dimenticano" che la licenza d'uso prevede di indicare esplicitamente da dove è stato tratto il testo. Ma non è di questo che vorrei parlare, quanto del concetto di "fonte" e delle sue conseguenze in Wikipedia.

Innanzitutto, Wikipedia è per definizione una fonte secondaria, se non addirittura terziaria. Mi spiego: una fonte primaria è un testo dove si presentano per la prima volta i risultati di una ricerca, o in generale una notizia. Una fonte secondaria è quella che cita delle fonti primarie, un po' come la rassegna stampa che non è un giornale ma contiene ritagli dai vari giornali; una fonte terziaria fa lo stesso con tutte le fonti, primarie, secondarie o terziarie che siano. In Wikipedia questo concetto è riassunto con le parole forse un po' fuorvianti "niente ricerche originali". Ciò significa che Wikipedia non è il posto dove scrivere la vostra relazione sull'evoluzione delle corolle dei fiori nell'alta val Brembana. Non perché non sia una interessante, ma perché Wikipedia non vuole essere il punto di ingresso delle conoscenze ma vuole raccogliere quanto è stato accettato da qualcun altro. Insomma, per prima cosa pubblicate la vostra ricerca sul Bollettino della Società Fitologica delle Alpi Lombarde, poi venite a inserirla nell'enciclopedia fregiandovi con il link della fonte. Lo stesso vale per le biografie di personaggi oscuri a tutti, se non ai loro parenti che con tanto amore hanno scritto la biografia in questione e magari pubblicato un libro a loro spese o con i nuovi servizi "print on demand".

Discorso ancora diverso, anche se fondamentalmente sulla stessa linea, per le voci sulle aziende. Una voce sulla Fiat non può mancare, e potrebbe anche esserci una voce più specializzata con l'elenco dei modelli d'auto prodotti dalla Fiat nella sua storia, il periodo in cui sono stati commercializzati e il numero di esemplari prodotti (quando ho scritto queste note non c'era, per la cronaca). Però se qualcuno scrivesse della latteria Giobatta Pautasso di Villar Perosa, la voce verrà subito eliminata. Di nuovo, sono in tanti a scrivere della Fiat, e Wikipedia si limita a prendere i dati che si trovano in giro e presentarli in modo organico; non c'è nessuno che parli del buon Pautasso, anche se vende la toma migliore di tutta la valle.

Qual è il confine che permette di dire se una voce è enciclopedica oppure no? Non è specificato da nessuna parte. Ci sono casi borderline che utenti diversi valutano in maniera opposta, anche se sono sorprendentemente poche le votazioni sull'opportunità di mantenere una voce che finiscono con un acceso dibattito. Per dare un'idea, una persona ai limiti dell'enciclopedicità sono io, visti i miei trascorsi informatici come direttore esecutivo della Naming Authority e coordinatore della gerarchia usenet it.*. Nel mio caso personale ci sono ragioni di opportunità che fanno ad ogni modo evitare l'inserimento, ma il concetto di fondo resta quello: per alcuni wikipediani le mie referenze basterebbero, per altri no. Per alcune categorie (calciatori, scrittori...) si sono stabilite delle linee guida per dare un bollino di accettazione – notate che non ci sono linee guida per dire "una voce di una certa categoria non viene inserita – ma non si potrà mai completare una griglia di ammissione.

Lo so che molti sono convinti che la "loro" voce debba avere cittadinanza in Wikipedia, ma il motivo generalmente da loro addotto, "Ma non costa nulla avere una voce in più! Mica ci sono problemi di spazio" cozza contro due problemi. Il primo, come visto in precedenza, è che un costo in effetti c'è, ed è proprio in termini di denaro; il secondo è più filosofico, come spiegato sopra, ed è legato alla scelta di non raccogliere tutta la conoscenza ma solo tutta la conoscenza resa per così dire "ufficiale" da qualcun altro. Se mi è permesso un paragone forse un po' ardito, non si vuole fare la borgesiana mappa 1 a 1 del territorio, che poi venne buttata via perché tanto valeva usare il territorio stesso come mappa. Temiamo poi anche un altro pericolo: qualcuno copia da Wikipedia un'affermazione senza fonti, e a sua volta Wikipedia aggiunge come fonte chi l'aveva. Più che lo scioglilingua, il problema è che in questo modo non c'è nessuna verifica della fonte, il che per un'enciclopedia è un peccato mortale.

È poi chiaro che un alto problema è la scelta delle fonti. In questo campo l'uguaglianza non ha affatto diritto di cittadinanza: penso che siano tutti d'accordo che è ben diverso citare la Treccani, dove si suppone una redazione controlli i vari testi pubblicati, oppure l'Eco di Roccacannuccia che ha un volonteroso tuttofare che assembla il mensile a partire da tutte le dicerie del paese. Ma il problema sorge in altre situazioni. Un testo di una casa editrice nota per pubblicare teorie complottiste è una fonte valida? E chi è che definisce se quell'editore pubblica teorie complottiste? Anche tra i quotidiani più blasonati gli svarioni anche pesanti sono ormai all'ordine del giorno; non basta più citare un articolo per avere la certezza che quanto scritto sia vero. Wikipedia per il momento non prende posizione su questi temi e cerca di limitarsi a indicare le varie possibilità se non ce n'è una assolutamente predominante: ma non è detto che la situazione resti tale e non si crei un elenco di "fonti più considerate".

Una voce di Wikipedia ha però una dimensione in più rispetto a un'enciclopedia normale: la sua cronologia, cioè la possibilità di vedere tutte le modifiche apportate ad essa nel tempo. In teoria è uno strumento molto potente: combinato con la possibilità di sapere tutte le modifiche di un utente alle voci dell'enciclopedia, può infatti permettere di capire se una certa aggiunta o modifica è stata fatta da una persona generalmente affidabile oppure no. Il guaio è che questa operazione è molto complicata, e non viene in pratica fatta mai, se non in due casi molto particolari: l'ultimissima modifica di una voce, per decidere se è valida o reinserire la versione precedente, e la ricerca di violazioni di copyright pregresse, dove viene fatta un'attenta operazione chirurgica per lasciare solamente i contributi corretti cancellando quelli illegali. Se sei un utente non troppo scafato, probabilmente WikiScanner può aiutarti: ti permette infatti di scoprire, nel caso di modifiche alle voci fatte da utenti non registrati, da quale rete tali modifiche provengano. Un altro strumento molto utile, che però richiede un'installazione nel proprio PC, è la History Flow Visualization Application di IBM, che visualizza graficamente le "stratificazione" delle successive versioni di una pagina.

Wikipedia per l'utente comune

Tutto quello che ho scritto fino ad ora è assolutamente e totalmente irrilevante per la stragrande maggioranza di chi usa Wikipedia e la considera alla stregua di un oracolo o della Fonte Prima e Totale di Conoscenza: quelli che... l'ha detto wikipedia. A quanto ne so, nessuno si è cimentato a valutare l'enciclopedia da questo punto di vista, indubbiamente poco purista ma sicuramente di un certo interesse pratico: provo così a farlo io, iniziando da una situazione ideale in cui nessuno si diverta a rovinare le voci dell'enciclopedia e vedendo poi cosa succede nel caso si capiti su una voce resa volontariamente scorretta. Ah, prima che qualcuno mi travisi: non dico che questa metrica (cioè questo modo di misurare la validità dell'enciclopedia) sia l'unica da usare, e nemmeno la migliore. Però vale la pena considerarla.

Le caratteristiche che un'enciclopedia dovrebbe avere sono:

Come si colloca Wikipedia in lingua italiana rispetto a questa metrica? A gennaio 2009 i risultati possono essere sintetizzati nel modo seguente.

L'affidabilità dovrebbe essere generalmente buona. La Wikipedia in lingua inglese è stata messa a confronto con enciclopedie tradizionali mostrando che la quantità e la qualità di imprecisioni ed errori è confrontabile. Non è mai stato fatto un esperimento simile con la versione in italiano; nella mia esperienza sui campi in cui ho una buona conoscenza della materia non mi capita però praticamente mai di dover correggere errori inseriti in buona fede. Per quelli in cattiva fede, vedi oltre :-)

L'aggiornamento è indubbiamente un punto di forza, forse fin troppo. Questo lo si poteva aspettare, visto che il mezzo è aggiornabile in tempo reale; ma spesso è sconcertante vedere inserita la data di morte di un personaggio pubblico qualche minuto dopo che le agenzie hanno battuto la notizia, e occorre bloccare temporaneamente le voci relative al governo italiano quando viene dato l'incarico di Presidente del Consiglio dei Ministri, visto che molti sono convinti che l'incaricato sia già il premier e quindi vanno a emendare le pagine.

Per quanto riguarda l'ampiezza, la situazione è sicuramente buona. Di nuovo, non arriviamo ai livelli dell'edizione in lingua inglese dove si trova davvero di tutto e di più ed è praticamente impossibile finire su un tema non trattato. Se però guardiamo il mezzo milione abbondante di voci in italiano, è vero che ce ne sono moltissime che a essere molto buoni potremmo definire di nicchia; ma tutte quelle più importanti dovrebbero esserci.

La completezza è probabilmente un punto ancora oggi relativamente debole. Intendiamoci: ci sono decine di migliaia di voci complete, chiare e utilizzabili. Il guaio è che ci sono campi per così dire maturi, come ad esempio informatica e fumetti, e altri campi dove è altamente probabile che la voce cercata sia uno "stub" (un abbozzo, cioè poche righe) o in cui la prosa lasci alquanto a desiderare. Io sono della scuola "meglio poco che nulla", però ammetto che spesso il poco è davvero poco. I campi più deboli sono quelli umanistici, dove purtroppo non c'è una massa critica di persone che conoscano bene gli argomenti e siano esperte nell'uso del software: in un certo senso Wikipedia è complementare a un'enciclopedia tradizionale, dove le voci scientifiche sono spesso più delicate.

Sulla comprensibilità, si possono fare ancora degli sforzi, ma direi che Wikipedia è già sulla buona strada. Le linee guida vorrebbero che il primo paragrafo serva per avere una rapida idea generale della voce, mentre il resto del testo dovrebbe servire per gli approfondimenti; quando la dimensione di una voce cresce molto, ad esempio quella sull'Italia, si creano sottovoci ("Storia dell'Italia", "Geografia dell'Italia", ...) a cui si può accedere dalla voce principale, che mantiene un paragrafo di riassunto per chi non è interessato ad approfondimenti troppo spinti. Da questo punto di vista, le voci più a rischio sono quelle delle cosiddette scienze dure (matematica, fisica, ma anche biologia), dove c'è la tendenza ad avere un testo corretto ma arido.

Nonostante quanto si possa pensare, la praticità è un altro punto debole. Il software su cui si basa Wikipedia facilita la creazione di reindirizzamenti a una voce (i cosiddetti redirect, che tra l'altro non entrano nel computo del numero totale di voci), ma la ricerca non è comunque semplicissima. Esiste un motore di ricerca interno, ma la sua qualità lascia alquanto a desiderare: spesso si ottengono migliori risultati cercando direttamente con Google e aggiungendo la chiave site:it.wikipedia.org per restringere la ricerca alle sole pagine dell'enciclopedia. Il problema principale sta nella grafia e nel formato dei lemmi (con o senza maiuscola? con o senza articolo?) Speso può essere utile partire da una voce di argomento simile, andare in fondo alla pagina per trovare le categorie a cui appartiene, e poi viaggiare all'interno dell'albero delle categorie; questa non è però certo un'opzione alla portata di un utente alle prime armi. È invece più facile passare da una voce all'altra di Wikipedia, vista la presenza dei rimandi ipertestuali (quelli sottolineati in blu) da una voce all'altra: forse un po' troppi, secondo la mia personale visione. I "link rossi", quelli che portano a una voce che non esiste, sono controintuitivi per l'utente comune, che si chiede perché vengano messi. Un non-problema è quello del "nome principale", che pure è fonte di accesi dibattiti. Ad esempio, il nome della voce che tratta l'anguria è quello latino scientifico, Citrullus Lanatus. Ma visto che se uno digita "anguria" tanto finisce sulla pagina corretta, per lui la cosa potrà essere buffa ma irrilevante in pratica.

Resta infine la verificabilità, che è diversa dall'affidabilità (le fonti scelte potrebbero essere inaffidabili, e una voce senza fonti potrebbe comunque essere corretta). Innanzitutto occorre tenere presente, come detto in precedenza, che per definizione Wikipedia non è una fonte primaria: questo significa che non è ammesso scrivere qualcosa di nuovo – per esempio la biografia del proprio nonno – ma bisogna che qualcun altro ne abbia parlato ufficialmente. Durante l'impetuosa crescita iniziale dell'enciclopedia le voci più importanti venivano scritte senza badare a inserire riferimenti; negli anni si è però rafforzata l'idea che le fonti sono una parte necessaria. È così facile trovare frasi evidenziate con l'avviso "citazione necessaria" oppure "senza fonti", e una voce importante o controversa può avere decine di note a piè di pagina. Detto questo, resta da rimarcare quanto accennato all'inizio: indicare le fonti non dà comunque garanzia di qualità della voce, soprattutto per chi non sia in grado di valutare la validità delle fonti stesse. Diciamo insomma che la verificabilità è più che altro utile per gli esperti, e ininfluente per l'utente qualunque.

Wikipedia e i vandali

Lasciamo ora da parte l'illusione di una Wikipedia fatta da utenti perfetti, e introduciamo – anche se non vorremmo in realtà esistesse – il concetto di vandalismo, che nel gergo di chi lavora sull'enciclopedia indica una qualunque operazione che attenta alla qualità di una voce anche se fatta involontariamente o in buona fede. Ogni giorno vengono fatti moltissimi vandalismi: la maggior parte di essi viene eliminata nel giro di qualche minuto al massimo, ma alcuni di essi possono rimanere visibili per settimane o anche mesi prima che qualcuno se ne accorga e li corregga. Fortunatamente al momento la probabilità di finire in una pagina vandalizzata è piuttosto bassa: ci sono infatti molte persone che dedicano il loro tempo a favore dell'enciclopedia non per creare o ampliare voci, ma per correggerle. Purtroppo però il numero di questi "patrollatori" cresce più lentamente di quello dei "vandali", e quindi il rischio di trovarsi una pagina rovinata aumenta col passare del tempo.

È ovvio che un vandalismo di qualunque tipo degrada la qualità dell'enciclopedia. Fin qua penso non ci siano dubbi. Ma è meno evidente cosa succeda alla fruibilità per un utilizzatore: come ho scritto, non mi pare che si parli spesso di questo modo di vedere le cose, che pure per l'utente comune è quello più importante. Vediamo dunque cosa succede nel caso di vari tipi di vandalismo, sempre partendo dal punto di vista di un tizio qualunque che vede solo la pagina principale della voce e non sa né vuole sapere di cose tipo la cronologia di una voce che permette di verificarne la storia e notare eventuali discrepanze.

La prima cosa da tenere a mente è che a parità di vandalismo, più la voce è importante più esso è visibile. Modificare la voce su Dante, Manzoni o Berlusconi significa aumentare la probabilità che qualcuno capiti nella pagina sfregiata, mentre rovinare la pagina di un comune della Polonia rischia di essere un'operazione concettuale di cui nessuno si accorgerà, perché a nessuno verrà in mente di consultare proprio quella pagina. Questo assioma porta a due corollari. Il primo è pragmatico: sono in molti a tenere sotto controllo le voci più importanti, e quindi il tempo che trascorre tra un vandalismo e la sua correzione è molto basso. Viceversa, le voci meno importanti possono restare vandalizzate per un tempo indefinito, proprio perché nessuno le tiene sott'occhio.
La seconda cosa da sapere può sembrare a prima vista incredibile: le voci create (non modificate) per puro vandalismo – spesso goliardico in questo caso – non sono generalmente un grande pericolo per l'utente casuale. Di nuovo, molti danno regolarmente un'occhiata alle voci che vengono create ex novo, e quindi è improbabile che una voce goliardica sopravviva per più di qualche ora; d'altro canto, una voce "Concetta Scraccaturi" il cui testo è "ha 15 anni, fa la II liceo a Piazza Armerina e le puzzano le ascelle" verrà cercata solo da chi sa che qualcuno l'ha inserita: nessuno ci capita a caso.

Passiamo ora alle modifiche alle voci. Anche in questo caso ci sono vari scenari. Una possibilità è che il testo della voce venga completamente eliminato, o sostituito con una frase tipo "Fate tutti skifo!!!!" con opportuno numero di punti esclamativi. Modifiche di questo genere vengono di solito corrette molto in fretta, perché nei file di log saltano subito all'occhio. Ma anche se non fosse così, per il consultatore casuale dell'enciclopedia quella che viene percepita è un'incompletezza dell'enciclopedia, il che è una brutta cosa ma non è una tragedia... a meno che uno non abbia preso Wikipedia come succedanea del babbo che per un bimbo, oltre che essere il più bravo e il più forte di tutti, è anche onnisciente. L'utente farà una scrollata di spalle, dirà che non è vero che Wikipedia sappia proprio tutto, e si rivolgerà altrove: magari a un clone dell'enciclopedia che non era aggiornato e quindi non è stato toccato dal vandalismo.

La cancellazione di una o più sezioni di una voce è un po' diversa. Fortunatamente anche questo tipo di vandalismi viene rapidamente corretto dai patrollatori; ma se questo non accade, l'utente casuale non si accorge di cosa è successo, e quindi rimane convinto di avere trovato tutto quello che valesse la pena conoscere sull'argomento. Ricordiamoci che usare Wikipedia significa generalmente cercare un riassunto premasticato, il che non è necessariamente un male ma in alcuni casi può appunto essere pericoloso. Ecco dunque un caso di modifica invisibile all'utente tipico ma nociva per la qualità dell'enciclopedia.

Ci sono infine le aggiunte e modifiche al testo. È molto raro che le aggiunte siano molto lunghe: se questo capita, si tratta generalmente di qualcuno che vuole aggiungere ad ogni costo la sua opinione o commento personale, spesso in un italiano pesante e/o sgrammaticato; tali aggiunte mi sa tanto che vengano saltate a piè pari da chi legge, oltre ad essere facilmente notate ed eliminate. Le aggiunte del tipo "scemo chi legge" danno un'impressione di scarsa qualità di Wikipedia, ma non tolgono nulla al trasferimento di informazione dall'enciclopedia all'utente.

Il caso veramente preoccupante è quello delle aggiunte, cancellazioni o sostituzioni minime al testo. Queste modifiche sono molto difficili da notare: se una voce non è tra gli "osservati speciali" di qualcuno, vale a dire un insieme di voci di cui il sistema segnala tutti i cambiamenti, una modifica di questo tipo può davvero passare inosservata per un tempo indefinito, e far sì che una voce sia sbagliata o peggio ancora fuorviante. Più la modifica è verosimile, più difficile è accorgersene: se scrivo che l'altezza di Torino è 1249 metri sul livello del mare è probabile che il lettore si accorga che c'è qualcosa che non va, anche se non potrà sapere qual è l'altezza effettiva. Ma se scrivo che è 219 metri sono ragionevolmente certo che il dato sarà preso per buono... e magari citato da qualche giornale. Garantisco che cose del genere sono all'ordine del giorno: io ad esempio tengo d'occhio le voci su Marco Pantani e Cristina Chiabotto perché ogni tanto qualcuno si diverte a cambiare leggermente altezza e peso, dati che sono presi dai loro siti ufficiali.

A mio parere, il problema delle modifiche sottili è quindi estremamente importante, anche se non pare sia molto sentito; come sempre, sono le modifiche di grandi dimensioni quelle che "fanno notizia". In ogni caso, comunque, occorrerà trovare una soluzione. Personalmente io sono favorevole al metodo utilizzato nella Wikipedia in lingua tedesca, dove ogni voce ha due versioni: quella "istantanea" e quella verificata. La prima è l'ultima versione della voce, esattamente come capita adesso; la seconda è l'ultima versione che ha avuto un "bollino di qualità" da un utente fidato. Se uno accede all'enciclopedia come anonimo vedrà la versione verificata, con una nota che lo avviserà che ce n'è anche una non verificata e più aggiornata che se vuole potrà andare a vedere; per l'utente registrato capiterà l'opposto, con la versione con le ultime modifiche presentata per default e l'eventuale nota che avvisa che tale voce non è stata ancora verificata e dà un collegamento alla versione "accertata"; infine l'utente fidato potrà mettere il bollino di accettazione sulla voce. Come notate, tutto è sempre disponibile – il che dal mio punto di vista è una condizione imprescindibile per Wikipedia – ma la presentazione è diversa. È chiaro che questa soluzione non ha nessun effetto sulla qualità in genere della voce, ma questo non è un problema, o meglio non è un nuovo problema.

Ah, se siete curiosi di sapere chi siano questi vandali, ecco qualche ritratto tipico.

Come vedete, ce n'è per tutti i gusti!

Per il momento – dopo meno di trentacinquemila battute complessive – è tutto. Spero che il mio punto di vista sia stato interessante e vi abbia dato qualche idea nuova.

Versione 1.00 - 13 gennaio 2009 - © .mau.
torna all'indice della sezione articoli
torna alla home page di .mau.