Archivi categoria: wikipedia

Wikipedia cambia licenza

In questi giorni, gli utenti di wikipedia e dei progetti fratelli votano per cambiare la licenza d’uso dei contenuti dell’enciclopedia: maggiori informazioni si possono trovare a partire dal Bar di Wikipedia.
Per chi fosse interessato a un riassunto: Wikipedia è liberamente distribuibile, ci si può fare anche i soldi vendendo il suo contenuto, però esige che il lavoro dei suoi contributori sia riconosciuto formalmente. Quando l’enciclopedia libera nacque, l’unico modo con un certo seguito di assicurarsi legalmente della cosa era licenziare il contenuto sotto la GNU Free Documentation License (GFDL). Non che siano in molti a seguirla in pratica, basta vedere quanti giornali copiano allegramente le notizie senza nemmeno una riga che spieghi da dove sono state prese. Però è anche vero che la GFDL era nata per la documentazione del software, e ha dei vincoli pesantucci, tipo dover allegare tutto il testo della licenza se appena si superava la cosiddetta “corta citazione”. Con la crescita dell’importanza di Wikipedia il limite diventava sempre più complicato, soprattutto per i contenuti non testuali; intanto le licenze Creative Commons erano nate e stavano prosperando. Così c’è stato un accordo tra le varie parti in gioco, e si è aperta una finestra di tempo che permette di modificare la licenziabilità dei contenuti in GFDL.
Se la proposta otterrà la maggioranza dei voti degli utenti, i contenuti attuali di Wikipedia avranno una doppia licenza: GFDL oppure Creative Commons – Attribution – Share Alike 3.0 (CC-BY-SA). I contributi futuri avranno la doppia licenza se aggiornamenti di materiale preesistente, altrimenti solo la CC-BY-SA. Dal punto di vista di chi contribuisce, non dovrebbe cambiare molto: l’attribuzione resta intatta. Il materiale però dovrebbe essere più facilmente redistribuibile, e gli ottimisti possono sperare che finalmente venga detto chiaramente quando le informazioni vengono prese da wikipedia. Spero che nessuno decida di fare una battaglia legale per il cambio di licenza – cosa teoricamente possibile, e che potrebbe portare a un incubo di versioni separate – e soprattutto spero che sia sempre più facile condividere materiale nel rispetto del lavoro di tutti.

Ultimo aggiornamento: 2009-04-14 12:08

Wikipedia come l’aspirina

Non so se vi sia capitato di vedere questo articolo di Repubblica. Nulla di realmente interessante, di per sé, a meno che non siate intenzionati a cercare un po’ di fumo, siate convinti che nessun poliziotto guardi il sito, e il nostro governo non abbia ancora oscurato l’indirizzo ip di webehigh.com.
Ma guardando più attentamente c’è una novità, o almeno è la prima volta che mi capita di vederlo scritto bello in grande già lì sul titolo (“Ecco la wikipedia dell’erba”). Si celebra il passaggio di wikipedia da nome proprio dell’Enciclopedia Libera a nome comune di una qualunque raccolta di dati scritta in maniera collaborativa. Non sono riuscito a vedere il sito di webehigh – nemmeno via open proxy – per capire se sia un wiki generico oppure nemmeno quello: non che la cosa cambi molto.
Il paragone con l’aspirina non l’ho scelto a caso: la Bayer per decenni ha fatto il cane da guardia per evitare che il nome venisse usato in modo generico e perdesse quindi i diritti sul marchio (a quanto pare nel Regno Unito non c’è riuscita). Non credo che la Wikimedia Foundation, che detiene i diritti sul marchio Wikipedia, farà qualcosa in proposito; certo però che è un segno della pervasività di Wikipedia (o se siete proprio cattivi, dell’incapacità di qualche giornalista di distinguere un sito da un concetto… ma in un certo senso è poi la stessa cosa)

Ultimo aggiornamento: 2009-02-08 07:00

I filtri a Wikipedia

Non so se avete sentito parlare (ad esempio lo potete leggere su La Stampa) della proposta fatta dal fondatore di Wikipedia Jimmy Wales di “mettere un filtro” a Wikipedia: più precisamente, di implementare un sistema di controllo “per cui prima della pubblicazione di una modifica o di una nuova voce servirà il vaglio di uno degli editori”. Visto che un paio di mesi fa ero andato a vedere cosa stava succedendo, posso spiegare le cose un po’ più a fondo. Per la cronaca, l’annuncio ufficiale (in inglese) si trova qui.
Innanzitutto una precisazione: la proposta vale per Wikipedia in lingua inglese. Ciascuna edizione di Wikipedia, ha le sue regole ed è assolutamente indipendente dalle altre edizioni. Quindi l’edizione in lingua italiana potrebbe decidere di non implementare i filtri anche se quella in inglese lo farà, oppure può capitare l’opposto, o ancora le due edizioni potrebbero implementare i filtri in maniera diversa – credo sia questo il significato della frase riportata «Datemi entro sette giorni un’alternativa da votare nelle due settimane successive». Sì, perché la possibilità teorica di filtrare è già presente nel software da quasi un anno, come si può leggere nella pagina relativa, e un’implementazione è stata fatta nella wikipedia in lingua tedesca. Sono così andato a vedere cosa succede là.
[vista per un utente registrato] Quella che vedete qui a sinistra è una sezione (in alto a destra, per la precisione) di quello che ho visto accedendo come utente registrato alla voce Arne Friedrich che era stata appena modificata. Si nota che viene visualizzata l’ultima versione, che è segnalata come draft: c’è un link (“view page”) per vedere l’ultima versione verificata, ed è possibile anche confrontare (“compare”) queste due versioni, per vedere cosa è cambiato. Cliccando sull’ultimo link (“+/-“) si scopre che “L’ultima versione visionata è stata approvata il 17 dic 2008. 1 modifica ha bisogno di una revisione.” Io non sono un editor approvato per la versione tedesca di Wikipedia, quindi non ho avuto la possibilità di segnare la modifica come verificata.
[vista per un utente non registrato] Entrando come utente non registrato, la pagina appare diversa, come vedete a destra. Appare la versione verificata (“Gesichtet”: come è facile immaginare, se uno non è registrato si deve cuccare tutti i messaggi nella lingua dell’enciclopedia, visto che non ha la possibilità di settarseli), e un link che permette di vedere comunque l’ultima versione (“zur aktuellen Version”). Nel caso una voce fosse così nuova da non essere ancora stata verificata, essa appare con l’avviso “Keine Version gesichtet” (nessuna versione controllata). Per la curiosità, la modifica era stata fatta da un utente anonimo, e consisteva nel togliere una frase probabilmente ridondante: si è passati da così a così.
Il mio punto di vista è che un’implementazione di questo tipo, dove comunque si ha sempre a disposizione l’ultima versione al semplice costo di un clic in più, male non faccia: non si nasconde nulla, anche nel caso di un utente non registrato al limite si mette qualcosa sotto il tappeto ma si avvisa che sotto il tappeto c’è appunto qualcosa. L’utente registrato può scegliere se vedere la versione verificata oppure la più recente, quindi per lui massima libertà. Certo che se l’implementazione impedisse ad esempio ai non registrati la possibilità di visionare l’ultima versione, allora le cose cambierebbero, e almeno per quanto mi riguarda si tratterebbe di censura.
Detto questo, i filtri sono davvero utili? Boh. Vedo almeno due problemi. Innanzitutto, ci potrebbe essere la possibilità di un tempo piuttosto lungo prima di arrivare alla verifica di alcune voci, il che porterebbe a una percezione di “Wikipedia non aggiornata”. Personalmente, non lo trovo affatto un problema, ma immagino che per qualcuno lo sia. Più importante è vedere chi possa approvare le modifiche. Si può immaginare che gli utenti ritenuti affidabili saranno parecchi, molti di più di quelli che hanno i diritti di amministratore (per Wikipedia in lingua italiana un centinaio scarso al momento). Ma naturalmente non è detto che tutti costoro siano sempre al di sopra di ogni sospetto, e i complottisti avrebbero quindi sempre frecce al loro arco, fors’anche più di adesso. Nessuna panacea, insomma: però potrebbe essere un interessante esperimento.
(p.s.: ovviamente il fatto che il demiurgo di Wikipedia sia a favore sposterà molti voti dalla parte del filtraggio, ma come si può leggere sopra non c’è affatto un seguito di tipo bulgaro)

Ultimo aggiornamento: 2009-01-27 12:40

Wikipedia e i vandali

(vedi prima, seconda, terza, quarta parte)
Lasciamo ora da parte l’illusione di una Wikipedia fatta da utenti perfetti, e introduciamo – anche se non vorremmo in realtà esistesse – il concetto di vandalismo, che nel gergo di chi lavora sull’enciclopedia indica una qualunque operazione che attenta alla qualità di una voce anche se fatta involontariamente o in buona fede. Ogni giorno vengono fatti moltissimi vandalismi: la maggior parte di essi viene eliminata nel giro di qualche minuto al massimo, ma alcuni di essi possono rimanere visibili per settimane o anche mesi prima che qualcuno se ne accorga e li corregga. Fortunatamente al momento la probabilità di finire in una pagina vandalizzata è piuttosto bassa: ci sono infatti molte persone che dedicano il loro tempo a favore dell’enciclopedia non per creare o ampliare voci, ma per correggerle. Purtroppo però il numero di questi “patrollatori” cresce più lentamente di quello dei “vandali”, e quindi il rischio di trovarsi una pagina rovinata aumenta col passare del tempo.
È ovvio che un vandalismo di qualunque tipo degrada la qualità dell’enciclopedia. Fin qua penso non ci siano dubbi. Ma è meno evidente cosa succeda alla fruibilità per un utilizzatore: come ho scritto, non mi pare che si parli spesso di questo modo di vedere le cose, che pure per l’utente comune è quello più importante. Vediamo dunque cosa succede nel caso di vari tipi di vandalismo, sempre partendo dal punto di vista di un tizio qualunque che vede solo la pagina principale della voce e non sa né vuole sapere di cose tipo la cronologia di una voce che permette di verificarne la storia e notare eventuali discrepanze.
La prima cosa da tenere a mente è che a parità di vandalismo, più la voce è importante più esso è visibile. Modificare la voce su Dante, Manzoni o Berlusconi significa aumentare la probabilità che qualcuno capiti nella pagina sfregiata, mentre rovinare la pagina di un comune della Polonia rischia di essere un’operazione concettuale di cui nessuno si accorgerà, perché a nessuno verrà in mente di consultare proprio quella pagina. Questo assioma porta a due corollari. Il primo è pragmatico: sono in molti a tenere sotto controllo le voci più importanti, e quindi il tempo che trascorre tra un vandalismo e la sua correzione è molto basso. Viceversa, le voci meno importanti possono restare vandalizzate per un tempo indefinito, proprio perché nessuno le tiene sott’occhio.
La seconda cosa da sapere può sembrare a prima vista incredibile: le voci create (non modificate) per puro vandalismo – spesso goliardico in questo caso – non sono generalmente un grande pericolo per l’utente casuale. Di nuovo, molti danno regolarmente un’occhiata alle voci che vengono create ex novo, e quindi è improbabile che una voce goliardica sopravviva per più di qualche ora; d’altro canto, una voce “Concetta Scraccaturi” il cui testo è “ha 15 anni, fa la II liceo a Piazza Armerina e le puzzano le ascelle” verrà cercata solo da chi sa che qualcuno l’ha inserita: nessuno ci capita a caso.
Passiamo ora alle modifiche alle voci. Anche in questo caso ci sono vari scenari. Una possibilità è che il testo della voce venga completamente eliminato, o sostituito con una frase tipo “Fate tutti skifo!!!!” con opportuno numero di punti esclamativi. Modifiche di questo genere vengono di solito corrette molto in fretta, perché nei file di log saltano subito all’occhio. Ma anche se non fosse così, per il consultatore casuale dell’enciclopedia quella che viene percepita è un’incompletezza dell’enciclopedia, il che è una brutta cosa ma non è una tragedia… a meno che uno non abbia preso Wikipedia come succedanea del babbo che per un bimbo, oltre che essere il più bravo e il più forte di tutti, è anche onnisciente. L’utente farà una scrollata di spalle, dirà che non è vero che Wikipedia sappia proprio tutto, e si rivolgerà altrove… magari a un clone dell’enciclopedia che non era aggiornato e quindi non è stato toccato dal vandalismo.
La cancellazione di una o più sezioni di una voce è un po’ diversa. Fortunatamente anche questo tipo di vandalismi viene rapidamente corretto dai patrollatori; ma se questo non accade, l’utente casuale non si accorge di cosa è successo, e quindi rimane convinto di avere trovato tutto quello che valesse la pena conoscere sull’argomento. Ricordiamoci che usare Wikipedia significa generalmente cercare un riassunto premasticato, il che non è necessariamente un male ma in alcuni casi può appunto essere pericoloso. Ecco dunque un caso di modifica invisibile all’utente tipico ma nociva per la qualità dell’enciclopedia.
Ci sono infine le aggiunte e modifiche al testo. È molto raro che le aggiunte siano molto lunghe: se questo capita, si tratta generalmente di qualcuno che vuole aggiungere ad ogni costo la sua opinione o commento personale, spesso in un italiano pesante e/o sgrammaticato; tali aggiunte mi sa tanto che vengano saltate a piè pari da chi legge, oltre ad essere facilmente notate ed eliminate. Le aggiunte del tipo “scemo chi legge” danno un’impressione di scarsa qualità di Wikipedia, ma non tolgono nulla al trasferimento di informazione dall’enciclopedia all’utente.
Il caso veramente preoccupante è quello delle aggiunte, cancellazioni o sostituzioni minime al testo. Queste modifiche sono molto difficili da notare: se una voce non è tra gli “osservati speciali” di qualcuno, vale a dire un insieme di voci di cui il sistema segnala tutti i cambiamenti, una modifica di questo tipo può davvero passare inosservata per un tempo indefinito, e far sì che una voce sia sbagliata o peggio ancora fuorviante. Più la modifica è verosimile, più difficile è accorgersene: se scrivo che l’altezza di Torino è 1249 metri sul livello del mare è probabile che il lettore si accorga che c’è qualcosa che non va, anche se non potrà sapere qual è l’altezza effettiva. Ma se scrivo che è 219 metri sono ragionevolmente certo che il dato sarà preso per buono… e magari citato da qualche giornale. Garantisco che cose del genere sono all’ordine del giorno: io ad esempio tengo d’occhio le voci su Marco Pantani e Cristina Chiabotto perché ogni tanto qualcuno si diverte a cambiare leggermente altezza e peso, dati che sono presi dai loro siti ufficiali.
A mio parere, il problema delle modifiche sottili è quindi estremamente importante, anche se non pare sia molto sentito; come sempre, sono le modifiche di grandi dimensioni quelle che “fanno notizia”. In ogni caso, comunque, occorrerà trovare una soluzione. Personalmente io sono favorevole al metodo utilizzato nella Wikipedia in lingua tedesca, dove ogni voce ha due versioni: quella “istantanea” e quella verificata. La prima è l’ultima versione della voce, esattamente come capita adesso; la seconda è l’ultima versione che ha avuto un “bollino di qualità” da un utente fidato. Se uno accede all’enciclopedia come anonimo vedrà la versione verificata, con una nota che lo avviserà che ce n’è anche una non verificata e più aggiornata che se vuole potrà andare a vedere; per l’utente registrato capiterà l’opposto, con la versione con le ultime modifiche presentata per default e l’eventuale nota che avvisa che tale voce non è stata ancora verificata e dà un collegamento alla versione “accertata”; infine l’utente fidato potrà mettere il bollino di accettazione sulla voce. Come notate, tutto è sempre disponibile – il che dal mio punto di vista è una condizione imprescindibile per Wikipedia – ma la presentazione è diversa. È chiaro che questa soluzione non ha nessun effetto sulla qualità in genere della voce, ma questo non è un problema, o meglio non è un nuovo problema.
Ah, se siete curiosi di sapere chi siano questi vandali, ecco qualche ritratto tipico.
* C’è il ragazzino che vuole mostrare quanto è bravo con i mezzi informatici.
* C’è il ragazzino che nelle ore di laboratorio informatico non sa cosa fare.
* C’è il tipo convinto che Wikipedia sia il posto più adatto per inserire il proprio curriculum, così lo vedono in tanti.
* C’è il tipo convinto di doversi vendicare contro qualcuno, e che vuole fare le cose in grande.
* C’è il tipo che vuole “ristabilire la verità storica”.
* C’è il tipo che vuole divulgare al mondo la sua grande scoperta.
* C’è il tipo che si mette a fare modifiche così, perché è un modo come un altro per passare il tempo.
* C’è il giornalista che inserisce apposta delle modifiche per dimostrare che Wikipedia è sbagliata, oppure perché deve fare un articolo sugli errori dell’enciclopedia.
Come vedete, ce n’è per tutti i gusti!
Per il momento – dopo meno di trentacinquemila battute complessive – è tutto. Spero che il mio punto di vista sia stato interessante e vi abbia dato qualche idea nuova.
(fine)

Ultimo aggiornamento: 2009-01-24 07:00

Wikipedia per l’utente comune

(vedi prima, seconda, terza parte)
Tutto quello che ho scritto fino ad ora è assolutamente e totalmente irrilevante per la stragrande maggioranza di chi usa Wikipedia e la considera alla stregua di un oracolo o della Fonte Prima e Totale di Conoscenza: quelli che… l’ha detto wikipedia. A quanto ne so, nessuno si è cimentato a valutare l’enciclopedia da questo punto di vista, indubbiamente poco purista ma sicuramente di un certo interesse pratico: provo così a farlo io, iniziando da una situazione ideale in cui nessuno si diverta a rovinare le voci dell’enciclopedia e vedendo poi cosa succede nel caso si capiti su una voce resa volontariamente scorretta. Ah, prima che qualcuno mi travisi: non dico che questa metrica (cioè questo modo di misurare la validità dell’enciclopedia) sia l’unica da usare, e nemmeno la migliore. Però vale la pena considerarla.
Le caratteristiche che un’enciclopedia dovrebbe avere sono:
* affidabilità – devo potermi fidare delle informazioni che vi trovo scritte, altrimenti è inutile che io la consulti.
* aggiornamento – non devo trovare informazioni obsolete, che possono essere fuorvianti.
* ampiezza – devo trovare quello che mi serve, altrimenti non me ne faccio nulla.
* completezza – la voce che mi interessa deve avere una trattazione sufficiente per darmi le informazioni che mi servono, senza carenze o solo dati irrilevanti.
* comprensibilità – quello che trovo deve essere comprensibile, almeno dando per scontata una certa cultura di base; un’enciclopedia non è un libro di approfondimento né un testo di divulgazione, ma una via di mezzo.
* praticità – non devo fare troppa fatica nel trovare una voce, anche se non so esattamente il suo nome; né devo compulsare chissà quanta roba nel caso di un rimando a un’altra voce.
* verificabilità – devo avere la possibilità di sapere da dove sono state prese le informazioni, per poter giudicare per conto mio se fidarmi o no.
Come si colloca Wikipedia in lingua italiana rispetto a questa metrica? A gennaio 2009 i risultati possono essere sintetizzati nel modo seguente.
L’affidabilità dovrebbe essere generalmente buona. La Wikipedia in lingua inglese è stata messa a confronto con enciclopedie tradizionali mostrando che la quantità e la qualità di imprecisioni ed errori è confrontabile. Non è mai stato fatto un esperimento simile con la versione in italiano; nella mia esperienza sui campi in cui ho una buona conoscenza della materia non mi capita però praticamente mai di dover correggere errori inseriti in buona fede. Per quelli in cattiva fede, vedi oltre :-)
L’aggiornamento è indubbiamente un punto di forza, forse fin troppo. Questo lo si poteva aspettare, visto che il mezzo è aggiornabile in tempo reale; ma spesso è sconcertante vedere inserita la data di morte di un personaggio pubblico qualche minuto dopo che le agenzie hanno battuto la notizia, e occorre bloccare temporaneamente le voci relative al governo italiano quando viene dato l’incarico di Presidente del Consiglio dei Ministri, visto che molti sono convinti che l’incaricato sia già il premier e quindi vanno a emendare le pagine.
Per quanto riguarda l’ampiezza, la situazione è sicuramente buona. Di nuovo, non arriviamo ai livelli dell’edizione in lingua inglese dove si trova davvero di tutto e di più ed è praticamente impossibile finire su un tema non trattato. Se però guardiamo il mezzo milione abbondante di voci in italiano, è vero che ce ne sono moltissime che a essere molto buoni potremmo definire di nicchia; ma tutte quelle più importanti dovrebbero esserci.
La completezza è probabilmente un punto ancora oggi relativamente debole. Intendiamoci: ci sono decine di migliaia di voci complete, chiare e utilizzabili. Il guaio è che ci sono campi per così dire maturi, come ad esempio informatica e fumetti, e altri campi dove è altamente probabile che la voce cercata sia uno “stub” (un abbozzo, cioè poche righe) o in cui la prosa lasci alquanto a desiderare. Io sono della scuola “meglio poco che nulla”, però ammetto che spesso il poco è davvero poco. I campi più deboli sono quelli umanistici, dove purtroppo non c’è una massa critica di persone che conoscano bene gli argomenti e siano esperte nell’uso del software: in un certo senso Wikipedia è complementare a un’enciclopedia tradizionale, dove le voci scientifiche sono spesso più delicate.
Sulla comprensibilità, si possono fare ancora degli sforzi, ma direi che Wikipedia è già sulla buona strada. Le linee guida vorrebbero che il primo paragrafo serva per avere una rapida idea generale della voce, mentre il resto del testo dovrebbe servire per gli approfondimenti; quando la dimensione di una voce cresce molto, ad esempio quella sull’Italia, si creano sottovoci (“Storia dell’Italia”, “Geografia dell’Italia”, …) a cui si può accedere dalla voce principale, che mantiene un paragrafo di riassunto per chi non è interessato ad approfondimenti troppo spinti. Da questo punto di vista, le voci più a rischio sono quelle delle cosiddette scienze dure (matematica, fisica, ma anche biologia), dove c’è la tendenza ad avere un testo corretto ma arido.
Nonostante quanto si possa pensare, la praticità è un altro punto debole. Il software su cui si basa Wikipedia facilita la creazione di reindirizzamenti a una voce (i cosiddetti redirect, che tra l’altro non entrano nel computo del numero totale di voci), ma la ricerca non è comunque semplicissima. Esiste un motore di ricerca interno, ma la sua qualità lascia alquanto a desiderare: spesso si ottengono migliori risultati cercando direttamente con Google e aggiungendo la chiave site:it.wikipedia.org per restringere la ricerca alle sole pagine dell’enciclopedia. Il problema principale sta nella grafia e nel formato dei lemmi (con o senza maiuscola? con o senza articolo?) Speso può essere utile partire da una voce di argomento simile, andare in fondo alla pagina per trovare le categorie a cui appartiene, e poi viaggiare all’interno dell’albero delle categorie; questa non è però certo un’opzione alla portata di un utente alle prime armi. È invece più facile passare da una voce all’altra di Wikipedia, vista la presenza dei rimandi ipertestuali (quelli sottolineati in blu) da una voce all’altra: forse un po’ troppi, secondo la mia personale visione. I “link rossi”, quelli che portano a una voce che non esiste, sono controintuitivi per l’utente comune, che si chiede perché vengano messi. Un non-problema è quello del “nome principale”, che pure è fonte di accesi dibattiti. Ad esempio, il nome della voce che tratta l’anguria è quello latino scientifico, Citrullus Lanatus. Ma visto che se uno digita “anguria” tanto finisce sulla pagina corretta, per lui la cosa potrà essere buffa ma irrilevante in pratica.
Resta infine la verificabilità, che è diversa dall’affidabilità (le fonti scelte potrebbero essere inaffidabili, e una voce senza fonti potrebbe comunque essere corretta). Innanzitutto occorre tenere presente, come detto in precedenza, che per definizione Wikipedia non è una fonte primaria: questo significa che non è ammesso scrivere qualcosa di nuovo – per esempio la biografia del proprio nonno – ma bisogna che qualcun altro ne abbia parlato ufficialmente. Durante l’impetuosa crescita iniziale dell’enciclopedia le voci più importanti venivano scritte senza badare a inserire riferimenti; negli anni si è però rafforzata l’idea che le fonti sono una parte necessaria. È così facile trovare frasi evidenziate con l’avviso “citazione necessaria” oppure “senza fonti”, e una voce importante o controversa può avere decine di note a piè di pagina. Detto questo, resta da rimarcare quanto accennato all’inizio: indicare le fonti non dà comunque garanzia di qualità della voce, soprattutto per chi non sia in grado di valutare la validità delle fonti stesse. Diciamo insomma che la verificabilità è più che altro utile per gli esperti, e ininfluente per l’utente qualunque.
(continua)

Ultimo aggiornamento: 2009-01-23 07:00

Wikipedia e le fonti

(vedi prima e seconda parte)
Ora che Wikipedia è così famosa, capita sempre più spesso che qualcuno la utilizzi come fonte: detto in parole povere, prenda una voce dall’enciclopedia e la ritenga verità assoluta. Se Enzo Jannacci aggiornasse oggi il testo della sua canzone Quelli che…, immagino che al posto di “l’ha detto il telegiornale!” canterebbe “l’ha detto Wikipedia!” Di per sé copiare dall’enciclopedia non è affatto vietato, anzi: peccato che troppo spesso la gente – anche i giornalisti, sì – “si dimenticano” che la licenza d’uso prevede di indicare esplicitamente da dove è stato tratto il testo. Ma non è di questo che vorrei parlare, quanto del concetto di “fonte” e delle sue conseguenze in Wikipedia.
Innanzitutto, Wikipedia è per definizione una fonte secondaria, se non addirittura terziaria. Mi spiego: una fonte primaria è un testo dove si presentano per la prima volta i risultati di una ricerca, o in generale una notizia. Una fonte secondaria è quella che cita delle fonti primarie, un po’ come la rassegna stampa che non è un giornale ma contiene ritagli dai vari giornali; una fonte terziaria fa lo stesso con tutte le fonti, primarie, secondarie o terziarie che siano. In Wikipedia questo concetto è riassunto con le parole forse un po’ fuorvianti “niente ricerche originali”. Ciò significa che Wikipedia non è il posto dove scrivere la vostra relazione sull’evoluzione delle corolle dei fiori nell’alta val Brembana. Non perché non sia una interessante, ma perché Wikipedia non vuole essere il punto di ingresso delle conoscenze ma vuole raccogliere quanto è stato accettato da qualcun altro. Insomma, per prima cosa pubblicate la vostra ricerca sul Bollettino della Società Fitologica delle Alpi Lombarde, poi venite a inserirla nell’enciclopedia fregiandovi con il link della fonte. Lo stesso vale per le biografie di personaggi oscuri a tutti, se non ai loro parenti che con tanto amore hanno scritto la biografia in questione e magari pubblicato un libro a loro spese o con i nuovi servizi “print on demand”.
Discorso ancora diverso, anche se fondamentalmente sulla stessa linea, per le voci sulle aziende. Una voce sulla Fiat non può mancare, e potrebbe anche esserci una voce più specializzata con l’elenco dei modelli d’auto prodotti dalla Fiat nella sua storia, il periodo in cui sono stati commercializzati e il numero di esemplari prodotti (quando ho scritto queste note non c’era, per la cronaca). Però se qualcuno scrivesse della latteria Giobatta Pautasso di Villar Perosa, la voce verrà subito eliminata. Di nuovo, sono in tanti a scrivere della Fiat, e Wikipedia si limita a prendere i dati che si trovano in giro e presentarli in modo organico; non c’è nessuno che parli del buon Pautasso, anche se vende la toma migliore di tutta la valle.
Qual è il confine che permette di dire se una voce è enciclopedica oppure no? Non è specificato da nessuna parte. Ci sono casi borderline che utenti diversi valutano in maniera opposta, anche se sono sorprendentemente poche le votazioni sull’opportunità di mantenere una voce che finiscono con un acceso dibattito. Per dare un’idea, una persona ai limiti dell’enciclopedicità sono io, visti i miei trascorsi informatici come direttore esecutivo della Naming Authority e coordinatore della gerarchia usenet it.*. Nel mio caso personale ci sono ragioni di opportunità che fanno ad ogni modo evitare l’inserimento, ma il concetto di fondo resta quello: per alcuni wikipediani le mie referenze basterebbero, per altri no. Per alcune categorie (calciatori, scrittori…) si sono stabilite delle linee guida per dare un bollino di accettazione – notate che non ci sono linee guida per dire “una voce di una certa categoria non viene inserita – ma non si potrà mai completare una griglia di ammissione.
Lo so che molti sono convinti che la “loro” voce debba avere cittadinanza in Wikipedia, ma il motivo generalmente da loro addotto, “Ma non costa nulla avere una voce in più! Mica ci sono problemi di spazio” cozza contro due problemi. Il primo, come visto in precedenza, è che un costo in effetti c’è, ed è proprio in termini di denaro; il secondo è più filosofico, come spiegato sopra, ed è legato alla scelta di non raccogliere tutta la conoscenza ma solo tutta la conoscenza resa per così dire “ufficiale” da qualcun altro. Se mi è permesso un paragone forse un po’ ardito, non si vuole fare la borgesiana mappa 1 a 1 del territorio, che poi venne buttata via perché tanto valeva usare il territorio stesso come mappa. Temiamo poi anche un altro pericolo: qualcuno copia da Wikipedia un’affermazione senza fonti, e a sua volta Wikipedia aggiunge come fonte chi l’aveva. Più che lo scioglilingua, il problema è che in questo modo non c’è nessuna verifica della fonte, il che per un’enciclopedia è un peccato mortale.
È poi chiaro che un alto problema è la scelta delle fonti. In questo campo l’uguaglianza non ha affatto diritto di cittadinanza: penso che siano tutti d’accordo che è ben diverso citare la Treccani, dove si suppone una redazione controlli i vari testi pubblicati, oppure l’Eco di Roccacannuccia che ha un volonteroso tuttofare che assembla il mensile a partire da tutte le dicerie del paese. Ma il problema sorge in altre situazioni. Un testo di una casa editrice nota per pubblicare teorie complottiste è una fonte valida? E chi è che definisce se quell’editore pubblica teorie complottiste? Anche tra i quotidiani più blasonati gli svarioni anche pesanti sono ormai all’ordine del giorno; non basta più citare un articolo per avere la certezza che quanto scritto sia vero. Wikipedia per il momento non prende posizione su questi temi e cerca di limitarsi a indicare le varie possibilità se non ce n’è una assolutamente predominante: ma non è detto che la situazione resti tale e non si crei un elenco di “fonti più considerate”.
Una voce di Wikipedia ha però una dimensione in più rispetto a un’enciclopedia normale: la sua cronologia, cioè la possibilità di vedere tutte le modifiche apportate ad essa nel tempo. In teoria è uno strumento molto potente: combinato con la possibilità di sapere tutte le modifiche di un utente alle voci dell’enciclopedia, può infatti permettere di capire se una certa aggiunta o modifica è stata fatta da una persona generalmente affidabile oppure no. Il guaio è che questa operazione è molto complicata, e non viene in pratica fatta mai, se non in due casi molto particolari: l’ultimissima modifica di una voce, per decidere se è valida o reinserire la versione precedente, e la ricerca di violazioni di copyright pregresse, dove viene fatta un’attenta operazione chirurgica per lasciare solamente i contributi corretti cancellando quelli illegali. Se sei un utente non troppo scafato, probabilmente WikiScanner può aiutarti: ti permette infatti di scoprire, nel caso di modifiche alle voci fatte da utenti non registrati, da quale rete tali modifiche provengano. Un altro strumento molto utile, che però richiede un’installazione nel proprio PC, è la History Flow Visualization Application di IBM, che visualizza graficamente le “stratificazione” delle successive versioni di una pagina.
(continua)

Ultimo aggiornamento: 2009-01-22 07:00

L’evoluzione di Wikipedia

(vedi prima parte)
Vorrei innanzitutto rimarcare una cosa: in questi anni Wikipedia è cambiata moltissimo. È chiaro che si è ampliata a dismisura nel numero di voci presenti, ma quello non è che la punta dell’iceberg. Parlerò più diffusamente nel seguito di come it.wiki si ponga oggi rispetto alle aspettative che si hanno per un’enciclopedia; qui sotto racconto cosa essa fosse nel 2004, e come sono cambiate le cose. Qualche statistica la trovate anche qui.
* Il numero di voci presenti era piccolo, per la maggior parte di settori specialistici, e la dimensione media della voce era minima. Pur di riempire i buchi, si scriveva qualche riga – generalmente corretta, ci mancherebbe altro, ma sicuramente semplicistica e di livello elementare – e si appiccicava l’etichetta “stub” (letteralmente “mozzicone”, poi è stato reso come “abbozzo”) per indicare che prima o poi ci si sarebbe lavorato su. Adesso continuano ed esserci moltissimi stub, e la percentuale rispetto al numero totale di voci presenti è più o meno costante; ma essi sono su voci meno fondamentali. Oltre che in ampiezza, l’enciclopedia è enormemente cresciuta nella precisione e nella profondità della trattazione delle voci, tanto che molte di esse sono diventate l’ombrello sotto il quale sono presenti più voci secondarie.
* Il numero di utenti era davvero piccolo. Praticamente i contributori si conoscevano tutti tra loro, e non credo ci fossero molti che usassero l’enciclopedia come semplici lettori. A un certo punto – in parte per l’effetto trascinamento dovuto alle citazioni da parte dei media della Wikipedia in lingua inglese, in parte forse perché essendo no profit c’era gente che trovava filosoficamente bello lavorarci su, o semplicemente perché era diventata abbastanza grande da essere considerata un valido strumento di lavoro – si è raggiunta una massa critica di utenti che in pratica sostenta autonomamente la crescita del sito.
* Le voci, come detto, all’inizio erano semplicistiche; anche dopo la prima ondata di ampliamenti erano più o meno equivalenti non dico a un riassuntino, ma a un tema; tranne nei casi in cui qualcuno si metteva con santa pazienza a tradurre la voce equivalente inglese, che avendo un paio d’anni di vita in più era molto più stabile. Non che la cosa sia di per sé un male: un’enciclopedia cartacea standard di dimensioni ridotte funziona proprio in questo modo, senza entrare troppo in profondità né dire dove sono state tratte le informazioni. Nel caso di un’enciclopedia senza una redazione, però, la cosa cambia molto; ci si è così ingegnati di dare anche delle metainformazioni, cioè spiegare perché ci sono quelle definizioni. Parlerò più avanti del problema delle fonti per Wikipedia: al momento faccio notare che la frasetta magica “citazione necessaria” è sempre più presente nelle voci, soprattutto se non strettamente scientifiche. Inoltre, almeno in alcuni campi specifici dove un gruppo di utenti si è attivato al riguardo, alle voci è associata una tabella che indica la loro qualità: ovviamente la qualità è definita internamente a Wikipedia e quindi è relativa e non assoluta, ma comunque è un indice interessante per capire se si pensa ci sia ancora qualcosa da fare.
Oggi la situazione è insomma molto diversa dal 2004, non solo per la Wikipedia in lingua inglese ma anche per quella in lingua italiana. Ma non è certo tutto oro quello che luccica! Ci sono ancora molte cose da fare per avvicinarsi al sogno di un’enciclopedia generalista perfetta: accenno ad alcune di esse.
* La diseguaglianza del livello dell’enciclopedia. Uno dei guai nell’avere un’enciclopedia scritta da volontari è che chi ci lavora si occupa dei temi che conosce meglio o che lo appassionano. Se uniamo questa cosa al fatto che in Italia – ma anche altrove – la cultura digitale non è poi così facile da trovarsi, ne viene fuori che statisticamente ci sono molti più contributori in grado di lavorare su voci informatiche e scientifiche di quanti sappiano e vogliano cimentarsi su quelle umanistiche. Non si può nemmeno immaginare che qualche volonteroso dedica di applicarvisi: se prendiamo ad esempio la voce su Carneade, io posso al più correggere gli errori ortografici e verificare le date di nascita e morte: non mi fiderei nemmeno di parafrasare il suo pensiero!
* Il costo di gestione. Nessuno di quelli che scrivono su Wikipedia viene pagato, lo facciamo tutti per hobby; ma anche se eliminassimo i 23 stipendiati dalla Wikimedia Foundation, i server dove si trova la base dati dell’enciclopedia costano, e la connessione a Internet costa ancora di più. Pensate che nei momenti di picco del 2008 si è visto un traffico di 3 gigabit al secondo: in pratica cinquecento volte l’ADSL a 7 megabit al secondo, per non parlare di chi si può solo connettere a 56 Kb/s. L’ultima raccolta fondi ha raggiunto l’obiettivo (6 milioni di dollari per sei mesi) solo grazie a due grandi “donazioni istituzionali”; aleggia così sempre la possibilità di inserire pubblicità nelle pagine dell’enciclopedia, anche se ci sono fortissime resistenze di principio.
* La scalabilità del modello. Wikipedia è ormai enorme. Fino a oggi, il software ha retto relativamente bene a una crescita molto maggiore di quanto era stato penso preventivato: ci sono state due Grandi Modifiche, a dicembre 2003 il passaggio da UseModeWiki a Mediawiki e a ottobre 2005 una riscrittura del db per migliorare l’efficienza (vedi le revisioni di MediaWiki). Ma non è detto che ce la possa sempre fare, tenendo conto che il contenuto di it.wiki ormai entra a fatica in un DVD.
* I vandalismi. Proprio perché Wikipedia ha tanto successo, è sempre più frequente trovare gente che rovina le voci dell’enciclopedia, o cerca di imporre il proprio punto di vista, andando contro a uno dei punti chiave: la neutralità. Parlerò più diffusamente dei vandalismi in seguito: per il momento osservo che il numero di persone che li contrastano cresce molto più lentamente dei vandali.
* Le scelte di gestione. Non esiste un “capo” o un “parlamento” in Wikipedia. Esistono alcuni utenti – un centinaio scarso per la versione in lingua italiana – che possono fare alcune operazioni in più come cancellare una voce o impedire l’accesso in scrittura a un utente; ma tutti gli utenti abituali – qualche migliaio, al momento – hanno diritto di voto e possono sovvertire i risultati. In questo caso non ci sono ancora problemi di scalabilità, ma stanno crescendo gli attriti tra “buoni” e “cattivi”. C’è chi è di manica larga e chi di manica stretta per stabilire se la qualità di una voce è sufficiente per meritare di stare nell’enciclopedia; c’è chi ammette voci che per altri sono sfacciatamente promozionali oppure di persone assolutamente oscure, e quindi da cassare immediatamente; c’è chi vuole dare un’ultima chance ai distruttori – non solo delle voci ma anche della cooperazione interna – e chi preferisce bloccare l’accesso al minimo comportamento non perfettamente in linea con le mille regole interne dell’enciclopedia.
Aggiungo subito che non ho alcuna ricetta per risolvere questi problemi: ritengo però che sia opportuno esplicitarli, e non lasciarli sottotraccia come capita spesso… sperando che non si finisca come al solito a fare interminabili e inconcludenti discussioni.
(continua)

Ultimo aggiornamento: 2009-01-21 07:00

Tante parole su Wikipedia / incipit

A otto anni dalla nascita di quello che al tempo era un progetto ausiliario per la creazione di un’enciclopedia “classica”, Wikipedia è ormai una realtà incontrovertibile. Io non sono uno dei primissimi contributori dell’enciclopedia – avevo provato a vedere l’edizione in inglese subito dopo che era stata lanciata, ma non ero in grado di dare un contributo utile in un buon inglese, quindi lasciai perdere e non entrai nel primo nucleo di pionieri della versione in lingua italiana. Però ho comunque una certa qual anzianità: ho iniziato a contribuire nel luglio 2004, subito dopo le grandi diatribe sulla scelta di inserire tutti i comuni italiani e passare così da meno di 15000 a più di 22000 voci. Ho perciò visto buona parte dell’evoluzione dell’enciclopedia e credo di poter dire qualcosa al riguardo. Ho pensato così di raccontare qualcosa da un punto di vista un po’ mio e un po’ – se ci riesco – di una persona che Wikipedia la usa, vorrebbe magari saperne di più, ma non è per nulla interessato a sapere come funziona tecnicamente. Mi concentrerò sull’edizione in lingua italiana (it.wiki, per gli amici) che poi è quella che interessa maggiormente noi italiofoni, anche se confesso che a volte vado a consultare quella in lingua inglese, perché in certi casi la versione italiana non è ancora così completa.
Il testo che troverete in questi giorni sul blog è nato dopo uno scambio di email con Fabio Metitieri, e con l’aiuto di Gianluigi Gamba, Mario Benvenuti e Frieda Brioschi; spero sia superfluo aggiungere che tutto quello che scriverò è a titolo puramente personale e non ha nulla di ufficiale.
Lo trovate anche sul mio sito.

Ultimo aggiornamento: 2009-01-20 07:00