Archivi categoria: wikipedia

Wikipedia e le fonti

(vedi prima e seconda parte)
Ora che Wikipedia è così famosa, capita sempre più spesso che qualcuno la utilizzi come fonte: detto in parole povere, prenda una voce dall’enciclopedia e la ritenga verità assoluta. Se Enzo Jannacci aggiornasse oggi il testo della sua canzone Quelli che…, immagino che al posto di “l’ha detto il telegiornale!” canterebbe “l’ha detto Wikipedia!” Di per sé copiare dall’enciclopedia non è affatto vietato, anzi: peccato che troppo spesso la gente – anche i giornalisti, sì – “si dimenticano” che la licenza d’uso prevede di indicare esplicitamente da dove è stato tratto il testo. Ma non è di questo che vorrei parlare, quanto del concetto di “fonte” e delle sue conseguenze in Wikipedia.
Innanzitutto, Wikipedia è per definizione una fonte secondaria, se non addirittura terziaria. Mi spiego: una fonte primaria è un testo dove si presentano per la prima volta i risultati di una ricerca, o in generale una notizia. Una fonte secondaria è quella che cita delle fonti primarie, un po’ come la rassegna stampa che non è un giornale ma contiene ritagli dai vari giornali; una fonte terziaria fa lo stesso con tutte le fonti, primarie, secondarie o terziarie che siano. In Wikipedia questo concetto è riassunto con le parole forse un po’ fuorvianti “niente ricerche originali”. Ciò significa che Wikipedia non è il posto dove scrivere la vostra relazione sull’evoluzione delle corolle dei fiori nell’alta val Brembana. Non perché non sia una interessante, ma perché Wikipedia non vuole essere il punto di ingresso delle conoscenze ma vuole raccogliere quanto è stato accettato da qualcun altro. Insomma, per prima cosa pubblicate la vostra ricerca sul Bollettino della Società Fitologica delle Alpi Lombarde, poi venite a inserirla nell’enciclopedia fregiandovi con il link della fonte. Lo stesso vale per le biografie di personaggi oscuri a tutti, se non ai loro parenti che con tanto amore hanno scritto la biografia in questione e magari pubblicato un libro a loro spese o con i nuovi servizi “print on demand”.
Discorso ancora diverso, anche se fondamentalmente sulla stessa linea, per le voci sulle aziende. Una voce sulla Fiat non può mancare, e potrebbe anche esserci una voce più specializzata con l’elenco dei modelli d’auto prodotti dalla Fiat nella sua storia, il periodo in cui sono stati commercializzati e il numero di esemplari prodotti (quando ho scritto queste note non c’era, per la cronaca). Però se qualcuno scrivesse della latteria Giobatta Pautasso di Villar Perosa, la voce verrà subito eliminata. Di nuovo, sono in tanti a scrivere della Fiat, e Wikipedia si limita a prendere i dati che si trovano in giro e presentarli in modo organico; non c’è nessuno che parli del buon Pautasso, anche se vende la toma migliore di tutta la valle.
Qual è il confine che permette di dire se una voce è enciclopedica oppure no? Non è specificato da nessuna parte. Ci sono casi borderline che utenti diversi valutano in maniera opposta, anche se sono sorprendentemente poche le votazioni sull’opportunità di mantenere una voce che finiscono con un acceso dibattito. Per dare un’idea, una persona ai limiti dell’enciclopedicità sono io, visti i miei trascorsi informatici come direttore esecutivo della Naming Authority e coordinatore della gerarchia usenet it.*. Nel mio caso personale ci sono ragioni di opportunità che fanno ad ogni modo evitare l’inserimento, ma il concetto di fondo resta quello: per alcuni wikipediani le mie referenze basterebbero, per altri no. Per alcune categorie (calciatori, scrittori…) si sono stabilite delle linee guida per dare un bollino di accettazione – notate che non ci sono linee guida per dire “una voce di una certa categoria non viene inserita – ma non si potrà mai completare una griglia di ammissione.
Lo so che molti sono convinti che la “loro” voce debba avere cittadinanza in Wikipedia, ma il motivo generalmente da loro addotto, “Ma non costa nulla avere una voce in più! Mica ci sono problemi di spazio” cozza contro due problemi. Il primo, come visto in precedenza, è che un costo in effetti c’è, ed è proprio in termini di denaro; il secondo è più filosofico, come spiegato sopra, ed è legato alla scelta di non raccogliere tutta la conoscenza ma solo tutta la conoscenza resa per così dire “ufficiale” da qualcun altro. Se mi è permesso un paragone forse un po’ ardito, non si vuole fare la borgesiana mappa 1 a 1 del territorio, che poi venne buttata via perché tanto valeva usare il territorio stesso come mappa. Temiamo poi anche un altro pericolo: qualcuno copia da Wikipedia un’affermazione senza fonti, e a sua volta Wikipedia aggiunge come fonte chi l’aveva. Più che lo scioglilingua, il problema è che in questo modo non c’è nessuna verifica della fonte, il che per un’enciclopedia è un peccato mortale.
È poi chiaro che un alto problema è la scelta delle fonti. In questo campo l’uguaglianza non ha affatto diritto di cittadinanza: penso che siano tutti d’accordo che è ben diverso citare la Treccani, dove si suppone una redazione controlli i vari testi pubblicati, oppure l’Eco di Roccacannuccia che ha un volonteroso tuttofare che assembla il mensile a partire da tutte le dicerie del paese. Ma il problema sorge in altre situazioni. Un testo di una casa editrice nota per pubblicare teorie complottiste è una fonte valida? E chi è che definisce se quell’editore pubblica teorie complottiste? Anche tra i quotidiani più blasonati gli svarioni anche pesanti sono ormai all’ordine del giorno; non basta più citare un articolo per avere la certezza che quanto scritto sia vero. Wikipedia per il momento non prende posizione su questi temi e cerca di limitarsi a indicare le varie possibilità se non ce n’è una assolutamente predominante: ma non è detto che la situazione resti tale e non si crei un elenco di “fonti più considerate”.
Una voce di Wikipedia ha però una dimensione in più rispetto a un’enciclopedia normale: la sua cronologia, cioè la possibilità di vedere tutte le modifiche apportate ad essa nel tempo. In teoria è uno strumento molto potente: combinato con la possibilità di sapere tutte le modifiche di un utente alle voci dell’enciclopedia, può infatti permettere di capire se una certa aggiunta o modifica è stata fatta da una persona generalmente affidabile oppure no. Il guaio è che questa operazione è molto complicata, e non viene in pratica fatta mai, se non in due casi molto particolari: l’ultimissima modifica di una voce, per decidere se è valida o reinserire la versione precedente, e la ricerca di violazioni di copyright pregresse, dove viene fatta un’attenta operazione chirurgica per lasciare solamente i contributi corretti cancellando quelli illegali. Se sei un utente non troppo scafato, probabilmente WikiScanner può aiutarti: ti permette infatti di scoprire, nel caso di modifiche alle voci fatte da utenti non registrati, da quale rete tali modifiche provengano. Un altro strumento molto utile, che però richiede un’installazione nel proprio PC, è la History Flow Visualization Application di IBM, che visualizza graficamente le “stratificazione” delle successive versioni di una pagina.
(continua)

Ultimo aggiornamento: 2009-01-22 07:00

L’evoluzione di Wikipedia

(vedi prima parte)
Vorrei innanzitutto rimarcare una cosa: in questi anni Wikipedia è cambiata moltissimo. È chiaro che si è ampliata a dismisura nel numero di voci presenti, ma quello non è che la punta dell’iceberg. Parlerò più diffusamente nel seguito di come it.wiki si ponga oggi rispetto alle aspettative che si hanno per un’enciclopedia; qui sotto racconto cosa essa fosse nel 2004, e come sono cambiate le cose. Qualche statistica la trovate anche qui.
* Il numero di voci presenti era piccolo, per la maggior parte di settori specialistici, e la dimensione media della voce era minima. Pur di riempire i buchi, si scriveva qualche riga – generalmente corretta, ci mancherebbe altro, ma sicuramente semplicistica e di livello elementare – e si appiccicava l’etichetta “stub” (letteralmente “mozzicone”, poi è stato reso come “abbozzo”) per indicare che prima o poi ci si sarebbe lavorato su. Adesso continuano ed esserci moltissimi stub, e la percentuale rispetto al numero totale di voci presenti è più o meno costante; ma essi sono su voci meno fondamentali. Oltre che in ampiezza, l’enciclopedia è enormemente cresciuta nella precisione e nella profondità della trattazione delle voci, tanto che molte di esse sono diventate l’ombrello sotto il quale sono presenti più voci secondarie.
* Il numero di utenti era davvero piccolo. Praticamente i contributori si conoscevano tutti tra loro, e non credo ci fossero molti che usassero l’enciclopedia come semplici lettori. A un certo punto – in parte per l’effetto trascinamento dovuto alle citazioni da parte dei media della Wikipedia in lingua inglese, in parte forse perché essendo no profit c’era gente che trovava filosoficamente bello lavorarci su, o semplicemente perché era diventata abbastanza grande da essere considerata un valido strumento di lavoro – si è raggiunta una massa critica di utenti che in pratica sostenta autonomamente la crescita del sito.
* Le voci, come detto, all’inizio erano semplicistiche; anche dopo la prima ondata di ampliamenti erano più o meno equivalenti non dico a un riassuntino, ma a un tema; tranne nei casi in cui qualcuno si metteva con santa pazienza a tradurre la voce equivalente inglese, che avendo un paio d’anni di vita in più era molto più stabile. Non che la cosa sia di per sé un male: un’enciclopedia cartacea standard di dimensioni ridotte funziona proprio in questo modo, senza entrare troppo in profondità né dire dove sono state tratte le informazioni. Nel caso di un’enciclopedia senza una redazione, però, la cosa cambia molto; ci si è così ingegnati di dare anche delle metainformazioni, cioè spiegare perché ci sono quelle definizioni. Parlerò più avanti del problema delle fonti per Wikipedia: al momento faccio notare che la frasetta magica “citazione necessaria” è sempre più presente nelle voci, soprattutto se non strettamente scientifiche. Inoltre, almeno in alcuni campi specifici dove un gruppo di utenti si è attivato al riguardo, alle voci è associata una tabella che indica la loro qualità: ovviamente la qualità è definita internamente a Wikipedia e quindi è relativa e non assoluta, ma comunque è un indice interessante per capire se si pensa ci sia ancora qualcosa da fare.
Oggi la situazione è insomma molto diversa dal 2004, non solo per la Wikipedia in lingua inglese ma anche per quella in lingua italiana. Ma non è certo tutto oro quello che luccica! Ci sono ancora molte cose da fare per avvicinarsi al sogno di un’enciclopedia generalista perfetta: accenno ad alcune di esse.
* La diseguaglianza del livello dell’enciclopedia. Uno dei guai nell’avere un’enciclopedia scritta da volontari è che chi ci lavora si occupa dei temi che conosce meglio o che lo appassionano. Se uniamo questa cosa al fatto che in Italia – ma anche altrove – la cultura digitale non è poi così facile da trovarsi, ne viene fuori che statisticamente ci sono molti più contributori in grado di lavorare su voci informatiche e scientifiche di quanti sappiano e vogliano cimentarsi su quelle umanistiche. Non si può nemmeno immaginare che qualche volonteroso dedica di applicarvisi: se prendiamo ad esempio la voce su Carneade, io posso al più correggere gli errori ortografici e verificare le date di nascita e morte: non mi fiderei nemmeno di parafrasare il suo pensiero!
* Il costo di gestione. Nessuno di quelli che scrivono su Wikipedia viene pagato, lo facciamo tutti per hobby; ma anche se eliminassimo i 23 stipendiati dalla Wikimedia Foundation, i server dove si trova la base dati dell’enciclopedia costano, e la connessione a Internet costa ancora di più. Pensate che nei momenti di picco del 2008 si è visto un traffico di 3 gigabit al secondo: in pratica cinquecento volte l’ADSL a 7 megabit al secondo, per non parlare di chi si può solo connettere a 56 Kb/s. L’ultima raccolta fondi ha raggiunto l’obiettivo (6 milioni di dollari per sei mesi) solo grazie a due grandi “donazioni istituzionali”; aleggia così sempre la possibilità di inserire pubblicità nelle pagine dell’enciclopedia, anche se ci sono fortissime resistenze di principio.
* La scalabilità del modello. Wikipedia è ormai enorme. Fino a oggi, il software ha retto relativamente bene a una crescita molto maggiore di quanto era stato penso preventivato: ci sono state due Grandi Modifiche, a dicembre 2003 il passaggio da UseModeWiki a Mediawiki e a ottobre 2005 una riscrittura del db per migliorare l’efficienza (vedi le revisioni di MediaWiki). Ma non è detto che ce la possa sempre fare, tenendo conto che il contenuto di it.wiki ormai entra a fatica in un DVD.
* I vandalismi. Proprio perché Wikipedia ha tanto successo, è sempre più frequente trovare gente che rovina le voci dell’enciclopedia, o cerca di imporre il proprio punto di vista, andando contro a uno dei punti chiave: la neutralità. Parlerò più diffusamente dei vandalismi in seguito: per il momento osservo che il numero di persone che li contrastano cresce molto più lentamente dei vandali.
* Le scelte di gestione. Non esiste un “capo” o un “parlamento” in Wikipedia. Esistono alcuni utenti – un centinaio scarso per la versione in lingua italiana – che possono fare alcune operazioni in più come cancellare una voce o impedire l’accesso in scrittura a un utente; ma tutti gli utenti abituali – qualche migliaio, al momento – hanno diritto di voto e possono sovvertire i risultati. In questo caso non ci sono ancora problemi di scalabilità, ma stanno crescendo gli attriti tra “buoni” e “cattivi”. C’è chi è di manica larga e chi di manica stretta per stabilire se la qualità di una voce è sufficiente per meritare di stare nell’enciclopedia; c’è chi ammette voci che per altri sono sfacciatamente promozionali oppure di persone assolutamente oscure, e quindi da cassare immediatamente; c’è chi vuole dare un’ultima chance ai distruttori – non solo delle voci ma anche della cooperazione interna – e chi preferisce bloccare l’accesso al minimo comportamento non perfettamente in linea con le mille regole interne dell’enciclopedia.
Aggiungo subito che non ho alcuna ricetta per risolvere questi problemi: ritengo però che sia opportuno esplicitarli, e non lasciarli sottotraccia come capita spesso… sperando che non si finisca come al solito a fare interminabili e inconcludenti discussioni.
(continua)

Ultimo aggiornamento: 2009-01-21 07:00

Tante parole su Wikipedia / incipit

A otto anni dalla nascita di quello che al tempo era un progetto ausiliario per la creazione di un’enciclopedia “classica”, Wikipedia è ormai una realtà incontrovertibile. Io non sono uno dei primissimi contributori dell’enciclopedia – avevo provato a vedere l’edizione in inglese subito dopo che era stata lanciata, ma non ero in grado di dare un contributo utile in un buon inglese, quindi lasciai perdere e non entrai nel primo nucleo di pionieri della versione in lingua italiana. Però ho comunque una certa qual anzianità: ho iniziato a contribuire nel luglio 2004, subito dopo le grandi diatribe sulla scelta di inserire tutti i comuni italiani e passare così da meno di 15000 a più di 22000 voci. Ho perciò visto buona parte dell’evoluzione dell’enciclopedia e credo di poter dire qualcosa al riguardo. Ho pensato così di raccontare qualcosa da un punto di vista un po’ mio e un po’ – se ci riesco – di una persona che Wikipedia la usa, vorrebbe magari saperne di più, ma non è per nulla interessato a sapere come funziona tecnicamente. Mi concentrerò sull’edizione in lingua italiana (it.wiki, per gli amici) che poi è quella che interessa maggiormente noi italiofoni, anche se confesso che a volte vado a consultare quella in lingua inglese, perché in certi casi la versione italiana non è ancora così completa.
Il testo che troverete in questi giorni sul blog è nato dopo uno scambio di email con Fabio Metitieri, e con l’aiuto di Gianluigi Gamba, Mario Benvenuti e Frieda Brioschi; spero sia superfluo aggiungere che tutto quello che scriverò è a titolo puramente personale e non ha nulla di ufficiale.
Lo trovate anche sul mio sito.

Ultimo aggiornamento: 2009-01-20 07:00

Quod est wikiveritas?

Da Slashdot sono finito su questo articolo di Technology Review. Così a prima vista l’articolo sembra essere uno della solita serie “perché wikipedia è brutta e cattiva”, e probabilmente in parte è così, anche se Garfinkel è costretto ad ammettere che le voci presenti sono sorprendentemente accurate (perché “miriadi di volontari apparentemente insonni sono costretti a passare buona parte del loro tempo a togliere quello che non sembra sufficientemente vero”, aggiunge in due punti diversi dell’articolo).
Fosse tutto qua, non mi sarei messo a commentarlo. Ci sono però due punti molto interessanti, che secondo me meritano di essere ponderati. Il primo, quello che si nota di più, è che secondo l’autore la comunità di wikipedia ha ridefinito il significato di “verità”. In pratica, “vero” non è più basato su consistenza e osservabilità, ma quello che conta è la verificabilità. In pratica, una cosa è vera-per-wiki se è riportata da un’altra fonte, possibilmente disponibile gratuitamente in rete (e in inglese, perché qua si parla sempre di en.wiki, e si sa che gli anglofoni sono forse più in difficoltà persino dei francesi ad accettare il concetto che ci siano delle altre lingue oltre alla loro). In un certo senso, questo è vero. La frasetta “citazione necessaria” viene aggiunta sempre più spesso alle voci di wikipedia, come chiosato anche da xkcd. D’altra parte, non è che tutte le fonti siano considerate uguali; ad esempio, garantisco che non dico il mio blog ma nemmeno il mio sito verrebbe considerato fonte sufficientemente valida. In pratica, insomma, l’epistemologia di wikipedia è demandata ad altri; è sicuramente più debole di un peer review (per l’ottima ragione che la comunità in genere non può essere definita di conoscenze pari a chi ha scritto la fonte), ma non è nemmeno così grave.
Ma forse il “maoismo digitale” invocato da Jaron Lanier (vedi qua) è un problema ben più grave. Lanier afferma che non è riuscito a togliere dalla voce a lui dedicata il fatto di essere anche un regista (negli anni ’90 ha girato un film sperimentale, definito da lui “spaventoso”). Tutte le volte che modificava la voce, qualcun altro rimetteva la scritta “che era stata tolta senza fonti”… fino a che non ha scritto il saggio che ho citato qui sopra. A questo punto la fonte c’era, e da allora Lanier non è più un regista :-) Naturalmente, e Garfinkel è pronto ad ammetterlo, nessuno poteva essere certo che l’utente che stava modificando la voce di Lanier fosse lo stesso Lanier; però l’esempio mostra come le politiche di wikipedia, almeno nella versione inglese, sono piuttosto inconsistenti quando si scende nel dettaglio. Infatti modificare la voce su sé stesso, almeno in en.wiki, viene considerata una cattiva procedura; non solamente in caso di autoelogi e promozione, ma in generale (per quanto ne so, nella versione italiana le migliorie a una voce esistente da parte del diretto interessato sono anzi gradite). C’è chi afferma che è vero che una persona è il miglior conoscitore di sé stesso, ma che si ha una “ricerca originale”, il Grande Peccato Wikipedico. Epperò, c’è tutta una parte dell’enciclopedia, quella dei fatti sulle trasmissioni televisive o sui fumetti, che in effetti è una ricerca originale: sì, la trasmissione o il fumetto esistono, ma non ci sono saggi ufficiali sull’argomento.
Che vuol dire tutto questo? Beh, che Wikipedia è incoerente. Nulla di realmente tragico: la filosofia moderna ci mostra una quantità incredibile di cose incoerenti. Onestamente non so se abbia un senso cercare di rendere le regole più coerenti: tutto è migliorabile, ci mancherebbe altro, ma per quanto sballato il meccanismo per adesso funziona, e quindi è meglio evitare riparazioni che potrebbero essere peggiorative. Detto tra noi, non credo nemmeno troppo alla possibilità di definire qualcuno “esperto del campo X”. A parte la difficoltà pratica, mi sa che rischieremmo guerre ancora peggiori tra due esperti.
Riassunto finale: Wikipedia è la tua amica, ma non è la Bibbia. Fìdatene il giusto necessario.

Ultimo aggiornamento: 2008-10-23 18:06