(vedi prima e seconda parte)
Ora che Wikipedia è così famosa, capita sempre più spesso che qualcuno la utilizzi come fonte: detto in parole povere, prenda una voce dall’enciclopedia e la ritenga verità assoluta. Se Enzo Jannacci aggiornasse oggi il testo della sua canzone Quelli che…, immagino che al posto di “l’ha detto il telegiornale!” canterebbe “l’ha detto Wikipedia!” Di per sé copiare dall’enciclopedia non è affatto vietato, anzi: peccato che troppo spesso la gente – anche i giornalisti, sì – “si dimenticano” che la licenza d’uso prevede di indicare esplicitamente da dove è stato tratto il testo. Ma non è di questo che vorrei parlare, quanto del concetto di “fonte” e delle sue conseguenze in Wikipedia.
Innanzitutto, Wikipedia è per definizione una fonte secondaria, se non addirittura terziaria. Mi spiego: una fonte primaria è un testo dove si presentano per la prima volta i risultati di una ricerca, o in generale una notizia. Una fonte secondaria è quella che cita delle fonti primarie, un po’ come la rassegna stampa che non è un giornale ma contiene ritagli dai vari giornali; una fonte terziaria fa lo stesso con tutte le fonti, primarie, secondarie o terziarie che siano. In Wikipedia questo concetto è riassunto con le parole forse un po’ fuorvianti “niente ricerche originali”. Ciò significa che Wikipedia non è il posto dove scrivere la vostra relazione sull’evoluzione delle corolle dei fiori nell’alta val Brembana. Non perché non sia una interessante, ma perché Wikipedia non vuole essere il punto di ingresso delle conoscenze ma vuole raccogliere quanto è stato accettato da qualcun altro. Insomma, per prima cosa pubblicate la vostra ricerca sul Bollettino della Società Fitologica delle Alpi Lombarde, poi venite a inserirla nell’enciclopedia fregiandovi con il link della fonte. Lo stesso vale per le biografie di personaggi oscuri a tutti, se non ai loro parenti che con tanto amore hanno scritto la biografia in questione e magari pubblicato un libro a loro spese o con i nuovi servizi “print on demand”.
Discorso ancora diverso, anche se fondamentalmente sulla stessa linea, per le voci sulle aziende. Una voce sulla Fiat non può mancare, e potrebbe anche esserci una voce più specializzata con l’elenco dei modelli d’auto prodotti dalla Fiat nella sua storia, il periodo in cui sono stati commercializzati e il numero di esemplari prodotti (quando ho scritto queste note non c’era, per la cronaca). Però se qualcuno scrivesse della latteria Giobatta Pautasso di Villar Perosa, la voce verrà subito eliminata. Di nuovo, sono in tanti a scrivere della Fiat, e Wikipedia si limita a prendere i dati che si trovano in giro e presentarli in modo organico; non c’è nessuno che parli del buon Pautasso, anche se vende la toma migliore di tutta la valle.
Qual è il confine che permette di dire se una voce è enciclopedica oppure no? Non è specificato da nessuna parte. Ci sono casi borderline che utenti diversi valutano in maniera opposta, anche se sono sorprendentemente poche le votazioni sull’opportunità di mantenere una voce che finiscono con un acceso dibattito. Per dare un’idea, una persona ai limiti dell’enciclopedicità sono io, visti i miei trascorsi informatici come direttore esecutivo della Naming Authority e coordinatore della gerarchia usenet it.*. Nel mio caso personale ci sono ragioni di opportunità che fanno ad ogni modo evitare l’inserimento, ma il concetto di fondo resta quello: per alcuni wikipediani le mie referenze basterebbero, per altri no. Per alcune categorie (calciatori, scrittori…) si sono stabilite delle linee guida per dare un bollino di accettazione – notate che non ci sono linee guida per dire “una voce di una certa categoria non viene inserita – ma non si potrà mai completare una griglia di ammissione.
Lo so che molti sono convinti che la “loro” voce debba avere cittadinanza in Wikipedia, ma il motivo generalmente da loro addotto, “Ma non costa nulla avere una voce in più! Mica ci sono problemi di spazio” cozza contro due problemi. Il primo, come visto in precedenza, è che un costo in effetti c’è, ed è proprio in termini di denaro; il secondo è più filosofico, come spiegato sopra, ed è legato alla scelta di non raccogliere tutta la conoscenza ma solo tutta la conoscenza resa per così dire “ufficiale” da qualcun altro. Se mi è permesso un paragone forse un po’ ardito, non si vuole fare la borgesiana mappa 1 a 1 del territorio, che poi venne buttata via perché tanto valeva usare il territorio stesso come mappa. Temiamo poi anche un altro pericolo: qualcuno copia da Wikipedia un’affermazione senza fonti, e a sua volta Wikipedia aggiunge come fonte chi l’aveva. Più che lo scioglilingua, il problema è che in questo modo non c’è nessuna verifica della fonte, il che per un’enciclopedia è un peccato mortale.
È poi chiaro che un alto problema è la scelta delle fonti. In questo campo l’uguaglianza non ha affatto diritto di cittadinanza: penso che siano tutti d’accordo che è ben diverso citare la Treccani, dove si suppone una redazione controlli i vari testi pubblicati, oppure l’Eco di Roccacannuccia che ha un volonteroso tuttofare che assembla il mensile a partire da tutte le dicerie del paese. Ma il problema sorge in altre situazioni. Un testo di una casa editrice nota per pubblicare teorie complottiste è una fonte valida? E chi è che definisce se quell’editore pubblica teorie complottiste? Anche tra i quotidiani più blasonati gli svarioni anche pesanti sono ormai all’ordine del giorno; non basta più citare un articolo per avere la certezza che quanto scritto sia vero. Wikipedia per il momento non prende posizione su questi temi e cerca di limitarsi a indicare le varie possibilità se non ce n’è una assolutamente predominante: ma non è detto che la situazione resti tale e non si crei un elenco di “fonti più considerate”.
Una voce di Wikipedia ha però una dimensione in più rispetto a un’enciclopedia normale: la sua cronologia, cioè la possibilità di vedere tutte le modifiche apportate ad essa nel tempo. In teoria è uno strumento molto potente: combinato con la possibilità di sapere tutte le modifiche di un utente alle voci dell’enciclopedia, può infatti permettere di capire se una certa aggiunta o modifica è stata fatta da una persona generalmente affidabile oppure no. Il guaio è che questa operazione è molto complicata, e non viene in pratica fatta mai, se non in due casi molto particolari: l’ultimissima modifica di una voce, per decidere se è valida o reinserire la versione precedente, e la ricerca di violazioni di copyright pregresse, dove viene fatta un’attenta operazione chirurgica per lasciare solamente i contributi corretti cancellando quelli illegali. Se sei un utente non troppo scafato, probabilmente WikiScanner può aiutarti: ti permette infatti di scoprire, nel caso di modifiche alle voci fatte da utenti non registrati, da quale rete tali modifiche provengano. Un altro strumento molto utile, che però richiede un’installazione nel proprio PC, è la History Flow Visualization Application di IBM, che visualizza graficamente le “stratificazione” delle successive versioni di una pagina.
(continua)
Ultimo aggiornamento: 2009-01-22 07:00
Come posso “scaricarmi” la cronologia di una pagina di wikipedia per analizzarla col tool di IBM? Ho cercato in rete ma non sono riuscito a trovare niente…
Grazie!
Epperdincibacco, ora che ci penso: come mai una prestigiosa rivista come RM non ha ancora una voce su Wikipedia? Qualcuno dubita della sua palese enciclopedicità? Adesso mi mi metto alla tastiera e tiro giù uno stub di due o trecentomila caratteri…
Amenità a parte, credo che, come al solito, uno dei punti essenziali sia il solito bilancio aspettativa/prodotto. Se cerco qualcosa su Wikipedia, lo faccio consapevole di star compiendo un’azione diversa dallo sfogliare la Treccani. E dico davvero “diversa”, non necessariamente “di qualità inferiore”. Qualcuno aveva fatto uno studio sull’affidabilità comparata tra la Britannica e Wikipedia, un paio d’anni fa, con risultati sorprendenti (non tanto peer l’affidabilità alta di Wikipedia, quanto per la bassa della Britannica); ma non mi sembra neanche questo dell’affidabilità il punto centrale.
Pensate alla “garzantina”: è indubbio che una delle ragioni del suo successo editoriale (specialmente prima dell’esistenza di internet) sta nel fatto che dedica volentieri un paio di righe anche a personaggi del tutto minori dello spettacolo e della cronaca, e che spesso venga comprata per avere un posto dove andare a vedere quanti anni abbia Gerry Scotti. Un “who’s who” in tono minore, insomma.
In gran parte, Wikipedia viene usata in questo senso, e finchè se ne fa questo uso, gran parte dei problemi esposti sono probabilmente sovradimensionati. Nel momento in cui viene usata come fonte primaria per altri tipi di ricerca, allora il discorso diventa diverso. Però, anche qui: in questi termini, gran parte parte delle questioni sollevate si ripresentano, mutatis mutandis, anche negli uffici di redazione della Treccani. Certo, lì si farà prima a trovare delle soluzioni di compromesso, immagino…
Di solito uso wikipedia proprio come fonte secondaria, nel senso che mi dà un’idea generale della situazione e un riferimento ad alcune fonti. Ad esempio:
1) quando un collega ha proposto di misurare la produttività usando l’indice h, ho scoperto cos’era, un paio di link ad articoli significativi pro e contro, e un link a un sito per calcolare il detto indice;
2) mi hanno regalato un libro che mi è piaciuto molto; ho trovato qualche interessante informazione sull’autore e una lista degli altri libri con traccia dei contenuti;
3) uno dei miei figli ha avuto sintomi stranissimi, commentati dal pediatra in modo assai sibillino; ho trovato una spiegazione dei termini tecnici e un paio di link di approfondimento (su siti affidabili tipo American Academy of Pediatrics), che mi hanno rassicurata molto.
Mi chiedo se la differenza sia tutta nel fatto che in genere non limito le mie ricerche ad articoli in italiano.
Il problema dell’autorevolezza delle fonti è a sua volta inficiato dal fatto, ormai evidente e conclamato, che svariate di quelle che un tempo erano fonti autorevoli (quali la stampa “ufficiale”, termine evocativo anche se nessuno potrebbe esattamente definire cosa ciò significhi) abbiano iniziato a riprendere voci da wikipedia, generando un circuito informativo ricorsivo che potrebbe comportare l’amplificazione di sciocchezze.
Un troll, un vandalo o un semplice disinformato in buona fede scrive una sciocchezza (magari con il template “citazione necessaria”!), questa viene ripresa da uno stagista in un articolo di costume su Repubblica e Repubblica viene citata come fonte eliminando il template.
E’ un po’ lo stesso meccanismo visto con voci segnalate come violazioni di copyright perché riprendevano paro paro siti che invece avevano smaccatamente copiato da wiki: non sempre è possibile risalire alla data di pubblicazione e capire chi è l’uovo e chi la gallina.
Ovvio che Wikipedia in tutto ciò non abbia alcuna responsabilità, dato che il problema è nel manico, vale a dire in chi non sa fare il proprio mestiere o non è messo in grado di farlo correttamente.
Riprovo a commentare sul tema sperando di superare questa volta la coda di moderazione… :-)
Da quanto scrivi parrebbe che la cancellazione di voci su Wikipedia sia prevalentemente legata ai casi che citi. In realtà se scorri la pagina di cancellazione la maggior parte delle voci in “fase di cancellazione” non sono voci che costituiscono “fonti primarie” (attualmente su un centinaio di voci ne ho trovata una che potrebbe corrispondere a questo caso). Ve ne sono a dire il vero alcuna altre (poche comunque) che sembrano essere il curriculum di illustri sconosciuti che provano ad usare Wikipedia per farsi un po’ di pubblicità. Esclusi questi casi però il 95% almeno delle voci in cancellazione sono legate ad un caso diverso, ovvero a quello di voci perfettamente compatibili con le linee guida di Wikipedia riguardo al rapporto con le fonti e assolutamente non autopromozionali che però vengono considerate non enciclopediche per il tema che trattano in quanto considerate non di pubblico interesse. Ovviamente si entra in un campo del tutto soggettivo: si va dal Museo dell’Aeronautica della tal città, al fotografo considerato famoso dagli appassionati ma ignoto al grande pubblico, dal gruppo musicale dal recente successo, al calciatore giovanissimo ma che ha già giocato in Serie A, alla frazione di un paese celebre perché Baracca era caduto con il suo aereo proprio lì. Questo uso prevalente, oltre che snaturare il senso dello strumento della cancellazione, ha un altro risvolto molto negativo. Il contributore che scrive una pagina sul suo pianista preferito e se la vede cancellare viene molto demotivato dal continuare a contribuire a Wikipedia.
Refuso: «pyubblicati».
Per la questione delle ricerche originali, bisogna anche considerare il rischio di esagerare: vedi http://brianna.modernthings.org/article/147/wikipedia-the-deeply-conservative-and-traditional-encyclopedia (tanto per fare il postino, segnalo anche questo recente messaggio e i suoi collegamenti, molto meno interessanti: http://www.astick.net/blog/?p=47, http://en.wikipedia.org/wiki/Wikipedia:WikiProject_Countering_systemic_bias).
Su questo quoto Alberto. Se il principio è la democrazia, qualsiasi cosa interessi a qualcuno tanto da perdere del tempo a scrivere una voce è per definizione enciclopedica. Quando lo fai, e dopo che hai passato delle ore a scrivere arriva uno che palesemente non ne capisce niente dell’argomento ma che mette la tua voce in cancellazione, il risultato è che ti viene da odiare Wikipedia e da decidere che non ci perderai mai più tempo – e ciò non è bello.
Comunque, uno potrebbe accettare un giudizio ponderato e motivato, o perlomeno delle linee guida (se i calciatori devono essere di A, almeno il criterio è chiaro)… mi basterebbe che l’enciclopedicità delle voci su Usenet siano discusse con esperti di Usenet e non con il primo che passa, per esempio :-)
Wikipedia per l’utente comune
Vantaggi e svantaggi di wikipedia visti da uno a cui non importa come è fatta.
Wikipedia e i vandali
Che cosa sono poi questi “vandalismi”?