Chiunque abbia scritto un libro sa perfettamente che il numero di refusi è sempre notevole, anche se al giorno d’oggi almeno gli errori più marchiani vengono segnalati dal correttore ortografico. Quello che è peggio è che quando si dà in giro il manoscritto da controllare, la gente trova i refusi, ma capita sempre che persone diverse ne trovino di diversi: in pratica non si può essere certi che siano stati trovati proprio tutti. (Per amor di precisione, la mia esperienza dice che si può essere certi che ne siano rimasti). Ma si può avere una stima di quanti siano gli errori sfuggiti ai correttori di bozze? Certo.
Supponiamo che in un manoscritto ci siano n refusi, e che sia letto da due persone che ne abbiano trovato una percentuale pari rispettivamente a p e q. Se facciamo l’assunzione che le due persone abbiano letto indipendentemente il testo (e questo lo possiamo sperare) e che la probabilità che trovino un singolo refuso sia indipendente (e qui non ci giurerei, leggete dopo), allora il primo avrà trovato np refusi, mentre il secondo nq. I refusi trovati da entrambi saranno allora npq, per l’ipotesi di indipendenza del singolo refuso. Il rapporto tra i refusi trovati per esempio dal primo lettore e quelli trovati da entrambi sarà pertanto 1/q; da qui e dal numero di refusi trovato dal secondo lettore possiamo avere una stima del numero totale di refusi.
In questo bel sistema teorico c’è un punto debole. Alcuni refusi a mio parere sono così eclatanti che nessuno può fare a meno di trovarli, e quindi il numero stimato dal processo qui sopra sovrastima il totale. È possibile fare di meglio? Probabilmente un esperto in statistica avrebbe una risposta esatta; io mi limito a fare un ragionamento euristico. Aggiungiamo un terzo lettore, ed eliminiamo dal computo totale i refusi che sono stati trovati da tutti e tre; poi prendiamo i primi due e rifacciamo il conteggio del numero stimato di refusi, ricordandosi poi di aggiungere quelli che abbiamo tolto all’inizio. In questo modo abbiamo una sottostima, perché alcuni dei refusi sono stati trovati da tutti solo per caso; otteniamo così una forchetta migliore del singolo dato di prima.
Però sappiate che i refusi in un testo sono sempre più di quanti se ne sono trovati!
Devo dire che in questo post non ho trovato nemmeno un refuso! :-)
Non sono un esperto di statistica, ma di review si :-).
Posso dire che il numero di refusi unici trovati da un singolo reviewer è correlato alla diversità del background culturale dei reviewer stessi. Tanto più i singoli reviewer vengono da ambienti, gruppi, scuole diverse, tanto maggiori saranno gli errori unici trovati. Dalla esperienza pratica direi che questo fattore conta più della cardinalità dell’insieme dei reviewer, almeno per n>=3.
Ricordo un testo a cui a me e a un paio d’altri era stato chiesto di cercare errori prima che venisse diffuso (non si trattava di peer review, comunque, l’autore ci contattò tutti personalmente, per questo conosco il risultato di cui parlo sotto… fosse stata una peer review non lo conoscerei).
Tutti trovammo diversi refusi… ma nessuno gli stessi! Ognuno trovò refusi diversi (anche se al 99% correttamente, cioè una minimissima parte dei refusi trovati alla fine non erano veri refusi… ma tutte le liste che presentammo all’autore erano diverse, anche se – come detto – tutte in larghissima parte corrette).