Chi genera i dati?

Neanche a farlo apposta, dopo il mio pippone di ieri ho scoperto che Goodreads sta per eliminare con un preavviso minimo (una settimana…) un’enorme quantità di dati presi da Amazon, perché le condizioni d’uso sono diventate nel tempo sempre più restrittive e ora sembrano impossibili da gestire. Quelli di Goodreads stanno così chiedendo ai librarian di “salvare” i libri: c’è proprio un pulsante “rescue me” che permette di riscrivere i metadati del libro, indicando se la fonte è un sito (non una libreria online…) o la propria copia del libro. Il lavoro è massacrante: tanto per fare un esempio, io avrei 243 libri da rimettere in sesto.
Alcune considerazioni sparse:
– Mi domando quali siano i diritti che Amazon accampa sui “suoi” dati, che in pratica sono quelli che gli arrivano dagli editori qualche mese prima dell’effettiva pubblicazione dei libri.
– Come corollario, i libri che verranno salvati avranno dati migliori di quelli che ci sono stati fino ad ora. Garantisco che il numero di pagine, e a volte persino il titolo nel caso di editori minori, sono spesso errati e non vengono corretti se non dopo parecchio tempo: nulla di strano, perché tanto per dire il mio libro è stato aggiunto a fine novembre 2010 quando non avevo nemmeno terminato di correggere le prime bozze!
– È vero che i contenuti generati dagli utenti (user generated content) sono generalmente di buona qualità, soprattutto in casi come questo in cui chi opererà ha un interesse personale, ma sarebbe molto più logico che Goodreads si accordasse con gli editori. Tra l’altro già adesso c’è il campo “official URL”, che punta al sito dell’editore: una collaborazione di questo tipo è win-win, ancora più oggidì con i siti degli editori che fanno e-commerce.
Insomma, perché dover sempre sfruttare il volontariato senza mai pensare alla possibilità di accordarsi per generare dati semantici?

Ultimo aggiornamento: 2012-01-24 20:43

13 pensieri su “Chi genera i dati?

  1. José Frasquelo Bové

    IANAL ma direi che campano il diritto sul dato raccolto e immagazzinato più che sull’informazione stessa, però quelli di goodreads non danno abbastanza dettagli per inquadrare esattamente la questione

  2. mattia?

    Sto leggendo le discussioni. Per come la stanno facendo mi pare una mossa suicida. Cancellare o cambiare versione dei libri significa rendere il sito inutilizzabile. Avrebbero quanto meno dovuto dare più tempo agli utenti per salvare i dati. Io certo non ho tempo in pochi giorni di mettere a posto i miei libri, figuriamoci mettermi a salvare quelli degli altri. Mah.

  3. .mau.

    ufficialmente dicono che all’inizio della prossima settimana importeranno un nuovo db di 14 milioni di titoli, ma mi sa per la maggior parte saranno inglesi. Resta il punto che amazon usa le pre-descrizioni dei libri, che sono anche spesso errate…

  4. mattia?

    Il fatto è che gli editori sono troppi per poter prendere i dati da ognuno di loro. Illudersi di prendere i dati dalle biblioteche è follia, basti pensare che quelle che sono nostre clienti importano i dati dalle nostri api che si basano a loro volta sui cataloghi commerciali. Forse solo sbn potrebbe essere affidabile, ma non sono certo che siano in pari con le novità.

  5. .mau.

    ma un editore intelligente, soprattutto se ha un sito che fa anche ecommerce, dovrebbe andare lui a offrire i dati :-)

  6. mestesso

    Molto brevemente: un editore ha poco o scarso interesse a diffondere lui medesimo i dati in formato “intelligente”. Perché? Ma perché chi distribuisce i prodotti digitali (Amazon et al) si comporta come la GDO (Grande distribuzione Organizzata): schiaccia il produttore con accordi capestro, e lo inchioda al muro. Questi metadati andrebbero immediatamente in pancia al distributore, favorendo lui (e non chi il contenuto lo pubblica).

  7. pbm

    In Italia si chiama Informazioni Editoriali – http://www.ie-online.it/ ed è una società dalla storia paradigmaticamente interessante: nata come consortile fra gruppi editoriali è stata poi via via abbandonata dagli editori maggiori e quindi assorbita dal gruppo Messaggerie Italiane – http://www.messaggerie.it/ che è contemporaneamente (la teoria di @mestesso non regge) editore (GeMS), distributore (Messaggerie Libri), dettagliante (MEL) Giunti al Punto, Ubik…) e online (IBS).
    Ovviamente produrre questi dati costa (l’azienda ha una redazione di una trentina di persone) e non essendo più, appunto, un servizio “degli editori” ma “ai dettaglianti” (e ad altri) viene fatto pagare ed è soggetto a condizioni d’uso…

  8. mestesso

    @pbm: io trovo buffo che la qualità dei dati su IBS (anche su prodotti dello stesso padrone) sia scarsa ;-). Me lo spiegheresti questo?

I commenti sono chiusi.