L’altro giorno scrivevo di una sentenza americana contro Anthropic per l’uso diciamo “disinvolto” di testi piratati per addestrare i suoi LLM. Quasi contemporaneamente c’è stata però una sentenza di segno opposto a favore di Meta. Ancora una volta, però, le cose non sono quelle che appaiono a prima vista.
In questo caso, infatti, il giudice Vince Chhabria ha dato ragione a Meta non perché la controparte avesse torto, ma perché ha chiesto le cose sbagliate. Dal suo punto di vista, Llama non riesce a generare ampi stralci di testo copiato dagli autori, e quindi la loro azione legale per violazione di copyright deve essere rigettata. In compenso, però, nota come la proliferazione di libri di scarsa qualità generati dalle IA può inquinare il mercato e quindi togliere valore alla creatività degli autori umani; peccato che gli autori non abbiano chiesto una condanna per tale fatto. Tutto questo lascia spazio a nuove cause, anche se vedo difficile dimostrare che un autore non vende perché le IA hanno riempito il mercato. In compenso, anche in questo caso il problema dei libri “caduti dal camion” e usati illegalmente per addestrare i modelli è lasciato a un giudizio successivo.
Che si può concludere? Che noi non abbiamo molte idee su come applicare la legge all’addestramento degli LLM, ma i giudici americani ne hanno ancora di meno… (e come dicevo l’altra volta, da noi non si parla nemmeno di tutto questo)
La doppia h (Chhabria) in che lingue acquista un senso fonologico? Casomai Lucia passasse da questi pizzi…
https://en.wikipedia.org/wiki/Chabra .
Guardando https://en.wikipedia.org/wiki/Shahmukhi , immagino che la traslitterazione usi k͟hē e waḍḍi ḥē (rispettivamente n. 10 e 9 tra le consonanti nella pagina).
Grazie, quindi è solo un tema di traslitterazione IPA priva di singoli glifi per ogni consonante di partenza.
Nella UE siamo più lenti in generale, e da noi la guerra principale sarà fra Springer vs LLM. Immagino che Springer lato UE (in USA ha già dato) stia affilando i coltelli, sia per raccogliere evidenze varie che lato lobbying. Molto farà anche il negoziato sui dazi, dove i vari ricatti incrociati saranno fortemente impattanti.
Perché pensi specificatamente a Springer? RELX (ex Reed Elsevier), Wiley-Blackwell (John Wiley & Sons) e Sage Publishing resteranno a guardare?
Springer è quello più importante ed influente, specie dopo la brexit che ha escluso dai giochi Penguin & Co., ed in generale gli inglesi che nel mercato librario contavano parecchio.