Grandi risultati informatici della sanità lombarda

Martedì Jacopo ha dovuto fare un tampone (negativo) perché la pediatra voleva essere certa che un suo sfogo cutaneo non fosse legato alle nuove versioni di Covid. Il laboratorio a cui ci ha mandato (Synlab) è privato, come nella miglior tradizione lombarda. Fatto il tampone (con notevole difficoltà legata al divincolarsi del giovane) danno ad Anna un foglio con le istruzioni per scaricare il giorno dopo il risultato. Fin qui tutto perfetto: non c’è alcuna ragione per dover tornare a ritirare un foglio. Ieri mattina provo a collegarmi al sito: ci ho perso venti minuti. In pratica ogni pagina a cui cercavo di accedere si caricava in un minuto o due, sempre che non andasse in timeout e dovessi rilanciarla.
Mi chiedo come sia possibile avere una connessione a scoiattoli per un sito. Gliel’avrei anche detto compilando il modulo di feedback che mi proponevano, ma è finito in timeout anche lui…

La “conoscenza” di Google

Quando fate una ricerca Google, spesso trovate nella colonna di destra un risultato già pronto, molto spesso da Wikipedia. Per dire, se io mi cerco arriva il risultato che vedete qui a sinistra. (Your mileage may vary: probabilmente a voi potrebbe arrivare il calciatore mio omonimo). Generalmente quelle informazioni sono prese da Wikipedia, citando regolarmente la fonte; ci sono eccezioni come nel mio caso, visto che come sapete Wikipedia non ha una voce su di me e quindi le informazioni arrivano dal sito del mio editore, ma in genere funziona così. Google aveva anche cercato di creare una sua base di conoscenza, ma alla fine ha visto che era più semplice dare du’ spicci alla Wikimedia Foundation e sfruttare il lavoro dei wikipediani. Solo che ci sono alcuni problemi…

A volte capita qualcuno che si lamenta perché trova un insulto nel testo di quella colonna, insulto che però non appare da nessuna parte su Wikipedia. Non sto a spiegarvi come lo si può fare, anche se è un segreto di Pulcinella; in quel caso però la colpa è in effetti anche di Wikipedia. Ma ci sono casi peggiori. Nell’ultimo mese, per due volte sono stato contattato da qualcuno che trovava la sua foto con allegata la descrizione da Wikipedia di tutt’altra persona, e chiedeva di toglierla. Il primo caso è stato quello di un giornalista a cui corrispondeva la biografia di un avvocato del secolo scorso; la seconda persona è Mario Moroni, che se vi ricordate mi aveva intervistato un paio di mesi fa. Qui Wikipedia non c’entra proprio nulla; molto semplicemente, le voci mostrate non hanno immagini a corredo – ricordate che anche le immagini su Wikipedia devono avere una licenza libera, quindi spesso è impossibile averne qualcuna. E allora che fa Google? Cerca in giro e prende l’immagine più cliccata corrispondente a quel nome-e-cognome, nel migliore esempio di stupidità applicata.

Ma la cosa peggiore è che Moroni prima di me aveva contattato Google che gli aveva detto che la colpa era di Wikipedia; e dopo che lui aveva riportato la mia risposta gli hanno replicato che se non c’è una voce wiki su una persona inseriscono la descrizione dell’omonimo con la foto di quella persona perché non possono verificarla. Posso dire che c’è qualcosa che non funziona in questo approccio?

Traduzioni automatiche non delle migliori

Domani Jacopo ha la verifica di spagnolo, e quindi mi sono messo a farlo ripassare. L’unità è dedicata allo sport, e tra le varie parole c’era “empatar”. Gli chiedo “cosa vuol dire?” e lui mi guarda come la mucca che guarda il treno. Io gli faccio “dai, è facile: è come impattare, cioè pareggiare. Guarda, te lo faccio vedere con Google Translate”. Apro, scrivo “empatar”, e mi esce fuori “cravatta”. Peggio ancora, scrivo “empatar un partido” per vedere se con un po’ di contesto la cosa funziona meglio, ed esce “per legare a una partita”. Vabbè, ho tirato fuori un vocabolarietto spagnolo e ho fatto vedere al giovane virgulto che essendo preadolescente non si fida più del suo vecchio padre che avevo ragione.

Cosa è successo? I più astuti tra i miei ventun lettori l’avranno capito. Provate a tradurre dallo spagnolo in inglese: “empatar” diventa (correttamente) “tie” e “empatar un partido” diventa “to tie at a game”. Evidentemente il sofisticatissimo sistema di traduzione automatica di Google Translate passa dall’inglese per tradurre dallo spagnolo all’italiano, ma non avendo nessuna idea semantica quando trova “tie” lo legge come “cravatta”, così come “to tie at a game” viene tradotto letteralmente come “per legare a una partita”. Direi che c’è ancora parecchia strada da fare….

Facebook mi segnala…

segnalazione di Facebook
Stamattina Facebook mi ha segnalato che il Garante ha sanzionato Facebook per un’informazione scorretta. Il testo – che bisognava leggere subito: ho aperto una nuova finestra ed era già svanito… – si trova a https://www.facebook.com/legal/italy e dice:

AUTORITÀ GARANTE DELLA CONCORRENZA E DEL MERCATO
Le società Facebook Inc. e Facebook Ireland Ltd.
Non hanno informato adeguatamente e immediatamente i consumatori, in fase di attivazione dell’account, dell’attività di raccolta, con intento commerciale, dei dati da loro forniti. In tal modo hanno indotto i consumatori a registrarsi sulla Piattaforma Facebook, enfatizzando anche la gratuità del servizio.
Tale pratica è stata valutata scorretta, ai sensi degli artt. 21 e 22 del Decreto Legislativo n. 206/2005 (Codice del Consumo).
L’Autorità ha disposto la pubblicazione della presente dichiarazione rettificativa ai sensi dell’articolo 27, comma 8, del Codice del Consumo.
(provvedimento adottato nell’adunanza del 29 novembre 2018 e disponibile sul sito www.agcm.it)

“Naturalmente” non ci sono link specifici sui provvedimenti, ma solo un puntatore al sito AGCM. Se siete curiosi, l’adunanza si trova qui: sono d’accordo col fatto che Facebook non dice che userà i dati per scopi commerciali, non credo molto che il fatto che “induca ingannevolmente” gli utenti a registrarsi, “enfatizzandone la sola gratuità” cosicché “gli utenti consumatori hanno assunto una decisione di natura commerciale che non avrebbero altrimenti preso (registrazione al social network e permanenza nel medesimo)”, ma non è un mio problema.

Ma qui parliamo di due anni e mezzo fa. cosa è successo dopo la pubblicazione? Ho trovato una nuova istruttoria aperta più di un anno dopo (gennaio 2020). In quell’anno c’è stata una sospensiva (sulla sola pubblicazione) da parte dell’ineffabile Tar del Lazio; l’istruttoria è andata avanti e il 17 febbraio scorso c’è stata la nuova sentenza, dove si rimarca che Facebook Inc. e Facebook Ireland Ltd “non hanno pubblicato la dichiarazione rettificativa e non hanno cessato la pratica scorretta accertata: pur avendo eliminato il claim di gratuità in sede di registrazione alla piattaforma, ancora non si fornisce un’immediata e chiara informazione sulla raccolta e sull’utilizzo a fini commerciali dei dati degli utenti.” (e specifica che ciò deve essere fatto “alla luce del valore economico assunto per Facebook dai dati ceduti dall’utente, che costituiscono il corrispettivo stesso per l’utilizzo del servizio.” Se il Codacons legge questo estratto fa partire una class action per obbligare Facebook a pagare i suoi utenti per l’uso della piattaforma).

Non sono riuscito a vedere se la nuova dichiarazione rettificativa debba essere presente per venti giorni nelle home page mobili, come lo era la vecchia, e non posso controllare direttamente non avendo Facebook sul mio furbofono. Se qualcuno volesse verificare, gliene sarei grato. Interessante comunque che a metà febbraio, quando è stata pubblicata la delibera del garante, io non avessi visto nulla in giro. Voi?

Il Garante ha colpito ancora

Ieri ho scritto del sito haveibeenfacebooked. Oggi il sito è sospeso “per ragioni legali” (il famoso codice di errore HTML 451). Il tutto perché il Garante ha ricordato a«chiunque sia entrato in possesso dei dati personali provenienti dalla violazione, che il loro eventuale utilizzo, anche per fini positivi, è vietato dalla normativa in materia di privacy, essendo tali informazioni frutto di un trattamento illecito.»

Nulla di strano, considerando che il sito era italiano, come avevo scritto in un post scriptum ieri (ci avevo pensato dopo averlo postato, scusatemi). La cosa più divertente di tutto questo, almeno per me, è che però nel messaggio di sospensione del sito sono stati lasciati i link ai sorgenti, sia front-end che back-end. Ovviamente avere i sorgenti a disposizione non è molto diverso dal dire “denunciateci tutti”, perché in questo modo si dà a chiunque la possibilità almeno teorica di accedere direttamente ai dati trafugati… Secondo me l’hanno fatto apposta.

Have I Been Facebooked?

In questi giorni avrete letto che dati personali di mezzo miliardo di account Facebook sono stati resi pubblici. I dati erano stati trafugati l’anno scorso, ma adesso sono appunto molto più visibili. Dal sito haveibeenfacebooked.com è possibile vedere cosa è (pubblicamente) conoscibile a partire da un numero di telefono. Per dire, su di me sanno

Facebook account ID
First name: M*******
Last name: C******
Gender
Location
Workplace

(ok, “workplace” dovrebbe essere Wikimedia Italia, ma anche se fosse la grande azienda dove lavoro la cosa cambierebbe poco). Notate che non è affatto chiaro se ci siano altri dati ottenibili solo a pagamento: questi sono quelli pubblici.

La cosa che mi preoccupa di più è naturalmente il phishing: un conto è mandare un SMS a un numero di telefono con un testo generico, altra storia è cominciare il messaggio con “ciao Maurizio!”. L’altra cosa che mi chiedo è se Facebook doveva rispettare il GDPR, e se sì come ha segnalato il data breach…

PS: in genere non è mai consigliato inserire i propri dati in un sito come questo, che tra l’altro è stato registrato da qualcuno che sta in provincia di Milano… Diciamo che vi conviene evitare di farlo e comportarvi come se i vostri dati fossero in effetti stati rubati.

Gli hub della disinformazione

La CBS riporta uno studio del Center for Countering Digital Hate, che mostra come i due terzi dei contenuti contro i vaccini e la loro sicurezza si possono far risalire a dodici persone, tra cui Robert F. Kennedy Jr., figlio di Bob e quindi uno dei millemila nipoti di John Kennedy. Per i curiosi, il documento si può scaricare da qui.

Da un punto di vista strettamente matematico – e che credo possa essere condiviso anche dagli antivaxx – questo risultato è molto interessante, perché mostra la portata della legge di potenza e del potere degli hub, di cui ho parlato con il mio amico e collega Paolo Artuso in Scimmie digitali. In pratica, pochi punti ben collegati – se volete, potete chiamarli “i poteri forti”… – bastano per una diffusione capillare delle informazioni. Questo accentramento è assolutamente normale in rete, per la semplice ragione che da un lato la diffusione di un’informazione è indipendente dalla distanza, e dall’altro che noi esseri umani siamo cablati per credere una cosa più vera se ci arriva da fonti che crediamo indipendenti.

Paradossalmente, insomma, diamo più credito a una stessa notizia ripetuta più volte che a tante notizie coerenti ma un po’ diverse tra loro; visto che le fonti antivaxx sono molto meno di quelle provaxx, ecco che molta gente dà più retta alle prime. Certo, qualcuno potrebbe dire che le grande piattaforme potrebbero fare qualcosa per bloccare quella sporca dozzina. Ma secondo voi succederà mai?

Google dà soldi anche agli editori italiani

Ieri sul blog di Google Italia è stato annunciato l’arrivo di Google News Showcase, che tradotto in italiano corrente significa “hanno fatto l’accordo con parecchi editori italiani”. Guardando la lista, spicca l’assenza di GEdI; ma abbiamo Cairo (Corriere della Sera), Caltagirone (Messaggero e Gazzettino), Monrif (Quotidiano Nazionale), Il Fatto Quotidiano, il Giornale e Libero. Insomma, una sventagliata di testate di tutte le tendenze politiche.

Al netto della soddisfazione indicata da tutti gli attori, si riesce a capire che tra qualche settimana Google pagherà anche in Italia i famosi “diritti connessi”, oltre che “la possibilità ai lettori di accedere a contenuti selezionati dietro paywall”, qualunque cosa ciò voglia dire. Repubblica si limita a un trafiletto, mentre La Stampa ricopia più o meno pedissequamente il comunicato: in entrambi i giornali la notizia è nascosta nelle sezioni economia e finanza.

Sarà interessante vedere cosa succederà tra un paio d’anni, secondo me. È vero che senza giornali le Big Tech non possono postare articoli (tranne quelli di cronaca, che già da un po’ possono essere composti da intelligenze artificali…), ma è anche vero che c’è un grande rischio che i quotidiani diventino lentamente una propaggine della Grande G. Chi vivrà leggerà…