Chiacchiero di Wikipedia su Radio Capital

Domattina alle 9.10 dovrei essere in collegamento telefonico con Radio Capital a parlare delle preoccupazioni della Wikimedia Foundation sul calo degli accessi (e quindi immagino delle donazioni…) a Wikipedia perché in tanti chiedono a ChatGPT oppure leggono il riassunto di AI Overview. Se ci riesco cercherò di spostare la chiacchierata su un tema che a me preoccupa ancora di più: voci scritte da AI e che ovviamente contengono le usuali allucinazioni degli LLM. Stay tuned!

Aggiornamento (21/10): trovate qui il clip dell’intervista, dove dico troppo spesso “allora”…

In quale corsia?

Mi sono accorto che l’app Esselunga ti dice in che corsia si trova un prodotto, ovviamente dopo aver specificato in quale negozio ti trovi. Per uno come me, che praticamente sempre devo andare a caccia di qualche commesso a cui chiedere dove si trovano i prodotti, è una svolta.

(Poi io sono uno di quelli che non riesce a vedere un prodotto che è davanti ai suoi occhi, d’accordo: però questo è già un inizio per me, no?)

È l’ora del porno anche per l’AI

È notorio che quello che ha sempre fatto sviluppare i mercati è stato il porno. Lasciamo perdere le battute sul mestiere più antico del mondo o sulle categorie di PornHub e pensiamo semplicemente ai telefoni cellulari: la tendenza è stata di renderli sempre più piccoli fino a che qualcuno non ha pensato a quali immagini potevano interessare gli acquirenti. Ci avevano provato con il calcio e il DVB-H, senza grandi risultati perché nessuno aveva interesse a vedere un francobollo da 320×240 pixel: ma da quando partirono i primi siti con immagini erotiche la dimensione dei furbofoni ha ricominciato a crescere, superando le misure dei matton… ehm, dei terminali degli anni ’90. Sì, le dimensioni contano.

Non è un caso, insomma, che il mercato delle AI, che sta disperatamente cercando di trovare modi per ottenere soldi veri, stia pensando al porno. Tutto nasce da questo tweet di Sam Altman:

Il tweet è un capolavoro. Altman parte dal dire “ah, abbiamo fatto in modo che ChatGPT non possa essere usato come strizzacervelli, visto che c’è gente che ci è morta”, e termina col dire “però adesso che stiamo per essere in grado di riconoscere l’età delle persone che interagiscono potremo dare il porno (pardon, “erotica” che è una parola che in inglese sembra più neutra). Inutile dire il tipo di commenti che si sono visti in rete. Alberto Romero, che aveva appena ripostato un suo articolo dell’anno scorso, che parla di come le intelligente artificiali siano bravissime con tutti i peccati capitali, ha scritto un altro post (dietro paywall, quindi ho letto solo l’inizio). Romero riprende il tweet di Altman, lo legge come “la soluzione ai problemi mentali indotti da ChatGPT è stata troppo esagerata, e a questo punto il sistema è in grado di capire chi è psicotico e chi no, e togliere le restrizioni sul porno a chi non lo è, ed è adulto”. Il problema di per sé non è il porno: tanto lo troviamo dappertutto. Il problema è che non ha senso confrontare OpenAI con PornHub: quest’ultimo non ha mai affermato di voler salvare l’umanità con l’intelligenza artificiale generale…

Su pivot-to-ai David Gerard scrive, con il suo solito ottimismo, che il vero problema è che la curva d’uso di ChatGPT è piatta, e solo il 5% degli utenti usa un piano a pagamento. Come scrivevo, il modo più semplice di cercare di fare soldi è il porno: ecco qua la mossa di OpenAi, anche se Altman ha cercato di far marcia indietro con un altro tweet. Difficile però che ci sia davvero un dietrofront: Gerard fa presente come SuperGrok, insomma il Grok a pagamento, ha lanciato l’avatar Ani che ha una modalità NSFW, anche se per il momento l’anime è solo in lingerie.

A me non importa più di tanto questa deriva porno, se non per il fatto che qualcuno potrebbe credere di mettere in pratica nel mondo reale quello che può fare con l’avatar; ma anche in questo caso ho il sospetto che non ci sarebbe molto di diverso con quello che si vede già oggi nei video senza IA. Quello che mi chiedo è se tutto ciò sarà almeno per i prossimi anni la pietra tombale sull’AGI. Perché se dal porno arrivassero soldi, perché li si dovrebbe dirigere su qualcos’altro che non funziona? E se non arrivassero non sarebbe l’inizio di un nuovo inverno IA?

Il labirinto dei quanti (libro)

copertina La curiosità di questo libro sta nel fatto che è composto da due biografie parallele, quella di Feynman e quella di Wheeler.
È vero che il primo ha fatto il dottorato con il secondo, che i due erano amici e hanno anche scritto qualche articolo insieme in gioventù (la differenza di età non era molto grande), ma essi avevano modi di approcciare la fisica molto diversi: Wheeler era sempre pronto a tirare fuori dal cappello idee strampalate, Feynman pur essendo pronto a tutto voleva avere sempre la possibilità di “vedere” le cose. Ciò detto, il testo è interessante soprattutto per vedere come la fisica si è evoluta tra il 1945 e il 1970, con idee che si formavano, venivano scartate e riprese. Buona la traduzione di Valeria Lucia Gili.

Paul Halpern, Il labirinto dei quanti : Richard Feynman, John Wheeler e la rivoluzione della fisica [The Quantum Labyrinth], Codice 2018 [2017], pag. 326, € 27, ISBN 9788875787677, trad. Valeria Lucia Gili – come Affiliato Amazon, se acquistate il libro dal link qualche centesimo va a me

Solo una coincidenza? (II)

Non so se avete avuto voglia di provare a dare una spiegazione per la notevole coincidenza che ho presentato mercoledì scorso. Qui ci sono le mie pensate, che mi hanno portato lentamente a trovare una soluzione.

La prima cosa che mi è venuta in mente è stata la legge di Benford, che si vede bene nei valori delle potenze di 10. Quella è però una falsa pista: beh, a dire il vero nemmeno troppo falsa, ma solo nel senso che il procedimento che porta alla legge di Benford è simile a quello che ci interessa. La seconda cosa che mi è venuta in mente è che $2^{10} \approx 10^3$, e che questo poteva forse spiegare la somiglianza dei valori. Però anche $2^{20} \approx 10^6$; d’accordo, l’errore è circa il doppio, ma la successione delle potenze “scalate tra 1 e 10” non assomiglia affatto a quella delle potenze frazionarie di 10. Però è anche vero che in certi casi la concordanza è ottima: abbiamo che $6^9 = 10077696$, e costruendo la tabella con le prime nove potenze (e quelle di 10 da $10^{1/9}$ in su) otteniamo (sempre approssimando)

$$
\begin{matrix}
n & \textrm{potenza} & \textrm{seietto} & \textrm{differenza} \\
0 & 1 & 1 & 0.00\% \\
1 & 1.2915 & 1.296 & 0.34\% \\
2 & 1.6681 & 1.6796 & 0.69\% \\
3 & 2.1544 & 2.16 & 0.26\% \\
4 & 2.7826 & 2.7993 & 0.60\% \\
5 & 3.5938 & 3.6 & 0.17\% \\
6 & 4.6416 & 4.6656 & 0.52\% \\
7 & 5.9948 & 6 & 0.09\% \\
8 & 7.7426 & 7.776 & 0.43\% \\
\end{matrix}
$$

Insomma, a volte l’essere arrivati molto vicino a una potenza di 10 funziona e a volte no. A questo punto sono tornato sui miei passi, e ho ripreso l’idea della legge di Benford, o meglio mi sono ricordato di come Simon Newcomb avesse notato la legge qualche decennio prima di Benford: le prime pagine delle tavole dei logaritmi erano più sporche delle ultime, il che significava che quelle pagine venivano usate di più. Prendiamo dunque i logaritmi in base 10 delle potenze di 10 usate nella tabella: per costruzione saranno tutti equidistanti tra 0 e 1 (più precisamente saranno 0/10, 1/10, …, 9/10, visto che ci siamo fermati prima di $10^1$). Cosa abbiamo invece nelle prime dieci potenze di 2? Sappiamo che $2^{10} \approx 10^3$, e quindi i loro logaritmi saranno equidistanti, con un passo di circa 3/10 (e infatti $\log_{10} 2 \approx 0.30103$). Trasformare le potenze di due mettendo il punto decimale dopo la prima cifra corrisponde a considerare solo la parte decimale (la mantissa) dei logaritmi; quindi abbiamo (quasi) la parte decimale dei multipli di 0.3; la cifra decimale di questi multipli varia da 0 a 9. Ora è chiaro perché considerare le prime venti potenze di 2 non funziona: abbiamo i valori della prima cifra decimale a coppie. Nel caso dei seietti, le parti decimali sono nove e quindi i logaritmi saranno distanziati circa di 1/9 uno dall’altro, mentre quelli delle potenze di 10 sono distanziati esattamente di 1/9.

A questo punto possiamo anche capire il motivo per cui gli errori variano: nei logaritmi abbiamo un residuo (0.00103 nel caso delle potenze di 2) che man mano si accumula. Gli errori maggiori si hanno pertanto in corrispondenza delle potenze più grandi di 2. In definitiva: no, non era una coincidenza, ma accorgersi del motivo non è immediato.

Statistiche del sito per agosto e settembre 2025

Dopo il burst di luglio, agosto e settembre sono tornati nella norma, con agosto stranamente più alto come visite e settembre con qualche crawler che si è lanciato (139.84.145.15.vultrusercontent.com e 60.166.100.56, oltre che 990 accessi da trello.com…). Ecco i dati: per agosto non metto le differenze perché tanto non avrebbero molto senso.

Agosto:
Visitatori unici 35.399
Numero di visite 80.802
Pagine accedute 233.446
Hits 375.705
Banda usata 4,38 GB

Settembre:
Visitatori unici 29.658 (-6741)
Numero di visite 71.632 (-9170)
Pagine accedute 359.235 (+125789)
Hits 548.440 (+172735)
Banda usata 7,36 GB (+2,98 GB)

Agosto ha avuto 8 giorni sotto le 2000 visite, il mimino domenica 17 con 1673; sabato 30 invece ha visto il record con 4468. Settembre ha avuto solo domenica 21 sotto le 2000 visite (1902), mentre il record è 3256 mercoledì 3. Le medie sono rispettivamente 2606 e 2387. Le Top 5:

Agosto:

  1. Addio Stocard… e passo a Catima: 1663 visite
  2. Ma quanta acqua è cascata?: 1071 visite
  3. Call center sanitari invasivi: 967 visite
  4. Fare analisi di laboratorio in farmacia: 724 visite
  5. Proprieà intellettuale sui cavi di ricarica: 719 visite

Altri otto post, più due del backup del Post, sono sopra le 500 visite: Romanaccio ne ha avute 1426.

Settembre:

  1. Call center sanitari invasivi: 1777 visite
  2. Come far sbagliare (a volte) un LLM: 1172 visite
  3. Addio Stocard… e passo a Catima: 827 visite
  4. Quanto non sappiamo dei nostri figli in rete: 719 visite
  5. Quizzino della domenica: Area di un triangolo: 697 visite

Altri otto post, più uno del backup del Post e uno di Matematica in pausa caffè, sono sopra le 500 visite: Romanaccio ne ha avute 1194.

Query Google agosto: abbiamo 3099 (-360) clic da mobile, 794 (-437) da desktop e 57 (-29) da tablet. Ecco le prime 10 query (tra parentesi le impressions, per capire quanto la mia pagina sia piaciuta a chi cerca: più il rapporto è basso, meno sono stato ritenuto interessante).

140 (3178) 0278655540
116 (535) insulti in romano
105 (297) insulti romani
86 (132) insulti romaneschi
76 (217) ronzaleppo
52 (192) ronzaleppi
45 (47) notiziole di mau
41 (689) stocard non funziona
31 (820) codice bianco ikea
28 (91) cicopando

Query Google settembre: abbiamo 2634 (-465) clic da mobile, 1140 (+446) da desktop e 56 (-1) da tablet. Le prime 10 query:

218 (7230) 0278655540
78 (247) insulti romani
67 (126) insulti romaneschi
57 (389) insulti in romano
44 (681) codice bianco ikea
33 (1521) +39 02 78655 540
29 (110) sdi53@pec.fatturapa.it
28 (72) franco guadagni
27 (864) 02 78655540
22 (194) rimario inglese

Prenotare i vaccini nonostante ARIA

Io sono una persona fragile. Quindi da alcuni anni mi vaccino regolarmente per influenza e Covid (prima non ero fragile e non lo facevo…). Come ci si vaccina a Milano? Si va sul sito sanità della regione e si cerca una disponibilità.
La scorsa settimana ci ho tentato, ma il sistema informatico mi diceva che non potevo prenotare il vaccino Covid, perché sarebbe arrivato solo questa settimana. Era inutile selezionare una data successiva: probabilmente il sistema sapeva che magari il vaccino non si trovava e quindi non si fidava.

Martedì mi sono di nuovo collegato. Ho trovato l’elenco dei posti dove vaccinarmi, e ho visto che a Villa Marelli, dove vado di solito, c’erano due slot per giovedì: uno alle 9.30 e uno alle 15. Seleziono il primo: arriva messaggio di errore dicendo che non è più disponibile. Seleziono il secondo: stessa storia. Aspetto dieci minuti perché dovevo fare dell’altro e mi ricollego: i due slot sono ancora lì, ma continuano a non essere disponibili. Decido così di provare a vedere se per telefono funziona meglio.

Chiamo Villa Marelli: l’impiegata risponde che è la parte di Villa Marelli sbagliata, quella con i medici di base (a dire il vero gli anni passati sono sempre andato lì…) e mi dà il numero della casa di Comunità. Chiamo: l’impiegata mi dice che bisogna andare sul numero verde regionale. Chiamo il numero verde regionale, seleziono 5 per le vaccinazioni, arriva un messaggio registrato che mi dice che quello non è il numero verde corretto.

Finalmente trovo qualcuno che risponde… e scopro che fa esattamente quello che facevo io dal sito, compresi gli errori di prenotazione non più presente. A questo punto ringrazio, seleziono l’appuntamento per venerdì pomeriggio, e finalmente sono a posto, nonostante i tentativi di depistaggio.

Chiudo con una nota per i milanesi: almeno a Villa Marelli (fermata Marche della lilla) sabato tutto il giorno e domenica mattina fanno lo shot day, vaccinazioni senza prenotazioni. (L’espressione “Shot day” me la sono inventata io, la tipa parlava di un generico “open day”…)