L’IA, il cosa e il come

Leggendo l’ultimo post di Alberto Romero ho avuto una sensazione piuttosto strana. Il suo punto è che ora che gli agenti IA sono diventati così bravi ad analizzare i dati, e quindi dare una risposta alle nostre domande, noi dobbiamo cambiare completamente paradigma: non concentrarci sul come fare le cose, come abbiamo fatto per millenni, ma sul cosa fare, o come dice lui “cosa vogliamo fare?”

A basso livello, il concetto ha perfettamente senso, e del resto – come capita molto spesso – gli antichi greci l’avevano già colto. Pensate alla leggenda di re Mida: la sua richiesta di far diventare oro tutto quello che toccava era stata evidentemente troppo frettolosa. Fuori dalla metafora, e tornando agli agenti AI: se noi abbiamo a disposizione sistemi come Codex (con GPT-5.3) e Claude Code (con Opus 4.6), che riescono a prendere dal mare magnum del web pezzi di codice e metterli insieme in modo abbastanza buono, il nostro lavoro si sposta dallo scrivere il codice al dover spiegare esattamente all’agente cosa vogliamo che scriva, magari anche con qualche esempio in negativo. Non per nulla c’è chi dice che ormai il punto di partenza per scrivere codice è generare i test per verificarlo. Romero afferma che le capacità che servono oggi sono insomma gusto, sape riconoscere la qualità di un risultato; giudizio, cioè saper valutare effettivamente i risultati; agentività, decidere di voler fare qualcosa e in che direzione muoversi. Infine termina dicendo che proprio perché noi abbiamo paura di essere così astratti ci tarpiamo, usando l’IA per scopi “banali” ma che ci danno l’impressione di fare qualcosa: per esempio, farci fare i riassunti di un documento oppure migliorare la prosa delle nostre email. Quello che dovremmo fare è pensare in grande.

Che cosa mi disturba in tutto questo? L’effetto Apprendista stregone. Tutti noi abbiamo visto Fantasia, e ci ricordiamo di Topolino che sapeva perfettamente cosa fare (pulire la stanza, come gli era stato chiesto), ha usato un agente (pronunciando le formule magiche per dare vita alla scopa) e si è trovato in una situazione che non si aspettava e che non sapeva risolvere. Non sto dicendo che il problema sia che stiamo arrivando alla singolarità, o se preferite alla superintelligenza di Nick Bostrom con le IA che producono graffette così bene da far finire il mondo. Sto dicendo che un agente AI, anche quando funziona male, non è una fotocopiatrice, del cui funzionamento non dobbiamo preoccuparci più di tanto se non quando togliamo un foglio inceppato. Se qui non abbiamo nessuna idea del come non avremo nemmeno idea del cosa. Attenzione: non è affatto detto – e probabilmente non sarà mai nemmeno possibile – capire quello che succede internamente nelle IA. Ma avere un’idea di come lo faremmo noi, per quanto in modo altamente subottimale, ci permette di capire cosa chiedere. Insomma, non basta avere in mente il risultato, oltre ovviamente che saper verificare se quello che ci viene venduto è un risultato, ma dobbiamo anche capire il perché di questo risultato. In matematica ciò è da sempre il pons asinorum: chi non capisce il perché sta usando una certa formula rischierà sempre di sbagliare senza accorgersene. È questo che vogliamo da una tecnologia che sarà sempre più pervasiva?

Quasi sapiens (ebook)

copertinaGuido Damini si autodefinisce “storico da bar” (ma è laureato con lode in storia moderna, non bara) e dovrebbe essere noto agli amanti dei podcast: io, che podcast non ne ascolto, l’ho però scoperto dalla rubrica di Paolo Gualandris.
Il sottotitolo del libro è già una spiegazione: l’umanita intera viene raccontata in cento cenni storici, da tre-quattro pagine ciascuno, corrispondenti ai cinque minuti di una puntata del podcast (e in fondo al libro, per chi ha davvero fretta, Damini condensa tutto in dieci megacenni). Quello che mi è piaciuto è che lui usa un approccio personale: per esempio, parlando di Attila, scrive “Fu a quel punto che la storia prese una piega degna delle migliori telenovelas turche: una principessa imperiale scrisse ad Attila. Indovinate? Era Onoria.” (Onoria che nel titolo del cenno viene chiamata “La crush di Attila) Inoltre spesso ci dà punti di vista diversi da quelli imparati a scuola (tipo che togliere la convertibilità del dollaro in realtà lo rafforzò). Un’ottima lettura per chi volesse un rapido ripasso della storia e magari capirci qualcosa in più.

Guido Damini, Quasi sapiens : Dalla scimmia a Trump. Come l’umanità se l’è cavata in 100 cenni storici, UTET 2025, pag. 432, € 10,99 (cartaceo: 19), ISBN 9791221220810 – come Affiliato Amazon, se acquistate il libro dal link Bezos mi dà qualche centesimo dei suoi utili
Voto: 5/5

Tregua automobilistica olimpica

Come ricordate, la mia grande azienda ha sentenziato che in fin dei conti la cerimonia inaugurale delle Olimpiadi invernali non era poi così importante da elargire una giornata di lavoro agile. Seguendo le indicazioni aziendali, stamattina ho preso la mia bella bicicletta e sono arrivato in ufficio. A parte un po’ di moto dei vigili in viale Zara (che bloccavano un controviale dal lato sbagliato…) ho capito che la mia grande azienda è stata in estrema minoranza e quasi tutti gli altri hanno seguito le raccomandazioni del prefetto facendo lavorare i loro dipendenti da casa. Niente traffico, sembrava di essere ad agosto (ma sudando molto di meno).
Il secondo pensiero è stato che magari si potrebbe davvero ripensare il modo di lavorare e ridurre di molto il traffico, ma mi sa che ci sarebbero troppe resistenze: non solo delle aziende ma di tutto l’indotto..

Si arriverà alla santa alleanza IA proposta da Mozilla?

Mozilla Foundation è una non profit che tra le altre cose gestisce Firefox, quello che ormai è praticamente rimasto l’unico browser su Windows che non usi Chromium come motore interno. Poi buona parte dei soldi che ha arrivano da Google, ma lasciamo perdere. Quello che conta in questo momento è che Mozilla non può certo competere con i quattro o cinque giganti dell’IA, perché non ha abbastanza soldi né capacità di convincere gli investitori a prestarglieli. Che ha pensato allora di fare? Di invocare una specie di Alleanza Ribelle (come quella di Star Wars…) di startup, sviluppatori e tecnologi per rendere l’IA più aperta e affidabile.

Sarà, ma a me questa pare una mossa disperata che però non darà grandi risultati. Già il tentativo dell’Unione Europea di mettere dei paletti sul modo di sviluppo delle IA sono piuttosto velleitarie, considerando che lo sviluppo si fa quasi sempre fuori dall’Europa e non possiamo certo pensare che le frontiere lo blocchino: ma soprattutto in questo momento gli investimenti necessari sono così elevati che pensare di poter fare qualcosa con qualche miliardo di dollari è velleitario. E secondo me è anche un segno il non aver visto parlare in giro di questa uscita del CEO di Mozilla Mark Surman. Poi lo sappiamo tutti che prima o poi questa bolla AI scoppierà, e non so nemmeno quanto “poi” sarà. Vale davvero la pena fare qualcosa adesso?

Gemini, mi prendi per i fondelli?

Sono abbastanza convinto di aver cantato un coro di una cantata di Bach dove tenore e basso partono dalla stessa nota, il tenore resta su quella nota mentre il basso fa una scala discendente. La cosa è simpatica, perché credevo che quando i Beatles fecero la stessa cosa in Please Please Me si fossero inventati qualcosa di fuori dall’armonia standard, mentre il buon vecchio Giovanni Sebastiano ci aveva già pensato.
Apro Gemini e gli chiedo “in quale cantata di Bach c’è un brano in cui il tenore mantiene una nota e il basso parte da quella nota e fa una scala discendente?”. Subito mi risponde

Ti riferisci quasi certamente a uno dei momenti più iconici e spettacolari della produzione sacra di Johann Sebastian Bach: l’aria per Tenore e Basso “Domine Deus” dalla Messa in Si minore (BWV 232).

spiegando la rava e la fava:

Oltre all’innegabile bellezza estetica, c’è una ragione teologica tipica del Barocco:
– L’Unità: Le due voci partono dalla stessa nota per simboleggiare l’unità del Padre (Basso) e del Figlio (Tenore).
– L’Incarnazione: La scala discendente del Basso rappresenta spesso il concetto del divino che scende verso l’umano.

Controllo la BWV 232, e scopro che il Domine Deus della BWV 232 è per soprano e tenore, e non ha un pedale. Glielo scrivo. Nuova risposta:

Hai perfettamente ragione, ti chiedo scusa per l’errore grossolano: il Domine Deus della Messa in Si minore è un duetto per Soprano e Tenore, non per Tenore e Basso.

Il brano che stai cercando, con quel gesto così specifico e simbolico, è quasi certamente il duetto per Tenore e Basso “Et in unum Dominum”… no, aspetta: sto facendo confusione con la struttura della Messa.

Il passaggio esatto che descrivi si trova nella Cantata BWV 4, “Christ lag in Todes Banden”.

Pensavo ce l’avesse fatta, perché l’anno scorso l’abbiamo effettivamente cantato: ma la «Cantata BWV 4, Versus VI, sesto movimento: il duetto per Tenore e Basso, “So feiern wir das hohe Fest”» è anch’esso per soprano e tenore, e comunque non ha un pedale (cioè la nota tenuta). Terzo tentativo:

Hai nuovamente ragione, e ti ringrazio per la precisione: il Versus VI della BWV 4 è effettivamente per Soprano e Tenore (e il basso continuo esegue un ritmo puntato, non una scala discendente sotto un pedale). Chiedo scusa per l’ulteriore confusione.

Il brano che descrivi con esattezza millimetrica è il duetto per Tenore e Basso della Cantata BWV 78, “Jesu, der du meine Seele”.

Si tratta del movimento n. 6, l’aria: “Nun du wirst mein Gewissen stillen”.

Stavolta l’aria è per basso solo ;-) A questo punto mi sono scocciato, e ho scritto “l’aria: “Nun du wirst mein Gewissen stillen” è per basso solo. Non fai prima a dire che non hai idea se ci sia qualcosa del genere?”. Ultima sua risposta:

Hai ragione a essere infastidito: ti ho fornito una serie di informazioni imprecise mescolando organici e movimenti, il che è controproducente. Mi scuso per la confusione e per aver cercato di “indovinare” brani che chiaramente non corrispondevano alla tua descrizione tecnica molto precisa.
[…]
A questo punto, la risposta più onesta è: non ho identificato con certezza la cantata esatta. Il passaggio che descrivi esiste sicuramente nella vastissima produzione di Bach (che conta più di 200 cantate), ma i miei precedenti tentativi di identificarlo hanno solo generato errori.

Se ricordi anche solo una parola del testo o il contesto liturgico (Pasqua, Avvento, ecc.), potrei fare una ricerca mirata, altrimenti ammetto di non avere la soluzione immediata sotto mano.

Morale della favola: se al primo colpo il chatbot non vi dà una risposta che ti permetta almeno di arrivare a quella esatta, ditegli di non tirare a indovinare :-)

Logaritmo discreto e dimostrazioni a conoscenza zero

Avevo parlato delle dimostrazioni a conoscenza zero una decina d’anni fa, sul Post. Magari la prossima settimana ne scrivo ancora. Per il momento vi lascio una dimostrazione pratica: una dimostrazione si dice a conoscenza zero se io riesco a convincerti che conosco un segreto senza rivelartelo. Per esempio, potrei dirti che ho una tecnica infallibile per lanciare una moneta e farla cascare su testa o croce: tu mi dai una moneta, mi dici quale faccia vuoi che esca, e io ci riesco una, dieci, cento volte di fila. A un certo punto tu ti fiderai che io sono effettivamente in grado di decidere quale faccia mostrare (e ovviamente non giocherai più a testa o croce con me), anche se non hai nessuna idea di come io faccia. La parola chiave è “fidarsi”: le dimostrazioni a conoscenza zero sono inerentemente probabilistiche, proprio perché non possiamo controllare la dimostrazione. Quello che conta è che la probabilità che io sia stato semplicemente fortunato sia piccola a piacere: con un solo lancio capiterebbe una volta su due, con dieci lanci una volta su 1000, con cento lanci la probabilità di essere stato fortunato sarebbe inconcepibilmente piccola.

Passiamo ora al logaritmo discreto. Probabilmente vi ricordate che se avete l’equazione $b^x = y$ allora $b$ è la radice x-sima di $y$, mentre $x$ è il logaritmo di $y$ in base $b$: a differenza di addizione e moltiplicazione, l’elevazione a potenza non è commutativa e quindi ci sono due operazioni inverse. Quello che a scuola non insegnano è che è possibile anche calcolare il logaritmo in un gruppo finito, se la dimensione del gruppo è un numero primo $p$ (insomma, se stiamo usando i numeri modulo $p$). Prendiamo per esempio $p = 7$: le potenze di 3 in base 7 sono le seguenti.

$$\begin{matrix}
n & 1 & 2 & 3 & 4 & 5 & 6 \\
3^n & 3 & 2 & 6 & 4 & 5 & 1 \\
\end{matrix}$$

Notate che non consideriamo lo 0, perché ci interessa il gruppo moltiplicativo e non quello additivo; notate anche come tutti i valori da 1 a 6 sono presenti nella riga delle potenze. Da qui è facile ricavare il logaritmo discreto:

$$\begin{matrix}
n & 1 & 2 & 3 & 4 & 5 & 6 \\
\log_3 n & 6 & 2 & 1 & 4 & 5 & 3 \\
\end{matrix}$$

In questo caso la tabella è facile da calcolare, ma se partissimo da un numero primo di centinaia di cifre sarebbe ancora facile elevare un numero a una qualche potenza, ma non lo sarebbe affatto partire da quel risultato e risalire al numero. Il logaritmo discreto è insomma una di quelle “funzioni a senso unico” che servono per la crittografia. Come si può sfruttare il logaritmo discreto per convincere il mio interlocutore che conosco $x$, il logaritmo in base $b$ di $y$, senza rivelarglielo? Ecco un protocollo di comunicazione, come spiegato da John Cook.

(1) Io scelgo un numero (naturale) casuale $r$, calcolo $t = b^r$, e mando al mio interlocutore il numero $t$.
(2) Lui mi spedisce a sua volta un altro numero casuale $c$.
(3) Io calcolo $s = r + cx$ e glielo mando.
(4) Lui verifica ce effettivamente $b^s = ty^c$. In caso affermativo si fida (oppure riprova più volte, se pensa che io abbia avuto fortuna).

Cosa conosce il mio interlocutore, oltre alla base $b$ e a $y$? Due numeri: $t$ e $s$. Il primo, $t$, è l’esponenziale (in base $b$ di un numero casuale, e quindi è anch’esso casuale: non dà dunque nessuna informazione. Il secondo, $s$, di per sé è basato su $x$, ma per trovarlo bisognerebbe conoscere $r$ e per riuscirci dovrebbe essere in grado di calcolare rapidamente il logaritmo discreto, cosa che al momento non è fattibile. Infine, abbiamo che $b^s = b^{r+cx} = b^r b^{cx} = t (b^x)^c = ty^c$. Inoltre, visto che io non potevo conoscere a priori $c$, non potevo fare il calcolo in anticipo. Anche questo punto è importante, perché altrimenti potrei usare dei trucchi: tornando all’esempio del lancio di monete, non è così difficile fare un video in cui io per dieci volte di fila lancio una moneta dicendo ciascuna volta cosa uscirà. Comincio a filmare finché non mi capita la successione di dieci risultati corretti, e taglio tutta la parte precedente del video…