Ciò che conta è il loop

Alejandro Piad Morffis ha messo nero su bianco quello che stavo cercando di far quagliare da un pezzo nella mia mente: qual è il vero vantaggio che si può avere nell’uso dell’IA. Il punto è che al momento ci sono due narrazioni contrastanti: quella che afferma che ormai è l’IA a fare lo scienziato, e noi ci limitiamo a rimettere a posto quanto è stato da essa trovato, e quella che continua a parlare di pappagalli stocastici, che buttano fuori stringhe senza necessariamente senso lasciando all’autore l’ingrato compito di separare il grano del loglio. Piad Morffis, in modo quasi zen, afferma che entrambe le narrazioni sono sbagliate, perché rispondono alla domanda sbagliata, e cioè “l’IA fa scienza?”. Ciò che al momento sta facendo scienza è il loop: se volete dirlo in italiano, il processo iterativo (ma capite che se devo usare otto sillabe al posto di una lascio perdere). Insomma è l’interazione che produce scienza. Procedo con alcuni esempi.

Il primo esempio è quello dei cicli di Claude, con protagonisti Claude (appunto), Donald Knuth e Filip Stappers. Quest’ultimo ha usato Claude per esplorare una classe di oggetti combinatorici che Knuth stava studiando: uno dei risultati dei lanci gli è parso interessante e l’ha così passato a Knuth, che l’ha validato a mano. Quindi Stappers ha avuto l’idea e scremato l’output, Knuth è stato il verificatore, e Claude il proponente. La scelta del termine da parte di Piad Morffis è deliberata: Claude ha solo sfornato strutture (trentuno, per la cronaca). Il secondo esempio vede come protagonista Terence Tao, forse il più grande matematico vivente. Nel suo caso, gli LLM sono creativi ma inaffidabili e generano passi per le dimostrazioni; c’è poi un passo con Lean (un verificatore automatico) che è affidabile ma non creativo e butta via tutto quello che non funziona; infine Tao guarda i risultati sopravvissuti e decide quali può valer la pena di portare avanti. In questo caso cambiano le etichette, ma continuiamo ad avere un loop. Abbiamo poi AlphaFold, che genera possibili strutture 3-d di proteine. In questo caso l’IA è la proponente, il verificatore è la natura stessa, nel senso che si verifica sperimentalmente se la molecola generata si piega proprio in quel modo, e gli umani decidono se la struttura potrebbe avere un’utilità pratica. Infine c’è GNoME, che non è il desktop grafico Linux ma l’acronimo di Google DeepMind’s Graph Networks for Materials Exploration. Anche in questo caso GNoME ha proposto un enorme numero (380000) di possibili strutture cristalline. I ricercatori ne hanno selezionate 58 che hanno ritenuto essere interessanti e hanno provato ad assemblarle. Sono riusciti a ottenere 41 nuovi materiali.

La cosa più interessante è che anche in passato ci sono stati esempi simili di loop. Il più famoso è probabilmente la dimostrazione del teorema dei quattro colori da parte di Appel e Haken, che sono riusciti a dimostrare che bastava verificare la possibile colorazione per un numero finito anche se dell’ordine delle migliaia di configurazioni base e poi hanno lasciato al computer il compito di trovare la colorazione. Ma anche la dimostrazione della congettura di Keplero sull’impacchettamento ottimale per le sfere ha una storia simile: Thomas Hales ha trovato la dimostrazione nel 1998, ma ci sono voluti 16 anni perché un verificatore formale (Flyspeck) confermasse la sua correttezza. Con gli LLM sono cambiate due cose. La prima è l’equivalente del passaggio dai calcolatori analogici, che erano bravissimi a risolvere un problema specifico, a quelli digitali, che possono essere programmati per risolvere un problema generico – magari in modo meno ottimale, ma comunque con un risparmio netto rispetto al dover trovare la struttura analogica corretta. La seconda è che gli LLM non solo sono più generali ma sono anche in grado di ricevere istruzioni da sé stessi, aumentando quindi ancora di più la generalità. Ma ci sono cose che restano le stesse! Il verificatore (umano o macchina che sia) deve essere “stupido ma affidabile al 100%”, e quindi gli LLM lì sono fuorigioco; il curatore, colui che cioè decide se i risultati sono non solo corretti ma anche interessanti, continua a essere appannaggio degli umani; e così il problema di partenza è dato dagli umani. Il loop si è accelerato tantissimo, pensate solo ai sedici anni di Flyspeck contro i secondi impiegati da Lean, ma sempre loop è. Guardando la scienza da questo punto di vista possiamo insomma essere ottimisti: quello che facciamo è migliorato, ma non è davvero cambiato.

5 commenti su “Ciò che conta è il loop”

  1. un cattolico

    Errata vel præsumpta errata corrige:

    «separare il grano del loglio»

    dal loglio

    «Ciò che al momento sta facendo scienza è il loop: se volete dirlo in italiano, il processo iterativo (ma capite che se devo usare otto sillabe al posto di una lascio perdere). Insomma è l’interazione che produce scienza»

    Iterazione, suppongo volessi scrivere. Che riduce poi a cinque sillabe lo sforzo :) perché non l’hai contemplata al posto di processo iterativo?

    «Procede con alcuni esempi»

    Procedo

    «Quest’ultimo ha usato Claude per esplorare una classe di oggetti combinatorici»

    Combinatori?

    «Ma anche la dimostrazione della congettura di Keplero sull’impacchettamento ottimale per le sfere ha una storia simile: Thomas Hales che ha trovato la dimostrazione nel 1998, ma ci sono voluti 16 anni perché un verificatore formale (Flyspeck) confermasse la sua correttezza».

    Senza che.

    «il curatore, colui che cioè decide se i risultati sono non solo corretti ma anche interessanti, continua a essere appannaggio degli umani»

    Io direi la curatela. Appannaggio, cioè prerogativa, peculiarità, mi suona più associato a qualità, funzioni, che non a persone.

    1. (a) in realtà pensavo proprio all’interagire, anche se in effetti il ciclo (che sono due sillabe ma è troppo generico in italiano) è quello di cui si parla.
      (b) “combinatorici” con la C viene usato in matematica
      (c) io invece vedo più il curatore che la curatela…

  2. un cattolico

    (a) ah ok! Mi ha fuorviato il periodo precedente. Iterazione sarebbe già meno generico di ciclo. Non ti piace per la suggestione che rimanda ad altri ambiti (matematici)?
    (b) non è solo per calco francofono/anglofilo (ok viene dal latino, ma suppongo sia arrivato a noi da illustri matematici francesi)? Intendo che se guardo “combinatorio” sul De Mauro mi dà come polirematiche matematiche locuzioni come “analisi combinatoria”, “calcolo combinatorio”, “teoria combinatoria”, “topologia combinatoria”
    (c) bene, non mi convince, ma potrei tranquillamente sbagliare io!

  3. Posso banalmente dire che il ruolo della IA è alla pari rispetto ad un umano, che prima faceva il proponente più o meno esplicitamente? Alias che il loop è sempre esistito a tutti i livelli, non solo accademici, e che ora la IA si è appropriata di un pezzo del loop.

    Se vuoi, è una conseguenza di passare il Test di Turing. Poi se mi chiedi quanto durerà questa “età dell’oro” io ti riponderei “non lo so, ma non fateci troppo affidamento”.

    1. attenzione alla rerminologia. L’articolo originale distingue tra “proposer” e “poser”. Il primo l’ho tradotto come “proponente”, il secondo l’ho reso con (“chi dà il problema di partenza”). Quest’ultimo non è ancora appannaggio dell’IA.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito utilizza Akismet per ridurre lo spam. Scopri come vengono elaborati i dati derivati dai commenti.

Torna in alto