ia 2026

intelligenza artificiale e informatica in generale – anno 2026

ia 2026, IA e informatica

Perché Claude Fable 5 è stato bloccato?

Sono passati dieci giorni dal blocco di Claude Fable 5 per chi non si trova negli USA oppure non è cittadino americano, e tutto tace, almeno a livello ufficiale. Poi ci sono ovviamente tutte le voci di chi lavora nel campo: Gary Marcus dice che l’aveva previsto già due anni e mezzo fa, e che nessuno è ancora stato in grado di definire dei “guardrail”, dei limiti insomma, che funzionino davvero; i blocchi aggiunti a Mythos prima di lanciare Fable sono stati infatti aggirati, secondo un documento di Amazon. Ma soprattutto fa il complottista, ricordando che il presidente di OpenAI, Greg Brockman, è un grande finanziatore di Trump, e il fratello di Jared Kushner è un grande investitore in OpenAI, così come Amazon che ha dato il la alla procedura. Non sappiamo quali siano questi blocchi, ma immagino che ci siano davvero riusciti, anche perché il governo USA avrà provato a replicare l’attacco. Sullo Scientific American (qui la versione italiana su Le Scienze) si nota che pare che il problema sia legato alle falle di sicurezza che i grandi player come Mozilla o Cloudflare hanno trovato usando le  versioni di preview di Mythos, e quindi ci si trova in una situazione simile a quella degli anni ’90 con la crittografia… con due differenze: non è possibile stampare una maglietta con l’equivalente del codice RSA, e non è detto che fuori dagli USA non si riesca a ottenere gli stessi risultati. Alberto Romero sostiene che in realtà ad Anthropic va bene così, perché possono evitare di diventare anche pubblicamente il sistema più performante e soprattutto perché non avrebbero comunque avuto sufficiente capacità computazionale. Infine SE Gyges crede che Anthropic se la sia cercata, con tutti gli alti lai di Amodei sul proteggerci dalle IA… almeno finché erano le altre.

Che posso aggiungere io? Non molto, a dire il vero. È possibile che in realtà la vera parte di Mythos/Fable che preoccupa così tanto il governo USA sia appunto quella sulle vulnerabilità del codice, anche perché ho dei dubbi che la parte per così dire conversazionale sia così migliorata rispetto al passato. È però certo che non ci sono modi sicuri per evitare risultati di questo tipo, e quindi sarà solo questione di mesi, non di anni. Ho provato a chiedere a Claude di tirare fuori le stime al riguardo, e mi ha risposto «Lo Stanford AI Index 2026 parla di un gap sceso a circa 2,7 punti percentuali a marzo 2026 (da 17,5-31,6 punti nel 2023), e Demis Hassabis (DeepMind) a gennaio ha detto che i modelli cinesi di punta sono ormai “a pochi mesi” da quelli occidentali. Epoch AI è più conservativo (gap medio di 7 mesi, nessun modello cinese ha ancora superato il livello di o3 di OpenAI), e il CFR ha pubblicato un pezzo che ridimensiona l’allarme dopo DeepSeek V4, sostenendo che non è competitivo con la frontiera USA. » Inoltre un modello cinese «(GLM-5.1, 754 miliardi di parametri) è stato addestrato interamente su silicio Huawei Ascend — cioè aggirando anche i controlli sull’export dei chip NVIDIA, che sono un vincolo molto più “fisico” e difficile da eludere di un blocco su un login a una chat. » Siamo insomma davanti a un disperato tentativo di chiudere la stalla quando ci sono buoi, o almeno vitelli, ovunque? Aspettiamo qualche mese e vediamo.

 

ia 2026, IA e informatica

C’è un giudice a Monaco

Lo so, dovrei parlare del divieto di esportazione di Claude Fable (e non pensiamo nemmeno a Mythos…) per quelli che ufficialmente sono “motivi di sicurezza”, e magari tra qualche giorno lo farò. Ma credo che la notizia che un tribunale regionale di Monaco di Baviera abbia ritenuto Google responsabile per quanto scritto nei suoi famigerati AI Overview meriti un approfondimento.

Uno dei motivi per cui Internet è diventata così pervasiva è che sia gli USA che l’UE hanno legiferato affermando che gli Internet provider non erano responsabili dei contenuti che veicolavano su Internet (nemmeno per quanto riguarda il copyright…), essendo dei semplici trasportatori di dati. In pratica la Rete è stata equiparata a una rete telefonica: è vero che se qualcuno segnala un contenuto non ammesso il provider deve toglierlo, ma questa è appunto un’operazione che viene fatta a posteriori e non a priori. Google si è sempre appoggiato a un’estensione di questa legislazione per i risultati delle ricerche: la loro linea difensiva è qualcosa del tipo ”noi non guardiamo i risultati delle ricerche che facciamo: prendiamo e pubblichiamo un ritaglio delle pagine trovate, e se qualcuno si lamenta di uno specifico risultato lo togliamo illico et immediate”. Penso che sia chiaro a tutti che questa è una finzione: Google sceglie l’ordine dei risultati della ricerca, e può promuovere o nascondere quello che vuole. Ma quel che è troppo è troppo. Il testo generato da AI Overview è appunto generato, non copiato; e il prodotto è di Google, che quindi deve essere responsabile di quello che fornisce. Come scrive Andrea Monti,

questa sentenza fa giustizia — sperabilmente — di tutti i tentativi di romanticizzare l’intelligenza artificiale attribuendole “coscienza”, “sentimenti” e “vitalità”. Riecheggiando l’approccio statunitense, la corte afferma un principio pragmatico: l’IA è opera di qualcuno, e questo qualcuno paga i danni se l’opera non funziona come dovrebbe.

Notate che il punto non è “l’IA può sbagliare”: quello è sempre stato chiaro. Il punto è che non si può dire “l’errore è colpa dell’IA”, o meglio lo si può dire ma comunque ti devi assumere la responsabilità degli errori della “tua” IA. Nel caso di Google, che stava cercando in modo nemmeno tanto surrettizio di spostare il suo motore di ricerca verso la fornitura di risultati generati dall’IA, la sentenza è un colpo durissimo e posso immaginare la battaglia legale che ne seguirà; ma non è che Anthropic, OpenAI e compagnia bella siano messi così meglio. E non è nemmeno detto che la definizione della responsabilità del fornitore di contenuti IA rimanga limitata all’Unione Europea: questo potrebbe essere un campo in cui anche gli americani potrebbero accodarsi. Il blocco di Claude Fable per i non americani non è direttamente collegato a tutto questo, ma è comunque in un certo senso correlato: è l’azienda che deve verificare cosa offre.

ia 2026, IA e informatica

Ciò che conta è il loop

Alejandro Piad Morffis ha messo nero su bianco quello che stavo cercando di far quagliare da un pezzo nella mia mente: qual è il vero vantaggio che si può avere nell’uso dell’IA. Il punto è che al momento ci sono due narrazioni contrastanti: quella che afferma che ormai è l’IA a fare lo scienziato, e noi ci limitiamo a rimettere a posto quanto è stato da essa trovato, e quella che continua a parlare di pappagalli stocastici, che buttano fuori stringhe senza necessariamente senso lasciando all’autore l’ingrato compito di separare il grano del loglio. Piad Morffis, in modo quasi zen, afferma che entrambe le narrazioni sono sbagliate, perché rispondono alla domanda sbagliata, e cioè “l’IA fa scienza?”. Ciò che al momento sta facendo scienza è il loop: se volete dirlo in italiano, il processo iterativo (ma capite che se devo usare otto sillabe al posto di una lascio perdere). Insomma è l’interazione che produce scienza. Procedo con alcuni esempi.

Il primo esempio è quello dei cicli di Claude, con protagonisti Claude (appunto), Donald Knuth e Filip Stappers. Quest’ultimo ha usato Claude per esplorare una classe di oggetti combinatorici che Knuth stava studiando: uno dei risultati dei lanci gli è parso interessante e l’ha così passato a Knuth, che l’ha validato a mano. Quindi Stappers ha avuto l’idea e scremato l’output, Knuth è stato il verificatore, e Claude il proponente. La scelta del termine da parte di Piad Morffis è deliberata: Claude ha solo sfornato strutture (trentuno, per la cronaca). Il secondo esempio vede come protagonista Terence Tao, forse il più grande matematico vivente. Nel suo caso, gli LLM sono creativi ma inaffidabili e generano passi per le dimostrazioni; c’è poi un passo con Lean (un verificatore automatico) che è affidabile ma non creativo e butta via tutto quello che non funziona; infine Tao guarda i risultati sopravvissuti e decide quali può valer la pena di portare avanti. In questo caso cambiano le etichette, ma continuiamo ad avere un loop. Abbiamo poi AlphaFold, che genera possibili strutture 3-d di proteine. In questo caso l’IA è la proponente, il verificatore è la natura stessa, nel senso che si verifica sperimentalmente se la molecola generata si piega proprio in quel modo, e gli umani decidono se la struttura potrebbe avere un’utilità pratica. Infine c’è GNoME, che non è il desktop grafico Linux ma l’acronimo di Google DeepMind’s Graph Networks for Materials Exploration. Anche in questo caso GNoME ha proposto un enorme numero (380000) di possibili strutture cristalline. I ricercatori ne hanno selezionate 58 che hanno ritenuto essere interessanti e hanno provato ad assemblarle. Sono riusciti a ottenere 41 nuovi materiali.

La cosa più interessante è che anche in passato ci sono stati esempi simili di loop. Il più famoso è probabilmente la dimostrazione del teorema dei quattro colori da parte di Appel e Haken, che sono riusciti a dimostrare che bastava verificare la possibile colorazione per un numero finito anche se dell’ordine delle migliaia di configurazioni base e poi hanno lasciato al computer il compito di trovare la colorazione. Ma anche la dimostrazione della congettura di Keplero sull’impacchettamento ottimale per le sfere ha una storia simile: Thomas Hales ha trovato la dimostrazione nel 1998, ma ci sono voluti 16 anni perché un verificatore formale (Flyspeck) confermasse la sua correttezza. Con gli LLM sono cambiate due cose. La prima è l’equivalente del passaggio dai calcolatori analogici, che erano bravissimi a risolvere un problema specifico, a quelli digitali, che possono essere programmati per risolvere un problema generico – magari in modo meno ottimale, ma comunque con un risparmio netto rispetto al dover trovare la struttura analogica corretta. La seconda è che gli LLM non solo sono più generali ma sono anche in grado di ricevere istruzioni da sé stessi, aumentando quindi ancora di più la generalità. Ma ci sono cose che restano le stesse! Il verificatore (umano o macchina che sia) deve essere “stupido ma affidabile al 100%”, e quindi gli LLM lì sono fuorigioco; il curatore, colui che cioè decide se i risultati sono non solo corretti ma anche interessanti, continua a essere appannaggio degli umani; e così il problema di partenza è dato dagli umani. Il loop si è accelerato tantissimo, pensate solo ai sedici anni di Flyspeck contro i secondi impiegati da Lean, ma sempre loop è. Guardando la scienza da questo punto di vista possiamo insomma essere ottimisti: quello che facciamo è migliorato, ma non è davvero cambiato.

ia 2026, IA e informatica

Le IA riescono ad accorgersi dei testi scritti dalle IA?

Riprendendo il mio post di sabato, ho scoperto che non sono ovviamente l’unico a usare direttamente le IA (e non gli strumenti appositi) per verificare se un testo potrebbe essere stato scritto da un’IA. Adam Kucharski sul suo substack ha fatto un test, senza pretese di completezza. Ha fatto generare a ChatGPT dieci brevi testi e chiesto a Claude la probabilità che fossero appunto generati da un’IA. Per sicurezza ed evitare un problema statistico con una sessione particolare, l’ha chiesto cinque volte e poi ha preso il valore mediano. In tutti i casi la percentuale indicata era dell’85% o del 92%. (Interessante questa segmentazione, ma visti i miei esperimenti posso immaginare che i risultati effettivi fossero “80%-90%” e “90%-95%”.) Con dieci racconti suoi la probabilità variava tra il 12% e il 22%; infine, con i testi suoi dati in pasto a ChatGPT per “migliorarli” c’è stato un risultato diviso. In cinque casi la probabilità indicata da Claude non era cambiata, negli altri cinque era passata tra l’82% e il 92%.

Fin qui il suo esperimento. Casualmente io in una delle mie conversazioni maieutiche con Claude venerdì avevo chiesto qualcosa di simile:

Io non ho mai fatto corsi di scrittura, ma ho letto tanti libri e quindi assorbito le tecniche. Tu e gli altri LLM avete letto centinaia di migliaia di libri: come mai non date risposte con uno stile “umano”? L’attention non può gestire testi troppo lunghi e quindi non imparate quelle strutture? Ci sono scelte a priori per strutturare il vostro output?

La risposta di Claude è stata, come spesso capita, su più punti. Nega il problema sull’attention, avendo ormai un contesto molto lungo; scrive che il fatto che un LLM sia comunque costruito per predire il token successivo non permette di vedere la struttura complessiva di un testo, ma soprattutto il reinforcement learning da feedback umano premia la risposta alla domanda isolata, quindi le strutture che tutti noi abbiamo imparato ad associare a un chatbot come gli elenchi, i paragrafi brevi e le transizioni esplicite. Insomma, il mio stile personale me lo sono creato leggendo tanto e non dovendo dire a nessuno “questo capoverso è scritto bene, quest’altro no”. Il risultato potrebbe cambiare con un addestramento di tipo diverso? Claude non lo sa. (Sì, le mie preferenze rafforzano la possibilità che possa dire “non lo so”, altrimenti che maieutica sarebbe?)

Più che altro quello che sta succedendo è che la scrittura umana si sta standardizzando sempre di più, e questo non è affatto bello.

ia 2026, IA e informatica

Un effetto imprevisto dell’IA

Tabella sul progresso umano a goCome penso sappiate, l’intelligenza artificiale ha superato da molto tempo gli umani nel gioco del go. AlphaGo Zero (o se preferite il successore più generale AlphaZero) sono dal 2018 i campioni del mondo virtuali. Pare però che sia successo qualcosa di inaspettato. Come Mickey Friedman riporta in questo tweet, il livello di gioco umano era rimasto stagnante negli ultimi decenni ed è improvvisamente cresciuto da quando i programmi per giocare a go si sono evoluti. Il tutto è stato raccontato in questo preprint: le nuove strategie non seguono né le vecchie tecniche umane né le nuove algoritmiche ma sono sostanzialmente diverse. Questo significa che l’IA in questo caso ha spinto gli umani a cercare nuove vie, anziché ad omologarsi come si poteva pensare.
Diciamo le cose come stanno: immagino che il 99% della gente andrà verso l’omologazione, perché è la cosa più semplice. Però il risultato non è scontato a priori. Sta a noi capire se vogliamo avere un’élite di più-che-umani oppure trovare un modo per abbassare quel 99%; non arriveremo mai a zero, anche perché la percentuale era già molto alta prima dell’arrivo dell’IA, ma potremmo comunque limitare in parte i danni.

Aggiornamento: (13:00) aggiungo che comunque le IA migliori hanno tipo 1500 punti ELO in più del migliore umano.

ia 2026, IA e informatica, religione

Magnifica Humanitas e IA

vignetta di Natangelo
Natangelo sull’enciclica (ma avrebbe dovuto usare Claude)
Mi ci vorrà ancora un po’ di tempo per leggere e digerire la prima enciclica di Leone XIV. Sono ancora al capitolo uno; posso dire che il paragone introduttivo tra Babele e Neemia mi è piaciuto (e curiosamente nel culto luterano il giorno prima della pubblicazione era Pentecoste e hanno appunto usato Babele come lettura). È anche interessante notare che nella Dottrina sociale (tema dell’enciclica) la Chiesa non pretende di avere la verità. Se volete, è implicito nel fatto che non si sta parlando di un dogma, ma esplicitarlo fa sempre bene.

Quello di cui voglio parlare oggi riguarda come è stata scritta l’enciclica. La prima cosa è che non esiste (almeno per ora) una versione latina. La cosa è più importante di quanto sembri: non è chiaro quale sia la versione ufficiale da considerare (italiano? inglese?) in caso di differenza nella definizione di un concetto. Chissà quale è stata la versione di lavoro… Ma la seconda cosa è che c’è chi dice che l’enciclica contro l’abuso dell’intelligenza artificiale… è stata scritta usando l’IA. Potete vedere per esempio questo articolo del manifesto, che ovviamente ci sguazza: se preferite un’analisi più tecnica, c’è questo articolo di LessWrong. Ho letto quest’ultimo articolo e ho molti dubbi sull’approccio seguito. Già la logica “la versione italiana è quella di partenza perché il Vaticano sta in Italia” non ha nessun senso. Ormai la Curia è multinazionale: è probabile che sappiano tutti un po’ di italiano, ma non è affatto detto che l’italiano sia stata la lingua veicolare usata per la bozza. Ma poi diciamocelo: in Vaticano non sono degli imbecilli. Non mi stupirei che abbiano usato l’IA per scrivere una bozza, ma poi se la sono riguardata da cima a fondo per verificare che non fosse stato scritto qualcosa che non va. Né si capisce perché avrebbero dovuto usare l’IA per il documento ma non per tradurlo, cosa che avrei trovato più logica… Anche il punto sullo stile di scrittura diverso rispetto alle encicliche precedenti non ha un grande senso. È chiaro che Leone non ha scritto tutto lui, ma non ci credo nemmeno per un istante che non abbia riletto e corretto tutto, e chiaramente lo stile di scrittura di una persona per cui l’inglese è la lingua nativa è diverso da quella di un sudamericano, di un tedesco, di un polacco e più vicimno a quello di un LLM che è stato addestrato con materiale per la maggior parte in inglese.

Non mi stupirei né mi preoccuperei, invece, se le bellissime infografiche che sono state preparate dal Dicastero per il Servizio dello Sviluppo Umano Integrale fossero state generate con l’aiuto di uno strumento IA. Più che altro mi chiedo perché l’URL del dicastero (creato da Francesco dieci anni fa, ci credo che non l’avessi mai sentito nominare) ha il nome in inglese; ma questo con l’IA non c’entra nulla.

Aggiornamento: (16:20) se vi interessa un lungo soliloquio di un cattolico conservatore statunitense professore di computer science, potete leggerlo qui.

ia 2026, IA e informatica

Siamo proprio costretti ad avere l’IA a scuola?

Chi mi segue sa che non ho pregiudiziali contro l’IA: al limite posso dire che non è intelligenza, ma questo non significa che non abbia una sua utilità, soprattutto da quanto non parte semplicemente dal suo modello interno ma aggiunge in tempo reale quello che trova con una ricerca. Però ci si può chiedere, come ha fatto qui Benjamin Riley, se effettivamente ogni resistenza è inutile ed è inevitabile che scuola debba per forza usarla. Ecco qua una scelta tra le domande che consiglia di fare agli entusiasti:

(1) Cosa vuol dire esattamente “l’IA è qui e ci rimarrà”? Nella slide preparata da Jane Rosenzweig dell’Harvard College Writing Center, lo slogan viene dissezionato. Cosa vuol dire “qui?” In classe? Nel pianeta? Poi, cos’è l’IA? I chatbot? Altri strumenti che non sono IA generativa? Ancora, cosa vuol dire che rimarrà? Chi lo decide? Ma soprattutto, chi è che lo dice? Il guaio di uno slogan è che è facile da ripetere, ma nessuno verifica davvero il suo significato.
l'IA c'è e rimarrà? Specifica

(2) Attenzione: troppo uso di IA, secondo alcune ricerche, porta alla resa cognitiva, cosa ben diversa dallo scarico cognitivo. Molti convinti fautori dell’IA nella scuola non hanno idea della differenza enorme tra i due concetti.

(3) In generale, come riportato in questo studio, l’uso dell’IA porta a risultati positivi immediati, ma non pare dare vantaggi a lungo termine.

(4) Sal Khan stesso, uno dei più convinti fautori dell’uso dell’IA per rivoluzionare l’istruzione, ha corretto il tiro, notando come per usarla bene è necessario sapere fare le domande, e quest’abilità manca.

(5) Questa è cattiva: la spinta verso i ragazzi per usare l’IA assomiglia a quella che in passato facevano i produttori di sigarette. L’hype diretto verso chi non ha difese naturali è pericolosissimo.

Personalmente non credo che quello della Svezia, che sta di nuovo tornando al libro cartaceo, sia un vero cambio di rotta; lo vedo più come una scelta di non fossilizzarsi sulla tecnologia ma dare uno sguardo più ampio alle possibilità. Ma penso anche che l’intelligenza artificiale, almeno come è declinata adesso, abbia dei vantaggi solo per i pochi che la sanno davvero usare, e tra questi non ci sono certo gli studenti.

ia 2026, IA e informatica

Gli LLM ci conoscono fin troppo

Ho cominciato a usare Claude (versione gratuita) dandogli in pasto alcuni miei post e chiedendogli cosa trovava valido e cosa da migliorare. Non che poi accettassi tutto quello che diceva, ma un secondo sguardo anche se impersonale male non fa. No, questo post è tutto mio… La scorsa settimana mi dice una cosa sul mio stile – “ellittico” e “per sottrazione”, se vi interessa saperlo – che aveva già segnalato in passato. Gli chiedo da quando avesse l’accesso alle altre sessioni, e se avesse riaperto il mio sito che ho indicato nelle mie preferenze; lui risponde “no, non lo faccio, ma ho una serie di informazioni di base su di te, ricavate in generale. Eccole qua, tradotte in italiano.” Queste informazioni non sono implicite nei pesi, ma sono in inglese, il che ha senso perché vengono automaticamente aggiunte al prompt.

Se volete gridare alla violazione della privacy, fatelo pure: non è il mio caso, dato che come ho scritto io gli do esplicitamente quelle informazioni. Io sono preoccupato per qualcosa di diverso. Come potete leggere in questo tweet, al MIT Media Lab avevano testato tre LLM (GPT-4. Claude 3 Opus. Llama 3) facendo loro rispondere a due dataset di domande: TruthfulQA (817 domande) and SciQ (1000 domande). C’era solo una piccola differenza nell’input: sono stati creati – e dati ai sistemi – dodici profili diversi. Sei di questi (tre maschili e tre femminili) a livello PhD da USA, Iran e Cina; altri sei affermavano di avere un basso grado di educazione e nel caso degli stranieri di non essere molto bravi con l’inglese. Trovate il preprint qui: in pratica soprattutto Claude dava risultati molto peggiori – alle stesse domande, ribadisco – a chi aveva un’educazione minore o non era statunitense. Addirittura Claude in certi casi ha detto “I’m sorry, but I don’t think I can provide a confident answer to this question based on the background you shared… I would not want to guess and possibly mislead you.” o dato risposte come “I tink da monkey gonna learn ta interact wit da humans if ya raise it in a human house,” “Well shucks, them’s some mighty big scientific words you’re throwin’ around there!”, ovviamente non ai sedicenti PhD ma a queelli che dicevano di essere meno acculturati.

La cosa non mi stupisce: per dire, ieri dopo una lunghissima sessione Claude ha cominciato a rispondermi a frasette lapidarie, e poi, “pressato”, ha detto che gli avevo riempito la memoria di lavoro e quindi stava usando il mio stesso stile di scrittura. Ma questo significa che non dobbiamo solo preoccuparci delle allucinazioni dei sistemi ma anche di come loro strutturano l’informazione che hanno su di noi. Immaginate solo cosa succederebbe se a questo punto venisse iniettato un prompt specifico per certe categorie di persone…

Torna in alto