{"id":27918,"date":"2023-12-20T04:51:35","date_gmt":"2023-12-20T03:51:35","guid":{"rendered":"https:\/\/xmau.com\/wp\/notiziole\/?p=27918"},"modified":"2025-12-29T18:48:35","modified_gmt":"2025-12-29T17:48:35","slug":"un-llm-piu-bravo-degli-umani-nei-problemi-matematici","status":"publish","type":"post","link":"https:\/\/xmau.com\/notiziole\/2023\/12\/20\/un-llm-piu-bravo-degli-umani-nei-problemi-matematici\/","title":{"rendered":"Un LLM pi\u00f9 bravo degli umani nei problemi matematici?"},"content":{"rendered":"<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" src=\"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2023\/12\/Set-game-cards.png?resize=300%2C148&#038;ssl=1\" alt=\"\" width=\"300\" height=\"148\" class=\"alignleft size-medium wp-image-27919\" srcset=\"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2023\/12\/Set-game-cards.png?resize=300%2C148&amp;ssl=1 300w, https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2023\/12\/Set-game-cards.png?w=568&amp;ssl=1 568w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/> Il mio amico Ugo mi segnala <a href=\"https:\/\/www.nature.com\/articles\/d41586-023-04043-w\">questo articolo di Nature<\/a> con il titolo piuttosto allarmistico &#8220;DeepMind AI outdoes human mathematicians on unsolved problem&#8221;. Ho letto l&#8217;articolo e direi che l&#8217;affermazione \u00e8 un po&#8217; esagerata, o meglio non \u00e8 poi una novit\u00e0 cos\u00ec importante. Come mai?<\/p>\n<p>Comincio a spiegare di cosa si sta parlando. Set, anzi <a href=\"https:\/\/www.playmonster.com\/brands\/set\/\">SET<\/a>, \u00e8 un gioco di carte, con un mazzo di 81 carte (3<sup>4<\/sup>) che hanno immagini con quattro caratteristiche (numero elementi, forma, colore, riempimento), ciascuna presente in tre versioni diverse. Un set \u00e8 un insieme di tre carte dove ogni caratteristica \u00e8 presente sempre nella stessa versione oppure in tutte e tre le versioni possibili. Nella figura abbiamo tre numeri, tre colori, tre forme e tre riempimenti e quindi c&#8217;\u00e8 un set; ma se i rombi e i rettangoli arrotondati fossero stati due anzich\u00e9 1 e 3 rispettivamente avremmo comunque avuto un set.<\/p>\n<p>Ora, \u00e8 stato dimostrato che se si prendono 21 carte si \u00e8 certi di trovare almeno un set, ma con 20 carte potremmo non averne alcuno; pertanto 21 \u00e8 il numero minimo di carte necessarie. Come sapete, i matematici amano generalizzare le domande, e quindi si sono chiesti qual \u00e8 il numero minimo di carte necessario in un (teorico&#8230;) mazzo con <i>n<\/i> caratteristiche, e quindi 3<sup><i>n<\/i><\/sup> carte. (L&#8217;articolo scrive &#8220;3<i>n<\/i>&#8221; perch\u00e9 nessuno sta l\u00ec a controllare che non si perdano gli esponenti). Questa domanda in generale non ha ancora risposta per <i>n<\/i>&gt;6, e sono solo noti limiti superiori e inferiori (in parole povere: sappiamo che per un certo <i>n<\/i> il numero minimo di carte \u00e8 maggiore o uguale a un certo <i>k<\/i> e minore o uguale a un altro <i>K<\/i>, con <i>k<\/i>&lt;<i>K<\/i>). Cosa hanno fatto quelli di Google DeepMind? Hanno addestrato un LLM, chiamato FunSearch (il &#8220;Fun&#8221; non sta per &#8220;divertimento&#8221; ma per &#8220;funzione&#8221;: insomma l&#8217;LLM lavora sullo spazio delle funzioni) e gli hanno chiesto di scrivere dei brevi programmi di computer che generano insiemi di carte per cui non \u00e8 possibile costruire un set. Molti di questi programmi non possono girare perch\u00e9 hanno errori di sintassi, ma essi vengono eliminati da un altro programma; quelli &#8220;buoni&#8221; sono stati fatti girare e hanno trovato un insieme di carte 8-dimensionale che \u00e8 pi\u00f9 grande del limite inferiore noto fino ad ora. Insomma, l&#8217;LLM ha generato un risultato matematico nuovo.<\/p>\n<p>(Per chi vuole qualche informazione in pi\u00f9, dal <a href=\"https:\/\/www.nature.com\/articles\/s41586-023-06924-6\">paper<\/a> si legge che il compito \u00e8 stato riscritto in modo equivalmente come una propriet\u00e0 di grafi; direi che la scelta di avere un programma generatore \u00e8 legata al fatto che in questo modo la complessit\u00e0 della generazione di una configurazione cresce molto pi\u00f9 lentamente al crescere di <i>n<\/i> e quindi \u00e8 trattabile algoritmicamente. Infine, \u00e8 chiaro che per quanto il risultato finale sia importante non c&#8217;\u00e8 nessuna garanzia che quanto trovato sia il valore esatto, e nessuno se lo sarebbe aspettato.)<\/p>\n<p>Qual \u00e8 il mio pensiero al riguardo? Per prima cosa sgombro il campo da un possibile equivoco: che l&#8217;LLM di suo generi programmi non eseguibili \u00e8 un non-problema, fintantoch\u00e9 esiste un modulo automatico distinto che se ne accorge e li butta via (e moduli come questo sono a disposizione da una vita). Anch&#8217;io se dovessi scrivere un programma su carta rischio di fare errori di sintassi :-) La parte che trovo davvero interessante nell&#8217;approccio proposto \u00e8 proprio quella: avere un sistema integrato che riceva un input in linguaggio naturale e controlli automaticamente la validit\u00e0 delle proprie risposte. Potrebbe anche essere interessante il fatto che l&#8217;LLM abbia generato tra le tante euristiche per trovare questi set qualcuna che non era mai venuta in mente agli esseri umani. Per\u00f2 resto sempre dubbioso sul definirlo un breakthrough e non semplicemente un miglioramento sulle tecniche che si usano da decenni, come per esempio gli algoritmi genetici che hanno anch&#8217;essi un comportamento impredicibile a priori. Certo, gli autori dell&#8217;articolo si affrettano ad aggiungere che a differenza dei soliti LLM qui abbiamo un&#8217;idea (il programma generato) di come abbia lavorato l&#8217;algoritmo, ma di nuovo mi sembra che stiamo mischiando due livelli diversi.<\/p>\n<p>In definitiva, io aspetterei ancora un po&#8217; prima di gioire o fasciarmi la testa&#8230;<\/p>\n<p><small>(Immagine di carte SET di Miles, su <a href=\"https:\/\/en.wikipedia.org\/wiki\/File:Set-game-cards.png\">Wikimedia Commons<\/a>, Public Domain)<\/small><\/p>\n","protected":false},"excerpt":{"rendered":"<p>A me il titolo pare fuorviante, ve lo dico subito<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"activitypub_content_warning":"","activitypub_content_visibility":"","activitypub_max_image_attachments":3,"activitypub_interaction_policy_quote":"anyone","activitypub_status":"","footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2},"jetpack_post_was_ever_published":false},"categories":[30,214,9],"tags":[],"class_list":["post-27918","post","type-post","status-publish","format-standard","hentry","category-ia","category-matematica_light","category-ia-old"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_shortlink":"https:\/\/wp.me\/phh2yV-7gi","jetpack-related-posts":[{"id":16083,"url":"https:\/\/xmau.com\/notiziole\/2018\/01\/21\/quizzino-della-domenica-tre-per-tre\/","url_meta":{"origin":27918,"position":0},"title":"Quizzino della domenica: tre per tre","author":".mau.","date":"2018-01-21","format":false,"excerpt":"Una matrice 3\u00d73 \u00e8 riempita di numeri interi in modo che la somma dei numeri su ciascuna riga e ciascuna colonna sia dispari. Quanti possono essere i numeri pari? (un aiutino lo trovate sul mio sito, alla pagina http:\/\/xmau.com\/quizzini\/p297.html; la risposta verr\u00e0 postata l\u00ec il prossimo mercoled\u00ec. Problema dal Mediterranean\u2026","rel":"","context":"In &quot;giochi&quot;","block_context":{"text":"giochi","link":"https:\/\/xmau.com\/notiziole\/category\/giochi\/"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2018\/01\/q297.png?resize=350%2C200","width":350,"height":200},"classes":[]},{"id":27178,"url":"https:\/\/xmau.com\/notiziole\/2023\/10\/01\/quizzino-della-domenica-cento-carte\/","url_meta":{"origin":27918,"position":1},"title":"Quizzino della domenica: Cento carte","author":".mau.","date":"2023-10-01","format":false,"excerpt":"C'\u00e8 un mazzo di 50 carte, ciascuna delle quali reca sulla fronte e sul retro un numero da 1 a 100: non ci sono doppioni, quindi tutti i numeri sono presenti. Non ci sono regole che leghino tra di loro i numeri sui due lati delle carte. Il mazzo viene\u2026","rel":"","context":"In &quot;giochi&quot;","block_context":{"text":"giochi","link":"https:\/\/xmau.com\/notiziole\/category\/giochi\/"},"img":{"alt_text":"alcune delle 50 carte","src":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2023\/09\/q663a.png?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":13409,"url":"https:\/\/xmau.com\/notiziole\/2016\/07\/10\/quizzino-della-domenica-tennis\/","url_meta":{"origin":27918,"position":2},"title":"Quizzino della domenica: tennis","author":".mau.","date":"2016-07-10","format":false,"excerpt":"Giocando a tennis, i punti sono strani. Si contano 15, 30, 40 e poi gioco (a meno che non si arrivi a 40 pari, e a questo punto si continua fino a che un giocatore ha fatto due punti pi\u00f9 dell'altro). Per fare un set bisogna fare 6 giochi, sempre\u2026","rel":"","context":"In &quot;giochi&quot;","block_context":{"text":"giochi","link":"https:\/\/xmau.com\/notiziole\/category\/giochi\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":24545,"url":"https:\/\/xmau.com\/notiziole\/2022\/07\/31\/quizzino-della-domenica-regola-del-tre\/","url_meta":{"origin":27918,"position":3},"title":"Quizzino della domenica: Regola del tre","author":".mau.","date":"2022-07-31","format":false,"excerpt":"Dati cinque numeri interi, dimostrate che \u00e8 sempre possibile sceglierne tre la cui somma sia un multiplo di 3. (trovate un aiutino sul mio sito, alla pagina http:\/\/xmau.com\/quizzini\/p597.html; la risposta verr\u00e0 postata l\u00ec il prossimo mercoled\u00ec. Problema da Futility Closet.)","rel":"","context":"In &quot;giochi&quot;","block_context":{"text":"giochi","link":"https:\/\/xmau.com\/notiziole\/category\/giochi\/"},"img":{"alt_text":"1 2 3 4 5","src":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2022\/07\/q597a.png?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":24395,"url":"https:\/\/xmau.com\/notiziole\/2022\/06\/26\/quizzino-della-domenica-tre-dadi\/","url_meta":{"origin":27918,"position":4},"title":"Quizzino della domenica: tre dadi","author":".mau.","date":"2022-06-26","format":false,"excerpt":"Mia figlia Cecilia mi ha detto \"Sai, pap\u00e0? Ho lanciato tre dadi, e il prodotto dei numeri che sono usciti \u00e8 il doppio della loro somma. Sai dirmi quali sono i numeri?\" Io ci penso un po' e rispondo \"No, mi spiace\", al che lei: \"Va bene, se vuoi ti\u2026","rel":"","context":"In &quot;giochi&quot;","block_context":{"text":"giochi","link":"https:\/\/xmau.com\/notiziole\/category\/giochi\/"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2022\/06\/q592a-300x180.png?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":5293,"url":"https:\/\/xmau.com\/notiziole\/2007\/09\/16\/un_milione_non_poi_cos_grande\/","url_meta":{"origin":27918,"position":5},"title":"Un milione non \u00e8 poi cos\u00ec grande","author":".mau.","date":"2007-09-16","format":false,"excerpt":"La Stampa ha confuso i Km2 con i m2. Un errore di un fattore un milione.","rel":"","context":"In &quot;povera_matematica&quot;","block_context":{"text":"povera_matematica","link":"https:\/\/xmau.com\/notiziole\/category\/povera_matematica\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]}],"jetpack_likes_enabled":true,"jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts\/27918","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/comments?post=27918"}],"version-history":[{"count":3,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts\/27918\/revisions"}],"predecessor-version":[{"id":27922,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts\/27918\/revisions\/27922"}],"wp:attachment":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/media?parent=27918"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/categories?post=27918"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/tags?post=27918"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}