{"id":33348,"date":"2025-08-07T16:22:08","date_gmt":"2025-08-07T14:22:08","guid":{"rendered":"https:\/\/xmau.com\/wp\/notiziole\/?p=33348"},"modified":"2025-12-29T18:46:49","modified_gmt":"2025-12-29T17:46:49","slug":"gli-llm-normali-e-la-matematica","status":"publish","type":"post","link":"https:\/\/xmau.com\/wp\/notiziole\/2025\/08\/07\/gli-llm-normali-e-la-matematica\/","title":{"rendered":"Gli LLM &#8220;normali&#8221; e la matematica"},"content":{"rendered":"<div class='__iawmlf-post-loop-links' style='display:none;' data-iawmlf-post-links='[{&quot;id&quot;:481,&quot;href&quot;:&quot;https:\\\/\\\/maddmaths.simai.eu\\\/divulgazione\\\/codogno-il-non-praticante\\\/ai-lavoro-matematica&quot;,&quot;archived_href&quot;:&quot;http:\\\/\\\/web-wp.archive.org\\\/web\\\/20251108214859\\\/https:\\\/\\\/maddmaths.simai.eu\\\/divulgazione\\\/codogno-il-non-praticante\\\/ai-lavoro-matematica\\\/&quot;,&quot;redirect_href&quot;:&quot;&quot;,&quot;checks&quot;:[{&quot;date&quot;:&quot;2026-02-11 19:52:52&quot;,&quot;http_code&quot;:403},{&quot;date&quot;:&quot;2026-02-15 21:05:56&quot;,&quot;http_code&quot;:403},{&quot;date&quot;:&quot;2026-02-19 22:44:26&quot;,&quot;http_code&quot;:403},{&quot;date&quot;:&quot;2026-02-23 17:06:38&quot;,&quot;http_code&quot;:403},{&quot;date&quot;:&quot;2026-02-27 23:23:17&quot;,&quot;http_code&quot;:403},{&quot;date&quot;:&quot;2026-03-03 08:24:20&quot;,&quot;http_code&quot;:403},{&quot;date&quot;:&quot;2026-03-07 19:10:00&quot;,&quot;http_code&quot;:403},{&quot;date&quot;:&quot;2026-03-13 18:37:55&quot;,&quot;http_code&quot;:403},{&quot;date&quot;:&quot;2026-03-17 06:52:58&quot;,&quot;http_code&quot;:403},{&quot;date&quot;:&quot;2026-03-20 09:45:12&quot;,&quot;http_code&quot;:403},{&quot;date&quot;:&quot;2026-03-24 05:16:47&quot;,&quot;http_code&quot;:403},{&quot;date&quot;:&quot;2026-03-28 11:47:42&quot;,&quot;http_code&quot;:403},{&quot;date&quot;:&quot;2026-03-31 23:17:35&quot;,&quot;http_code&quot;:403}],&quot;broken&quot;:true,&quot;last_checked&quot;:{&quot;date&quot;:&quot;2026-03-31 23:17:35&quot;,&quot;http_code&quot;:403},&quot;process&quot;:&quot;done&quot;},{&quot;id&quot;:482,&quot;href&quot;:&quot;https:\\\/\\\/www.scientificamerican.com\\\/article\\\/mathematicians-question-ai-performance-at-international-math-olympiad&quot;,&quot;archived_href&quot;:&quot;http:\\\/\\\/web-wp.archive.org\\\/web\\\/20260211195703\\\/https:\\\/\\\/www.scientificamerican.com\\\/article\\\/mathematicians-question-ai-performance-at-international-math-olympiad\\\/&quot;,&quot;redirect_href&quot;:&quot;https:\\\/\\\/www.scientificamerican.com\\\/article\\\/mathematicians-question-ai-performance-at-international-math-olympiad\\\/&quot;,&quot;checks&quot;:[{&quot;date&quot;:&quot;2026-02-12 04:29:08&quot;,&quot;http_code&quot;:206},{&quot;date&quot;:&quot;2026-02-15 21:05:56&quot;,&quot;http_code&quot;:206},{&quot;date&quot;:&quot;2026-02-19 22:44:26&quot;,&quot;http_code&quot;:206},{&quot;date&quot;:&quot;2026-02-23 17:06:35&quot;,&quot;http_code&quot;:206},{&quot;date&quot;:&quot;2026-02-27 23:23:18&quot;,&quot;http_code&quot;:206},{&quot;date&quot;:&quot;2026-03-03 08:24:18&quot;,&quot;http_code&quot;:206},{&quot;date&quot;:&quot;2026-03-07 19:09:59&quot;,&quot;http_code&quot;:206},{&quot;date&quot;:&quot;2026-03-15 11:16:09&quot;,&quot;http_code&quot;:206},{&quot;date&quot;:&quot;2026-03-18 14:15:28&quot;,&quot;http_code&quot;:206},{&quot;date&quot;:&quot;2026-03-24 05:16:48&quot;,&quot;http_code&quot;:206},{&quot;date&quot;:&quot;2026-03-28 11:47:42&quot;,&quot;http_code&quot;:503},{&quot;date&quot;:&quot;2026-03-31 23:17:32&quot;,&quot;http_code&quot;:206}],&quot;broken&quot;:false,&quot;last_checked&quot;:{&quot;date&quot;:&quot;2026-03-31 23:17:32&quot;,&quot;http_code&quot;:206},&quot;process&quot;:&quot;done&quot;},{&quot;id&quot;:483,&quot;href&quot;:&quot;https:\\\/\\\/matharena.ai\\\/imo&quot;,&quot;archived_href&quot;:&quot;http:\\\/\\\/web-wp.archive.org\\\/web\\\/20260102005940\\\/https:\\\/\\\/matharena.ai\\\/imo\\\/&quot;,&quot;redirect_href&quot;:&quot;&quot;,&quot;checks&quot;:[{&quot;date&quot;:&quot;2026-02-11 19:53:39&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-02-15 21:05:55&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-02-19 22:44:27&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-02-23 17:06:35&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-02-27 23:23:20&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-03 08:24:17&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-07 19:10:00&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-12 01:31:56&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-15 11:16:09&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-18 14:15:27&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-24 05:16:47&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-28 11:47:39&quot;,&quot;http_code&quot;:200},{&quot;date&quot;:&quot;2026-03-31 23:17:35&quot;,&quot;http_code&quot;:200}],&quot;broken&quot;:false,&quot;last_checked&quot;:{&quot;date&quot;:&quot;2026-03-31 23:17:35&quot;,&quot;http_code&quot;:200},&quot;process&quot;:&quot;done&quot;}]'><\/div>\n<p>All&#8217;inizio della settimana ho scritto su MaddMaths! (come, non leggete la mia rubrica &#8220;il matematico non praticante&#8221; che tengo l\u00ec? Male, nolto male) <a href=\"https:\/\/maddmaths.simai.eu\/divulgazione\/codogno-il-non-praticante\/ai-lavoro-matematica\/\">un articolo sulla medaglia virtuale d&#8217;oro<\/a> ottenuta da Google DeepMind alle Olimpiadi della matematica. Gi\u00e0 l\u00ec esprimevo i miei dubbi: vedo che non sono il solo, leggendo <a href=\"https:\/\/www.scientificamerican.com\/article\/mathematicians-question-ai-performance-at-international-math-olympiad\/\">questo articolo di Emily Riehl<\/a> su Scientific American. <\/p>\n<p>Dall&#8217;articolo ho scoperto che le voci che anche OpenAI avrebbe raggiunto un punteggio da medaglia d&#8217;oro sono solo voci, o almeno non c&#8217;\u00e8 stato un riconoscimento ufficiale da chi gestisce l&#8217;IMO: nulla di strano, in un ambiente dove l&#8217;hype \u00e8 al momento pi\u00f9 importante dei risultati. Ma la cosa pi\u00f9 interessante \u00e8 un&#8217;altra. Non \u00e8 tanto il fatto che questi modelli tirano fuori un certo numero di risposte e poi scelgano (non ho idea come) quella pi\u00f9 robusta: non penso, a differenza di Riehl, che questo equivalga a lavorare in squadra, visto che il modello sottostante \u00e8 lo stesso. Quello che conta davvero \u00e8 che si \u00e8 tenuto <a href=\"https:\/\/matharena.ai\/imo\/\">un torneo parallelo informale<\/a> ospitato da MathArena e che ha coinvolto (si fa per dire) i modelli disponibili commercialmente. Risultato? Nessuno \u00e8 arrivato nemmeno alla medaglia di bronzo (che viene data a met\u00e0 circa dei partecipanti alle olimpiadi reali). Il migliore \u00e8 stato Gemini 2.5 Pro con 13 punti su 42, molti meno della soglia di 19 punti necessaria per la medaglia di bronzo. (Un esercizio risolto correttamente vale sei punti, ma se ne pu\u00f2 ottenere qualcuno per una risposta errata ma con alcuni passi corretti). Il tutto spendendo pi\u00f9 di 400 dollari :-)<\/p>\n<p>Il mio commento finale? non \u00e8 diverso da quello che avevo scritto su MaddMaths!. Questi sistemi ne hanno ancora di parametri da macinare. Questo non vuol dire prenderli sottogamba, e del resto ricordo che i sistemi di dimostrazione automatica dei teoremi sono ormai usati regolarmente, il che significa che nessuno ha un pregiudizio aprioristico. Semplicemente manca ancora molto per avere qualcosa di pi\u00f9 di un aiuto.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Certo, ci sono gli annunci sensazionali. Ma nella pratica i risultati non sono cos\u00ec eccezionali.<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_lmt_disableupdate":"","_lmt_disable":"","jetpack_post_was_ever_published":false,"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"activitypub_content_warning":"","activitypub_content_visibility":"","activitypub_max_image_attachments":3,"activitypub_interaction_policy_quote":"anyone","activitypub_status":"federated","footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2}},"categories":[30,1024,1005,214],"tags":[],"class_list":["post-33348","post","type-post","status-publish","format-standard","hentry","category-ia","category-ia-2025","category-matelight-2025","category-matematica_light"],"modified_by":".mau.","jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_shortlink":"https:\/\/wp.me\/p6hcSh-8FS","jetpack-related-posts":[{"id":28176,"url":"https:\/\/xmau.com\/wp\/notiziole\/2024\/01\/24\/alphageometry\/","url_meta":{"origin":33348,"position":0},"title":"AlphaGeometry","author":".mau.","date":"2024-01-24","format":false,"excerpt":"Un programma di AI che sa (davvero) risolvere esercizi di geometria.","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/wp\/notiziole\/category\/ia\/"},"img":{"alt_text":"una dimostrazione di AlphaGeometry (dal sito di Google DeepMind)","src":"https:\/\/i0.wp.com\/xmau.com\/wp\/notiziole\/wp-content\/uploads\/sites\/6\/2024\/01\/afphageo.png?resize=350%2C200&ssl=1","width":350,"height":200,"srcset":"https:\/\/i0.wp.com\/xmau.com\/wp\/notiziole\/wp-content\/uploads\/sites\/6\/2024\/01\/afphageo.png?resize=350%2C200&ssl=1 1x, https:\/\/i0.wp.com\/xmau.com\/wp\/notiziole\/wp-content\/uploads\/sites\/6\/2024\/01\/afphageo.png?resize=525%2C300&ssl=1 1.5x"},"classes":[]},{"id":8650,"url":"https:\/\/xmau.com\/wp\/notiziole\/2012\/01\/08\/problema_della_\/","url_meta":{"origin":33348,"position":1},"title":"Problema della domenica: la medaglia falsa","author":".mau.","date":"2012-01-08","format":false,"excerpt":"Un problema di pesate","rel":"","context":"In &quot;matematica_light&quot;","block_context":{"text":"matematica_light","link":"https:\/\/xmau.com\/wp\/notiziole\/category\/matematica_light\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":30264,"url":"https:\/\/xmau.com\/wp\/notiziole\/2024\/12\/27\/ai-e-matematica-ci-sono-miglioramenti\/","url_meta":{"origin":33348,"position":2},"title":"AI e matematica: ci sono miglioramenti?","author":".mau.","date":"2024-12-27","format":false,"excerpt":"c'\u00e8 chi dice di s\u00ec, ma restano molti dubbi.","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/wp\/notiziole\/category\/ia\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":36536,"url":"https:\/\/xmau.com\/wp\/notiziole\/2026\/04\/02\/un-paio-di-cose-su-wikipedia\/","url_meta":{"origin":33348,"position":3},"title":"Un paio di cose su Wikipedia","author":".mau.","date":"2026-04-02","format":false,"excerpt":"cosa pu\u00f2 contenere (soprattutto quella in inglese) e come l'enciclopedia potrebbe cambiare","rel":"","context":"In &quot;wikipedia&quot;","block_context":{"text":"wikipedia","link":"https:\/\/xmau.com\/wp\/notiziole\/category\/wikipedia\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":24199,"url":"https:\/\/xmau.com\/wp\/notiziole\/2022\/06\/04\/sotto-il-segno-del-toro-libro\/","url_meta":{"origin":33348,"position":4},"title":"Sotto il segno del Toro (libro)","author":".mau.","date":"2022-06-04","format":false,"excerpt":"Perch\u00e9 le donne matematiche sono ancora neglette?","rel":"","context":"In &quot;rec-2022&quot;","block_context":{"text":"rec-2022","link":"https:\/\/xmau.com\/wp\/notiziole\/category\/recensioni\/rec-2022\/"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/xmau.com\/wp\/notiziole\/wp-content\/uploads\/sites\/6\/2022\/05\/9788899442125.jpg?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":33456,"url":"https:\/\/xmau.com\/wp\/notiziole\/2025\/08\/21\/abbiamo-raggiunto-il-top-degli-llm-attuali\/","url_meta":{"origin":33348,"position":5},"title":"Abbiamo raggiunto il top degli LLM attuali?","author":".mau.","date":"2025-08-21","format":false,"excerpt":"ChatGPT-5 non \u00e8 stato quel salto quantico che ci eravamo abituati ad aspettare","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/wp\/notiziole\/category\/ia\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]}],"jetpack_likes_enabled":true,"jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/xmau.com\/wp\/notiziole\/wp-json\/wp\/v2\/posts\/33348","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/xmau.com\/wp\/notiziole\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/xmau.com\/wp\/notiziole\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/xmau.com\/wp\/notiziole\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/xmau.com\/wp\/notiziole\/wp-json\/wp\/v2\/comments?post=33348"}],"version-history":[{"count":1,"href":"https:\/\/xmau.com\/wp\/notiziole\/wp-json\/wp\/v2\/posts\/33348\/revisions"}],"predecessor-version":[{"id":33349,"href":"https:\/\/xmau.com\/wp\/notiziole\/wp-json\/wp\/v2\/posts\/33348\/revisions\/33349"}],"wp:attachment":[{"href":"https:\/\/xmau.com\/wp\/notiziole\/wp-json\/wp\/v2\/media?parent=33348"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/xmau.com\/wp\/notiziole\/wp-json\/wp\/v2\/categories?post=33348"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/xmau.com\/wp\/notiziole\/wp-json\/wp\/v2\/tags?post=33348"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}