{"id":30264,"date":"2024-12-27T04:51:27","date_gmt":"2024-12-27T03:51:27","guid":{"rendered":"https:\/\/xmau.com\/wp\/notiziole\/?p=30264"},"modified":"2025-12-29T18:48:34","modified_gmt":"2025-12-29T17:48:34","slug":"ai-e-matematica-ci-sono-miglioramenti","status":"publish","type":"post","link":"https:\/\/xmau.com\/notiziole\/2024\/12\/27\/ai-e-matematica-ci-sono-miglioramenti\/","title":{"rendered":"AI e matematica: ci sono miglioramenti?"},"content":{"rendered":"<p>Alex Wilkins <a href=\"https:\/\/www.alex-wilkins.com\/blog\/aimaths2024\/\">in questo articolo<\/a> racconta dei progressi ottenuti nel 2024 dalle intelligenze artificiali nel campo della risoluzione di problemi matematici.<br \/>\nCome sapete, gli LLM non &#8220;comprendono&#8221; quello che hanno in input (o in output, se per questo) ma scelgono fondamentalmente la frase pi\u00f9 probabile data la successione di parole in ingresso e le variabili nascoste che hanno a disposizione. Quindi se chiediamo a ChatGPT e ai suoi amici quanto fa 2 + 2 \u00e8 estremamente probabile che la risposta sia 4; ma alla domanda &#8220;Add 34957 to 70764&#8221; rischiamo che la risposta sia <a href=\"https:\/\/www.d.umn.edu\/~tcolburn\/cs1581\/lectures\/chapter07\/intelligence\/slide007.html\">105621<\/a>. (Non ho fatto la prova, ma immagino che chi sviluppa gli LLM abbia tenuto conto di questa particolare addizione e quindi ci sia del codice che faccia dare la risposta corretta.) Il guaio \u00e8 che proprio perch\u00e9 gli LLM non capiscono quello che fanno \u00e8 difficile per loro anche solo accorgersi che il problema \u00e8 matematico e passarlo a un modulo &#8220;classico&#8221; che faccia i conti.<\/p>\n<p>Pare per\u00f2 che quest&#8217;anno ci sia stato un miglioramento nelle performance di questi sistemi, partendo da Google Deepmind che sarebbe riuscita a prendere una medaglia d&#8217;argento alle olimpiadi della matematica &#8211; no, non vuol dire arrivare secondi, ma essere tra il 20% dei migliori &#8211; e arrivando al prossimo sistema O3 di OpenAI che avrebbe ottenuto il 75,7% di risposte corrette sul test &#8220;semiprivato&#8221; della ARC Challenge, studiato appunto per avere problemi facili per gli umani ma difficili per l&#8217;AI. <a href=\"https:\/\/www.newscientist.com\/article\/2462000-openais-o3-model-aced-a-test-of-ai-reasoning-but-its-still-not-agi\/\">Peccato<\/a> che il costo per rispondere a ciascuna domanda \u00e8 intorno ai 20$; O3 avrebbe anche raggiunto l&#8217;87,5%, sopra la soglia dell&#8217;85% che permetterebbe di vincere l&#8217;ARC Challenge, se non fosse per un piccolo particolare. Il costo per rispondere meglio alle domande \u00e8 di 172 volte maggiore: in pratica per rispondere a una singola domanda O3 consuma 3500 euro di energia&#8230; e comunque le soluzioni in questo caso arrivavano per forza bruta, il che spiega il costo.<\/p>\n<p>Diciamo insomma che questi sistemi ne hanno ancora da fare di strada&#8230;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>c&#8217;\u00e8 chi dice di s\u00ec, ma restano molti dubbi.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"activitypub_content_warning":"","activitypub_content_visibility":"","activitypub_max_image_attachments":3,"activitypub_interaction_policy_quote":"anyone","activitypub_status":"federated","footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2},"jetpack_post_was_ever_published":false},"categories":[30,214,9],"tags":[],"class_list":["post-30264","post","type-post","status-publish","format-standard","hentry","category-ia","category-matematica_light","category-ia-old"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_shortlink":"https:\/\/wp.me\/phh2yV-7S8","jetpack-related-posts":[{"id":32179,"url":"https:\/\/xmau.com\/notiziole\/2025\/04\/24\/quando-gli-llm-si-dimenticano-quello-che-hanno-detto\/","url_meta":{"origin":30264,"position":0},"title":"Quando gli LLM si dimenticano quello che hanno detto","author":".mau.","date":"2025-04-24","format":false,"excerpt":"DeepSeek ha fatto tutto un suo ragionamento e poi si \u00e8 contraddetto...","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/"},"img":{"alt_text":"la \"dimostrazione\" di DeepSeek.","src":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/04\/colori.jpg?resize=350%2C200&ssl=1","width":350,"height":200,"srcset":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/04\/colori.jpg?resize=350%2C200&ssl=1 1x, https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/04\/colori.jpg?resize=525%2C300&ssl=1 1.5x"},"classes":[]},{"id":33709,"url":"https:\/\/xmau.com\/notiziole\/2025\/09\/16\/gli-llm-sono-tarati-per-avere-allucinazioni\/","url_meta":{"origin":30264,"position":1},"title":"Gli LLM sono tarati per avere allucinazioni?","author":".mau.","date":"2025-09-16","format":false,"excerpt":"Un paper di OpenAI sembra indicare proprio questo.","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/"},"img":{"alt_text":"risultati","src":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/09\/Clipboard_09-15-2025_01.png?resize=350%2C200&ssl=1","width":350,"height":200,"srcset":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/09\/Clipboard_09-15-2025_01.png?resize=350%2C200&ssl=1 1x, https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/09\/Clipboard_09-15-2025_01.png?resize=525%2C300&ssl=1 1.5x, https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/09\/Clipboard_09-15-2025_01.png?resize=700%2C400&ssl=1 2x"},"classes":[]},{"id":27918,"url":"https:\/\/xmau.com\/notiziole\/2023\/12\/20\/un-llm-piu-bravo-degli-umani-nei-problemi-matematici\/","url_meta":{"origin":30264,"position":2},"title":"Un LLM pi\u00f9 bravo degli umani nei problemi matematici?","author":".mau.","date":"2023-12-20","format":false,"excerpt":"A me il titolo pare fuorviante, ve lo dico subito","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2023\/12\/Set-game-cards-300x148.png?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":35371,"url":"https:\/\/xmau.com\/notiziole\/2026\/01\/06\/il-miglior-mio-uso-degli-llm\/","url_meta":{"origin":30264,"position":3},"title":"Il miglior mio uso degli LLM","author":".mau.","date":"2026-01-06","format":false,"excerpt":"sostituiscono i motori di ricerca e non solo, ma danno altri problemi","rel":"","context":"In &quot;ia 2026&quot;","block_context":{"text":"ia 2026","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/ia-2026\/"},"img":{"alt_text":"nuove domande su stackoverflow","src":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2026\/01\/G9xlSUcWoAAJpTZ.jpg?resize=350%2C200&ssl=1","width":350,"height":200,"srcset":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2026\/01\/G9xlSUcWoAAJpTZ.jpg?resize=350%2C200&ssl=1 1x, https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2026\/01\/G9xlSUcWoAAJpTZ.jpg?resize=525%2C300&ssl=1 1.5x"},"classes":[]},{"id":31328,"url":"https:\/\/xmau.com\/notiziole\/2025\/02\/06\/open-euro-llm\/","url_meta":{"origin":30264,"position":4},"title":"Open Euro LLM","author":".mau.","date":"2025-02-06","format":false,"excerpt":"Progetto europeo per costruire un LLM multilingua che \"conservi la diversit\u00e0 culturale e linguistica\". Riusciranno mai a farlo?","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/"},"img":{"alt_text":"logo di Open Euro LLM","src":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/02\/openeurollm.png?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":34694,"url":"https:\/\/xmau.com\/notiziole\/2025\/12\/08\/perche-unai-dovrebbe-sapere-che-un-articolo-e-stato-ritirato\/","url_meta":{"origin":30264,"position":5},"title":"Perch\u00e9 un&#8217;IA dovrebbe sapere che un articolo \u00e8 stato ritirato?","author":".mau.","date":"2025-12-08","format":false,"excerpt":"Ovvio che le cose vadano cos\u00ec: come fanno a distinguere lo status?","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]}],"jetpack_likes_enabled":true,"jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts\/30264","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/comments?post=30264"}],"version-history":[{"count":1,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts\/30264\/revisions"}],"predecessor-version":[{"id":30265,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts\/30264\/revisions\/30265"}],"wp:attachment":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/media?parent=30264"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/categories?post=30264"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/tags?post=30264"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}