{"id":32179,"date":"2025-04-24T04:51:23","date_gmt":"2025-04-24T02:51:23","guid":{"rendered":"https:\/\/xmau.com\/wp\/notiziole\/?p=32179"},"modified":"2025-12-29T18:46:52","modified_gmt":"2025-12-29T17:46:52","slug":"quando-gli-llm-si-dimenticano-quello-che-hanno-detto","status":"publish","type":"post","link":"https:\/\/xmau.com\/notiziole\/2025\/04\/24\/quando-gli-llm-si-dimenticano-quello-che-hanno-detto\/","title":{"rendered":"Quando gli LLM si dimenticano quello che hanno detto"},"content":{"rendered":"<p>In queste settimane sul sito <a href=\"https:\/\/www.calenpiario.it\/\">calenpiario.it<\/a> vengono proposti alcuni problemi matematici. <a href=\"https:\/\/www.calenpiario.it\/index.php?a=problem&#038;p=149\">Quello del 16 aprile<\/a> aveva una formulazione un po&#8217; strana, forse per fare in modo che non venisse dato in pasto agli LLM. Ad ogni modo io ho voluto comunque provare a usarli, non con il testo originale ma con uno semplificato, per vedere come avrebbero risposto. Ho cos\u00ec fatto la domanda \u00abun cubo deve essere dipinto col minor numero possibile di colori scelti tra 24 in modo tale che due facce confinanti su uno spigolo non siano dello stesso colore.In quanti modi pu\u00f2 essere colorato il cubo? (Colorazioni che usano gli stessi colori, anche disposti in modo diverso, sono da considerarsi equivalenti)\u00bb per vedere cosa succedeva. Un ragionamento &#8220;umano&#8221; vede che sono necessari tre colori distinti, questi devono essere collocati su facce opposte del cubo, e quindi c&#8217;\u00e8 essenzialmente un unico modo per colorarli: il numero totale di possibilit\u00e0 \u00e8 pertanto $24 \\choose 3 $ = 2024. Che \u00e8 successo in pratica?<\/p>\n<p>Sia <a href=\"https:\/\/aistudio.google.com\/prompts\/new_chat?model=gemini-2.5-pro-exp-03-25\">Gemini Pro<\/a> che <a href=\"https:\/\/math-gpt.org\/chat\/d9bc3278-a00d-432c-b58f-e46b7472819a\">Math GPT<\/a> che <a href=\"https:\/\/claude.ai\/chat\/d06f6ea0-3854-4dbb-9b7e-c13893d1ab06\">Claude 2.7<\/a> hanno dato la risposta corretta. Invece <a href=\"https:\/\/chat.deepseek.com\/a\/chat\/s\/81bd8da9-4ece-47f2-9b49-490c9f5fa868\">DeepSeek<\/a> nella versione &#8220;veloce&#8221; si \u00e8 completamente impallato, scrivendo possibili risposte e poi ripensandoci su, fino a terminare con la risposta errata 4048: <\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" src=\"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/04\/colori.jpg?resize=575%2C747&#038;ssl=1\" alt=\"la &quot;dimostrazione&quot; di DeepSeek.\" width=\"575\" height=\"747\" class=\"aligncenter size-full wp-image-32181\" srcset=\"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/04\/colori.jpg?w=575&amp;ssl=1 575w, https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/04\/colori.jpg?resize=231%2C300&amp;ssl=1 231w\" sizes=\"auto, (max-width: 575px) 100vw, 575px\" \/><\/p>\n<p>Per confronto, <a href=\"https:\/\/chat.deepseek.com\/a\/chat\/s\/053b473c-31b5-4cea-96fa-b691c966a527\">DeepSeek &#8220;pensante&#8221;<\/a> ha fatto tutto il ragionamento in inglese ma ha dato la risposta corretta.<\/p>\n<p>L&#8217;errore di DeepSeek &#8220;base&#8221; mi ha lasciato molto stupito. Una caratteristica degli LLM che viene molto sottolineata \u00e8 infatti che il testo generato durante la risposta viene usato per tarare meglio la risposta stessa, in un ciclo di feedback. Insomma, non \u00e8 un banale sfoggio di &#8220;competenza&#8221; ma proprio un ausilio alla risposta del sistema. Invece a quanto pare questo \u00e8 stato un tipico caso di allucinazione: DeepSeek \u00e8 partito per la tangente, scrivendo <\/p>\n<blockquote><p>Ma questo \u00e8 valido solo se consideriamo che tutte le colorazioni con 3 colori sono equivalenti a meno di permutazioni, il che non \u00e8 vero. In realt\u00e0, ci sono 2 distinte classi di colorazioni con 3 colori:<br \/>\n&#8211; Colorazione a coppie: Due colori sono usati per due facce opposte ciascuno, e il terzo colore per le altre due facce opposte.<br \/>\n&#8211; Colorazione non a coppie: Un colore \u00e8 usato per tre facce, un altro per due, e il terzo per una faccia, con particolari vincoli di adiacenza.<\/p><\/blockquote>\n<p>Quello che parrebbe \u00e8 che DeepSeek si sia dimenticato del vincolo di non avere due facce adiacenti (o meglio, che non l&#8217;abbia pi\u00f9 mantenuto nel suo input), anche se comunque il ragionamento resta errato: manca infatti la classe &#8220;4 facce del colore A, 1 del colore B, 1 del colore C&#8221;. E questo tipo di errore \u00e8 molto pi\u00f9 strano&#8230; Diciamo insomma che il ragionamento matematico pu\u00f2 ancora lasciare a desiderare.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>DeepSeek ha fatto tutto un suo ragionamento e poi si \u00e8 contraddetto&#8230;<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"activitypub_content_warning":"","activitypub_content_visibility":"","activitypub_max_image_attachments":3,"activitypub_interaction_policy_quote":"anyone","activitypub_status":"federated","footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2},"jetpack_post_was_ever_published":false},"categories":[30,1024],"tags":[],"class_list":["post-32179","post","type-post","status-publish","format-standard","hentry","category-ia","category-ia-2025"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_shortlink":"https:\/\/wp.me\/phh2yV-8n1","jetpack-related-posts":[{"id":35790,"url":"https:\/\/xmau.com\/notiziole\/2026\/02\/02\/una-tavola-di-lookup-e-cosciente\/","url_meta":{"origin":32179,"position":0},"title":"Una tavola di lookup \u00e8 cosciente?","author":".mau.","date":"2026-02-02","format":false,"excerpt":"Un interessante punto di vista filosofico, pensando agli attuali LLM","rel":"","context":"In &quot;ia 2026&quot;","block_context":{"text":"ia 2026","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/ia-2026\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":12611,"url":"https:\/\/xmau.com\/notiziole\/2016\/02\/14\/quizzino-della-domenica-il-cubo-a-pezzi\/","url_meta":{"origin":32179,"position":1},"title":"Quizzino della domenica: il cubo a pezzi","author":".mau.","date":"2016-02-14","format":false,"excerpt":"Immaginate di avere un cubo formato da ventisette cubetti uguali, un po' come il cubo di Rubik (s\u00ec, lo so che il cubetto interno non esiste perch\u00e9 fa parte del meccanismo di rotazione. Questo cubo ha tutti i 27 cubetti). Immaginate ora di volere avere sei parallelepipedi 2\u00d72\u00d71, che hanno\u2026","rel":"","context":"In &quot;giochi&quot;","block_context":{"text":"giochi","link":"https:\/\/xmau.com\/notiziole\/category\/giochi\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":34694,"url":"https:\/\/xmau.com\/notiziole\/2025\/12\/08\/perche-unai-dovrebbe-sapere-che-un-articolo-e-stato-ritirato\/","url_meta":{"origin":32179,"position":2},"title":"Perch\u00e9 un&#8217;IA dovrebbe sapere che un articolo \u00e8 stato ritirato?","author":".mau.","date":"2025-12-08","format":false,"excerpt":"Ovvio che le cose vadano cos\u00ec: come fanno a distinguere lo status?","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":23161,"url":"https:\/\/xmau.com\/notiziole\/2021\/12\/19\/quizzino-della-domenica-il-cubo-primo\/","url_meta":{"origin":32179,"position":3},"title":"Quizzino della domenica: Il cubo primo","author":".mau.","date":"2021-12-19","format":false,"excerpt":"Un cubo ha otto vertici e dodici spigoli. Siete in grado di assegnare i numeri da 0 a 7 ai vertici, in modo che la somma dei due numeri agli estremi di ciascuno spigolo sia un numero primo? Ricordo che 1 non \u00e8 un numero primo, ma 2 s\u00ec. (trovate\u2026","rel":"","context":"In &quot;giochi&quot;","block_context":{"text":"giochi","link":"https:\/\/xmau.com\/notiziole\/category\/giochi\/"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2021\/10\/q555.png?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":31328,"url":"https:\/\/xmau.com\/notiziole\/2025\/02\/06\/open-euro-llm\/","url_meta":{"origin":32179,"position":4},"title":"Open Euro LLM","author":".mau.","date":"2025-02-06","format":false,"excerpt":"Progetto europeo per costruire un LLM multilingua che \"conservi la diversit\u00e0 culturale e linguistica\". Riusciranno mai a farlo?","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/"},"img":{"alt_text":"logo di Open Euro LLM","src":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/02\/openeurollm.png?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":34187,"url":"https:\/\/xmau.com\/notiziole\/2025\/11\/03\/wikipedia-e-lia\/","url_meta":{"origin":32179,"position":5},"title":"Wikipedia e l&#8217;IA","author":".mau.","date":"2025-11-03","format":false,"excerpt":"Rischi e opportunit\u00e0 (s\u00ec, ci sono anch'esse)","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]}],"jetpack_likes_enabled":true,"jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts\/32179","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/comments?post=32179"}],"version-history":[{"count":5,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts\/32179\/revisions"}],"predecessor-version":[{"id":32292,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts\/32179\/revisions\/32292"}],"wp:attachment":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/media?parent=32179"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/categories?post=32179"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/tags?post=32179"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}