{"id":33709,"date":"2025-09-16T04:51:36","date_gmt":"2025-09-16T02:51:36","guid":{"rendered":"https:\/\/xmau.com\/wp\/notiziole\/?p=33709"},"modified":"2025-12-29T18:46:20","modified_gmt":"2025-12-29T17:46:20","slug":"gli-llm-sono-tarati-per-avere-allucinazioni","status":"publish","type":"post","link":"https:\/\/xmau.com\/notiziole\/2025\/09\/16\/gli-llm-sono-tarati-per-avere-allucinazioni\/","title":{"rendered":"Gli LLM sono tarati per avere allucinazioni?"},"content":{"rendered":"<p>Qualche giorno fa Alberto Romero <a href=\"https:\/\/www.thealgorithmicbridge.com\/p\/openai-researchers-have-discovered\">ha scritto un post<\/a> che riprende un paper scritto da alcuni ricercatori di OpenAI, dal titolo <a href=\"https:\/\/cdn.openai.com\/pdf\/d04913be-3f6f-4d2b-b283-ff432ef4aaa5\/why-language-models-hallucinate.pdf\">&#8220;Why Language Models Hallucinate&#8221;<\/a>. La tesi degli autori \u00e8 che le allucinazioni degli LLM, cio\u00e8 le risposte completamente inventate, sono il risultato del modo in cui i modelli sono addestrati, vale a dire per cercare di dare il maggior numero di risposte possibili. Questo significa che se non c&#8217;\u00e8 una risposta chiaramente ricavabile dal materiale di addestramento &#8211; in altri termini, se i token che vengono man mano emessi arrivano da una distribuzione senza un picco chiaro, che corrisponde a una classificazione &#8220;forte&#8221; &#8211; il modello si comporta come lo studente tipico quando all&#8217;esame trova domande a risposta multipla su temi che non conosce: tira a indovinare. Se indovina, bene; altrimenti non perde nulla.<\/p>\n<p>Prima di parlare dell&#8217;articolo in s\u00e9, Romero fa una meta-analisi di cosa pu\u00f2 significare la pubblicazione di quell&#8217;articolo. Sui primi due punti (bisogna lavorare per eliminare le allucinazioni, anche al costo di un modello che a volte risponde &#8220;non lo so&#8221;; fino ad adesso non \u00e8 stata data priorit\u00e0 al problema) mi trovo d&#8217;accordo, mentre non penso che la pubblicazione implichi che OpenAI sia vicinissima ad avere trovato una soluzione. Se fosse cos\u00ec, mi sarei aspettato prima un modello &#8220;dubbioso ma non allucinato&#8221;, e subito dopo la pubblicazione dell&#8217;articolo, visto che sarebbero stati in parecchi ad accorgersi della filosofia dietro un modello di quel tipo. <\/p>\n<p>Entrando nel merito dell&#8217;articolo, i ricercatori affermano appunto che il problema delle allucinazioni non \u00e8 tanto dovuto al materiale di ingresso che \u00e8 &#8220;sporco&#8221;, cosa che pu\u00f2 peggiorare i risultati ma non \u00e8 fondamentale. Il problema \u00e8 che anche se i dati di addestramento fossero perfetti l&#8217;LLM non risponderebbe mai &#8220;non lo so&#8221; a una domanda, perch\u00e9 \u00e8 stato addestrato per predire la parola successiva anche se non ha al suo interno nessun pattern trovato nel testo e soprattutto perch\u00e9 in media l&#8217;accuratezza (misurata come percentuale di risposte esatte) comunque cresce, dato che non viene misurata &#8220;risposta corretta: +1; risposta errata: -1; nessuna risposta: 0&#8221; ma solo come risposte corrette sul totale. Ecco perch\u00e9 gli LLM bluffano sempre. Nella tabella qui sotto, <a href=\"https:\/\/openai.com\/index\/why-language-models-hallucinate\/\">presa dal loro blog<\/a>, gli autori dell&#8217;articolo mostrano il confronto con un modello basato su GPT-5 che dice &#8220;non lo so&#8221;. La percentuale di risposte corrette cala un po&#8217;, ma quella di risposte sbagliate crolla. <\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" src=\"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/09\/Clipboard_09-15-2025_01.png?resize=867%2C452&#038;ssl=1\" alt=\"risultati\" width=\"867\" height=\"452\" class=\"aligncenter size-full wp-image-33719\" srcset=\"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/09\/Clipboard_09-15-2025_01.png?w=867&amp;ssl=1 867w, https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/09\/Clipboard_09-15-2025_01.png?resize=300%2C156&amp;ssl=1 300w, https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/09\/Clipboard_09-15-2025_01.png?resize=768%2C400&amp;ssl=1 768w, https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/09\/Clipboard_09-15-2025_01.png?resize=624%2C325&amp;ssl=1 624w\" sizes=\"auto, (max-width: 867px) 100vw, 867px\" \/><\/p>\n<p>Dal mio punto di vista, un chatbot meno sicuro di s\u00e9 sarebbe sicuramente un vantaggio, perch\u00e9 perderei meno tempo a verificare le risposte che mi d\u00e0: ma ho il sospetto che il mio tipo di interazione sia molto minoritario. <\/p>\n<p>La parte pi\u00f9 divertente dell&#8217;articolo \u00e8 per\u00f2 quella sull&#8217;indovinello del chirurgo&#8230; Ma ne parlo tra qualche giorno.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Un paper di OpenAI sembra indicare proprio questo.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"activitypub_content_warning":"","activitypub_content_visibility":"","activitypub_max_image_attachments":3,"activitypub_interaction_policy_quote":"anyone","activitypub_status":"federated","footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2},"jetpack_post_was_ever_published":false},"categories":[30,1024],"tags":[],"class_list":["post-33709","post","type-post","status-publish","format-standard","hentry","category-ia","category-ia-2025"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_shortlink":"https:\/\/wp.me\/phh2yV-8LH","jetpack-related-posts":[{"id":34504,"url":"https:\/\/xmau.com\/notiziole\/2025\/11\/24\/gli-llm-hanno-problemi-con-la-parola-no\/","url_meta":{"origin":33709,"position":0},"title":"Gli LLM hanno problemi con la parola &#8220;no&#8221;","author":".mau.","date":"2025-11-24","format":false,"excerpt":"E non solo perch\u00e9 fanno fatica a darti una risposta negativa.","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":36337,"url":"https:\/\/xmau.com\/notiziole\/2026\/03\/16\/gli-llm-sono-una-forza-opposta-ai-social-media\/","url_meta":{"origin":33709,"position":1},"title":"Gli LLM sono una forza opposta ai social media?","author":".mau.","date":"2026-03-16","format":false,"excerpt":"Secondo un'opinione controcorrente, le loro risposte sui temi importanti seguirebbero il consenso degli esperti.","rel":"","context":"In &quot;ia 2026&quot;","block_context":{"text":"ia 2026","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/ia-2026\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":32179,"url":"https:\/\/xmau.com\/notiziole\/2025\/04\/24\/quando-gli-llm-si-dimenticano-quello-che-hanno-detto\/","url_meta":{"origin":33709,"position":2},"title":"Quando gli LLM si dimenticano quello che hanno detto","author":".mau.","date":"2025-04-24","format":false,"excerpt":"DeepSeek ha fatto tutto un suo ragionamento e poi si \u00e8 contraddetto...","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/"},"img":{"alt_text":"la \"dimostrazione\" di DeepSeek.","src":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/04\/colori.jpg?resize=350%2C200&ssl=1","width":350,"height":200,"srcset":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/04\/colori.jpg?resize=350%2C200&ssl=1 1x, https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2025\/04\/colori.jpg?resize=525%2C300&ssl=1 1.5x"},"classes":[]},{"id":33348,"url":"https:\/\/xmau.com\/notiziole\/2025\/08\/07\/gli-llm-normali-e-la-matematica\/","url_meta":{"origin":33709,"position":3},"title":"Gli LLM &#8220;normali&#8221; e la matematica","author":".mau.","date":"2025-08-07","format":false,"excerpt":"Certo, ci sono gli annunci sensazionali. Ma nella pratica i risultati non sono cos\u00ec eccezionali.","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":37273,"url":"https:\/\/xmau.com\/notiziole\/2026\/06\/01\/le-ia-riescono-ad-accorgersi-dei-testi-scritti-dalle-ia\/","url_meta":{"origin":33709,"position":4},"title":"Le IA riescono ad accorgersi dei testi scritti dalle IA?","author":".mau.","date":"2026-06-01","format":false,"excerpt":"Se sono scritti da zero, s\u00ec. Senn\u00f2 \u00e8 pi\u00f9 complicato","rel":"","context":"In &quot;ia 2026&quot;","block_context":{"text":"ia 2026","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/ia-2026\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":29001,"url":"https:\/\/xmau.com\/notiziole\/2024\/05\/27\/italica-base-dati-per-i-grandi-modelli-linguistici\/","url_meta":{"origin":33709,"position":5},"title":"Un&#8217;italica base dati per i Grandi Modelli Linguistici?","author":".mau.","date":"2024-05-27","format":false,"excerpt":"A che servirebbe lo Stato nello sviluppo dei modelli LLM?","rel":"","context":"In &quot;IA e informatica&quot;","block_context":{"text":"IA e informatica","link":"https:\/\/xmau.com\/notiziole\/category\/ia\/"},"img":{"alt_text":"LLM al lavoro","src":"https:\/\/i0.wp.com\/xmau.com\/notiziole\/wp-content\/uploads\/sites\/6\/2024\/05\/Multiple_attention_heads-204x300.png?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]}],"jetpack_likes_enabled":true,"jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts\/33709","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/comments?post=33709"}],"version-history":[{"count":2,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts\/33709\/revisions"}],"predecessor-version":[{"id":33722,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/posts\/33709\/revisions\/33722"}],"wp:attachment":[{"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/media?parent=33709"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/categories?post=33709"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/xmau.com\/notiziole\/wp-json\/wp\/v2\/tags?post=33709"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}