Perché non fidarsi delle AI generative, parte N

come ChatGPT sbaglia Se volete chiacchierare con una AI, non ci sono problemi. Se volete trovare la risposta a una domanda matematica, io ci starei attento. Nella figura qui sopra vedete l’incipit della risposta di ChatGPT alla domanda “49 + 610 + 320 è primo? Come lo posso dimostrare?”. Se andate su Quora potete cliccare e leggere tutto il suo “ragionamento”.
Peccato che quel numero non sia un multiplo di 13. Probabilmente il metodo predittivo aveva un bias verso certi numeri. Lo si vede fin dall’inizio, quando scrive «We can start by noting that [math]4^2 \equiv 1 \pmod{13}[/math]»: quattro al quadrato fa 16, che chiaramente è congruo a 3 modulo 13 e non a 1. Insomma, evitate di usarlo se volete barare sui compiti a casa: ci sono siti molto più accurati :-)

Ultimo aggiornamento: 2023-09-07 10:40

9 pensieri su “Perché non fidarsi delle AI generative, parte N

  1. Marco B

    Non è solo questione di tempo? Ho visto che Wolfram Alpha ha un plug-in con ChatGPT, la differenza la farà il back-end

    1. .mau. Autore articolo

      nì. In casi come questo, WA si limiterebbe a trovare il risultato 3547512721 e fattorizzarlo. Tecnicamente avrebbe dato una risposta corretta, ma non ci servirebbe.

  2. mu/6

    Ho provato con Bard di Google, che mediamente sbaglia di meno sulle domande matematiche (almeno per la mia esperienza), ma anche lui fa errori grossolani: alla domanda posta in italiano risponde correttamente che il numero non è primo, ma lo motiva dicendo che è divisibile per 3…

  3. Fabio

    Facciamo finta che sia un quizzino…

    Se non ho sbagliato, direi che è un quadrato.

    Infatti:
    4^9 = 2^18 = (2^9)^2
    6^10 = 2^10 * 3^10 = 2 * (2^9) * (3^10)
    3^20 = (3^10)^2

    Quindi è il quadrato di 2^9 + 3^10

  4. Bubbo Bubboni

    Ho provato anche io con la versione gratuita del 3 agosto della nota AI.
    A me ha funzionato (sospetto però che abbia copiato il ragionamento di Fabio), ci ha aggiunto anche tre metodi di verifica diversi e pubblicizza l’uso del cervello elettronico per i metodi più complicati.
    Però nel testo del post il quizzino è diverso rispetto allo screenshoot, e questo sì che è umano…

    1. .mau. Autore articolo

      non so se sia umano, ma è molto .mau.esco. Per dire, ho messo due post contemporanei stamattina anziché uno oggi e uno domani…

  5. Gino L

    Le AI generative sono come quegli studenti che hanno studiato tutto il libro, lo hanno capito poco, ma sono bravi ad infrascare il discorso e se non stai molto attento a quello che dicono ti sembra tutto corretto.

    La cosa che mi stupisce sempre è la qualità del testo come rispetto della lingua (italiana, inglese o altro).

I commenti sono chiusi.