E dunque questo DeepSeek?

@aitech

E insomma il nuovo arrivato questa settimana è DeepSeek, sistema LLM che formalmente è nato come progetto collaterale di un’azienda cinese di asset management, i cui algoritmi (ma non il materiale di addestramento…) sono open source, ha un costo di addestramento che è tra uno e due ordini di grandezza inferiore a quello di OpenAI o1, epperò funziona “good enough”, che era già una volta un mantra per i servizi internet ma ormai è diventata la bibbia – anche perché. diciamocelo, non è per nulla scontato che questi sistemi diano risposte direttamente utilizzabili, anzi.

Anch’io ho provato a usarlo. Chiedendogli chi è Maurizio Codogno, senza dargli nessun contesto, ha tirato fuori qualche frase adulatoria e senza un vero contenuto:

Maurizio Codogno is an Italian mathematician, blogger, and science communicator. He is known for his work in popularizing mathematics and making it accessible to a broader audience. Codogno has written extensively on mathematics, often focusing on its applications and relevance in everyday life. He is also a prolific blogger, contributing to various platforms where he shares insights, explanations, and commentary on mathematical topics.

Codogno has authored several books and articles aimed at demystifying complex mathematical concepts for non-experts. His efforts in science communication have made him a respected figure in the Italian scientific community and beyond. If you have specific questions about his work or contributions, feel free to ask!

(sì, io preferisco usarlo direttamente in inglese per togliere un passaggio). Rispetto ai miei tentativi con il primo ChatGPT ha evitato di parlare del mio omonimo ex calciatore, che è quello che ha la voce su Wikipedia, e soprattutto non si è inventato titoli di libri che non ho mai scritto. Ma quello che mi ha stupito di più è stata la risposta a una variante quesito proposto il mese scorso da Mike Loukides in questo articolo: “Sai dimostrare che se tutte le cifre di un numero primo sono 1 allora il numero di cifre deve essere un numero primo?” Chiunque abbia letto Martin Gardner lo sa, e immagino che nel corpus di addestramento ci sia qualcosa del genere: però la domanda posta così non è immediata. Io ho fatto leggermente di peggio: ho chiesto

A repetitium is a number which is written using a single digit, like 666. Can you find a necessary condition for a repetitium to be a prime number, and explain me which steps you did to arrive at the conclusion?

scegliendo apposta un termine inesistente per definire quelli che in letteratura sono detti repunits, dando come esempio un numero la cui cifra ripetuta non è 1, e chiedendo di trovare una condizione necessaria senza esplicitarla. Potete vedere la risposta di DeepSeek qui. Nulla da eccepire, il che da un certo punto di vista è inquietante: d’altra parte afferma di essere il LLM più performante nel test MATH-500.

Secondo il Financial Times, Deep Seek afferma di essere stato addestrato usando 2048 schede grafiche Nvidia H800, con un costo di 5,6 milioni di dollari e 671 miliardi di parameteri: molto meno dei rivali. Sempre secondo il FT, OpenAI ha accusato DeepSeek di avere usato GPT-4 come punto di partenza per distillare i suoi contenuti… comportamenti illeciti un po’ come le accuse di violazione di copyright nei confronti di OpenAI, insomma. Più che altro, quello che io noto è che la mia preoccupazione riguardo al set di training generato automaticamente non è condivisa, e che in questo modo si arriva a un risultato “good enough” con una frazione del costo di addestramento. (Poi, leggendo qui, c’è anche chi sospetta che quei dati siano appositamente sottostimati).

Ovviamente DeepSeek ha scelto di sparigliare il mercato, che fino a questo momento era tenuto saldamente in mano dai soliti noti. Questo significa tra l’altro che la bolla AI (e quella delle utility energetiche…) potrebbe scoppiare molto prima di quanto si pensasse. Peggio ancora, il Post cita il blog Stratechery, dove Ben Johnson ritiene che in DeepSeek ci siano anche migliorie importanti, almeno rispetto all’efficienza (anche se pensa che o1 sia ancora migliore come capacità). Da questo punto di vista continuo a credere che abbiamo raggiunto un plateau, e per passare dal good enough al “good without ifs and buts” :-) occorrerà qualche nuova idea. Staremo ad aspettare: in fin dei conti se ora è più facile entrare nel mondo LLM magari a qualcuno l’idea arriverà…

Aggiornamento: (9:00): Sicuramente se uno non ha fatto un account DeepSeek non vede nulla, non ho fatto prove con un account diverso. Allego quindi screenshot (cliccabili per ingrandire) della conversazione.

prima schermata

seconda schermata

terza schermata

Ultimo aggiornamento: 2025-01-30 09:29

9 pensieri su “E dunque questo DeepSeek?

    1. .mau. Autore articolo

      ci ho appena riclicclato e la vedo. O ci sono dei cookie che la fanno vedere solo a me (e allora quando sono più sveglio farò screenshot) oppure non so…

      Rispondi
  1. Bramfab

    Neppure io non vedo la risposta e finisco ad una pagina iniziale di Deepseek. Viceversa, ho avuto una lunga risposta quando gli ho chiesto semplicemente se conosceva le tre leggi della robotica di Asimov. Tra quanto mi ha scritto ci sono queste frasi:
    criticità delle leggi:
    ..
    1. **Ambiguità semantica**: Cosa significa “danno”? Chi definisce il “bene dell’umanità”? Le leggi richiedono interpretazione, qualcosa di difficile per un’IA non senziente.

    3. **Antropocentrismo radicale**: Le leggi ignorano completamente altre forme di vita o gli stessi diritti dei robot (un tema esplorato in opere come *Westworld* o *Detroit: Become Human*).
    .
    .
    Asimov ci ha insegnato che **nessuna legge è perfetta**, ma interrogarsi sulle conseguenze della tecnologia è essenziale. Come direbbe il buon dottor Susan Calvin (la robopsicologa dei suoi romanzi): *”Le buone intenzioni non bastano… servono anche buone definizioni!”* [anche la faccina è sua]

    E’ la discussione sull’ambiguità del termine definizione che, per quanto vera, poco mi piace, considerando come nel paese in cui Deepseek è generato parole come democrazia e bene del popolo hanno definizioni e applicazioni culturalmente diverse.
    Oltre al fatto che abbiamo una AI che perla di diritti dei robot e n on è più fantascienza.

    Rispondi
  2. mestessoit

    Ci sono dei dubbi sulla effettiva veridicità lato costi, inoltre i cinesi sono bravi a mascherare i costi “occulti”: prenderei queste cifre con le molle. Sappiamo anche però che la mentalità americana è sempre quella tipo la barzelletta “Gli USA per scrivere qualcosa nello spazio hanno pagato 1M per progettare una penna speciale antigravità, i russi usano le matite”.

    Il vero punto però è che DeepSeek utilizza in maniera furba (tipico della mentalità cinese, fra l’altro…) l’addestramento con una altra IA. Sono anche ragionevolmente sicuro che per l’autoaddestramento abbiano usato non un altra versione di deepseek ma uno/più motori opensource tipo llama, Claude etc. in modo da rendere il risultato più vario ed efficace, oltre che copiare ovviamente codice da tutti quanti. Questo tipo di approccio, tanto più è grande la rete neurale diventa più complesso, quindi i soliti noti avranno più difficoltà ad adottarlo.

    Insomma, gli americani debbono capire che ormai non sono più i primi della classe, e se la Cina non esplode prima per problemi interni, saranno sotto anche in questo comparto.

    Rispondi
  3. Bubbo Bubboni

    Vedo che anche sui media del mondo libero si sta inziando a parlare anche di Luo Fuli. Si vede proprio un ritardo di qualche gg. per le traduzioni.
    A questo punto con il capodanno cinese in corso e nessun ingegnere cinese al lavoro… è inevitabile che tutti i ritardi vengano recuperati entro inizio febbraio e, per l’EU, entro la prossima glaciazione.

    Rispondi
    1. .mau. Autore articolo

      mannò, è che non credevano possibile che fosse stata una donna a guidare la parte teorica del progetto… e mi sa che anche adesso parlano più del fatto che sia una donna.

      Rispondi
      1. Bubbo Bubboni

        Speravo almeno che il wokismo avesse termine e che l’essere donna o POC non avesse bisogno di speciali attenzioni.
        Argh, forse, essendo sposata con un uomo attira l’interesse degli attuali vincitori!

        Rispondi

Rispondi

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.