Numeri primoriali e compositoriali

Ok, il fattoriale di un numero naturale \( n \) è il prodotto dei numeri da \( 1 \) a \( n \) e si indica con la notazione \( n! \). Questo immagino vi sia ben noto. Ma avete mai sentito parlare dei numeri primoriali? Dato un numero naturale \( n \), il suo primoriale \( n\# \) è il prodotto dei numeri primi da \( 1 \) a \( n \). Questo ovviamente significa che per esempio il primoriale di 12 è uguale a quello di 11 (e vale \( 2 \cdot 3 \cdot 5 \cdot 7 \cdot 11 = 2310 \)); in effetti c’è anche chi afferma che i primoriali sono solo quelli relativi ai numeri primi, e li rappresenta quindi con \( p_n\# \). In ogni caso, i primi primoriali distinti sono 2, 6, 30, 210, 2310, 30030, 510510, 9699690, 223092870, 6469693230, 200560490130, 7420738134810, 304250263527210, 13082761331670030, 614889782588491410.

Non esiste una funzione continua che estende i primoriali, a differenza della funzione Gamma per il fattoriale; la colpa, per così dire, sta nel fatto che la distribuzione dei primi è erratica. Se però prendiamo la funzione di Čebyšëv \( \vartheta(x)=\sum_{p\le x} \ln p \), cioè la somma dei logaritmi dei numeri primi inferiori a quello dato, sappiamo che \( \vartheta(n) \approx n \) e quindi \( n\# \approx e^{\vartheta(n)} \), per quello che può servire. La cosa buffa è che per \( n \lt 10^{11} \) abbiamo \( n\# \lt e^n \), ma sappiamo anche che ci sono sono infiniti intervalli di valori per cui invece \( n\# \gt e^n \). Quello che sappiamo al momento è che \(n\#\leq (2.763)^n\) e per \(>n \ge 563\) si ha che \( n\#\geq (2.22)^n \). Infine, se sommiamo gli inversi dei primoriali distinti otteniamo una costante:

\(\sum_{p\,\text{primo}} {1 \over p\#} = {1 \over 2} + {1 \over 6} + {1 \over 30} + \ldots = 0{.}7052301717918\ldots \),

e che questo numero è irrazionale (ma l’hanno dimostrato solo nel 2015… insomma non deve essere stato banale)

Ci sono poi i numeri compositoriali, che sono quello che manca ai primoriali per arrivare ai fattoriali: il prodotto di tutti i numeri composti da \( 1 \) a \( n \). Che io sappia, non esiste un simbolo per definirli: si scrive semplicemente \( n! \over n\# \) e chi si è visto si è visto. I primi compositoriali distinti sono 1, 4, 24, 192, 1728, 17280, 207360, 2903040, 43545600, 696729600, 12541132800, 250822656000, 5267275776000, 115880067072000, 2781121609728000, 69528040243200000, 180772904632320000.

Tutta questa pappardella mi è servita per dire che il numero \( 751882!/751882\# + 1 \) è primo: questo è il più grande numero “quasi compositoriale” conosciuto, con le sue 3765621 cifre. Nella pagina che ho linkato il denominatore è \( 751879\# \), ma per quanto detto sopra il valore è lo stesso, e in questo modo si vede meglio che il numero differisce di 1 da un compositoriale. In genere è difficile dimostrare la primalità di numeri di questo tipo, e per questo se ne conoscono di meno: per dire, quando è stata certificata la sua primalità era il 109-simo più grande numero primo conosciuto…

Parlo di pi greco ad Alatri

Non so quanti dei miei ventun lettori stiano dalle parti di Frosinone. Ad ogni modo, per festeggiare la Giornata Internazionale della matematica, venerdì prossimo sarò ad Arpino e Alatri per parlare di pi greco (e del mio libro… ma questo lo conoscete già) agli studenti del Tulliano e del liceo Pietrobono.
Ho però scoperto che mentre la prima presentazione sarà al castello di Ladislao, quella di Alatri sarà presso la biblioteca civica, e quindi a ingresso libero. Se vi interessa vedere la mia bella faccia, sapevàtelo!

Non siamo più in grado di riconoscere i testi generati dalle IA?

Una volta era facile capire quando un testo era generato automaticamente: la sua struttura aveva un non so che di artefatto. Ora a quanto pare gli LLM sono arrivati a fregarci sempre meglio. MomScience riporta il risultato di due studi, nemmeno troppo recenti (si parla del 2023) dove il tasso di errore nel definire se un testo era umano o artificiale era intorno al 50%: essenzialmente come tirare a indovinare. Peggio ancora, nel caso di editor di riviste tecniche il tasso di riconoscimento corretto è stato molto inferiore al 50%: in pratica un reverse benchmark.

Come mai? Innanzitutto, le IA ormai non fanno più errori grammaticali e refusi, a differenza di chi scrive spesso di fretta e non rilegge il suo testo (quorum ego). In pratica, al momento è meglio fidarsi di un testo più ruspante. Credo però che ci sia anche un altro punto: il fare una verifica superficiale, senza entrare nel merito del significato del testo. Un altro studio, stavolta del 2026, elenca gli indizi cercati dai professori quando controllano gli elaborati ricevuti. I primi quattro sono la presenza di allucinazioni nei fatti presentati; allucinazioni nelle fonti citate; mancanza (appunto!) di errori grammaticali e ripetizioni del testo. Peccato che se il compito è quello di riassumere un testo è molto improbabile che le IA facciano di questi “errori”, o più correttamente lascino tracce visibili!

Quello a cui forse dovremo rassegnarci è che non è più importante sapere chi (o cosa…) ha scritto un testo, ma dobbiamo concentrarci sul suo contenuto. Ho come il sospetto che per molta gente ciò sarà ancora più difficile :-)

IA e clean room

Nella sua newsletter, Simon Willison racconta di un caso interessante he riguarda le reimplementazioni di codice. L’esempio tipico, raccontato anche nel suo post, è stato quando Compaq ha preso un gruppo di sviluppatori per disassemblare il BIOS dei PC IBM e scrivere un documento di specifiche relative; il documento è stato dato a un altro gruppo di sviluppatori che hanno creato un BIOS compatibile ma senza problemi di copyright, perché a essere copiate sono state le funzionalità e non il codice. Questa metodologia si chiama in gergo “clean room”, come le camere pulite dove si costruiscono (costruivano? io me le ricordo a fine anni ’80…) i chip, perché non c’è nessuna contaminazione. Il problema è che un metodo del genere è molto costoso, in termini di risorse e soprattutto di tempo. Ma ora ci sono le IA che scrivono codice: non si può far fare il lavoro a loro?

È proprio quello che è stato fatto con la libreria Python chardet, che cerca di determinare qual è il codifica dei caratteri usata in un documento. Il programma è stato creato nel 2006 da Mark Pilgrim e rilasciato sotto la licenza LGPL, e portato avanti da vari sviluppatori, soprattutto da Dan Blanchard che ha praticamente preso le redini del progetto dal 2012 e la versione 1.1. Ora Blanchard ha rilasciato una nuova versione, la 7.0.0 (al momento siamo alla 7.0.2) definita come “riscrittura da zero” con l’aiuto di Claude Code e rilasciata con la MIT license, il che significa che può essere usata anche senza far automaticamente far diventare open source tutto il progetto che la usa. Pilgrim però ha obiettato, dicendo che non era possibile cambiare licenza al software, e da qui è partita una diatriba. Blanchard ha spiegato che è partito dalla generazione di un insieme di specifiche usando superpowers, per poi partire ex novo con un progetto e istruire Claude Code a non usare codice GPL oppure LGPL. Il risultato, usando il tool JPlag che verifica la somiglianza del codice con un altro dato, è che la similarità massima è dell’1,29%.

Willison elenca poi una serie di punti che rendono il caso complicato: Blanchard sicuramente conosce fin troppo bene il codice originale, avendoci lavorato su per tre lustri; Claude Code ha sicuramente referenziato parti del codice originale, come il file che elenca le proprietà delle varie codifiche, ma d’altra parte Pilgrim aveva scritto il codice partendo da un’implementazione in C con la licenza Mozilla; Claude è stato quasi sicuramente addestrato anche con il materiale di chardet, e la sua “memoria” è sicuramente molto più affidabile di quella degli sviluppatori che compilano in una clean room. Ma naturalmente il vero problema non è tanto chardet, che rimarrebbbe con una licenza libera. Il software libero nasce proprio in contrapposizione a quello proprietario: cosa succede se il pendolo si sposta dall’altra parte e le aziende sfruttano il software libero per averne dell’altro bloccato?

Quizzino della domenica: Cinque bambini

790 – algebra

Ai giardinetti ci sono cinque banbini che hanno tutti meno di dieci anni. La cosa buffa è che considerando le loro età come numeri interi (quindi nessuno ha per dire 2,5 anni) la media delle loro età, la mediana (l’età del terzo in ordine di vecchiaia), la moda (l’età più rappresentata nel gruppo) e la gamma (la differenza tra l’età del più vecchio e quella del più giovane) è la stessa. E la cosa ancora più buffa è che domani, quando uno dei bambini compirà gli anni, mediana e moda saranno ancora uguali, ma il loro valore sarà diverso. Quanti anni hanno (oggi) i bambini?

i cinque bambini
(trovate un aiutino sul mio sito, alla pagina https://xmau.com/quizzini/p790.html; la risposta verrà postata lì il prossimo mercoledì. Problema di Jack Murtagh, da Scientific American; immagine di oksmith modificata, da OpenClipArt.)

150 (anni di) invenzioni italiane (libro)

copertina Comincio con un plauso al formato grafico del volume: una coppia di pagine dedicata a ogni brevetto, con un particolare dei disegni associati, un brano del testo che accompagnava la domanda di brevetto e la breve storia dell’inventore. La scelta di Marchis è stata quella di dedicarsi ai brevetti rilasciati negli USA, e di prenderne uno per anno, scegliendo fior da fiore: c’è Fermi che brevetta un modo per ottenere elementi radioattivi, ma anche la caffettiera. Nel mezzo abbiamo una storia d’Italia e degli italiani, ma anche il progressivo modificarsi del concetto di brevetto: si parte dalle singole persone e si arriva abbastanza presto alle aziende che si prendono i diritti commerciali, e ci si sposta dalle invenzioni agli oggetti di design. Lettura divertente.

Vittorio Marchis, 150 (anni di) invenzioni italiane, Codice 2017², pag. 344, € 29, ISBN 9788875787011 – come Affiliato Amazon, se acquistate il libro dal link Bezos mi dà qualche centesimo dei suoi utili
Voto: 5/5

La matematica che conta – Presentazione in Hoepli

la locandina Come forse avrete letto in giro, la Hoepli non se la passa bene; c’è il forte rischio che la casa editrice sia ceduta a qualche grande gruppo, e soprattutto che la libreria venga chiusa, con le ripercussioni sui dipendenti. Quale migliore occasione per un milanese di andare venerdì prossimo (13 marzo) a vedere la presentazione del libro del mio amico Daniele Gouthier La matematica che conta? Non ho ancora fatto in tempo a leggere il libro – io sono da solo a leggere, e a scrivere sono così in tanti! – ma so bene come scrive, visto che ho letto e apprezzato Matematica fuori dalle regole, e sono certo che anche questa sua nuova fatica possa essere più interessante per chi con la matematica ha sempre avuto un rapporto complicato.
L’unica cosa che mi dispiace è che io il 13 sarò nel frusinate – ovviamente a parlare di matematica… il Pi Day è dietro l’angolo – e quindi non potrò essere presente.