Nome dell'autore: .mau.

curiosità 2026, curiosita'

Il Metaculus Democracy Threat Index

Se guardate i social network, trovate tanta gente che dice che la nazione X sta scivolando verso un regime autoritario. Spesso per X si intendono gli USA. Ma vi siete mai chiesti se c’è un modo per stimare esattamente quanto scivolamento ci sia? Scott Alexander (ma anche Claude…) è piuttosto scettico al riguardo. Però ha trovato un sito che al momento sembra avere un approccio interessante: il Metaculus Democracy Threat Index, appunto. Metaculus, come Alexander spiega, è un sito di previsioni: l’idea è insomma simile a quella delle società di scommesse, che calcolano le percentuali di vittoria rispetto a cosa la gente scommette. In questo caso ci sono però due differenze: innanzitutto non si giocano soldi, ma soprattutto le domande (al momento 153, un bel numero biblico) sono fatte in modo da non richiedere una risposta binaria sì/no, ma dare una percentuale di previsione. Questo permette di avere una grana più fine nel misurare il rischio.

Naturalmente ci sono molti modi in cui il sistema può essere manipolato, e Alexander ne elenca un paio: un gruppo motivato di persone può dare apposta risposte di un certo tipo, e le domande stesse, pur essendo pubbliche, possono non essere davvero neutre. L’esperimento però è interessante: sarebbe bello vedere qualcosa del genere anche da noi in Italia.

,
ia 2026, IA e informatica

Bolla o non bolla?

Questa settimana ci sono stati alcuni segnali che potrebbero essere considerati preoccupanti da chi si occupa di finanza, almeno per quanto riguarda l’IA. (Io non ne capisco nulla, riferisco solo). Per prima cosa, pare che l’offerta pubblica per le azioni di OpenAI slitterà al 2027: secondo Gary Marcus è possibile che Altman si sia accorto che la sua speranza di valutare l’azienda mille miliardi di dollari è stata presa come uno scherzo, o più banalmente che stia aspettando di capire cosa succederà con SpaceX, che dopo il boom dell’IPO sta pian piano calando di valore. Anthropic al momento non è pervenuta. Sempre Marcus nota come i modelli cinesi stiano riducendo la distanza, e l’uscita di GLM 5.2 da parte di z.ai sia stata un duro colpo, soprattutto perché usare questi modelli costa di meno. (Ho provato la versione gratuita di GLM: l’output in italiano è molto da migliorare, leggi fa schifo, ma se gli si dice che si scrive in italiano ma si vuole la risposta in inglese i risultati sono indubbiamente buoni)

Ma mi sa che il problema vero sia un altro. Come scrive Alberto Romero, il fatto stesso che ChatGPT 5.6 sia al momento concesso solo a selezionate aziende – selezionate dal governo USA, ovvio – è un cambio di rotta a 180 gradi. Qualcuno è convinto, o è stato convinto, che i modelli di frontiera dei due grandi player americani sono così buoni da essere considerati un patrimonio nazionale da custodire gelosamente. Ma siamo poi così sicuri che sia davvero così? O forse è una mossa estrema per far durare ancora un po’ di più la bolla? Credo che entro l’inizio del 2027 avremo in un modo o nell’altro la risposta: per il momento non possiamo fare altro che aspettare.

milano

Tropicale?

temperatura odiernaLa definizione di “notte tropicale” è quella in cui la temperatura minima non scende sotto i 20 gradi Celsius. Oggi la stazione meteo vicino a casa mia ha segnato una massima di 37,9 (alle 17:15, il che se ci pensate è già qualcosa di inaspettato); sempre meglio dei 41,7 gradi misurati nel Brandeburgo, al confine con la Polonia, d’accordo. Ma il problema è che la temperatura minima, registrata alle 6:13, è stata di 29,2 gradi. Sì, il punto di rugiada è stato intorno ai 20 gradi per tutta la giornata, e quindi c’era qualche possibilità di far evaporare il sudore, ma comunque non sono temperature consone alla mia personale vita.

rec 2026, recensioni

Sovrumano (libro)

copertina Mettiamola così: se volete sapere qualcosa di come fanno le IA a essere più brave di noi, avete sbagliato libro. Qui Cristianini parla della grande gara tra valutatori – chi crea i test per stabilire quanto le IA siano brave – e addestratori – chi appunto addestra le IA per superare i test. Da questo punto di vista il libro diventa utile, perché ci fa scoprire quanti test diversi sono stati sviluppati negli anni e come le IA sono sempre riuscite a ottenere risultati prima paragonabili e poi migliori degli esseri umani in un tempo brevissimo. Lo stile di scrittura è leggero e piacevole, ma come dicevo quello della gara è l’unico motivo per cui potrei consigliarne la lettura.

Nello Cristianini, Sovrumano : Oltre i limiti della nostra intelligenza, Il Mulino 2025, pag. 152, € 15, ISBN 9788815392107 – come Affiliato Amazon, se acquistate il libro dal link Bezos mi dà qualche centesimo dei suoi utili
Voto: 3/5

ia 2026, IA e informatica

Quante ne sa Claude!

Martedì sera tardi, mentre ero già a letto, ho chiesto a Claude se sapeva come mai il mio smartwatch da poco funzionava bene per l’ECG – quando mi sono capitati casi di fibrillazione atriale li riconoscevo anch’io dal grafico – ma faceva schio per la pressione. Tra l’altro avevo anche scritto “smartphone” e non “smartwatch”. La risposta è stata chiarissima:

L’ECG legge un segnale elettrico diretto (la differenza di potenziale tra due elettrodi): è una misura oggettiva, poco interpretativa, per questo anche un sensore economico riesce a beccare la fibrillazione.

La pressione, invece, quasi nessun telefono/smartwatch la misura davvero. Quello che fanno è stimarla da un sensore ottico (PPG, lo stesso della frequenza cardiaca), guardando la forma e i tempi dell’onda di pulsazione, e da lì inferiscono sistolica/diastolica con un modello statistico. Per funzionare, questo modello va calibrato: di solito ti chiede una misura vera con bracciale all’inizio, e da quella estrapola tutto il resto.

Il problema è che:

    • l’algoritmo è ancorato a quella calibrazione, e tende a “tirare” le stime verso quel valore iniziale anche quando la pressione reale cambia, perché il segnale ottico ha poca sensibilità reale alle variazioni assolute di pressione (è più bravo a cogliere trend che valori assoluti)
  • piccoli fattori come posizione del dito, pressione di contatto, microvasocostrizione vengono spesso smussati dal firmware per evitare letture “ballerine” che farebbero sembrare il dispositivo poco affidabile — col risultato paradossale che sembra più stabile di quanto sia davvero la tua pressione.

Mercoledì mattina ho provato a fare una ricerca Google «perché uno smartwatch sbaglia i valori della pressione»: la maggior parte dei risultati non c’entrava molto, solo questo articolo parlava di PPG, ma probabilmente non l’avrei considerato perché parlava di Apple Watch e ipertensione che non sono il mio caso. Sempre martedì sera ho provato a chiedere perché sul mio tablet Doogee T20 usando Gboard avevo degli errori sul touch. Lì la risposta è stata più generica, ma comunque il primo suggerimento che ha dato – fare attenzione che Gboard ha un controllo separato del tocco rispetto a quello Android – mi è bastato per risolvere il problema. In questo caso la ricerca Google di controllo non mi ha dato nessun risultato.

Che morale trovo in tutto questo?  Che il modo di fare una ricerca è completamente cambiato. Io sono sempre stato della scuola “non sbrodolo: metto il minimo numero di parole chiave senza pensare a fare un discorso sensato”, ma con un chatbot devo fare un lavoro diverso e dargli tutto il contesto possibile. Poi dovrò comunque controllare le risposte, però è probabile che sia riuscito a trovare e assemblare informazioni che mi erano sfuggite, nonostante la mia abilità nel campo. Insomma, il mondo sta cambiando, e oggi dobbiamo imparare a spiegare al chatbot tutto, per permettergli di trovare le connessioni che potrebbero essere utili per avere una risposta.

relax

Troppo tardi


Ho scoperto troppo tardi l’esistenza di Emma, “l’AI nata in Italia”. Purtroppo “L’utilizzo emerso non è stato pienamente in linea con gli obiettivi previsti per questo tipo di test”, e quindi non è più possibile farle domande e soprattutto avere risposte come quelle mostrate in questo thread… Un altro grandissimo risultato di Egomnia.

Torna in alto