Anche se ormai slashdot sembra sempre più simile a Dagospia, ogni tanto c’è qualche notizia interessante. Oggi, ad esempio, parlava di un nuovo sistema antispam, sviluppato dalla Abaca. La tecnologia usata è spiegata qua: in pratica, per decidere se un messaggio è spam oppure no si guarda a chi lo riceve. Non ridete: la cosa non è così stupida come sembra a prima vista.
Il razionale di Abaca è più o meno questo: se io ricevo tanto spam in percentuale e mi arriva un messaggio, questo probabilmente è spam; se ne ricevo poco, probabilmente non è spam. Intendiamoci: le affermazioni “matematiche” di quella pagina fanno ridere, dall’affermazione che «questo è un fatto garantito matematicamente, che non può essere messo in difficoltà da uno spammer» all’idea che un’efficacia del 99% sia «con da dieci a cento volte meno errori di ogni altro sistema disponibile» – in effetti, partendo da un messaggio spam su 100 non filtrato, un sistema con cento volte più errori è un sistema che non filtra nulla. E naturalmente un sistema di questo tipo non può per definizione funzionare con una singola casella email, ma deve essere gestito su una base dati piuttosto ampia, come quella di un ISP; però potrebbe essere un’utile aggiunta alle altre tecniche antispam, per semplificare la distinzione tra i siti che mandano molta posta in maniera lecita e gli altri.
Ultimo aggiornamento: 2007-12-04 13:51
In effetti la tecnica è interessante (le affermazioni matematiche sono state semplicemente scritte da un commerciale, cioè “una persona che per definizione va in difficoltà con le differenze”). Tra l’altro tecniche di controllo basate sulla distribuzione del traffico sono già state studiate con buoni risultati anche in altri campi.
In realtà la tecnica che presentano è mista, nel senso che cerca di stabilire una correlazione tra messaggi diversi in base al mittente, poi stabiliscono quanto è probabile che il mittente sia uno spammer in base ai destinatari. Il razionale è che indirizzi email poco spammate sono anche in pochi db di indirizzi validi degli spammer; l’unico modo per uno spammer per evitare il sistema sarebbe quello di “drogare” la distribuzione delle mail ma per fare ciò dovrebbe avere un db con e-mail particolarmente nuove o spedire in batch di poche mail così da rendere poco rilevante la distribuzione.
In realtà si potrebbe “drogare” la distribuzione in altro modo, ovvero evitando che un gruppo di mail venga raggruppato come inviato da un’unica macchina (o comunque correlato in qualche modo) e la cosa è abbastanza fattibile usando IP Spoofing o header falsificati.
Credo che l’efficacia della tecnica sia comunque buona solo in associazione ad altre tecniche; in caso contrario come farebbe a classificare gli indirizzi riceventi “buoni” da quelli “cattivi”? Usando solo quella tecnica si rischia una retroazione positiva che come sa chiunque capisca qualcosa di controlli, è un disastro.
Ciao
non per nulla ho scritto “utile aggiunta“… da solo non lo userei mai, come antispam.
Non so al momento quanto sia la ratio tra computer zombie e messaggi spam inviati, per poter dire se in effetti uno spammer intelligente riuscirebbe a nascondersi bene da questo sistema, però ripeto che l’idea potrebbe essere interessante.