Archivi categoria: informatica e AI

traduzione “intelligente”

Ho dato in pasto a Google Translate un brano da rendere in inglese (sono pigro, e ci metto meno tempo a correggere tutti gli errori della traduzione automatica rispetto a scrivere da zero). Nel brano c’erano dei link, che di solito elimino e ricopio a mano dall’originale, ma stavolta – sempre per pigrizia – erano rimasti nel testo. Bene, un sito “unimi.it” è diventato “unimi . com”.

Ultimo aggiornamento: 2010-07-08 15:55

addavenì l’e-book!

Sto cercando di scrivere un ebook. Ci sarà dentro roba già postata in giro, nulla di particolare insomma; però mi piaceva l’idea di capire come funziona questa bellissima rivoluzione digitale. Però mi sto già arenando di brutto, e per fortuna che la data di “pubblicazione” dovrebbe essere fine anno.
Ci sono ovviamente problemi di formattazione varia: pur partendo da xhtml 1.1 (che so trattare) e da CSS (che non è che conosca così bene, soprattutto per quanto riguarda le versioni condizionali) ho scoperto che cose normali da vedere a video non funzionano affatto su un e-reader, e bisogna ripensarle da capo. Ma fin lì ci arrivo. Ma poi succede che la divisione in capitoli non funziona per nulla, perché si perdono tutti i link interni: e allora giù di modifiche. E poi succede che .epub, che sarebbe un sistema nato per la riformattazione libera, non ha un modo per inserire nel file le regole di sillabazione, il che è male (sono trent’anni che esistono file molto compatti per sillabare, come sa chiunque abbia usato TeX). Ma non è tutto: chi ha il Kindle non può leggere .epub, e deve avere il file in formato .mobi; non so nemmeno se sia possibile avere un CSS separato per epub e mobi, visto che mi sa che anche il rendering sia diverso. Sì, potrei offrire la versione PDF o anche direttamente l’xhtml; ma questo significa che se non sei uno smanettone il tutto non lo leggi bene. Non parliamo poi di chi dice “massì, CSS3 farà tutto perfettamente!”. Certo, magari sarà così. Ma quanti anni ci vorranno prima di avere la specifica definita e i lettori che la implementino?
La mia sensazione è che in questo momento (momento che sta durando da qualche anno) l’unica cosa che sta interessando i produttori di hardware e software è mettere un DRM in modo che nessuno possa piratare i libri, e quindi gli unici ebook che si riescono a leggere bene sono le ultime novità librarie che si pagano quanto se non più la versione cartacea. Ma un povero untorello come me, che non ha nessun motivo di lucchettare il proprio testo e vorrebbe semplicemente che fosse facilmente fruibile, si trova immediatamente fregato. Altro che condivisione della cultura!

Ultimo aggiornamento: 2010-07-08 07:00

Posta Elettronica Certificata

Come forse avrete letto, qualche settimana fa il miniministro Brunetta ha lanciato in pompa magna il progetto di posta elettronica certificata nei confronti della Pubblica Amministrazione. Non sono totalmente sicuro che la cosa sia un gran vantaggio, visto che c’è la presunzione di ricezione anche se non si apre il messaggio e non si può fare in modo che noi scriviamo per PEC e l’amministrazione statale ci risponda per mezzo di una sana vecchia raccomandata; e inoltre, come forse non sapete, non è nemmeno garantita l’interoperabilità tra la PEC di diversi enti. Ma su queste cose io ci vado comunque a nozze, e così mi sono armato di santa pazienza e sono andato sul sito postacertificata.gov.it.
La procedura è abbastanza bizantina: si fa una preattivazione online, poi dopo almeno 24 ore e non più di un mese si deve andare in un ufficio postale abilitato con fotocopia e originale di un documento d’identità e del codice fiscale. Peccato che al mio primo tentativo il sistema si sia piantato per il troppo traffico, al secondo non mi era apparsa la schermata di ok e al terzo mi diceva che avevo già fatto la domanda. Passo comunque in posta (sportelli dei conti correnti, non delle operazioni con le lettere) e l’impiegato mi fa “guardi, abbiamo la procedura bloccata a terminale”. Insomma, non solo erano state sottostimate le risorse lato utente, ma nemmeno quelle di backoffice erano sufficienti!
Dopo qualche giorno riprovo la preiscrizione: sembra andato tutto a buon fine, ma non c’è traccia della mail di conferma che dovrei ricevere. In effetti avevo usato un indirizzo un po’ strano, tipo pippo+PEC@gmail.com; è perfettamente lecito secondo gli RFC 821 e 2821 e coincide con pippo@gmail.com, ma molti programmi non lo sanno e si lamentano per l’indirizzo “inesistente”. Quando finalmente la stagione delle piogge è terminata, e passato ancora un paio di giorni per sicurezza, ripasso comunque dall’ufficio postale; consegno, firmo, torno a casa e mi trovo sull’email di casa la notifica che è tutto a posto.
Adesso resta solo da scoprire come usarla, come scrivevo sopra :-)

Ultimo aggiornamento: 2010-05-26 14:18

dominii, siti, indirizzi IP: la solita confusione.

Per l’ennesima volta un articolo su uno dei maggiori quotidiani italiani, questa volta il Corsera, mostra come i nostri giornalisti non siano ancora riusciti a capire l’abc di come funzionino nomi e indirizzi in Internet.
Eva Perasso parte da una notizia direi corretta, che tra pochi mesi non ci saranno più indirizzi IPv4 a disposizione, e riesce a tirare fuori come conseguenza che “per trovare un dominio libero tra quelli di vecchia generazione si spenderà sempre di più”, seguendo un percorso tutto nella sua testa.
Provo a spiegare per l’ennesima volta la differenza tra nomi e indirizzi. Queste notiziole sono ospitate all’indirizzo 80.94.113.103, e al nome xmau.com, il che significa che a xmau.com è associato l’indirizzo 80.94.113.103. Ma non è scritto da nessuna parte che l’associazione sia biunivoca, cioè che a un nome corrisponda uno e un solo indirizzo e viceversa! Un sito molto grande potrebbe avere più indirizzi, un po’ come il palazzo sede di una banca potrebbe avere più numeri civici, e soprattutto a un indirizzo IP possono corrispondere molti dominii, proprio come molte famiglie di un condominio abitano allo stesso numero civico della stessa via della stessa città. Il concetto non mi sembra così complicato, ma a quanto pare non entra proprio in testa al giornalista tipo. Certo, la mancanza di indirizzi IPv4 si farà sentire, ma non certo per quelle ragioni, o per “i pacchetti di siti acquistati per compiere frodi”…
Aggiornamento: (5 maggio, 11:30) Dopo tutto lo sputtanamento ricevuto, ma soprattutto dopo che Mantellini ha raccontato che non era nemmeno stato rettificato, quelli del Corsera hanno cancellato la pagina :-)
Aggiornamento: (5 maggio, 13:30) L’articolo è tornato in linea, con l’occhiello «Il seguente articolo era stato pubblicato in una prima versione contenente alcune gravi imprecisioni. Pubblichiamo a seguire una revisione del testo e chiediamo scusa ai lettori. La redazione.» e le frasi incriminate cancellate. Resta comunque poco chiaro chi si accaparri gli indirizzi IPv4, e insomma non segnalerei certo l’articolo per chi volesse sapere cosa sta succedendo: però è giusto apprezzare la redazione del Corriere che ha scritto nero su bianco “ci siamo sbagliati”.

Ultimo aggiornamento: 2010-05-04 15:06

io l’avevo detto

Il mese scorso avevo ipotizzato che Google si fosse recuperato i dati della mia ADSL, visto che quando sono nella casa nuova e mi connetto via wifi il suo Google Maps mi dice che sono nella casa vecchia.
Ora leggo dal Register che in Germania si stanno parecchio arrabbiando perché le automobili di Street View hanno scansionato le reti WLAN private registrando i MAC address dei PC.
Va a finire che ci avevo azzeccato davvero!

Ultimo aggiornamento: 2010-04-26 07:00

Mozilla add-on blocklist

Beh, prima o poi doveva capitare: ieri mattina Firefox ha aperto una finestra di avviso, dicendo che avrebbe bloccato una versione del Java Deployment Toolkit che manco sapevo di avere installato, consigliandomi molto caldamente di far ripartire il browser senza quell’estensione e suggerendomi di dare un’occhiata a questa pagina.
In effetti l’idea delle estensioni è molto utile, perché permette di avere una versione di base del browser snella (occhei, non è il caso di Firefox) mentre ciascun utente può aggiungere quello che gli serve, un po’ come nelle pizze. Però in questo modo la probabilità di un malfunzionamento complessivo aumenta esponenzialmente, viste anche tutte le interazioni tra i vari add-on; e la colpa rimane sempre imputata al browser. Questo potrebbe essere l’inizio di un’inversione di tendenza.

Ultimo aggiornamento: 2010-04-21 08:00

Il grande Googlello

L’altro giorno rispondevo a una mail, e avevo lasciato una riga di citazione, il cui testo conteneva tra l’altro la frase “see attachment”. Io l’allegato l’avevo visto, in effetti; ma quando ho schiacciato il tasto “send” mi è apparsa una finestrella di pop-up di GMail che diceva più o meno (in inglese, io uso sempre la versione inglese dei programmi se appena ne ho possibilità) «sei sicuro di voler spedire questo messaggio senza allegati? Ho notato che hai scritto “vedi allegato”…»
Certo, la cosa è assolutamente automatica, non c’è l’omino Google che legge il mio messaggio. Ma proprio perché la cosa è assolutamente automatica, non oso pensare a cosa potrebbe trovare nei miei messaggi. Sarà meglio che inizi ad evitare di mandare baci (scritti) alle mie amiche e conoscenti, anche se per fortuna Anna usa un altro portale per la sua posta :-)

Ultimo aggiornamento: 2010-04-03 07:00

Aiuto! Firefox e charset

A quanto pare, questo problema ce l’hanno in tanti e nessuno riesce a risolverlo, o perlomeno io non sono riuscito a trovare una risposta. Però magari qualcuno dei miei lettori sa che cosa fare.
Ogni tanto mi capita un messaggio illeggibile su GMail, visto da Firefox (3.6, su macchine XP). Ad esempio, la newsletter di Meridiano Zero mi arriva con dei rettangolini che corrispondono agli apostrofi; Chrome in compenso visualizza il tutto bene. Ho provato a toccare View → Character Encoding, mettendo di tutto (Universal/Off, ISO-8859-1/UTF-8), ma niente da fare. Guardando i sorgenti della newsletter, vedo che è un MIME multipart: la parte testuale ha come header
  Content-transfer-encoding: quoted-printable
e quella HTML
  Content-type: text/html; charset=iso-8859-1
  Content-transfer-encoding: quoted-printable
mentre però la pagina inizia con
  <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">

  <html>
  <head>
  <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
il che mi può far immaginare che ci sia un problema di contrasto tra i due content type.
Ma ci sono cose peggiori: provate a guardare questi due messaggi che sono arrivati sul blog: good e bad. Io non riesco a vedere alcuna differenza, però il bad mostra le lettere accentate come se fossero scritte in ISO-8859-2, insomma con le lettere degli alfabeti slavi, mentre il good è perfetto.
Qualche idea, qualcuno?

Ultimo aggiornamento: 2010-03-30 13:22