IDN in Italia: alcuni commenti

Questo documento vuole esporre i miei commenti personali sulla possibilità di introdurre nomi a dominio internazionalizzati (IDN) immediatamente al di sotto del Country Code Top Level Domain .it. Non ho nessuna pretesa di scrivere qui le Risposte; ho piuttosto cercato di esporre diverse tesi, con quelli che io ho visto come pro e contro, per dare un ausilio a chi dovrà prendere le decisioni. Il testo è di pubblico dominio.

Questa è la seconda versione: le modifiche rispetto alla precedente sono indicate in blu. Ho raccolto spunti da Tullio Andreatta, Marco d'Itri, Giorgio Giunchi, Enzo Viscuso.

1. Premessa: cosa sono gli IDN

I nomi identificativi dei calcolatori in rete sono sempre stati composti con un insieme di caratteri molto ristretto: le lettere (senza distinzione tra maiuscole e minuscole), le cifre e il trattino. Anche se i documenti ufficiali (RFC 1034 e 1035, con i loro aggiornamenti) non ponevano limiti ai caratteri utilizzabili, la pratica ha portato ad avere implementazioni che assumevano implicitamente queste limitazioni.
Lo spostamento verso un mondo più internazionale ha anche portato alla richiesta, soprattutto da parte dei paesi asiatici, di avere i nomi a dominio che potessero rappresentare parole nella propria lingua. Dopo tre anni di discussioni, si sono definiti alcuni nuovi RFC (3454, 3490, 3491, 3492) che danno questa possibilità.

La scelta che è stata fatta, non senza aspre discussioni all'interno del gruppo di lavoro IDN, è stata quella della codifica dei caratteri. I nomi IDN, pertanto, appaiono come delle stringhe di lettere, cifre e trattino, aventi però una sottostringa distintiva (xn--). In questo modo, si è certi che le applicazioni che non conoscono IDN continuano a funzionare, anche se all'utente apparirà un nome illeggibile; si immagina che man mano esse verranno aggiornati.
Dal punto di vista tecnico, si è definito un algoritmo (Nameprep) per decidere quali caratteri Unicode sono accettabili - ad esempio i vari tipi di spazio o di punto sono stati vietati - e quali sono equivalenti - ad esempio, alcune legature con la coppia di caratteri corrispondente. E' stato poi definito un altro algoritmo (Punycode) per convertire da e verso IDN. Tecnicamente non vi sono pertanto problemi.

2. Scelte possibili per gli IDN in Italia

Se vogliamo introdurre anche in Italia i nomi IDN, abbiamo a disposizione una serie di scelte, più o meno pragmatiche, su cui si può discutere.

3. Equivalenze di caratteri

Abbiamo appena visto come sia possibile definire alcuni caratteri come "equivalenti". Questo impatta ovviamente sulle possibilità di registrazione (vedi sotto): tendenzialmente si può dire che i nomi a dominio contenenti caratteri equivalenti non possono venire registrati, che devono venire registrati a forza dal titolare del nome canonico, o che possono venire registrati da quest'ultimo (il caso "possono venire registrati da chiunque" non si dà, perché allora non avrebbe nemmeno senso creare l'equivalenza!)
Ecco i problemi che sorgono:

4. Impatti prevedibili con l'introduzione degli IDN

Ho già fatto vedere che le varie scelte hanno un impatto sulle nuove registrazioni. Ma occorre anche tenere a mente i problemi legati all'introduzione dei nuovi nomi, e il loro impatto con quelli già registrati. Di nuovo, ecco le varie scelte che si possono fare.


Vorrei ancora stressare un punto molto importante: le regole di equivalenza devono essere verificabili automaticamente, sia nel caso del sunrise period che nel blocco di registrazioni. Altrimenti il costo per la RA sarebbe troppo alto. Questo non significa che le regole debbano essere inutilmente generali: ad esempio, si potrebbe dire "se il nome a dominio finisce con una vocale, si ritengono equivalenti le forme con questa vocale accentata". In questo caso, telema.it e telèma.it non sarebbero equivalenti, ma universita.it e università.it sì. Come ho detto all'inizio, questo documento vuole proprio limitarsi a essere un riferimento: non penso che si possa trovare in quattro e quattr'otto la soluzione perfetta.

Questo documento è stato redatto da Maurizio Codogno
Versione 1.00, 24 ottobre 2003