{"id":14,"date":"2012-07-23T19:39:34","date_gmt":"2012-07-23T18:39:34","guid":{"rendered":"http:\/\/xmau.com\/wp\/voices\/2012\/07\/23\/calcolatori_e_alfabeti\/"},"modified":"2014-10-23T11:04:48","modified_gmt":"2014-10-23T10:04:48","slug":"calcolatori_e_alfabeti","status":"publish","type":"post","link":"https:\/\/xmau.com\/voices\/2012\/07\/calcolatori_e_alfabeti\/","title":{"rendered":"Calcolatori e alfabeti"},"content":{"rendered":"<p>Vi \u00e8 mai capitato di andare all&#8217;estero, finire in un Internet Point, e scoprire con orrore che la tastiera su cui scrivete non \u00e8 quella giusta? L&#8217;esperienza di non trovare le lettere al punto giusto \u00e8 scioccante, e io che ho una certa qual et\u00e0 ricordo con terrore il periodo alla fine degli anni &#8217;70 in cui le RELAWIONI datate l)\/% si sprecavano, visto che mi toccava passare dalla macchina da scrivere con una tastiera QZERTY e i numeri che venivano digitati come maiuscole ai miei primi(tivi) computer che avevano la tastiera QWERTY e mancavano di lettere accentate. Ma la storia di come interagiamo con i caratteri del PC \u00e8 molto pi\u00f9 complcata: iniziamo a vedere la parte relativa ai <b>charset<\/b>, cio\u00e8 agli insiemi di caratteri che dovrebbero rappresentare quanto si pu\u00f2 scrivere in una lingua.<br \/>\n<!--more-->Potrei partire da Adamo ed Eva, o per meglio dire dai geroglifici egiziani che a un certo punto persero il valore di idea per assumere anche quello di lettera; ma in effetti di tastiere ai tempi non ce n&#8217;erano. Per\u00f2, seguendo le arcaiche <a href=\"http:\/\/www.robotwisdom.com\/net\/etextfaq.html\">FAQ del newsgroup alt.etext<\/a>, credo che si possa datare il primo momento in cui abbiamo una conversione dall&#8217;alfabeto usato di solito a un altro alfabeto con la nascita dell&#8217;<a href=\"it.wikipedia.org\/wiki\/Codice_Morse\">alfabeto Morse<\/a>. Con esso si hanno a disposizione 44 caratteri, in fila per sei col resto di due: le ventisei lettere dell&#8217;alfabeto inglese, gli otto segni di interpunzione <tt>.,:;-\/?\"<\/tt> e le dieci cifre: uno si deve accontentare, e non esclamare tra l&#8217;altro nulla. Il lettore attento si sar\u00e0 accorto di un&#8217;altra peculiarit\u00e0 dell&#8217;alfabeto Morse, che cio\u00e8 i caratteri hanno una lunghezza diversa: ma questo fa parte della <b>codifica<\/b>, che con il charset ha ben poco a che fare, e di cui parler\u00f2 la prossima volta.<br \/>\nIl passo successivo, il <a href=\"http:\/\/it.wikipedia.org\/wiki\/Codice_Baudot\">codice Baudot<\/a> usato nelle telescriventi, \u00e8 il primo codice con un numero ben definito di bit per rappresentare i caratteri: ben cinque. Due alla quinta fa 32, per\u00f2, e non c&#8217;\u00e8 nemmeno spazio per lettere e numeri! Niente paura: nella versione rivista del Baudot, si usano ventisei lettere e sei codici. I codici sono lo spazio, il NULL che non punzona nulla, il &#8220;carriage return&#8221; che riporta la testina tutto a sinistra e il &#8220;line feed&#8221; che fa avanzare la carta (e la contrapposizione CR\/LF nasce proprio ora, prima di fare impazzire chi doveva convertire tra Windows, Unix e Mac), ma soprattutto FIGS e LTRS, dei codici di &#8220;cambio alfabeto&#8221;. Col primo si passava a un nuovo insieme di caratteri contenente i numeri e i segni di interpunzione; col secondo si tornava alle lettere. Erano cos\u00ec stati inventati gli antenati del tasto ESC.<br \/>\nMa anche col trucco di cambiare alfabeto cinque bit erano davvero pochi, e cos\u00ec dal 1932 nacque il <a href=\"http:\/\/en.wikipedia.org\/wiki\/Teletypesetter\">TTS code<\/a> che di bit ne aveva ben sei. Il cambio di alfabeto era sempre presente, ma stavolta serviva a passare dalle lettere maiuscole alle minuscole, che finalmente, giusto quattrocento anni dopo la loro nascita, fanno la loro comparsa anche in questo mondo. Un racconto sicuramente apocrifo, che avevo letto decenni orsono e non sono riuscito a ritrovare se non <a href=\"http:\/\/newsgroups.derkeiler.com\/Archive\/Rec\/rec.games.pinball\/2006-03\/msg16401.html\">in questo resoconto<\/a>, diceva che in precedenza, quando si era dovuto scegliere se usare solo le lettere maiuscole o solo le minuscole, si era notato come queste ultime aumentavano la leggibilit\u00e0 di un testo; per\u00f2 il presidente del comitato decise per le MAIUSCOLE &#8220;perch\u00e9 altrimenti non si sarebbe potuto scrivere correttamente il nome di Dio&#8221;.<br \/>\nDa questo punto in avanti parte la corsa alla crescita degli alfabeti utilizzabili dai computer, o meglio agli standard: come sapete, il bello degli standard \u00e8 che ce ne sono sempre tanti tra cui scegliere. Il primo standard relativo ai computer usava sei bit per i caratteri, ha la mia et\u00e0 (\u00e8 del 1963) ed \u00e8 stato creato dall ASA (American Standard Association, la mamma dell&#8217;ANSI); continuava a non avere le minuscole. L&#8217;ASCII (American Standard Code for Interchange of Information) inizia a essere definito due anni dopo&#8230; con dei buchi corrispondenti alle lettere minuscole, che saranno standardizzate solo alcuni anni dopo; intanto IBM andava avanti per conto suo con l&#8217;EBCDIC, e in Europa l&#8217;ISO riusc\u00ec nel 1967 a codificare le varie versioni nazionali dello standard ISO 646. Ci sono infatti alcune cose che in genere non si sanno: innanzitutto che ASCII si pronuncia &#8220;aschi&#8221; e non &#8220;asci&#8221;; inoltre c&#8217;erano dieci posizioni &#8220;libere&#8221; che venivano usate per le lettere accentate nelle lingue diverse dall&#8217;inglese. Peccato che quelle posizioni corrispondevano alle graffe, al backquote, e insomma ai caratteri che servivano ai programmatori! Insomma, non le usava nessuno, e non per nulla la mia generazione si abitu\u00f2 a scrivere gli apostrofi, o meglio ancora i backquote &#8220;`&#8221;, al posto degli accenti.<br \/>\nAumentando la potenza dei calcolatori e gli utenti non anglofoni, il numero di caratteri richiesto per un alfabeto continu\u00f2 a crescere. Si arriv\u00f2 cos\u00ec allo <a href=\"http:\/\/it.wikipedia.org\/wiki\/ISO_8859\">standard ISO 8859-1<\/a> (del 1999, ma gi\u00e0 presente nella versione ECMA fin dal 1986), che partendo dal principio che i byte hanno 8 bit li usa tutti per ottenere ben 256 caratteri, ed \u00e8 lo standard ufficiale per le pagine HTML (visto come sono internazionalizzate?). Lo standard va benissimo per le lingue europee standard, meno per le lingue slave scritte coi caratteri latini, ancora meno per neogreco e cirillico, tanto che c&#8217;\u00e8 una cifra di ISO 8859-x per usare le lettere latine e quelle di una singola altra lingua europea. Peggio ancora, nel 1999 si sfrutt\u00f2 l&#8217;introduzione dell&#8217;euro per fare una versione riveduta e corretta di ISO 8859-1, chiamata ISO 8859-15 e che genera semplicemente confusione.<br \/>\nNel frattempo, cinesi e giapponesi &#8211; ma anche gli arabofoni &#8211; si lamentarono di essere ingiustamente trascurati: nacque cos\u00ec <a href=\"http:\/\/it.wikipedia.org\/wiki\/Unicode\">Unicode<\/a>, che usa due byte, cio\u00e8 sedici bit, cio\u00e8 65536 possibilit\u00e0, per definire tutti i caratteri. Inizialmente avrebbe anche dovuto avere spazio per il Klingon, che poi <a href=\"http:\/\/en.wikipedia.org\/wiki\/Klingon_alphabets\">non \u00e8 stato accettato<\/a> con la miserrima scusa che non \u00e8 una lingua parlata da nessuno. Unicode, o per meglio dire il fratello ISO 10646, \u00e8 quasi coetaneo a ISO 8859: la prima versione \u00e8 infatti del 1991. Ora siamo alla versione 6.1.0 di Unicode, rilasciata a gennaio 2012. Naturalmente ci si \u00e8 accorti che 65536 caratteri non erano sufficienti per tutti, anche perch\u00e9 i caratteri CJK &#8211; cinesi, giapponesi e coreani &#8211; riempivano la maggior parte dello spazio. Cos\u00ec si \u00e8 iniziato a creare nuovi &#8220;piani&#8221; (gruppi di 65536 caratteri). E per passare da un piano all&#8217;altro come si fa? Semplice, si usano alcuni caratteri speciali che indicano di cambiare piano! Le soluzioni informatiche sono l&#8217;esempio pi\u00f9 tipico di applicazione dei concetti di Giovanni Battista Vico: i corsi e ricorsi storici&#8230;<br \/>\nSe siete sopravvissuti fino a qua, sappiate che la prossima volta complicher\u00f2 ancora pi\u00f9 le cose&#8230;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>I charset, vale a dire gli insiemi di caratteri usati dai calcolatori, hanno una storia lunga e non esattamente lineare. Ecco qualche curiosit\u00e0.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_feature_clip_id":0,"_jetpack_memberships_contains_paid_content":false,"activitypub_content_warning":"","activitypub_content_visibility":"","activitypub_max_image_attachments":4,"activitypub_interaction_policy_quote":"anyone","activitypub_status":"","footnotes":"","jetpack_post_was_ever_published":false},"categories":[16],"tags":[],"class_list":["post-14","post","type-post","status-publish","format-standard","hentry","category-standard"],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"jetpack_shortlink":"https:\/\/wp.me\/phh2za-e","jetpack-related-posts":[],"_links":{"self":[{"href":"https:\/\/xmau.com\/voices\/wp-json\/wp\/v2\/posts\/14","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/xmau.com\/voices\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/xmau.com\/voices\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/xmau.com\/voices\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/xmau.com\/voices\/wp-json\/wp\/v2\/comments?post=14"}],"version-history":[{"count":1,"href":"https:\/\/xmau.com\/voices\/wp-json\/wp\/v2\/posts\/14\/revisions"}],"predecessor-version":[{"id":93,"href":"https:\/\/xmau.com\/voices\/wp-json\/wp\/v2\/posts\/14\/revisions\/93"}],"wp:attachment":[{"href":"https:\/\/xmau.com\/voices\/wp-json\/wp\/v2\/media?parent=14"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/xmau.com\/voices\/wp-json\/wp\/v2\/categories?post=14"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/xmau.com\/voices\/wp-json\/wp\/v2\/tags?post=14"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}