Oggi sta girando per la rete questa notizia: La traduzione di Google Translate di “Non ho votato Berlusconi” è “I have voted for Berlusconi”. E questo succede solo per Berlusconi.
L’ho appena provato, e in effetti è così; non solo per la traduzione in inglese ma anche in francese, tedesco e spagnolo (in latino fa un casino inenarrabile, e non ho testato altre lingue). Altri tempi verbali e altri politici danno la traduzione corretta, e anche “Tu non hai votato Berlusconi” è corretto, come è reso correttamente “Non ho votato per Berlusconi” (forma grammaticale che io preferirei, del resto).
Sarebbe interessante scoprire quali siano i misteriosi sistemi automatici che rendono Berlusconi così piacevole a Google Translate.. e già che ci siamo perché se mi fermo a “Non ho votato Berlusc” la traduzione è “I did not vote Berlusca”. Questo uso di uno dei nomignoli del nostro PresConsMin mi fa pensare a qualche falla nei documenti usati per generare il corpus delle corrispondenze tra le lingue (o meglio nella generazione dell’albero sintattico-semantico, ho come la sensazione che Google “traduca” internamente in un suo pseudolinguaggio formale); purtroppo temo che questi algoritmi siano ancora più segreti di quello che genera gli AdSense :-)
Ultimo aggiornamento: 2010-11-08 15:41
mi sa che hanno già risolto… a me adesso traduce correttamente quella frase :)
sicuro? ho riprovato, ecco qua: http://i55.tinypic.com/2mepijd.png
ah, mannaggia, avevo letto male e avevo provato con “Io non ho votato…” e in quel modo traduce bene! :)
Quello di Google non è un traduttore classico, ma si basa su un algoritmo che raffronta testi simili (il db di google, prendendo tutta la rete, è in questo senso immenso) in lingue diverse, senza una vera e propria grammatica o un vocabolario. Affascinante ed economico per big G, ma da usare con cautela perché prende cantonate del genere. Probabilmente all’estero, dove si parlerà del fatto che gli italiani votano Berlusconi, è difficile trovare testi sul non voto. Ma succedono errori anche peggiori della sparizione di un “non”, soprattutto traducendo i nomi di persona da lingue minori. Tipo che la Aguilera da non ricordo più quale lingua orientale diventa Lady Gaga, che probabilmente ha più risultati google con lo stesso tema (musica pop americana) a suo favore :p
Ho fatto anch’io tutte le prove (anche perchè l’ho letto su repubblic e mi asspettavo l’ennesima cantonata)
Se qualcuno ne viene a capo mi faccia sapere…
Effettivamente cliccando sul link del tuo post ora anche io vedo la traduzione corretta: algoritmi adattivi o rapido intervento degli uomini di Google?
La faccenda si complica: ho provato da due pc diversi (stessa rete) e uno traduceva correttamente, l’altro no. Entrambi browser Firefox.
Io ho una teoria, anche se non credo che sia questa la soluzione. Google si basa, per le sue traduzioni, anche su dati statistici d’uso. Ora, ammettendo che sia in grado di associare queste statistiche a una certa conoscenza del mondo (in senso semantico), google non fa altro che associare l’occorrenza linguistica più frequente su Internet (per ragioni sociologiche, “io non ho votato Berlusconi”) con il dato “ci sono più persone che hanno votato Berlusconi che persone che non lo hanno votato”.
Insomma l’enunciato “io non ho votato Berlusconi” significa per Google “io ho votato berlusconi”, un po’ come se si ripetesse a un bambino la parola “cane” in presenza di un gatto, e il bambino logicamente iniziasse a chiamare “cane” il gatto.
Come spiegava @Davide, il motore di Google è di tipo statistico: viene "addestrato" con testi paralleli (testo originale e relativa traduzione umana) e "impara" a riconoscere le corrispondenze tra parole e segmenti di frase in ogni coppia di lingue, assegnando una probabilità più alta alle associazioni più ricorrenti, in modo da poterle poi riprodurre in fase di traduzione applicando vari algoritmi e parametri statistici. Ovviamente questi sistemi non sono perfetti e quello delle frasi negative che diventano affermative è un errore abbastanza comune.
Lascia però un po perplessi che lo stesso errore apparisse (appaia ancora?) in lingue diverse e solo con quella specifica frase e quello specifico nome, come se corrispondesse esattamente a un segmento considerato altamente affidabile dal sistema ma che in origine era stato tradotto erroneamente in varie lingue (da traduttori umani!). O forse è lo scherzetto di qualche simpatico burlone che, quando era ancora possibile suggerire traduzioni alternative per migliorare quelle suggerite dal motore, aveva deciso di divertirsi un po?!?
PS Una spiegazione del perché i motori di traduzione a volte sostituiscano i nomi propri con altri in The (probable) truth about Austria and Ireland.
succede anche con “non ho votato comunisti” :)
Secondo me siete ottimisti, a parer mio c’e’ stato qualcuno in google che semplicemente si e’ divertito molto, ieri ;)
e’ ancora possibile suggerire traduzioni alternative. Probabilmente un bel po’ di gente s’e’ messa d’accordo per effettuare questa modifica e fare un po’ i burloni.