Ieri sull’Official Google Blog è apparso un intervento (“Helping computers understand language“) in cui viene spiegato l’approccio di Google al problema delle migliorie ai risultati delle ricerche, cercando di applicare tecniche di intelligenza artificiale per inserire nei risultati anche occorrenze diverse da quelle richieste – ad esempio, se uno chiede song words arrivano anche le pagine dove appaiono le parole song lyrics. Douglas Hofstadter, il cui punto di vista sull’intelligenza artificiale è sicuramente non mainstream, ha subito scritto un’email in cui senza usare mezzi termini se la prende con questo sistema che gli rende impossibile usare Google in maniera “creativamente stupida” (cercando ad esempio di capire quale tra due frasi in una lingua straniera è la più usata in pratica) e mandando in copia la mail alla cricca dei suoi amici e conoscenti che sa essere interessati a questi argomenti.
Dal mio punto di vista quello che conta esplicitamente è la semantica dietro tutto questo. Per la cronaca, Google aggiunge i sinonimi (corretti o no che siano è un’altra storia) nelle ricerche normali: se però si fa una ricerca col testo tra virgolette oppure – ho scoperto solo leggendo quel post – precedendo una o più parole con un +, la ricerca resta su quella precisa frase o parola. Io mi preoccuperei davvero se il significato semantico delle virgolette, cioè una citazione precisa – lasciamo perdere l’italica stampa e i famigerati virgolettati di Repubblica – non divenisse più quello standard; sulle singole parole sono indeciso se sia meglio fare come fa Google, cioè “default con sinonimi, occorre specificare che non li si vuole” oppure l’opposto “default senza sinonimi, occorre dire da qualche parte che li si vuole”, chessò con un LIKE maiuscolo all’inizio della stringa di ricerca. C’è poi il secondo punto, quanto cioè un algoritmo puramente statistico possa dare un supporto fattivo alla ricerca del vero significato di quello che l’utonto tipico chiede. Viste certe stringhe di ricerca che capitano sul mio blog, in effetti la cosa potrebbe anche funzionare se fatta bene :-)
Voi che ne pensate?
Ultimo aggiornamento: 2010-01-20 12:56