Archivi annuali: 2013

La grande bellezza

Per dare un po’ di gioia a Guia Soncini (che è già uscita con uno dei suoi amabilissimi commenti prima ancora che io mi mettessi a scrivere qualcosa… mica posso deluderla) mi sono deciso a leggere e commentare questo post di Massimo Mantellini che racconta della sua ricerca negli inferi delle pagine di risultati di una ricerca di Google. A Mantellini pareva di ricordare che quando il film era uscito le recensioni fossero state molto schierate (o estremamente positive o estremamente negative), ma i primi risultati non erano quelli che voleva lui e quindi è dovuto andare sino alla ventesima pagina. Bene. Ho provato anch’io a fare la stessa ricerca (“la grande bellezza”, senza le virgolette) e ho avuto risultati simili, tranne che il suo post adesso è nella top ten. Peccato che questo non significhi nulla, se non che in effetti gli algoritmi di Google ogni tanto hanno delle pecche (e sarebbe divertente scoprire dove *questo* mio post si situerà: qualcuno vuole fare la prova?) Ecco perché la cosa non significa nulla, almeno a mio parere.
(1) Google non sa cosa voglio cercare (beh, non è proprio vero, ma di quello ne parlo dopo). Tanto per dire, fino a stamattina la frase “La grande bellezza” a me non diceva proprio nulla: è tanto se sapevo che l’ultimo film di Sorrentino, qualunque fosse il suo nome, era entrato nella short list dei nove film stranieri tra cui verrà scelta la cinquina. (Occhei, a me il cinema interessa zero, ma quello è un mio problema). Di per sé, il fatto che Google abbia “capito” che si parlasse del film è un grande risultato.
(2) Scordatevi tutte le palle che avete sentito sui motori di ricerca semantici. Non funzionano, scommetto che non funzioneranno nei prossimi cinque anni, e scommetto che tra cinque anni potrò rifare la stessa identica scommessa. Gli algoritmi di Google funzionano secondo tecniche di tutt’altro tipo (fondamentalmente statistiche su quantità enormi di dati): è sempre stato così e le cose non cambieranno presto. Non è un caso che tra i primi link ritornati da una ricerca ci sia quasi sempre la voce di Wikipedia al riguardo e che in alto a destra di questa ricerca particolare ci siano i siti di recensioni cinematografiche: l’unico modo che Google ha per inserire della “semantica” nei suoi risultati è decidere a priori che certi siti sono semanticamente importanti in assoluto (Wikipedia) o in relativo (se statisticamente La grande bellezza è un film, allora si evidenziano i siti che recensiscono film)
(3) Non è nemmeno strano che ci siano le ultime notizie dei media e non quelle uscite a suo tempo. Perché io che faccio una ricerca oggi dovrei essere più interessato al passato che al presente? E se la gente clicca sui siti dei media, perché Google non dovrebbe indicizzarli più che altri siti snobbati? (a parte naturalmente perché gli editori non lo vogliono… mai capito perché non facciano un opt-out esplicito sullo spider di Google, è banalissimo) (no, lo capisco benissimo, tranquilli). In effetti nelle opzioni di ricerca avanzata manca una spunta “elimina le voci più recenti di tot”, ma non saprei in quanti la userebbero.
(4) In realtà Google sa fin troppe cose di noi che non siamo i suoi clienti ma i suoi fornitori (di dati): quindi, se Mantellini cercasse spesso recensioni, le recensioni dovrebbero salire in alto nei risultati della *sua* ricerca. Non so se ipotesi e tesi siano vere, però.
(5) Riprendendo il punto 2: come fa Google a immaginare che Mantellini (o chiunque altro) voglia comunque vedere le recensioni negative e non solo le positive, e voglia vedere le recensioni “della rete” (qualunque cosa voglia dire) e non quelle dei siti specializzati? Per il secondo punto, ricaschiamo sul modello statistico: al 99% delle persone che vogliono leggere una recensione di quel film importuntubo che Leonardo ne avesse parlato a suo tempo. Per il primo punto, per non saper né leggere né scrivere avrei fatto una ricerca “la grande bellezza recensioni negative” (che tra l’altro mi appare prima di finire la frase, il che significa che non sono l’unico ad avere avuto questa brillante idea). I risultati, da una mia veloce scorsa, non saranno il massimo: ma abbiamo tolto Wikipedia, abbiamo tolto giornali e affini, abbiamo mandato molto in giù i siti di cinema mainstream. Certo, poi possiamo discutere sulla qualità delle pagine che vengono ritornate: ma ancora una volta non esiste un modo di valutare automaticamente la qualità di una pagina, ma solo la sua popolarità.
Su una cosa però mi sento di dare ragione a Massimo. Nell’ultimo anno o due c’è un forte inquinamento di risultati, con una serie di siti fotocopia che incollano lo stesso testo (anche in ispregio al copyright, ma non è di quello che voglio parlare). Dieci anni fa questo non succedeva per l’ottima ragione che non capitavano così spesso queste scopiazzature. Il guaio è che l’algoritmo che trova “le pagine simili” non sta funzionando così bene come un tempo, e Ciò È Male… anche se poi basta saper fare bene la ricerca e tutto si rimette a posto.
In definitiva? L’internauta comune dovrà reimparare a fare ricerche. Se non ci riuscirà, peggio per lui.

Ultimo aggiornamento: 2013-12-31 14:22

necrofili wikipediani

Tra i tanti guai che affliggono Wikipedia c’è sicuramente la scarsità di volontari che aggiungono materiale all’enciclopedia. Beh, in realtà c’è tanta gente che vuole parlare di sé stessa o delle cose fatte da loro o delle cose per cui sono pagati per fare pubblicità, ma per il momento tralasciamo questo fatto.
Ma c’è un guaio che si aggiunge al guaio: quelli che non appena un personaggio famoso ha un incidente o una malattia che lo portano in fin di vita, corrono immediatamente ad aggiornare Wikipedia scrivendo della sua morte. L’ultimo caso in ordine di tempo è quello di Michael Schumacher, dove ieri sera un cretinutente non registrato ha modificato per tre volte in dieci minuti la voce relativa per indicare la sua morte (alla fine la voce è stata semiprotetta, quindi per qualche giorno la potranno modificare solo gli utenti registrati). Il penultimo caso è stato quello di Andrea Brambilla (“Zuzzurro”), dato per morto con ventiquattr’ore di anticipo.
Lo so, non so nulla di psicologia né tanto meno di psichiatria. Però riesco più o meno a intuire la logica – si fa per dire – di chi cerca un minimo di notorietà commentando “PRIMO!!!12!” non appena un vip scrive un post. Riesco anche a immaginare perché qualcuno metta apposta informazioni false su una voce di Wikipedia: la madre degli imbecilli è sempre incinta, e qualcuno può sperare di ridere al pensiero che qualcuno scriva che Napoleone è morto il 1822. Ma in questi casi non c’è nessuna identità associata (e quindi che razza di “primo” sei?) e chi va a vedere quelle voci sa bene che il personaggio in questione non è ancora morto. Quindi che logica ci sarebbe?
Post Scriptum (31/12): mi sono dimenticato di aggiungere tra le varie possibilità quella – capitata piuttosto spesso in passato – in cui un grande o piccolo quotidiano casualmente accede alla voce di Wikipedia proprio nei pochi minuti in cui essa indica erroneamente la morte. Io non sono un grande amante del caso, e quindi in quei frangenti capisco la logica.

Ultimo aggiornamento: 2013-12-30 16:54

Quizzino della domenica: Tetris e bestemmie

Il pezzo del Tetris a forma di “Z” (o di saetta, chiamatelo come volete) è quello che induce più bestemmie nei giocatori quando arriva, perché non si sa mai come metterlo. Ma i problemi con quel pezzo arrivano anche fuori dal Tetris! Prendete un quadrato di lato 5×5, e cercate di ricoprirlo con il minor numero possibile di pezzi a forma di Z. I pezzi devono corrispondere alla quadrettatura del quadrato, come mostrato sotto; possono però essere sovrapposti oppure uscire dai bordi del quadrato.
È chiaro che sei pezzi non bastano, perché ricoprono al più 24 caselle e il quadrato ne ha 25. Ma qual è il numero minimo di pezzi necessario?
[il quadrato 5x5 e un pezzo a Z]
(un aiutino lo trovate sul mio sito, alla pagina http://xmau.com/quizzini/p144.html; la risposta verrà postata lì il prossimo mercoledì. Problema tratto dai Giochi di Archimede 2013.

Ultimo aggiornamento: 2016-06-07 14:43

e i correttori di bozze?

[papa Francesco ha canonizzato Ignazio di Loyola...] Eugenio Scalfari, da quando ha lasciato la direzione de La Repubblica, si è riservato il diritto di scrivere l’editoriale della domenica: l’omelia, come viene affezionatamente chiamata. I contenuti sono generalmente piuttosto opinabili, ma viviamo in un paese sostanzialmente libero, e Scalfari ha tutto il diritto di esprimere le proprie idee.
Con l’età che avanza, Scalfari ha preso una deriva religiosa e si sente molto felice di poter colloquiare prima con il buonanima del cardinal Martini e poi nientemeno che con papa Francesco. Nulla di male, e possiamo anche accettare di trovarci un certo numero di omelie a questo riguardo: viviamo in un paese sostanzialmente libero, e nessuno ci obbliga a leggerlo. Solo che oggi, nel socialino dell’odio, qualcuno ha scritto che Scalfari avrebbe scritto «questo Papa, gesuita al punto d’aver canonizzato pochi giorni fa Ignazio di Loyola». Sono andato a leggere l’articolo, e ho trovato scritto «gesuita al punto d’aver canonizzato pochi giorni fa il primo compagno di Ignazio di Loyola» (san Pietro Favre, per la cronaca), e sono stato subito zittito. In effetti mi sono ricordato di avere ancora un abbonamento elettronico a Repubblica, sono andato a leggere e – inutile dirlo – la frase originale era quella riportata dagli altri.
Non mi stupisco molto che Repubblica corregga al volo un articolo senza dire nulla: si sa, i giornali esteri seri fanno la correzione e in fondo all’articolo si scusano per l’errore iniziale, ma quelli sono appunto giornali esteri. Non mi stupisco nemmeno troppo che Scalfari non abbia idea che sant’Ignazio di Loyola sia appunto santo: un (ex) mangiapreti come lui l’avrà sempre sentito nominare senza l’appellativo di santo. Ma mi state venendo a dire che Scalfari manda la sua omelia e nessuno la legge prima di pubblicargliela? Altro che assolutismo papale!
Aggiornamento: (19:15) Su Friendfeed mi hanno fatto notare che Luca Sofri (un’oretta prima di me) era arrivato alla stessa conclusione sui correttori di bozze; e soprattutto su Facebook Carlo Felice Dalla Pasqua mi ha segnalato che ora l’articolo online è di nuovo nella forma originale errata. Non so, mi sembra di essere in 1984.

Ultimo aggiornamento: 2013-12-29 17:15

_The Joy of Game Theory_ (ebook)

Come probabilmente sapete, sono un affezionato lettore sia del blog di Presh Talwalkar che dei suoi ebook. Stavolta la sua ultima fatica (Presh Talwalkar, The Joy of Game Theory, pag. 197, € 3,08) non è sui quizzini ma parla di teoria dei giochi. Non è in effetti una sorpresa: avendo lui studiato non solo matematica ma anche economia, è naturale che scriva su questi temi: e d’altra parte la teoria dei giochi è a metà strada tra matematica ed economia sin dai tempi di Von Neumann e Morgenstern, il che ha dei vantaggi perché le persone hanno punti di vista diversi e degli svantaggi perché i due gruppi spesso non si capiscono per nulla. Aggiungiamo poi che occorre anche pensare alla psicologia per capire i risultati, e potete immaginare il dramma.
Il libro di Talkalwar è un’introduzione abbastanza particolare al tema: invece che intimidire il lettore con formule su formule e concetti teorici difficili da riconoscere in pratica, l’autore preferisce fare alla rovescia. Nel testo ci sono moltissimi esempi reali, nel senso che sono proprio tratti dagli articoli di quotidiani e periodici: a partire da questi viene costruita la teoria su cui si basano, ricavando in pratica i risultati teorici come l’equilibrio di Nash, e mostrando l’ubiquità di temi classici come il dilemma del prigioniero e il gioco dell’escalation. Inoltre Talwalkar spiega in dettaglio, con il suo usuale stile molto chiaro, la cornice in cui si trovano questi esempi, e cosa potrebbe succedere se qualche attore decidesse all’improvviso di rompere le regole del gioco. (Vi ricordate che avevo accennato al fatto che nella teoria dei giochi entra anche la psicologia?)
In definitiva, raccomando caldamente il libro a chi voglia farsi un’idea della teoria dei giochi senza essere costretto a sorbirsi troppa teoria; ma penso che anche chi conosce già i suoi fondamenti trarrà profitto dalla scelta dei suoi esempi.

Ultimo aggiornamento: 2017-04-18 09:59

I misteri del copyright

Ho scoperto via xlthlx che un giudice americano ha sentenziato che Sherlock Holmes è nel pubblico dominio, o più o meno. Da quello che ho capito leggendo l’articolo, è nel pubblico dominio la caratterizzazione dei personaggi attraverso le storie scritte da Conan Doyle prima del 1923 (cioè 90 anni fa), ma non è possibile usare le informazioni usate nei libri successici (Conan Doyle morì nel 1930).
Notate la differenza tra il copyright sui libri (che è scaduto con i settant’anni dalla morte dell’autore, almeno in Europa) e il copyright sui personaggi che – almeno per la legge americana – dovrebbe se non sbaglio durare novant’anni. Questo significa che chiunque usasse i personaggi per fare delle nuove opere doveva sganciare soldi alla Conan Doyle Estate Ltd.
Belle cose, vero? Capirei al limite che ci sia per un certo periodo di tempo la possibilità di bloccare sviluppi che vadano contro lo spirito originale dell’opera, ma qua siamo davvero oltre ogni logica :-(

Ultimo aggiornamento: 2013-12-27 19:40

gioco per il dì di festa: Sudokion

Siete stanchi dei soliti sudoku? Su plus.maths.org ci sono alcune varianti, dove i numeri da 1 a 9 devono essere collocati su righe, colonne e altre cose casuali. Ci sono schemi di Hypernion, Katastrophion e Pandemonium (bei nomi, soprattutto l’ultimo) Buon divertimento :-)

Ultimo aggiornamento: 2014-12-28 19:16

gioco per il dì di festa: Come Solve the Show

Come Solve the Show, creato da Plexus (ma io l’ho trovato su Smart-Kit) è un “semplice” puzzle. Nulla di troppo complicato, una volta scoperto che i pezzi si ruotano con le frecce (oppure con A e D), però qualche minuto di divertimento te lo dà.
(ah, sì: ti salva – immagino via cookie – il punto in cui sei arrivato, quindi puoi anche fermarti un attimo)

Ultimo aggiornamento: 2014-12-28 19:16