Archivi categoria: informatica e AI

Ello

“The new kid in town”, come cantavano gli Eagles, è l’ultimo arrivato ma in senso positivo: “quello nuovo” che tutti vogliono conoscere. Stamattina per esempio abbiamo avuto Ello, un social network davvero minimale – e che funziona meglio su mobile che da desktop, per la cronaca. La sua interfaccia è piuttosto strana. Puoi suddividere chi segui solo come “friends” e “noise”; è difficile vedere a prima vista come si fa a scrivere e commentare; e il font monospaziato è davvero retrò. Meno strano che il sito sia a inviti, e soprattutto che mentre chi si era iscritto ieri sera come me avesse a disposizione una ventina di inviti chi l’ha fatto oggi ne ha avuti solo quattro: sono quelle cose che scoppiano nelle mani degli sviluppatori, come scritto qui.

Ello non ha pubblicità e afferma esplicitamente nel suo manifesto che non vuole vendere i dati degli utenti. Però è vero che si sono beccati 400.000 dollari da un fondo di Venture Capital (che immagino vorrà prima o poi rientrare dei soldi), e c’è gente con forti dubbi sul modello, specificatamente per quanto riguarda la privacy. E allora perché ci stanno andando tutti? Perché le usanze sono queste :-)

Ultimo aggiornamento: 2014-09-26 16:45

Google+ e le mie foto

Stamattina mi è comparsa questa notifica di Google+: «Some photos that you made public on Google+ have been selected to appear on Views and Google Maps.» Sono andato a vedere che foto fossero: sono queste due (si vedono?), che avevo scattato durante un corteo cui avevo partecipato nel 2008.

Sgombriamo il campo dagli equivoci. Quelle foto sono pubbliche, e se Google vuole usarle lo può tranquillamente fare; non me ne può importare di meno. Non mi chieda però dove le ho scattate – non scherzo: quando le ho visualizzate mi ha chiesto «Was this image taken at Lor. Al Sas?» che non so nemmeno cosa sia. Gli basti la geolocalizzazione. Quello che però mi dà fastidio è che in queste foto “generate dall’utente”, a differenza da quelle che usa con Google Maps, le facce non sono mica oscurate. Una bella paraculata, non trovate? (Tra l’altro le foto non hanno nulla di davvero interessante neppure per chi debba usare le mappe, perché naturalmente non erano state fatte per mostrare le vie o i palazzi…)

Ultimo aggiornamento: 2014-09-19 11:32

la cattiva reputazione della matematica

[attenzione! la matematica è rischiosa!] In ufficio c’è un firewall per uscire su Internet. Fin qui nulla di strano. Il firewall ha una serie di regole per bloccare siti “pericolosi”: per esempio, immagino che youporn non sia accedibile (ah, ho controllato: è in effetti bloccato, come categoria “pornography” e “minimal risk”).

Bene: il firewall mi ha appena bloccato l’accesso a una pagina del sito Math Munch. Il sito è indicato come “Malicious” e “High Risk”; la regola attiva è “Destinazioni bloccate per cattiva reputazione”. Che diavolo può esserci di così perfido in quel sito? Semplice: si parla di matematica, come potete vedere facilmente da voi (se non siete bloccati da un firewall): il suo titolo è ”
A Weekly Digest of the Mathematical Internet”. Direi che quel messaggio di avviso la dice lunga.

(ah: se vado sulla home page del sito posso tranquillamente leggere tutto il post…)

Ultimo aggiornamento: 2014-07-10 11:22

il nuovo recordman del crapware: flac2mp3

Per crapware si intende il software che cerca di installarti non so quant’altra robaccia che tu non sei assolutamente interessato a usare. Tanto per dire, le barre di ricerca si installano a pacchi.
Orbene, l’altra settimana Anna mi ha chiesto di installare sul suo pc un convertitore da FLAC a MP3. Io di formati audio non ne so nulla, e ho preso il primo che mi è capitato, da http://www.flac2mp3.biz/ . Ordunque, lancio il programma (troppo piccolo per i miei gusti, ma ormai è anche di moda scaricare solo il primo installatore…) e mi esce una schermata con una licenza d’uso per un altro programma. Occhei, penso io, nema problema: ammazzo l’installazione e poi andrò a cercare un altro programma. Come sempre me ne sono dimenticato, ma un paio di giorni dopo Anna mi chiama e mi dice “che devo fare con questo?” Era ancora la schermata di installazione di quel convertitore.
A questo punto ho dovuto applicare tutto il mio neurone alla procedura di installazione e leggere attentamente tutto quello che veniva scritto. In pratica, se si annullava l’installazione appariva una nuova finestra che spiegava come se proprio volevi smettere di installare il programma con i suoi maravigliosi programmi ancillari dovevi cliccare su Cancel, se avevi chiuso la finestra solo perché avevi erroneamente sfiorato il tasto del trackpad potevi continuare l’installazione senza problemi cliccando su Continue, e infine se eri così pazzo da voler proseguire l’installazione senza i maravigliosi programmi ecc. ecc. ti era permesso di cliccare su skip. Questo per 2 (due) diversi programmi. Ah: nel caso della prima opzione, anche se non veniva esplicitato, era necessario togliere la spunta all’opzione “rilancia il programma all’avvio del computer”. Insomma, una faticaccia.

Siti pericolosi

Il proxy aziendale blocca una gran quantità di siti. Non so cosa succede con quelli pornografici, ma posso assicurare che quelli di condivisione file lo sono: una grande scocciatura, ma riesco a capire la logica dietro questa scelta (scambio di file: sì, li puoi scambiare anche via Facebook e Google+, ma…) e quindi mi lamento solo silenziosamente. Ci sono poi altri stranissimi casi, tipo il blog di Licia che parla solo di lessico e terminologia: ma forse il problema è che ne uccide più la lingua (italiana, inglese, italiese) che la spada.

Però il giorno di Pasqua mi sono trovato, mentre guardavo un post sul telefonino, un link bloccato per “sito pericoloso”. Il sito era web.archive.org, che come probabilmente sapete è semplicemente una raccolta di testi (nemmeno di immagini) dalla rete. Ho scritto chiedendo lumi al “supporto navigazione” e stamattina è arrivata la risposta: Il sito è bloccato perché inserito nella categoria “Anonymizing Utilities“ .

Ultimo aggiornamento: 2014-04-28 10:05

Ho il pc posseduto

Stamattina – beh, tecnicamente era ancora stanotte, alle 5 non siamo ancora all’alba – sento degli strani suoni e mi sveglio: c’erano le note di una canzone che arrivavano da qualche parte in casa. Penso di aver per sbaglio inserito una radiosveglia, mi alzo e comincio a cercare la fonte del suono, che proveniva dal piano di sopra: salgo, e vedo che la colpa è del PC, che stava trasmettendo una canzone anni ’60 (che per me si chiama L’arcobaleno ed è la versione italiana di un brano inglese, ma non sono riuscito a trovare… ah, la vecchiaia. Dire che posso canticchiare la melodia!). Che il computer non fosse spento, ci stava. Che non avessi zittito l’audio, ci stava pure. Che – una volta partito Google Chrome – questo avesse lanciato la sua ultima finestra che era lo streaming di Radio Popolare, che alle cinque del mattino trasmette unattended musica, ci stava anche. Ma perché doveva partire Chrome? Il pc era semichiuso come al solito, quindi non posso nemmeno pensare che Ariel ci sia salita su. Mah, misteri.

Ultimo aggiornamento: 2014-04-10 12:02

ladri di byte

Non sono nato ieri, e so perfettamente che quando si misurano le memorie di massa le unità di misura non sono quelle binarie (1K=1024, 1M=1048576, eccetera) ma quelle decimali.
Però mi fa abbastanza specie che la chiavetta Kingston DataTraveler® G4 da 16 GB abbia una capacità di 15.711.879.168 byte. E il resto?

Ultimo aggiornamento: 2014-02-25 10:46

La grande bellezza

Per dare un po’ di gioia a Guia Soncini (che è già uscita con uno dei suoi amabilissimi commenti prima ancora che io mi mettessi a scrivere qualcosa… mica posso deluderla) mi sono deciso a leggere e commentare questo post di Massimo Mantellini che racconta della sua ricerca negli inferi delle pagine di risultati di una ricerca di Google. A Mantellini pareva di ricordare che quando il film era uscito le recensioni fossero state molto schierate (o estremamente positive o estremamente negative), ma i primi risultati non erano quelli che voleva lui e quindi è dovuto andare sino alla ventesima pagina. Bene. Ho provato anch’io a fare la stessa ricerca (“la grande bellezza”, senza le virgolette) e ho avuto risultati simili, tranne che il suo post adesso è nella top ten. Peccato che questo non significhi nulla, se non che in effetti gli algoritmi di Google ogni tanto hanno delle pecche (e sarebbe divertente scoprire dove *questo* mio post si situerà: qualcuno vuole fare la prova?) Ecco perché la cosa non significa nulla, almeno a mio parere.
(1) Google non sa cosa voglio cercare (beh, non è proprio vero, ma di quello ne parlo dopo). Tanto per dire, fino a stamattina la frase “La grande bellezza” a me non diceva proprio nulla: è tanto se sapevo che l’ultimo film di Sorrentino, qualunque fosse il suo nome, era entrato nella short list dei nove film stranieri tra cui verrà scelta la cinquina. (Occhei, a me il cinema interessa zero, ma quello è un mio problema). Di per sé, il fatto che Google abbia “capito” che si parlasse del film è un grande risultato.
(2) Scordatevi tutte le palle che avete sentito sui motori di ricerca semantici. Non funzionano, scommetto che non funzioneranno nei prossimi cinque anni, e scommetto che tra cinque anni potrò rifare la stessa identica scommessa. Gli algoritmi di Google funzionano secondo tecniche di tutt’altro tipo (fondamentalmente statistiche su quantità enormi di dati): è sempre stato così e le cose non cambieranno presto. Non è un caso che tra i primi link ritornati da una ricerca ci sia quasi sempre la voce di Wikipedia al riguardo e che in alto a destra di questa ricerca particolare ci siano i siti di recensioni cinematografiche: l’unico modo che Google ha per inserire della “semantica” nei suoi risultati è decidere a priori che certi siti sono semanticamente importanti in assoluto (Wikipedia) o in relativo (se statisticamente La grande bellezza è un film, allora si evidenziano i siti che recensiscono film)
(3) Non è nemmeno strano che ci siano le ultime notizie dei media e non quelle uscite a suo tempo. Perché io che faccio una ricerca oggi dovrei essere più interessato al passato che al presente? E se la gente clicca sui siti dei media, perché Google non dovrebbe indicizzarli più che altri siti snobbati? (a parte naturalmente perché gli editori non lo vogliono… mai capito perché non facciano un opt-out esplicito sullo spider di Google, è banalissimo) (no, lo capisco benissimo, tranquilli). In effetti nelle opzioni di ricerca avanzata manca una spunta “elimina le voci più recenti di tot”, ma non saprei in quanti la userebbero.
(4) In realtà Google sa fin troppe cose di noi che non siamo i suoi clienti ma i suoi fornitori (di dati): quindi, se Mantellini cercasse spesso recensioni, le recensioni dovrebbero salire in alto nei risultati della *sua* ricerca. Non so se ipotesi e tesi siano vere, però.
(5) Riprendendo il punto 2: come fa Google a immaginare che Mantellini (o chiunque altro) voglia comunque vedere le recensioni negative e non solo le positive, e voglia vedere le recensioni “della rete” (qualunque cosa voglia dire) e non quelle dei siti specializzati? Per il secondo punto, ricaschiamo sul modello statistico: al 99% delle persone che vogliono leggere una recensione di quel film importuntubo che Leonardo ne avesse parlato a suo tempo. Per il primo punto, per non saper né leggere né scrivere avrei fatto una ricerca “la grande bellezza recensioni negative” (che tra l’altro mi appare prima di finire la frase, il che significa che non sono l’unico ad avere avuto questa brillante idea). I risultati, da una mia veloce scorsa, non saranno il massimo: ma abbiamo tolto Wikipedia, abbiamo tolto giornali e affini, abbiamo mandato molto in giù i siti di cinema mainstream. Certo, poi possiamo discutere sulla qualità delle pagine che vengono ritornate: ma ancora una volta non esiste un modo di valutare automaticamente la qualità di una pagina, ma solo la sua popolarità.
Su una cosa però mi sento di dare ragione a Massimo. Nell’ultimo anno o due c’è un forte inquinamento di risultati, con una serie di siti fotocopia che incollano lo stesso testo (anche in ispregio al copyright, ma non è di quello che voglio parlare). Dieci anni fa questo non succedeva per l’ottima ragione che non capitavano così spesso queste scopiazzature. Il guaio è che l’algoritmo che trova “le pagine simili” non sta funzionando così bene come un tempo, e Ciò È Male… anche se poi basta saper fare bene la ricerca e tutto si rimette a posto.
In definitiva? L’internauta comune dovrà reimparare a fare ricerche. Se non ci riuscirà, peggio per lui.

Ultimo aggiornamento: 2013-12-31 14:22