Indica un intervallo di date:
  • Dal Al

Questo libro ti potrebbe interessare. E perché?

Amazon sembra ormai conoscere i miei gusti letterari meglio di me, un fatto che rischia di rendere inutili tutte le belle discussioni intorno a un paio di birre e sotto un bel sole primaverile per consigliarsi quali libri leggere. Ecco che cerco un nuovo libro per aggiornarmi sulle nuove applicazioni nel mondo del crowdsourcing, e Amazon mi consiglia un titolo chiaramente migliore di cui non ero al corrente. Poco più sotto mi imbatto nella frase “persone come te hanno comprato anche…” e mi sorge un dubbio. Chi è simile a me, e perché? Cosa sono io per Amazon?

Humor_recommender

Come tante altre lettrici e lettori al mondo, circa 250 milioni, sono una riga in una grossa matrice (una tabella) che ha per colonne tutti, ripeto tutti, i libri contenuti nel catalogo di Amazon. In ogni casella della riga a me associata è indicato il voto che ho fornito con la mia recensione al libro in questione, il fatto che io lo abbia comprato o meno, che mi sia soffermato più volte a guardare la pagina di presentazione o, la maggior parte delle volte, non c’è scritto nulla. Insomma, faccio parte di una gigantesca matrice utilizzatori-oggetti, contenente un punteggio numerico in ogni casella, a rappresentare il grado di apprezzamento dell’utilizzatore x al libro y. I celebri nonché incorporei “big data” hanno spesso questa forma.

Ora mettiamo il caso che Amazon voglia sapere se consigliarmi “cinquanta sfumature di grigio”. Ci sono due possibilità: potrebbe cercare il libro più simile a “cinquanta sfumature di grigio” – suppongo “cinquanta sfumature di nero” – controllare se gli ho dato un voto, e decidere in funzione di questo punteggio se consigliarmi il titolo iniziale o meno (approccio “item-item”). Se nella casella “Umberto”-“cinquanta sfumature di nero” non c’è scritto nulla, continuerà a cercare il secondo libro più simile a “cinquanta sfumature di grigio”, e così via fino a trovare un punteggio su cui prendere una decisione.

Altrimenti, come seconda possibilità, potrebbe cercare l’utilizzatore più simile a me (magari una lettrice indonesiana con i miei stessi gusti, che ahimè mai incontrerò), controllare se questa persona ha dato un voto a “cinquanta sfumature di grigio” e decidere se consigliarmelo (approccio “user-user”). In entrambi i casi, non è necessario ricorrere ad esperti o conoscenti per definire la somiglianza tra libri o tra utenti: tutto è già scritto nella grande matrice. Due libri sono simili se hanno ricevuto voti simili dalle stesse persone (in media, o utilizzando funzioni di somiglianza più complesse), e allo stesso modo due individui sono simili se hanno dato voti simili agli stessi titoli.

Insomma Amazon cosa fa? Probabilmente una combinazione dei due approcci. Oppure, ancora più plausibile, utilizza approcci più moderni fondati sull’apprendimento automatico, algoritmi che navigando nella matrice “imparano” le mie preferenze e quelle delle persone simili a me, e sanno indovinare la mia preferenza su un nuovo titolo con accuratezza sempre maggiore. Con il rischio di ritrovarsi presto a bere una birra con il proprio smartphone a discutere di libri!

[Per approfondire, un dettagliatissimo articolo di wikipedia sul collaborative filtering, un sinonimo per sistemi di raccomandazione.]