Ormai sono giorni che non si fa che parlare del caso Cambridge Analytica legato alle scorse elezioni americane, questa la sintesi estrema di quanto successo con qualche considerazione da “addetto ai lavori“.

Christopher Wylie nelle scorse settimane, concedendo a quanto pare un paio di ghiotte esclusive al Guardian ed al New York Times, ha denunciato un uso scorretto di una grande quantità di dati “prelevati” da Facebook.
Ecco, questo è il primo punto su cui soffermarci, come sono stati prelevati questi dati?
La stampa ha parlato di furto di dati, la stampa estera ha usato più volte il verbo “to harvest” che significa letteralmente “raccogliere” ed in gergo tecnico significa azionare un qualche script in grado di collezionare dati automaticamente.
In ogni modo, ai tempi in cui questi dati sono stati raccolti, non c’era da fare molto per ottenere i dati non solo della persona target, ma anche quelli della propria lista di amici, cosa che ad oggi è divenuta impossibile.

Il ragionamento quindi alla base di questa raccolta dati è lo stesso che si pone alla base di Facebook stesso: se hai bisogno di dati, probabilmente le persone te li daranno spontaneamente.
Succede così anche oggi, ogni giorno, su internet.
E bada bene, parlo di internet, non solo di Facebook.

C’è da chiedersi come mai questa raccolta di dati non sia avvenuta su Twitter, un occhio poco attento potrebbe rispondere che su Twitter in realtà non c’è molto da condividere, ai tempi erano disponibili solamente 140 miseri caratteri e el foto erano poco usate.
Bhè, magari è utile dare un’occhiata lato tecnico: Twitter ti fornisce pochi dati, è vero, ma la cosa più ostile è che utilizzando il login tramite Twitter, l’utente avrebbe dovuto comunque inserire manualmente l’email, che non viene mai allegata ai dati trasferiti di default.
Un ostacolo, non indifferente.
Oh ma che buono Twitter che non fornisce l’email di default, bhè, non proprio, infatti da qualche mese a questa parte all’atto dell’iscrizione, Twitter esplicita che l’esperienza utente sulla sua piattaforma verrà influenzata anche da ciò che l’utente “vede online”.

La tecnica infatti con cui sono stati raccolti i dati è semplicissima, quasi imbarazzante fin dal nome, un’applicazione chiamata “This is your digital life“, che tramite Facebook Login (qui un dettaglio sulle autorizzazioni, ad oggi) permetteva di visualizzare le proprie preferenze, e in definitiva la propria vita online.
Ancora, se hai bisogno di dati, molto probabilmente le persone te li daranno.

Facebook Login, nel comunicare con l’utente che lo sta utilizzando, mette in chiaro in maniera netta quali sono i dati che verranno trasferiti al creatore dell’applicazione, e l’utente semplicemente, acconsente a quel tipo di trattamento dei dati.
Ai tempi però, questo sistema permetteva di avere accesso ad una serie di dati riferiti alla lista dei propri amici, da qui il conteggio secondo il quale è stato possibile risalire ai profili di 50 milioni di persone attraverso la connessione di soli 270.000 individui.

Ad oggi non è più possibile ottenere dati di terze persone, ma la possibilità di ottenere dati degli utenti tramite applicazioni o servizi web è viva e vegeta.
Ma un momento, perchè Facebook non rende più possibile ottenere i dati della lista degli amici di un utente?
Non certo per carità cristiana, ma solamente perchè nel grafo social di un individuo, mediamente, su Facebook sono presenti amici, colleghi, genitori, parenti vari, sconosciuti ed ex compagni di classe.
Categorie di persone troppo diverse tra loro, e con una relazione poco commerciale con l’utente.
Il passo successivo per Facebook è stato quello di perfezionare il concetto di Lookalike Audience, ovvero, partendo da un set di dati o dai fan di una pagina, è possibile andare a targetizzare persone simili in base a comportamento, attitudine al consumo ed affinità al di là del fatto di avere queste persone affini tra i contatti, il tutto senza doversi inventare Cambridge Analytica, ma comodamente dalla piattaforma adv di Facebook.

Tornando al meccanismo del test/quiz per ottenere i dati degli utenti: tecnicamente l’utente ha prestato il suo consenso a trasferire i propri dati da una società, Facebook, ad un’altra, ovvero l’owner di This is your digital life.
Ed a poco valgono le lamentele secondo cui quelli sono “i nostri dati“, li abbiamo già dati a Facebook, ed abbiamo accettato un mare di termini e condizioni.

Ciò che facciamo finta di non vedere, o che con un tocco di malizia gli addetti ai lavori hanno taciuto, è il semplicissimo fatto che il tracciamento delle abitudini di navigazione, dei siti visitati, delle ricerche effettuate, dell’ultimo acquisto effettuato, insomma, di tutto ciò che noi facciamo online è il pane quotidiano dell’intera industry.

Io non posso permettermi, ad oggi, di fare una campagna pubblicitaria che abbia come dati solamente il sesso o l’area geografica di interesse, io devo poter mostrare il mio annuncio ad una persona che è in linea con N criteri, dal numero di figli, al periodo in cui è nato l’ultimo figlio, con un’auto di grossa cilindrata e che abbia speso più di un tot in un e-commerce di alta fascia.
Io ho bisogno di sapere vita, morte e miracoli dell’utenza che voglio targetizzare, e questo, lo ripeterò fino allo sfinimento, avviene sull’intera internet, non solo su Facebook.

Ad oggi, le tecnologie che abbiamo a disposizione ci permettono elevatissimi livelli di sofisticazione, andando a raccogliere infinite quantità di dati per poter deliverare al meglio non solo un’ipotetica campagna banner, ma addirittura per poter ottimizzare al massimo la spesa per ogni singola impression.

Parlando di banner poi, mi viene da sorridere per il polverone alzato dalla normativa sui cookies: il dover rendere obbligatorio il banner per l’accettazione da parte dell’utente dell’uso dei cookies.
Il 99% dei banner sono totalmente scollegati dall’attività vera e propria di raccolta dati tramite cookies, anche perchè ogni singolo banner per l’accettazione dei cookies dovrebbe riuscire a comunicare con N software diversissimi tra loro sia prima che dopo la scelta del visitatore del sito, cosa che non avviene MAI.
Il tutto poi è stato fatto in un modo così farraginoso che i siti hanno tutti, o quasi, questo banner fittizio per l’accettazione dei cookies, mentre le app, che sono in grado di tracciare davvero qualsiasi cosa, a quanto pare non hanno nessun obbligo.
Poi ci ritroviamo un giorno a puntare il dito verso Facebook.

Come detto, ad oggi, grandi quantità di dati transitano e vengono smerciati tra diversi attori, tutte società private, e vanno ad influenzare ciò che ci viene proposto su centinaia di siti.
Ma quali sono queste entità misteriose che contribuiscono ad informare la totalità o quasi delle campagne marketing online?
Si chiamano D.M.P. acronimo che sta per Data Management Platforms, a cui si rivolgono i principali siti e servizi da un lato per monetizzare i dati della propria utenza, e dall’altro per targetizzare al millimetro ogni campagna.

Qui uno schemino semplice semplice, ma che la dice lunga: quella verde al centro è la tua DMP.

Certo, Cambridge Analytica ha dovuto fare un bel lavoro di analisi e razionalizzazione dei dati ottenuti dal proprietario dell’applicazione This is your digital life, ma ad oggi sembra davvero un lavoro superfluo vista la vastità del panorama tecnologico a disposizione dell’ecosistema.

Al mito della creazione serve il Diavolo, e qui abbiamo tutti gli elementi, il whistleblower nei panni del buono, la misteriosa Cambridge Analytica che veste i panni del fuorilegge, e la corporation cattiva additata come complice.
Ok, lo ammetto, Facebook avrebbe potuto fare molto di più, anche al netto delle ultime dichiarazioni di Theresa Hong alla BBC, se non altro per garantirsi un certo grado di tranquillità, ma davvero è complice?
Direi di no.

Postille varie, che è bene conoscere.

Una volta era molto figo fare app per Facebook in grado di appropriarsi di milioni di dati di altrettanti utenti, infatti nel 2007 a Stanford esisteva una classe, la Facebook Class, in cui B.J. Fogg insegnava ai suoi alunni a fare proprio questo.
E molte delle app create durante quel corso hanno generato milioni di utenti (ai tempi era più facile) e sono state vendute di lì a poco.
Ovviamente la vicenda veniva descritta in tutt’altro tono.

Ecco semmai ci fosse l’opportunità di criticare Facebook, magari sarebbe utile farlo quando fornisce addirittura il permesso di fare incetta di dati, come successo nella campagna di Obama nel 2012, secondo quanto riferisce il Daily Mail.

Una parola sull’Italia.

La cosa che mi ha fatto più ridere è stato vedere un sacco di gente arrovellarsi ogni giorno su Facebook per interpretare un particolare di questa storia, il fatto che a quanto pare Cambridge Analytica abbia servito anche un partito italiano.
A mio parere c’è ben poco da utilizzare CA per l’Italia, il Movimento 5 Stelle ha più del 30% ed ha utilizzato 4 fake news ed una manciata di meme. Altro che CA, a noi basta pochissimo.
E poi ce lo vedi Di Maio a capirci di Big Data? 🙂

Non sono l’unico a pensarla così.

Appena finito di scrivere questo post, mi imbatto in un post dettagliato e ben circostanziato di Doc Searls sul suo blog di Harvard, da leggere assolutamente se si vuole avere un dettaglio più scientifico di ciò che ho scritto qui di corsa e male.

Cambridge Analytica e ciò che facciamo finta di non sapere