arc-convert-01

Home : Archivio

Come un albero nella foresta; Privacy o sicurezza? [39.23 - 10.11.2021]

Che dire? questo post è imprigionato da più di un mese nel limbo della mia tastiera, costantemente ricacciato indietro dal poco tempo a disposizione ma anche dalla sua intrinseca complessità. Oggi provo a buttarlo giù in una forma più semplice e più diretta saltando a piè pari quelle premesse e quei richiami che richiederebbero una trattazione molto estesa. Diamine! Questo in fin dei conti è un blog non un paper scientifico :)

In estrema sintesi: Molte delle misure di sicurezza che possiamo adottare durante la navigazione sul web possono paradossalmente essere dannose per la nostra privacy. Una riformulazione in chiave informatica di quel vecchio adagio che individua in una foresta il posto migliore per nascondere un albero.

Partiamo dal contesto che forse c'è più familiare. Ogni utente mediamente avanzato non utilizza un browser liscio di fabbrica ma ne modifica il funzionamento intervenendo sulle impostazioni o installando estensioni. Gli adblocker e i vari salva-privacy sono sempre in vetta alle classifiche degli addon più scaricati; sicuramente svolgono le funzioni per cui sono progettati, ma non è affatto detto che il risultato sia davvero una maggiore privacy rispetto ad un soggetto seriamente interessato a tracciarci. Mi spiego subito.

Un adblocker è sostanzialmente un file host con efficacia circoscritta al browser. In sostanza non permette la creazione di connessioni tra il browser e i siti inseriti nelle sue liste di blocco. Questo è sufficiente a bloccare i meccanismi tradizionali di tracciamento, per esempio quelli basati su cookie, script e web beacon, ma rischia di rivelarsi un'arma a doppio taglio rispetto a tecniche più complesse. Se ad esempio con un adblocker attivo visitiamo un sito della galassia Google, la nostra controparte sa esattamente chi siamo ed allo stesso tempo sa anche che stiamo bloccando i circuiti pubblicitari della stessa azienda o di altre ad essa collegate. Siamo in sostanza un'anomalia statistica facilmente individuabile incrociando il comportamento atipico del nostro browser con l'indirizzo IP con cui ci presentiamo sul web.

Aggiungendo altri strati di sicurezza, da questo punto di vista non facciamo altro che peggiorare la nostra situazione. Disattivando Javascript, bloccando il caricamento dei font remoti, camuffando il nostro user agent non facciamo altro che rafforzare l'entità della nostra anomalia creando una impronta digitale via via più riconoscibile anche cambiando dinamicamente l'indirizzo IP da cui accediamo.

Proviamo a fare qualche calcolo spannometrico. In questa pagina trovate l'elenco degli user agent più comuni sul web. Nel momento in cui scrivo ai primi due posti ci sono versioni recenti di Chrome e Firefox in esecuzione su Windows 10, entrambe comunque al di sotto del 10% del totale. Già il semplice fatto che io usi la versione ESR di Firefox, mi rende molto più riconoscibile dato che questa particolare configurazione è usata solo dallo 0,5% degli utenti (sempre al momento in cui ho visitato la pagina). Di questa piccola frazione, quanti sono gli utenti che usano anche NoScript e uBlock? Ovviamente un sottoinsieme anche più piccolo. E quanti di questi hanno impostato Firefox per bloccare traccianti e fingerprinting? Una quantità ancora molto minore. Il mio user agent dice che ho il browser in italiano e questo restringe ulteriormente il piccolo gruppo omogeneo a cui appartengo. l'accettare o meno i cookie, la profondità di colore del monitor, l'ora locale impostata sul PC, gli headers HTTP_ACCEPT (e potrei proseguire a lungo), sono tutte caratteristiche che contraggono progressivamente l'insieme a cui appartiene il mio browser. E tanto più questi sono anomali, tanto più piccolo è l'insieme di appartenenza.

Con questi e altri strumenti a disposizione va da sé che l'indirizzo IP esatto diventa quasi superfluo per tracciare l'utente. L'intervallo IP del provider sarebbe già ben più che sufficiente a rendere il nostro browser estremamente riconoscibile, al limite addirittura unico, quando abbinato alle altre informazioni di cui ho accennato.

Apparentemente quindi sicurezza e privacy viaggiano su linee divergenti al punto che mantenere su livelli ragionevolmente alti entrambe è probabilmente impossibile allo stato attuale.

Sarà forse ora più chiaro il perché delle molte perplessità emerse attorno a Google FLoC, un sistema di tracciamento degli utenti che applica in maniera sistematica questo genere di raggruppamenti; E che proprio per questo rischia di essere persino peggiore delle tecniche che vorrebbe rimpiazzare.