Deep Web: investigazioni digitali nel lato oscuro della rete

di Fabio Massa

La peculiarità del deep web è l’elevato livello di anonimato favorito dall’utilizzo di particolari tecnologie, come Tor. Da una parte Tor garantisce un livello di anonimato che consente di trasferire in alta sicurezza i dati oppure di superare condizioni di censura presenti in alcuni paesi, dall’altra parte rappresenta il mezzo ideale per attività criminali. L’analisi forense dei client nei quali è stato installato “Tor Browser Bundle”, può aprire scenari investigativi interessanti, che smentiscono alcune certezze di anonimato garantite dai manutentori dello stesso progetto.


 

I motori di ricerca nel web, in un certo senso, sono il cuore pulsante di internet, il termine “googling” è diventato ormai parte del nostro linguaggio e delle nostre abitudini digitali per qualsiasi attività online che decidiamo di intraprendere. Ma non tutti sanno che i classici motori di ricerca come Google, Yahoo, Bing in realtà accedono solo ad una piccolissima parte dei dati presenti nella rete, stimati nel 2001 allo 0,03% e ad oggi al 4% dei reali contenuti di internet. I risultati delle ricerche effettuate con i tradizionali motori di ricerca riguarda solo ciò che è stato indicizzato dai web crawler. In realtà il resto dei contenuti e dei siti web sono presenti nel deep web, chiamato anche invisible web, hidden web ecc. vale a dire quella parte del web invisibile ai web crawler poiché generata in maniera tale da non permetterne l’indicizzazione. La peculiarità del deep web, da non confondere con la dark net, è l’elevato livello di anonimato favorito dall’utilizzo di particolari browser progettati per questo scopo.

Prima di trattare nello specifico l’argomento, è opportuno capire il funzionamento dei motori di ricerca e dei loro robot (crawler) nelle fasi di indicizzazione di quella parte di internet evidente che noi tutti conosciamo.
I robot implementano la vera e propria funzionalità di ricerca ed utilizzano sofisticati algoritmi per raccogliere i dati dalle pagine ipertestuali. Sono chiamati “ragni” proprio perché riescono a districarsi nella complessa infrastruttura dei dati del web in modo multidirezionale raccogliendo e indicizzando tutti i metadati. Questi metadati, composti da svariate informazioni, quali ad esempio elementi come il titolo della pagina, la posizione della pagina (URL) e le parole chiave ripetute all’interno del testo, occupano molto meno spazio di quanto contenuto all’interno della pagina e quindi rendono estremamente versatili e funzionali le operazioni di indicizzazione dei contenuti nei motori di ricerca attuali. Questi utilizzano i “crawler” per la scansione dei contenuti web in modo totalmente automatizzato, esplorando il World Wide Web e generando copia delle pagine visitate per eseguire una successiva analisi e la conseguente indicizzazione. I crawler però hanno alcuni limiti tecnologici che limitano il recupero e la scansione del contenuto del WWW.

 

Di seguito elenchiamo alcune categorie di risorse, utilizzate in particolar modo nel deep web, non raggiungibili da questi software:

La crescita del deep web si deve alla diffusione di due software open source, il browser TOR e il BitCoin. Il Browser Tor fornisce la piattaforma all’utente per la navigazione anonima e per l’accesso agli pseudo-domini di primo livello aventi estensione “.onion”, mentre il BitCoin è la valuta digitale utilizzata in modo particolare per eseguire transazioni finanziarie in modo anonimo specialmente all’interno del deep web. In particolare, la cripto moneta, o valuta digitale, utile per eseguire transazioni finanziarie in modo anonimo, utilizza la tecnologia peer to peer priva del supporto di un’autorità centrale che gestisce le transazioni e l’emissione di denaro. Tutto viene svolto tramite algoritmi crittografici che controllano la creazione e il trasferimento di denaro in modo completamente anonimo.

 

…continua su EDICOLeA

 


Articoli pubblicati da Fabio Massa

 

Exit mobile version