Web sommerso

Da Wikipedia, l'enciclopedia libera.
(Reindirizzamento da Web invisibile)

Il web sommerso (o in inglese deep web), spesso erroneamente confuso con il dark web, è l'insieme delle risorse informative del World Wide Web non indicizzate dai normali motori di ricerca. Per spiegare la mole di dati presente nel deep web si utilizza la metafora dell'iceberg, dove la parte al di sopra dell'acqua corrisponde a tutte le pagine del web indicizzate dai motori di ricerca: il cosiddetto web accessibile; mentre la parte sostanziale dell'iceberg si trova sommersa e corrisponde al web sommerso.

Secondo una ricerca sulle dimensioni della rete condotta nel 2000 da Bright Planet[1], un'organizzazione degli Stati Uniti d'America, il Web è costituito da oltre 550 miliardi di documenti e 18 milioni di GB, mentre Google ne indicizza solo 2 miliardi, ossia meno dell'uno per cento. Questi dati rimagono approssimativi in quanto il direttore dell'istituto di informatica e telematica CNR di Pisa, Domenico Laforenza, ha ammesso che non esistono metriche e tecnologie per misurare l'effettiva ampiezza del Web sommerso.

Differenza tra deep web e dark web[modifica | modifica wikitesto]

Il deep web è quella parte del World Wide Web non indicizzata dai comuni motori di ricerca. Di questa categoria fanno quindi parte nuovi siti non ancora indicizzati, pagine web a contenuto dinamico, web software e siti privati aziendali. Il dark web è un sottoinsieme del deep web, solitamente irraggiungibile attraverso una normale connessione internet senza far uso di software particolari perché giacente su reti sovrapposte ad Internet chiamate genericamente darknet. Le darknet più comuni sono Tor, I2P e Freenet. L'accesso a queste reti avviene tramite software particolari che fanno da ponte tra Internet e la darknet. Uno dei più famosi è Tor che, oltre a fornire accesso all'omonima rete, garantisce l'anonimato all'utente, permettendogli di navigare anonimamente anche sul normale World Wide Web da uno dei nodi della rete Tor. Le darknet sono usate, in alcuni casi, per attività illegali: famoso è il caso di Silk Road, un sito di commercio elettronico sulla rete Tor che effettuava attività criminali.

Composizione[modifica | modifica wikitesto]

I documenti che fanno parte del Web invisibile possono essere suddivisi nelle seguenti categorie:

  • Contenuti dinamici: pagine web dinamiche, ovvero pagine Web il cui contenuto viene generato sul momento dal server, che possono essere richiamati solo compilando un form o a risposta di una particolare richiesta;
  • Pagine non collegate: pagine Web che non sono collegate a nessun'altra pagina Web. Se l'accesso non è impedito da adeguate impostazioni di sicurezza, il motore indicizza la parent directory del sito, che contiene non solo le pagine visibili, ma tutto ciò che è caricato nel server ospitante;
  • Pagine ad accesso ristretto: siti che richiedono una registrazione o comunque limitano l'accesso alle loro pagine impedendo che i motori di ricerca possano accedervi;
  • script: pagine che possono essere raggiunte solo attraverso link realizzati in JavaScript o in Flash e che quindi richiedono procedure particolari;
  • Contenuti non di testo: file multimediali, archivi Usenet, documenti scritti in linguaggio non HTML, in particolare non collegati a tag testuali (tuttavia alcuni motori di ricerca come Google sono in grado di ricercare anche documenti di questo tipo);
  • Contenuti banditi dai comuni motori di ricerca perché illegali: di questa categoria fanno parte siti pedo-pornografici o snuff, commercio e produzione illegale di droghe e armi, siti sottoposti a censure governative, siti di warez e malware;
  • Software: certi contenuti sono nascosti intenzionalmente al normale Internet, e sono accessibili solo con software speciali, come Tor, I2P o altri darknet software. Per esempio Tor consente ai propri utenti di accedere anonimamente a siti che utilizzano il suffisso .onion, nascondendo il loro indirizzo IP.

Note[modifica | modifica wikitesto]

Voci correlate[modifica | modifica wikitesto]

Altri progetti[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Controllo di autoritàGND: (DE7664173-9
Internet Portale Internet: accedi alle voci di Wikipedia che trattano di internet