TrustRank

Da Wikipedia, l'enciclopedia libera.

Il TrustRank è una tecnica di analisi dei link di un sito web per distinguere le pagine web "utili" ai fini della navigazione dallo spam. Il nome è stato acquistato da Google il 16 marzo 2005.[1]

Differenza col PageRank[modifica | modifica wikitesto]

Il PageRank di Google è un diffuso algoritmo, sul quale si è fondata per anni (e si basa tuttora) l’indicizzazione di Google, che assegna un punteggio ad ogni pagina Web, basandosi sul numero di link che riportano ad essa. Il fondamento è che, se molte pagine linkano tutte ad uno stesso indirizzo, esso deve essere ovviamente importante; quest’attività può essere considerata una versione più raffinata e complessa della Link Popularity.

Il modus operandi del web-spam, che permette al Page Rank di crescere, agisce essenzialmente attraverso due vie:
1) link e parole chiave nascoste, che vengono comunque indicizzate dai motori di ricerca;
2) creazione di numerose pagine che linkano ad un’unica pagina designata in precedenza, in modo da rendere suddetta pagina rilevante per la classificazione da parte del motore.

Come funziona il Trust Rank[modifica | modifica wikitesto]

Il Trust Rank ha lo scopo di aiutare nella classificazione di una pagina o sito web, attraverso un processo che prevede diverse fasi:
1) l’algoritmo seleziona un gruppo di pagine delle quali non è chiaro lo “spam status”, chiamate seed;
2) un esperto umano esamina le pagine e comunica all’algoritmo quali possono essere definite spam (bad pages) e quali no (good pages);
3) l’algoritmo infine identifica le altre pagine sulle basi della precedente classificazione umana.

Note[modifica | modifica wikitesto]

  1. ^ Zoltán Gyöngyi, Hector Garcia-Molina, Jan Pedersen, Combating Web Spam with TrustRank in Proceedings of the International Conference on Very Large Data Bases, vol. 30, 2004, p. 576. URL consultato il 26 ottobre 2007.