Indicizzazione (motori di ricerca)

Da Wikipedia, l'enciclopedia libera.

Per indicizzazione si intende l'inserimento di un sito web o un blog nel database di un motore di ricerca. L'indicizzazione di un sito internet, in altre parole, è il modo in cui il sito viene acquisito e interpretato dai motori di ricerca e quindi compare nelle loro pagine di risposta alle interrogazioni degli utenti web.

Diversa cosa è il posizionamento, che è invece un'azione volta a determinare che un sito compaia in una specifica posizione nelle pagine di risposta dei motori (cioè nelle prime posizioni).

Operazioni dei motori di ricerca[modifica | modifica wikitesto]

Registrazione dei siti[modifica | modifica wikitesto]

Dal lato dei motori di ricerca, l'indicizzazione dei siti web/blog è la loro prima e fondamentale operazione.

Dopo averli registrati, i motori di ricerca scansionano periodicamente i siti presenti nei propri archivi per verificare eventuali aggiornamenti: tramite particolari programmi chiamati spider ("ragni"), entrano in un sito e ne incominciano a leggere il codice sorgente alla ricerca di nuove modifiche del contenuto o della struttura. Quando uno spider trova un link a un'altra pagina del sito o ad un altro sito, analizza anche quest'ultimo.

Quando il motore di ricerca termina la lunga operazione di scansione dei siti già presenti in archivio comincia a scansionare tutti i siti proposti dai webmaster tramite il servizio add url (segnala un sito) che si trova in tutti i motori di ricerca.

Il sito non viene indicizzato, totalmente o in parte, se nel codice HTML sono presenti istruzioni come <meta name="robots" content="noindex">, oppure, in caso di foto, <meta name="robots" content="noimageindex">.

Classificazione dei siti[modifica | modifica wikitesto]

Dopo aver scansionato la rete e quindi indicizzato (nel senso di raggruppato) una grandissima mole di pagine web, il motore di ricerca passa alla seconda fase: classificarle e posizionarle in base a delle parole chiave che rispecchino il più possibile il sito. In questo modo i motori di ricerca, tramite particolari algoritmi, assicurano ai loro utenti contenuti validi e aggiornati. Ogni motore utilizza algoritmi particolari, come il PageRank di Google, che attribuisce ad una pagina un'importanza che dipende dal numero di collegamenti che puntano a tale pagina dagli altri siti internet.

Ultimamente i motori di ricerca tendono a penalizzare, ma non sempre, l'uso di segnalazioni/indicizzazioni automatiche tramite software.

Indicizzazioni ripetute della stessa pagina vengono considerate spam.

I tempi di indicizzazione di un sito internet possono variare da poche settimane ai tre mesi.

Diritto italiano[modifica | modifica wikitesto]

Una sentenza del Tribunale di Roma emessa il 23 marzo 2011, ha condannato un motore di ricerca per aver pubblicato link a siti web peer-to-peer che consentono lo streaming di film coperti da copyright.[1]

Note[modifica | modifica wikitesto]

  1. ^ Marcello Tansini, Condanna Yahoo contro film in streaming e download illegali, BusinessOnline.it, 24 marzo 2011. URL consultato il 26-11-2012.

Voci correlate[modifica | modifica wikitesto]