Indicizzazione (motori di ricerca)

Da Wikipedia, l'enciclopedia libera.

Per indicizzazione si intende l'inserimento di un sito web nel database di un motore di ricerca, mediante l'uso di apposite parole-chiave. Generalmente è un procedimento che le aziende di web hosting forniscono a pagamento, ma che si può svolgere anche in proprio.
L'indicizzazione di un sito internet, in altre parole, è il momento in cui il sito viene riconosciuto dai motori di ricerca e quindi compare nelle loro pagine di risposta alle interrogazioni degli utenti web.
Diversa cosa è il posizionamento, che è invece un'azione volta a determinare che un sito compaia in una specifica posizione nelle pagine di risposta dei motori (cioè nelle prime posizioni).

Operazioni dei motori di ricerca[modifica | modifica wikitesto]

Registrazione dei siti[modifica | modifica wikitesto]

Dal lato dei motori di ricerca, l'indicizzazione dei siti web è la loro prima e fondamentale operazione.
Dopo averli registrati, i motori di ricerca scansionano periodicamente i siti presenti nei propri archivi per verificare eventuali aggiornamenti: tramite particolari programmi chiamati spider ("ragni"), entrano in un sito e ne incominciano a leggere il codice sorgente alla ricerca di nuove modifiche del contenuto o della struttura. Quando uno spider trova un link a un'altra pagina del sito o ad un altro sito, analizza anche quest'ultimo.
Quando il motore di ricerca termina la lunga operazione di scansione dei siti già presenti in archivio comincia a scansionare tutti i siti proposti dai webmaster tramite il servizio add url (segnala un sito) che si trova in tutti i motori di ricerca.

Il sito non viene indicizzato, totalmente o in parte, se nel codice HTML sono presenti istruzioni come <meta name="robots" content="noindex">, oppure, in caso di foto, <meta name="robots" content="noimageindex">.

Classificazione dei siti[modifica | modifica wikitesto]

Dopo aver scansionato la rete e quindi indicizzato (nel senso di raggruppato) una grandissima mole di pagine web, il motore di ricerca passa alla seconda fase: classificarle e posizionarle in base a delle parole chiave che rispecchino il più possibile il sito. In questo modo i motori di ricerca, tramite particolari algoritmi, assicurano ai loro utenti contenuti validi e aggiornati. Ogni motore utilizza algoritmi particolari, come il PageRank di Google, che attribuisce ad una pagina un'importanza che dipende dal numero di collegamenti che puntano a tale pagina dagli altri siti internet.
Ultimamente i motori di ricerca tendono a penalizzare, ma non sempre, l'uso di segnalazioni/indicizzazioni automatiche tramite software. Indicizzazioni ripetute della stessa pagina vengono considerate spam.

I tempi di indicizzazione di un sito internet possono variare da poche settimane ai tre mesi. Nel caso si utilizzi il servizio pay per inclusion l'indicizzazione avviene dopo pochi giorni, versando una somma per ogni pagina che si intende far indicizzare. Con questo metodo l'inserimento della pagina è garantito.

Diritto italiano[modifica | modifica wikitesto]

Una sentenza del Tribunale di Roma emessa il 23 marzo 2011, ha condannato un motore di ricerca per aver pubblicato link a siti web peer-to-peer che consentono lo streaming di film coperti da copyright.[1]

Note[modifica | modifica wikitesto]

  1. ^ Marcello Tansini, Condanna Yahoo contro film in streaming e download illegali, BusinessOnline.it, 24 marzo 2011. URL consultato il 26-11-2012.

Voci correlate[modifica | modifica wikitesto]