Meta tag

Da Wikipedia, l'enciclopedia libera.

I meta tag, o tag meta, sono metadati utilizzabili nell'HTML per veicolare informazioni aggiuntive correlate alla pagina web che ne fa uso. Sono in genere analizzati e utilizzati per mezzo di sistemi automatici (come i browser o i motori di ricerca), che li possono elaborare per fornire servizi o funzionalità specifiche.

A differenza di molti altri tag, i tag meta non forniscono al browser informazioni strettamente legate alla formattazione della pagina, non influendo sulla impaginazione grafica. A meno che non elaborati appositamente, sono generalmente invisibili all'utente, se non attraverso la visualizzazione del codice sorgente della pagina oppure tramite le finestre di proprietà dei browser.

I tag meta, non essendo formalmente codificati, possono essere utilizzati a discrezione del webmaster secondo le proprie necessità. Gli unici elementi richiesti dalla grammatica formale sono l'utilizzo di un attributo "name" e di un attributo "content".

Origine[modifica | modifica wikitesto]

La nascita dei tag meta è originariamente dovuta alla necessità di fornire un supporto ai motori di ricerca per una corretta ‏indicizzazione dei siti e delle pagine, quando ancora non esistevano algoritmi avanzati in grado di analizzare il testo della pagina e basarsi su variabili più complesse.

Per motivi di potenza di calcolo e memoria, infatti, i crawler utilizzati dai motori di ricerca si limitavano a raccogliere e analizzare le prime stringhe di testo della pagina. Per questo motivo i webmaster inserivano nelle intestazioni della pagina dei tag appositamente destinati a contenere metadati che riassumessero l’intero contenuto della pagina. Tale aiuto fornito dai webmaster, però, lasciava ampio spazio a comportamenti opportunistici volti a sviare il corretto funzionamento del motore di ricerca, nel tentativo di apparire in un maggior numero di ricerche. Ciò era possibile inserendo fra i metadati informazioni non pertinenti ai contenuti della pagina, ma legati ad altri argomenti di interesse cercati dagli utenti.

Ben presto, però, il superamento delle limitazioni tecniche e la raffinazione degli algoritmi, sempre più sofisticati, permisero di aggirare l'uso improprio dei tag meta, orientando l'analisi delle pagine sui testi, sui contenuti, sul numero di link entranti nel sito, il numero di click ricevuti e numerose altre variabili.

Ciò ha portato al superamento dei tag meta tra gli elementi utili per il posizionamento, sebbene non sia ancora scomparsa la leggenda metropolitana secondo la quale essi possano fornire contributi significativi nei risultati dei motori di ricerca.[1]. Il tag meta "keywords", per esempio, è tra quelli ufficialmente non riconosciuti da Google,[2] che ne analizza altri per scopi tecnici non correlati alla posizione nelle pagine dei risultati.

Struttura[modifica | modifica wikitesto]

La struttura dei tag meta è relativamente semplice e duttile, prevedendo due soli attributi:

<meta name="proprietà" content="valore" />
  • l'attributo name indica il tipo di informazione contenuta nel tag
  • l'attributo content invece il contenuto della informazione

I primi quindi richiamati da una specifica parola, i secondi invece sono variabili e contestuali al sito o alla pagina cui fanno riferimento. Anche l'attributo name può essere scelto in modo variabile, ma solo quelli più diffusi sono riconosciuti dai sistemi di analisi standardizzati.

Esiste anche un attributo, chiamato http-equiv, che unito all'attributo content fornisce al browser degli header http. Alcuni esempi sono:

<meta http-equiv="refresh" content="5" />
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />

Che rispettivamente aggiornano la pagina ogni 5 secondi e forniscono informazioni al browser circa il contenuto e la codifica della pagina.

Non è specificato un tag meta per indicare la data di creazione e ultimo aggiornamento della pagina.

Metadati per i motori di ricerca[modifica | modifica wikitesto]

Description[modifica | modifica wikitesto]

Il metadato description è destinato a contenere una breve descrizione dei contenuti della pagina. Può essere utilizzato, a discrezione del motore di ricerca, come testo riassuntivo nella pagina dei risultati. Diversamente che agli albori di Internet, non ha effetti sul posizionamento.[3].

Keywords[modifica | modifica wikitesto]

Il metadato keywords aveva lo scopo di contenere una serie di parole chiave rappresentative del contenuto della pagina indirizzate prevalentemente ai motori di ricerca per l'individuazione dell'argomento trattato. L'abuso di tali tag decretò la fine del loro utilizzo. Il maggiore motore di ricerca, Google, non lo elenca tra i tag riconosciuti.[2] È tuttavia opinione comune che i motori di ricerca analizzino ancora in modo subordinato tale tag per verificare la presenza di parole fuorvianti non presenti all'interno del testo della pagina, penalizzando tali comportamenti scorretti.

Il contenuto dell'attributo content è quindi una lista di parole. Su come tali termini vadano separati, per esempio con virgole o con spazi, non esistono pareri unanimi. Non tutti i motori considerano le virgole come dei separatori, per questo motivo si adotta spesso la soluzione di usare una virgola seguita da uno spazio.

Robots[modifica | modifica wikitesto]

Il tag meta robots è indirizzato esclusivamente agli spider, fornendo due tipologie distinte di direttive: se indicizzare o meno la pagina, o se seguire o meno i collegamenti dalla pagina in questione verso altre; l'attributo content, quindi, contentiene determinate variabili:

  • index
    per indicare che la pagina può essere indicizzata.
    noindex
    per indicare invece di non indicizzare la pagina.

I due tipi di direttive possono essere liberamente abbinati secondo le esigenze del webmaster:

... content="index,follow" 

la disposizione è ininfluente, ma non possono contenere indicazioni contrastanti. Se il tag meta "robots" non è inserito, gli spider agiscono di default come se fossero indicati index e follow, la cui combinazione può essere indicata anche con il valore all, così come none deseleziona entrambe le possibilità.[4]

È facoltà del motore di ricerca seguire queste indicazioni,[4] sebbene la netiquette lo preveda.

A questi tag base si aggiungono:

  • follow
    per indicare di seguire i link a altre pagine collegate;
    nofollow
    per indicare di non seguire le pagine linkate;
    nosnippet
    per indicare di non mostrare snippet nei risultati di ricerca;
    noarchive
    per indicare di non salvare una copia della pagina nella memoria cache del motore.
    date
    per indicare di non indicizzare una pagina a partire da una certa data. Le precedenti indicizzazioni non sono cancellate, e non è disponibile un metatag per impostare una data a partire dalla quale la pagina non è più visibile fra i risultati del motore, e/o nella sua memoria cache.

Altri tag meta[modifica | modifica wikitesto]

I tag meta possono essere utilizzati discrezione del webmaster per propri utilizzi. L'unico elemento necessario per la grammatica formale è l'utilizzo di attributo "name" e un attributo "content".

Tra gli altri tag meta diffusi vi sono:

  • "author", per indicare l'autore della pagina
  • "generator", per indicare il sistema che ha generato la pagina.

Note[modifica | modifica wikitesto]

  1. ^ Motori di ricerca I meta tag
  2. ^ a b Meta tag riconosciuti da Google - Guida di Strumenti per i Webmaster
  3. ^ Contenuti del meta tag description
  4. ^ a b "Il meta tag ROBOTS" in I meta tag"

Collegamenti esterni[modifica | modifica wikitesto]

Meta tag in Open Directory Project, Netscape Communications. (Segnala su DMoz un collegamento pertinente all'argomento "Meta tag")

Informatica Portale Informatica: accedi alle voci di Wikipedia che trattano di Informatica