Capire la struttura XML di Google SiteMaps
Google SiteMaps è un sistema introdotto nel 2005 dal gigante di Mountain View allo scopo di segnalare al suo spider le pagine di un sito e, tanto per smentire chi lo crede fermamente, questo sistema NON favorisce l'indicizzazione dei contenuti, essendo appunto solo uno strumento di segnalazione.
In questo articolo by-passeremo le spiegazioni teoriche e di Marketing e ci concentreremo sulla struttura XML in cui questo sistema è materialmente redatto.
Il file XML va preferibilmente messo nella root di un sito ed il nome del file non è importante. Supponiamo possa essere sitemaps.xml.
Esaminiamo la sua struttura di base:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.mrwebmaster.it/</loc>
<lastmod>2006-09-15</lastmod>
<changefreq>weekly</changefreq>
<priority>1.0</priority>
</url>
</urlset>
Alla prima riga troviamo la dichiarazione e la versione del linguaggio XML e la sua codifica UTF.
In seguito troviamo il Tag principale che è urlset con relativa chiusura alla fine del file; il suo Namespace, specificato dal Tag xmlns, fa riferimento al percorso remoto di Google stesso, su cui è presente la DTD relativa agli spazi nei nomi utilizzati e gestiti stesso da Big G.
A questo punto esaminiamo il nodo composto da dal Tag principale url e dall'elenco dei Tag utili a specificare i valori per singola pagina.
loc - Specifica la pagina da segnalare allo spider di Google: in questo caso la Homepage.
lastmod - Indica la data dell'ultima modifica della pagina in formato:
aaaa-mm-ggovvero
anno-mese-giornochangefreq - Indica la frequenza con cui una pagina viene aggiornata :
- daily - quotidianamente
- weekly - settimanalmente
- monthly - mensilmente
Proviamo adesso ad ampliare il file XML costituente il Google SiteMaps, specificando anche la pagina del Forum di Mr. Webmaster, oltre alla già specificata Homepage:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.mrwebmaster.it/</loc>
<lastmod>2006-09-15</lastmod>
<changefreq>weekly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://forum.mrwebmaster.it/</loc>
<lastmod>2006-09-15</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
</urlset>
La modifica (aggiunta) è evidenziata in grassetto.
Si consiglia di automatizzare il meccanismo di aggiornamento del file XML in questione attraverso un qualsiasi software o webware, di propria creazione, attraverso il linguaggio di scripting lato server che si preferisce.







