|
Réponse
:
L'offre Google Sitemaps (http://www.sitemaps.org/) est récente puisqu'elle a été lancée par le moteur de recherche en juin 2005 (http://actu.abondance.com/2005-23/google-sitemaps.php). Il s'agit d'une solution permettant de fournir aux crawlers de Google (Googlebot) un plan du site au format XML. Les robots peuvent alors identifier et aller chercher toutes les pages qui y sont décrites, selon les indications fournies dans le fichier.
Le concept de l'outil est extrêmement simple : vous créez un fichier XML qui contient la liste des pages de votre site, plus certaines informations sur chacune d'entre elles (fréquence de mise à jour, priorité de crawl, etc.). Vous téléchargez ce fichier sur votre serveur. Vous signalez à Google sa présence. Les robots de ce dernier viennent alors le lire et tiennent compte des données qui y sont proposées pour mieux indexer, plus en profondeur et de façon plus exhaustive, votre site.
Notez bien, cependant, que :
- L'utilisation d'un "SiteMap" n'est en rien une garantie que Google indexera TOUTES les pages qui y sont décrites. Le moteur de recherche reste maître de la façon dont il indexe les sites. Mais l'utilisation d'un tel fichier facilite, logiquement, ce processus...
- De même, Google Sitemaps n'est en rien une garantie que votre site sera mieux positionné. Cet outil n'est qu'un outil d'indexation, pas un outil de positionnement ("ranking")...
- Enfin, l'utilisation de Google Sitemaps ne remplace pas le "crawling" classique de votre site par ses robots, suivant les liens des pages web de façon traditionnelle. Les deux méthodes restent tout à fait complémentaires...
Le format "sitemap protocol" décrit un fichier XML qui va fournir des indications pour chaque page de votre site.
Le fichier créé sera de cette forme :
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>url</loc>
<lastmod>date</lastmod>
<changefreq>fréquence de mise à jour</changefreq>
<priority>priorité</priority>
</url>
</urlset>
Contenant les indications suivantes :
- urlset (obligatoire) commence et termine (/urlset) le fichier en question.
- url (obligatoire) décrit chaque page et contient les champs suivants :
* loc représente l'adresse de la page (http://www.votresite.com/page1.html). Ce champ commence par "http://" et se termine par un "/" éventuellement. Ce champ ne peut contenir plus de 2048 caractères.* lastmod est la date de dernière modification du fichier. Cette date doit répondre au format ISO 8601 (http://www.w3.org/TR/NOTE-datetime), le plus souvent sous la forme YYYY-MM-DD soit 2005-09-15 pour le 15 septembre 2005.
* changefreq représente la fréquence de mise à jour de la page, à choisir parmi les possibilités suivantes : always, hourly, daily, weekly, monthly, yearly, never. Bien entendu, dans ce cas, il faudra faire des choix en optant pour la fréquence la plus vraisemblable si celle-ci n'est pas constante.
* priority indique l'importance que vous donnez à la page à l'intérieur de votre site. Sa valeur va de 0 à 1 et peut être, bien entendu, décimale (0.5, 0.7, etc.). Attention : pas de virgule, c'est le point qui marquera ici la décimale. Si rien n'est indiqué, la priorité par défaut est fixée à 0.5. Par exemple, la page d'accueil de votre site aura, vraisemblablement, une priorité de 1.
Notez également que les champs lastmod, changefreq et priority sont optionnels.
Le protocole SiteMaps est actuellement suivi par plusieurs moteurs :
- C'est tout d'abord Google qui a lancé l'idée (http://actu.abondance.com/2005-23/google-sitemaps.php) et proposé ensuite l'outil en français (http://actu.abondance.com/2005-37/google-sitemaps.php).
- Yahoo! l'a suivi en proposant ce standard sur son site de shopping (http://actu.abondance.com/2006-26/yahoo-sitemaps.php).
- Microsoft a rejoint le groupe en travaillant officiellement avec Google et Yahoo! au développement du standard "Sitemaps" au sein d'un consortium (http://actu.abondance.com/2006-46/sitemaps.php).
- Entre temps, Google l'avait proposé pour son moteur de recherche sur les mobiles (http://actu.abondance.com/2005-35/google-mobile-sitemaps.php) et pour son site Google News (http://actu.abondance.com/2006-47/google-news-sitemaps.php).
Le système semble donc bel et bien lancé. Le fait que les trois plus grands moteurs de recherche de la planète se rattachent à ce protocole en fait un gage de succès. Les webmasters du monde entier vont donc devoir plancher sur ce standard pour voir leur site mieux pris en compte par les moteurs (rappelons que le système "Sitemaps" n'amène qu'une meilleure indexation quantitative d'un site web et ne joue pas sur le "ranking" des pages).
|