Créer un Sitemap


 

Suivez le guide !

Introduction au Sitemap


Un Sitemap est un élément essentiel pour le référencement de votre site web. Il est important que celui-ci soit en ligne et mis à jour régulièrement. Mais tout d'abord, posons nous une question fondamentale :

Question Un Sitemap c'est quoi ?

Un Sitemap est un fichier XML, on peut donc dire une page web ou l'on référence toutes les pages d'un site. En somme, ceci :

FIchier XML d'un Sitemap


Google Sitemaps (Parce que c'est évidemment une invention Google) est un moyen simple pour indiquer à Google (et surtout à ses robots qui l'utilisent comme carte pour se balader dans votre site) toutes les pages de celui-ci. Vous pouvez aussi indiquer celles qui vous semblent les plus importantes et les éventuelles modifications apportées récemment.

Ce service permet une exploration plus efficace et plus rapide ainsi que des résultats de recherche plus récents et mieux placés.

Question Comment Google indexe t-il les pages et comment l'aider à les trouver ?

En fait, les moteurs de recherche tels que Google ou Yahoo explorent et indexent (c'est-à-dire analysent et trient) les informations sur internet (le contenu mais aussi la structure) par l'intermédiaire de logiciels appelés "robots d'exploration", "bots" ou encore "spidesr".

Lorsque les robots d'exploration découvrent un site, ils suivent les liens que celui-ci propose pour rassembler les informations contenues dans l'ensemble des pages puis les indexent dans leurs immenses bases de données. Les robots d'exploration effectuent ensuite des visites régulières de ce site pour vérifier si ces derniers ont été modifiés ou enrichis. (Evidement, plus votre site change vite et la quantité d'information est importante, plus ils passeront souvent).

La découverte des pages d'’un site à travers l'exploration des liens entres celles-ci, d'’autant plus lorsqu’il est récemment créé, peut être un processus extrêmement long. Les robots doivent tout d’abord trouver votre site à partir d’'un lien provenant d'’un autre site puis une fois la page analysée et les liens vers les autres pages trouvés, le robot continuera sa « découverte ». Ce processus, notamment pour un « gros » site, peut être extrêmement long et ne parlons pas des difficultés liées à la réindexation des modifications d'’un site.

Google Sitemap a donc pour objectif de tendre à corriger ce problème.

Voilà ce que dit Google à propos de ce service d'exploration :

Source : Google Sitemaps

Google Sitemaps est une expérience d'exploration du Web. Nous espérons étendre notre couverture du Web et accélérer la découverte et l'ajout de pages dans notre index en utilisant des plans Sitemap pour informer et piloter nos robots d'exploration.



Suivez le guide !

Créer le Sitemap de son site

Il existe plusieurs façons de créer un fichier Sitemap : vous pouvez trouver des générateurs de Sitemap disponibles sur des sites, des logiciels spécialisés pour ou tout simplement des scripts que vous pouvez mettre en place spécifiquement, tout dépend de vos habitudes de programmation et surtout de votre site (taille, applications utilisées sur le site, etc.).

Google propose un générateur de fichiers Sitemaps, que vous pouvez télécharger ici : Google Sitemap Generator. Il s'agit d'un script relativement simpliste, qui génère la liste des fichiers de votre site dans un Sitemap de base.

Dans le cas de sites plus complexes, il est nécessaire de programmer son outil de génération de fichier Sitemaps. Il en existe des spécialisés pour les forums PHPBB, des scripts en PHP, des scripts en ASP et même des scripts pour OSCommerce.

Ici, nous détaillerons l'utilisation du logiciel Yooda Sitemap qui va vous permettre sans effort de créer votre Sitemap.



Une fois le fichier téléchargé, vous devrez extraire l'exécutable en effectuant un clic-droit sur le fichier puis en cliquant sur « Extraire tout ».

Voici les étapes d'installations :

ETAPE 1 : Cliquez sur « Next » pour continuer

Image cache, cliquer pour afficher / cacher l'image
Yooda installation 1

ETAPE 2 : Choisissez l'emplacement du dossier d'installation plus cliquez sur « Next »

Image cache, cliquer pour afficher / cacher l'image
yooda instal 2

ETAPE 3 : Cliquez sur « Install » pour confirmer l'installation.

Image cache, cliquer pour afficher / cacher l'image
yooda instal 3

ETAPE 4 : Une barre de progression vous indiquera l'avancement de l'installation

Image cache, cliquer pour afficher / cacher l'image
yooda instal 4

ETAPE 5 : Cliquez sur « Finish » pour terminer et lancer le programme

Image cache, cliquer pour afficher / cacher l'image
yooda instal 5

L'installation de YoodaMap est maintenant terminée.

Notez que vous devrez vous inscrire gratuitement pour utiliser le programme (excepté si vous utilisez déjà SeeUrank ou Yooda MatchDensity qui vous reconnaîtrons). L'inscription est immédiate : vous recevez directement par mail votre mot de passe.

Suivez le guide !

Utilisation de Yooda Map


Une fois que vous avez renseigné votre e-mail et reçut le mot de passe, vous arriverez à une interface comme celle-ci :



Pour commencer à explorer et créer votre Sitemap, entrez le nom de votre site dans le champ du nom de domaine :

Champ pour le domaine à crawler

Généralement, vous entrez votre nom de domaine seul comme « http://www.monsite.com » et le crawl (l'exploration de votre site) cherchera dans toutes les pages qu'il trouve. Vous pouvez aussi spécifier un répertoire particulier comme :
« http://www.monsite.com/repertoire_a_mapper/ ».

Attention ! Si vous entrez le nom d'un répertoire, SEUL CE REPERTOIRE sera analysé ! Une fois le répertoire choisi, cliquez sur le bouton ci-dessous pour lancer le crawl :

Bouton Lancer de yooda

Vous pouvez aussi avec le champ d'exclusion supprimer un répertoire lors du crawl. Il vous suffit d'entrer dans le champ l'adresse complète du fichier ou du répertoire à supprimer du crawl. L'image ci-dessous illustre un exemple :

Exclusion de fichier simple Yooda

De la même manière, vous pouvez ignorer une page spécifique comme dans l'exemple ci-dessous :

Exclusion spécifique Yooda

Attention tout de même, les pages comme « http://www.monsite.com/redirect.php » ne seront pas ignorées car elles se trouvent dans un répertoire différent. De même la page « http://www.monsite.com/redirect/redirect.html » ne sera pas non plus ignorée car elle à pour extension « .html » et non pas « .php » comme spécifié ci-dessus !

Vous pouvez aussi spécifier une exclusion d'une chaine de caractère comme le montre l'exemple ci-dessous:

Exclusion d'une chaine Yooda

Ici, si la chaine « ads= » est trouvée dans l'une des URLs du site, cette page sera ignorée. Notez qu'il faut faire précéder de % la chaine que vous souhaitez exclure.

Si votre site possède des frames et que vous souhaitez les crawler elles aussi, cochez la case correspondante :

Crawler les frames

Une fois que tout vos paramètres de crawl sont entrés, vous pouvez lancer l'analyse avec le bouton cité ci-dessus. Lors du lancement, les paramètres de crawl se bloqueront, une barre de progression vous indiquera l'état d'avancement du processus et le fichier de log en dessous vous indiquera toutes les URLs trouvées.

Le bas de la fenêtre de votre écran devrait donc ressembler à quelque chose comme :

Ecran de log pendant le crawl

Une fois l'analyse terminée, le bouton « Google Sitemap » devrait être disponible :

Bouton Google Sitemap

Cliquez dessus pour afficher votre 1er Sitemap !

Affichage du fichier xml du Sitemap

Vous pouvez depuis cet écran vérifier le contenu du Sitemap généré. Si certaines URLs ne vous plaisent pas, fermez la fenêtre du fichier et ajouter à votre liste d'exclusion les URLs indésirables. Réaffichez alors le fichier Sitemap et les URL auront été enlevées !

Notez que la suppression n'est pas définitive !!! Supprimer simplement la règle d'exclusion pour réafficher les URLs supprimées.

Une fois que le fichier contient les URL de votre choix, vous pouvez sauvegarder le Sitemap en cliquant simplement sur le bouton en haut à droite :

bouton sauver Sitemap

Sauvegardez le fichier ou vous le souhaitez sur votre ordinateur et le tour est joué !


Suivez le guide !

Paramètres additionnels - Optimisation du Sitemap

Le fichier que l'on vient de générer est un Sitemap de base. La structure est simple et contient les éléments essentiels d'un Sitemap. La structure devrait ressembler à l'image ci-dessous. Nous allons pouvoir l'améliorer en spécifiant plusieurs paramètres :

URL simple

Voici la signification des différentes balises. Notez que les balises fonctionnent toujours par paire.

<urlset> requise

Encapsule le fichier et indique la version du protocole utilisée par le Sitemap.

<url> requise

Balise principale pour déclarer une URL. (les balises restantes sont contenues dans celle-ci)

<loc> requise

URL de la page. L'adresse URL doit commencer impérativement par « http:// ». La longueur de l'url ne doit pas dépasser 2,048 caractères.

Vous pouvez optimiser votre Sitemap en ajoutant des paramètres à l'intérieur de la balise <url> pour chaque URL du Sitemap.

<lastmod> optionnelles

Indique la date de la dernière modification du fichier. Cette date doit être au format standard W3C Datetime. Vous pouvez omettre l'heure et écrire la date sous la forme : YYYY-MM-DD.

<changefreq> optionnelles

Indique la fréquence d'actualisation de la page. Attention, cela ne signifie pas que le robot visitera votre page tous les jours mais lui donnera une indication. Il décidera par lui-même. Les différentes valeurs sont :

  • always (toujours)
  • hourly (dans l'heure)
  • daily (chaque jour)
  • weekly (chaque semaine)
  • monthly (chaque mois)
  • yearly (chaque année)
  • never (jamais)

La valeur « always » doit être utilisée pour indiquer une page dont le contenu change à chaque affichage de la page. En contrepartie, « never » devra être utilisée pour indiquer des urls archivées.

<priority> optionnelles

Cette balise sert à indiquer la priorité relative de cette page par rapport au reste des URLs de votre site. La valeur peut osciller entre 0.0 et 1.0. C'est encore une indication que vous fournissez au robot. C'est lui prendra la décision finale de la prochaine date du crawl de la page.

La priorité par défaut est de 0.5.

Notez que la valeur que vous assignez à la page ne modifiera pas sa position dans les résultats de recherche en revanche, elle peut influencer la page qui va être retenue par le moteur de recherche pour l'affichage des résultats d'une requête.

Mettre toutes les valeurs à 1 ne sert à rien non plus car les valeurs étant relatives, les différences seront nulles et le robot se comportera comme si vous n'aviez rien fait.

Voici un exemple d'une URL du Sitemap une fois tous les paramètres ajoutés :

URL avec paramètres

Vous pouvez ajouter ces 3 paramètres à toutes vos URLs du fichier de Sitemap mais gardez à l'esprit que ces ajouts ne sont que des indications que vous fournissez en plus au robot. En rien elles n'améliorent ou rabaissent l'efficacité d'un Sitemap. Vous avez juste un peu plus de contrôle sur son effet en favorisant certaines pages de votre site.

Vérifiez bien que le fichier se termine par la balise fermante du Sitemap : </urlset>

Nous avons maintenant terminé la création et l'optimisation de notre Sitemap ! Nous allons maintenant procéder à la dernière étape : son envoi à Google !


Suivez le guide !

Emplacement de votre Sitemap

Depuis le début, nous parlons d'envoyer notre Sitemap à Google. En réalité, nous n'envoyons rien mais nous allons indiquer à Google ou se trouve le Sitemap sur notre site ! Il en va de même pour Bing (le moteur de recherche de microsoft) qui utilise le même principe. Vous devez spécifier à quelle URL se trouve votre Sitemap sur votre site.

Donc, avant d'envoyer votre Sitemap à Google, il va falloir l'envoyer sur votre site.

Bien évidement, votre Sitemap trône actuellement quelque part dans votre ordinateur. Il vous faudra l'envoyer sur votre serveur à la racine de votre site via un FTP pour que celui-ci soit accessible en ligne et donc par tous les moteurs de recherche.

L'emplacement de ce fichier sur votre site est très important !

En effet, on peut lire dans la FAQ de Google que les fichiers Sitemaps doivent se placer dans le répertoire que l'on veut indexer.

Si nous plaçons nos fichiers Sitemaps directement à la racine : www.mon-site.com/Sitemap.xml alors toutes les URL de n'importe quel type comme « www.mon-site.com/n-importe-quoi » seront valides. (le n-importe-quoi pouvant être un fichier, une page, un répertoire, etc.).

Par contre si l'on place le fichier Sitemaps dans « www.mon-site.com/repertoire/Sitemap.xml », si certaines des url du Sitemaps pointent vers des URL : « www.mon-site.com » ou « www.mon-site.com/autre-repertoire/ » par exemple, celles-ci seront tout simplement refusées car elles se situent plus haut dans l'arborescence des fichiers et ne seront donc pas indexées par Google Sitemaps. On ne peut indexer que des pages se trouvant au même niveau ou plus bas dans l'arborescence (c'est-à-dire dans un sous-dossier qui lui-même peut avoir des sous-dossier... etc.)

Seules les URL du type « www.mon-site.com/repertoire/n-importe-quoi » seront valides.

Notez que le fichier XML généré et non compressé ne doit pas dépasser 10 Mb ou contenir plus de 50 000 Urls. Si tel est le cas de votre site vous pouvez générer plusieurs fichiers Sitemaps.



Suivez le guide !

Envoyez votre Sitemap à Google et Bing

Envoyer son Sitemap à Google est extrèmement simple. Pour se faire, rendez vous à cette adresse : Envoyer le Sitemap. Entrez alor simplement l'adresse de votre sitemap sur votre site et cliquez sur le bouton « Envoyer » pour soumettre le tout !

paramètre Google

C'est terminé ! Si vous souhaitez vous arrêter là, cela n'aura aucune conséquence votre sitemap étant terminé !

Vous pouvez aussi utiliser une manière alternative pour soumettre votre Sitemap à Google, plus longue mais qui permet d'obtenir un suivi complet du référencement de votre site ainsi que de nombreuses autres informations.

Tout d'abord, il vous faut un compte Google (créez s'en un si ce n'est pas déjà le cas). Une fois connecté avec celui-ci, cliquez sur « paramètres de compte Google » en haut à droite de la page d'accueil de Google.

paramètre Google

Sur cette page de configuration, vous allez trouver l'outil pour les webmaster :

outil webmaster Google

Cliquez dessus pour accéder à la page de configuration de vos sites. Actuellement, vous n'avez pas de site lié à Google. Il va falloir l'ajouter pour d'une part, indiquer à Google qu'il faut explorer votre site et d'autre part, pour pouvoir soumettre votre Sitemap. Vous faites ainsi d'une pierre 2 coups ! Cliquez sur « Ajouter un site... » et entrez le nom de votre site comme dans l'exemple :

ajouter un site Google

Vous devrez alors justifier que vous êtes bien le propriétaire du site en ajoutant une balise, un fichier ou du texte à des endroits spécifiques ou seul le propriétaire du site peut aller. Vous devrez suivre les directives de Google pour confirmer et ajouter votre site (c'est une étape assez fastidieuse mais tout est bien expliqué avec de beaux exemples !)

Une fois cette étape terminée et votre site validé, vous arriverez sur le tableau de bord de votre site. Vous trouverez dans le menu à droite l'endroit où envoyer votre Sitemap.

tableau de bord Google webmaster

Vous arriverez alors une fenêtre ressemblant fortement à celle où vous avez enregistré votre site plutôt.

Une fois cette dernière étape franchie, vous pouvez enfin soumettre votre Sitemap.

envoyer un Sitemap Google

Au passage, vous pouvez aussi le soumettre à Bing en cliquant ici. Google et Bing vérifieront alors l'existence de votre fichier et lanceront leurs robots à l'assaut de votre site.

Votre Sitemap est enfin en ligne et les principaux moteurs de recherche sont au courant !

Félicitations ! Vous êtes arrivé à la fin de ce tutoriel ! Merci d'avoir pris le temps de nous lire !