Manipuler Googlebot avec la directive HTTP X-Robots-Tag

A quoi correspond la directive X-Robots-Tag ?

X-robots-tag et échange de liensX-Robots-Tag est une directive (facultative) pouvant se trouver dans l'entête HTTP d'une page web au même titre que la directive Server ou encore la directive Content-Type par exemple. Elle a été mis en place par le moteur de recherche Google en 2007 puis adoptée par Yahoo et Bing. L'objectif de la mise en place de cette nouvelle directive est de proposer un moyen supplémentaire de contrôle du passage des robots d'indexation sur un site. Ainsi, cette directive est une alternative à la balise méta robots ou encore au fichier robots.txt qui répondent à ce même objectif.

Quelles sont les valeurs permettant de contrôler un robot d'indexation avec X-robots-tag ?

J'ai dénombré 8 groupes de valeurs possibles pour utiliser cette directive :

Quel est le rapport entre X-Robots-Tag et échange de liens ?

Généralement, lorsque l'on procède à un échange de liens avec un partenaire, notre principale soucis est de vérifier au niveau du code source qu'il s'agisse bien d'un lien en dur, que ce lien ne soit pas en nofollow,... Cependant, un partenaire malin peut très bien utiliser la directive X-Robots-Tag: nofollow dans l'entête HTTP de la page concernée pour profiter au maximum de cet échange à votre grand désavantage...On pense rarement à regarder l'en-tête HTTP !

A noter que cette technique peut également se faire avec les valeurs nofollow, none, noindex et unavailable_after.

Comment détecter une utilisation de la directive X-Robots-Tag ?

Pour vérifier si ce partenaire ne vous a pas arnaqué, vous pouvez vérifier manuellement l'entête de la page de partenariat avec le plugin firefox Webdeveloper par exemple. Cependant, si vous gérez plusieurs sites web, cela peut être fastidieux ! Voici un script shell permettant d'automatiser tout cela (vous trouverez dans le script des notes importantes).

Par Olivier TASSEL - Dernière mise à jour : 11/02/2010