Agence de référencement naturel Paris

AGENCE DE REFERENCEMENT NATUREL PARIS

Actualités E-commerce

+33 1 41 62 10 61
+33 6 07 49 90 52

Agence de référencement Paris : Conseils et solutions pour
comment bien vendre sur internet

Conseils pour le référencement naturel par Balise Meta Robots

Article publié le 13/01/2015

La Balise Meta Robots permet d’indiquer si une page peut être indexée ou pas, et d’autres cas de figure. Ce tutoriel explique tout ce qu’on doit savoir pour optimiser le référencement naturel, surtout sur Google.

Meta Robots : définition et code HTML

La « meta robots » est une balise HTML. Elle est située dans l’entête HTML, entre les balises <head> et </head>. Elle facultative et elle permet de fournir quelques instructions aux robots des moteurs de recherche afin d’empêcher par exemple l’indexation de la page (robots noindex).

La syntaxe est très simple, comme cet exemple de meta robots la montre (version XHTML ou HTML5) :

<metaname="robots" content="noindex" />

Parfois, plusieurs valeurs, figurant dans « content » peuvent être indiquées simultanément. Ces valeurs sont séparées entre elles par une virgule comme cet exemple le montre :

<metaname="robots" content="noindex,notranslate" />

Avant de continuer, notez que d’autres dossiers similaires sont proposés :

  • La balise « title »
  • La balise « meta keywords »
  • La balise « meta description »
  • La liste des balises méta

Le rapport avec le fichier robots.txt

Il faut faire quelques rappels avant de donner une liste de toutes les possibilités du meta tag robots :

  • quand une page spécifique est consultée par des robots, c’est la balise meta robots qui fournit les instructions nécessaires aux robots
  • le droit d’accéder à une page ou un groupe de pages du site est fourni par le fichier robots.txt aux robots.

En résumé :

  • pour empêcher en amont le crawl, qui entrainera l’indexation, il faut la bloquer dans le fichier robots.txt
  • pour empêcher l’indexation d’une page qui a été autorisée au crawl, il faut mettre une balise meta robots noindex à l’intérieur
  • attention : pour supprimer une page indexée de Google, il ne faut pas la bloquer au crawl, dans le robots.txt. La raison en est simple : Google ne la consultera pas à cause justement de robots.txt même si on met aussi une metanoindex. Google ne va pas désindexer cette page.

Balise meta robots noindex

Format : <metaname="robots" content="noindex" />

Il ne faut pas indexer une page quand noindex l’indique au robot. Ce qui veut dire que le robot va crawler cette page. Pour éviter cela, il faut utiliser le fichier robots.txt

Ce cas n’est possible que si Google est autorisé à crawler la page. Une fois que la page est crawlée, elle sera rapidement désindexée et l’index sera supprimé.

Si, par malheur, une balise meta robots noindex a été mise sur page stratégique du site, la conséquence pour le référencement sera dramatique. Il faut repérer au plus vite cette erreur pour pouvoir la corriger en retirant la metanoindex.

Il existe une astuce pour repérer les pages non indexables en procédant à un audit technique gratuit RM Tech. Le rapport d’audit fournira de nombreux conseils pour le référencement.
Pour ce faire, on peut l’essayer sur MyRankingMetrics.