Googlebot Evergreen : Googlebot utilise dorénavant la dernière version de Chrome

A l’occasion du rĂ©cent Ă©vĂ©nement Google I/O, Google a annoncĂ© que son bot explorait dorĂ©navant le web en utilisant la […]

Mathieu CHAPON

A l’occasion du rĂ©cent Ă©vĂ©nement Google I/O, Google a annoncĂ© que son bot explorait dorĂ©navant le web en utilisant la dernière version de Chrome. En clair, Googlebot se comporte maintenant comme un Chrome version 74, et non 41 !
Mais qu’est-ce que cela change concrètement ?

Sundar Pichai sur la scene du Google I/O 2019

Googlebot passe en mode « evergreen »
Lorsque Google a rĂ©vĂ©lĂ© que Googlebot Ă©tait capable d’exĂ©cuter le javascript pour indexer les contenus gĂ©nĂ©rĂ©s cĂ´tĂ© navigateur, ils avaient Ă©galement prĂ©cisĂ© que cette version de leur crawler tournait sur Chrome 41. A l’Ă©poque, cette version du navigateur Ă©tait dĂ©jĂ  obsolète. Mais c’Ă©tait un premier pas, et Martin Splitt, l’un des ingĂ©nieurs travaillant sur le crawler avait expliquĂ© il y’a dĂ©jĂ  de nombreux qu’ils travaillaient Ă  une nouvelle version « evergreen ».
« evergreen », c’est l’adjectif imagĂ© pour dĂ©crire les processus ou les logiciels qui ne deviennent jamais obsolètes. En fait, l’idĂ©e de dĂ©part Ă©tait d’exploiter les fonctionnalitĂ©s « headless » incluses dans les versions rĂ©centes de Chromium, et donc de remplacer l’ancien Googlebot par Chromium. Cela permet de mettre Ă  jour Googlebot au fur et Ă  mesure du dĂ©ploiement des nouvelles versions de Chromium, et donc de faire reposer sur la communautĂ© de dĂ©veloppement Chromium le soin de mettre Ă  jour … Googlebot.
Cette version avancĂ©e du crawler n’est pas utilisĂ©e Ă  chaque fois, le crawl se passe toujours en deux temps
Martin Splitt a rappelĂ© Ă  l’occasion de cette annonce que le crawl de Google se passe toujours en deux temps : le code est crawlĂ© une première fois, sans exĂ©cuter le javascript. Et c’est seulement dans un deuxième temps que le crawler capable d’exĂ©cuter le javascript explorera la page.
Martin Split a expliquĂ© qu’ils travaillaient sur un processus qui fonctionnerait en une passe au lieu de deux. Il n’a donnĂ© aucune prĂ©cision sur la date Ă  laquelle cette nouvelle architecture de crawl serait mise en place.
Le User Agent n’a pas (encore) changĂ©, et c’est volontaire
Google n’a pas encore changĂ© le User Agent de cette nouvelle version de Googlebot, donc mĂŞme si vous voyez ceci dans vos logs, en rĂ©alitĂ© c’est une version Chrome 74 qui est en fait utilisĂ©e. Pourquoi cet « oubli » ? En fait c’est volontaire, car certains scripts qui dĂ©tectent les bots des moteurs de recherche devront ĂŞtre mis Ă  jour, et Google veut donner du temps aux dĂ©veloppeurs pour corriger leur code. Martin Split prĂ©pare un billet de blog pour expliquer comment le faire.

Le « vieux » Googlebot est toujours utilisé dans certains outils
Attention, les renditions obtenues dans la Google Search Console, ou l’outil de compatilitĂ© mobile, continuent d’utiliser l’ancienne version de Googlebot, qui se comporte comme un Chrome 41.
NĂ©anmoins, il est facile dorĂ©navant de tester ce que voit le Googlebot actuel en utilisant Chromium en mode « headless browser » Ă  l’aide d’instruction entrĂ©es dans la console en mode « ligne de commandes ». On peut Ă©galement utiliser le couple « Puppeteer / Chromium » pour crĂ©er des scripts plus complexes.

Puppeteer est un excellent outil pour piloter la version « headless » de Chrome (surnommée « Chromeless »).

Qu’est-ce que cela change ?

Dès lors que Googlebot exploite la dernière version de Chromium, cela signifie que de nombreuses fonctionnalités avancées des browsers sont dorénavant compatibles avec Googlebot, et peuvent être exploitées. Voici ci-dessous la liste des fonctionnalités non supportées dans Chrome 41 et qui deviennent supportées par la nouvelle version de Googlebot.

Est-ce que cela veut dire que je peux me lâcher et faire un site en full javascript ou en mode SPA et avoir un bon référencement ?
MĂŞme si le Googlebot Evergreen annonce un meilleur support des fonctionnalitĂ©s avancĂ©es des browsers, notamment en ce qui concerne le support avancĂ© du Javascript, cette nouvelle version doit respecter les mĂŞmes contraintes que l’ancienne, et rien ne change concernant les recommandations :

  • le « Server Side Rendering » reste la solution la plus sĂ»re pour crĂ©er un site facile Ă  crawler et Ă  comprendre par un moteur de recherche
  • le « Client Side Rendering » pose toujours des problèmes, surtout si le code est lent Ă  s’exĂ©cuter, boguĂ©, ou si les actions pour gĂ©nĂ©rer le contenu sont peu susceptibles d’ĂŞtre comprises par un bot
  • le Dynamic Rendering est la solution prĂ©conisĂ©e par Google
  • Mais un « hybrid rendering » bien fait est plus facile Ă  maintenir, et donne d’excellents rĂ©sultats.
  • Voici un rappel des articles dĂ©jĂ  rĂ©digĂ©s sur le sujet :
    • https://www.search-foresight.com/john-mueller-recommande-le-dynamic-rendering-chez-search-foresight-on-napprouve-pas/
    • https://www.search-foresight.com/google-explique-comment-implementer-le-dynamic-rendering/
Sommaire
Echangeons sur votre projet

Découvrez nos autres articles