Recherche à facette : Définition, exemples et meilleures pratiques SEO

Recherche à facette : Définition, exemples et meilleures pratiques SEO

Sam Underwood
Sam Underwood est un consultant indépendant qui aide les entreprises de e-commerce à faire croître leurs revenus organiques via le SEO on-page, SEO technique et des stratégies de contenu.
Si vous avez tra­vail­lé sur n’importe quel type de site qui a besoin de gér­er un grand nom­bre d’éléments comme des annonces ou des listes, vous avez cer­taine­ment eu à faire avec la recherche à facette.

La recherche à facettes est une méth­ode d’UX large­ment util­isée pour aider les util­isa­teurs à trou­ver rapi­de­ment ce qu’ils cherchent. Le côté négatif est que cela implique beau­coup de com­pli­ca­tions SEO poten­tielles qu’il va fal­loir gérer.

Vous allez appren­dre dans ce guide :

La recherche à facettes (ou nav­i­ga­tion à facette) est un type de nav­i­ga­tion sou­vent trou­vé dans les pages d’archives ou de caté­gories avec de nom­breux élé­ments. Son objec­tif est d’aider les util­isa­teurs à trou­ver rapi­de­ment ce qu’ils recherchent grâce à plusieurs fil­tres selon les attrib­uts des éléments.

La plu­part des gens par­lent de recherche à facettes tout sim­ple­ment avec le terme “fil­tres”.

Vous trou­verez le plus sou­vent ce type de nav­i­ga­tion sur des pages caté­gorie de :

  • Sites e‑commerce comme AO.com.
  • Sites d’annonce d’emploi comme Indeed.
  • Sites de voyage/réservation comme Google Flights ou Airbnb.

Mais on peut aus­si en trou­ver sur d’autres sites de grande ampleur.

La recherche à facettes fonc­tionne via le fil­tre des élé­ments d’une page de caté­gorie selon les attrib­uts, comme dit plus haut, ce seront sou­vent des listes de :

  • Pro­duits
  • Hotels/vols
  • Emplois

Les attrib­uts peu­vent vari­er de site en site, mais les plus fréquents sont :

  • Prix
  • Couleur
  • Mar­que
  • Poids
  • Temps de trajet
  • Salaire
  • Quan­tité
  • Temps de livraison

Une fois que les admin­is­tra­teurs du site ont don­né les attrib­uts adéquats aux élé­ments, le site va les pro­pos­er aux util­isa­teurs dans une liste :

Ce qui arrive lorsqu’un util­isa­teur sélec­tionne un fil­tre va vari­er, mais en règle générale ce sera l’une de ces qua­tre choses :

  1. La liste va se met­tre à jour instan­ta­né­ment selon la sélec­tion sans recharg­er la page (via du JavaScript)
  2. La page recharge est la liste se met à jour (pas besoin de JavaScript)
  3. Lorsque l’utilisateur clique, rien ne se passe tant qu’il ne cliquent pas aus­si sur “Appli­quer”, ce qui va met­tre à jour la liste (encore une fois, avec du JavaScript).
  4. Lorsque l’utilisateur clique sur appli­quer les fil­tres, une nou­velle page se charge.

Les deux pre­mières options ont une UX sim­i­laire, mais dif­férente de la troisième.

L’UX choisie va dépen­dre de si votre util­isa­teur va avoir ten­dance à sélec­tion­ner plus d’un fil­tre. S’il a plutôt ten­dance à appli­quer plusieurs fil­tres, il est logique de ne les appli­quer que lorsqu’il a fini de les sélec­tion­ner et a cliqué sur le bou­ton pour valider.

Une fois que les fil­tres sont appliqués, l’URL peut éventuelle­ment se met­tre à jour pour refléter la sélec­tion. Ce qui arrive à l’URL à cette étape peut varier : 

  1. Ça ne change rien. La liste est mise à jour sans change­ment d’URL.
  2. Le site ajoute un paramètre à l’URL comme “?colour=blue&brand=samsung”.
  3. Le site ajoute un hash à l’URL pour iden­ti­fi­er la sélec­tion, par exem­ple #colour=blue
  4. Une nou­velle URL sta­tique est créée comme /jeans/bleu/ (l’utilisateur a ici choisi l’attribut “bleu”)

Les types de prob­lèmes qu’il va fal­loir prévoir ou cor­riger avec la mise en place d’une recherche à facette impliquent :

  • La dupli­ca­tion de contenu
  • Le gon­fle­ment de l’index (index bloat)
  • Explo­ration (crawl­ing)

Mal­heureuse­ment, la recherche à facettes peut poten­tielle­ment créer un nom­bre presque infi­ni de com­bi­naisons et d’URL index­ables. Si vous avez un prob­lème comme celui-ci, l’impact SEO risque d’être très important.

Voici quelques exem­ples de la manière dont ces prob­lèmes arrivent et leur impact sur le SEO de votre site :

Contenu dupliqué

On par­le de con­tenu dupliqué lorsque du con­tenu sim­i­laire est acces­si­ble via plusieurs URL. Les fil­tres sont con­nus pour créer des mass­es de con­tenu dupliqué. Ceci est prin­ci­pale­ment dû aux pages fil­trées qui sont des copies très proches de la page originale.

Si le con­tenu dupliqué n’est pas néces­saire­ment un mau­vais sig­nal de rank­ing, cela peut causer quelques problèmes :

Voici par exem­ple le site de e‑commerce currys.co.uk. Nous com­mençons par leur page écran PC HP. C’est une maque­tte de e‑commerce rel­a­tive­ment stan­dard, avec un head­er, une liste et une recherche à facettes :

Et, sous la liste de pro­duit, du con­tenu au sujet des écrans HP :

Main­tenant, appliquons le fil­tre “écran 4k”.

Vous ver­rez que la liste de pro­duit se met à jour, le H1 change et l’URL passe de :

/hp-computing/pc-monitors/pc-monitors/354_3057_30059_16_xx/xx-criteria.html

À :

/hp-4k-monitors/pc-monitors/pc-monitors/354_3057_30059_16_ba00012894-bv00311096/xx-criteria.html

Mais si vous scrollez jusqu’en bas de la page, le même bloc de con­tenu est tou­jours là, sous la liste de produits.

Ce n’est qu’un exem­ple de dupli­ca­tion sur le site. Met­tez ça à l’échelle de tous les fil­tres disponibles, et vous allez rapi­de­ment avoir des mil­lions de pages dupliquées que Google doit essay­er de rassem­bler en une seule page canonique.

Gonflement d’index (Index bloat)

Le gon­fle­ment d’index est lorsque les moteurs de recherche index­ent des pages de votre site qui n’ont aucune valeur de recherche.

Ne per­me­t­tre à Google d’indexer que des pages de qual­ité est très impor­tant, des pages indexées de basse qual­ité vont avoir un impact négatif glob­al sur votre site, comme John Mueller l’explique dans cette vidéo :

https://www.youtube.com/watch?v=B1UrnctsiZU&t=605s

La recherche à facettes peut poten­tielle­ment créer des mil­lions d’URL index­ables qui ne con­ti­en­nent aucun con­tenu unique. Cela peut aus­si créer des vari­antes de pages qui n’apportent aucune valeur ajoutée aux util­isa­teurs ou aux moteurs de recherche.

Voici un exemple : 

AO.com a une page de caté­gorie dédiée aux lave-linges non-encastrables

Un util­isa­teur peut vis­iter cette page et décider s’il veut fil­tr­er par :

  • Mar­que : Samsung
  • Capac­ité : Grande
  • Couleur : métallique
  • Fonc­tion­nal­ités : lavage rapide
  • Classe énergie : A

Grâce aux fil­tres, le site mon­tre les machines qui répon­dent pré­cisé­ment aux besoins de l’utilisateur.

Mais est-ce qu’un util­isa­teur va un jour faire une recherche aus­si pré­cise sur Google ?

Bien évidem­ment que non.

Nous le savons parce que nous avons une esti­ma­tion de recherche men­su­elle estimée de seule­ment 90 pour “lave-linge non encas­tra­ble” au Roy­aume-Uni, il y a donc très peu (aucune ?) chances que quelqu’un fasse une recherche plus spé­ci­fique comme “grand lave-linge sam­sung non encas­tra­ble avec fonc­tion lavage rapi­de et classe énergie A” 

Avoir des pages indexées qui ne cor­re­spon­dent pas à une demande et recherche et qui sont de basse qual­ité peut poten­tielle­ment pouss­er un algo­rithme à avoir un impact négatif sur votre site

Gâchis de budget de crawl

Google ne peut dédi­er qu’un mon­tant fini de ressources pour explor­er les pages de votre site. C’est ce qu’on appelle le bud­get de crawl.

Gér­er son bud­get de crawl n’est pas quelque chose que Google va con­sid­ér­er comme pri­or­i­taire à moins que vous ayez un énorme site (+1M pages uniques) ou grand (10k+ pages uniques) avec du con­tenu qui change rapidement.

Au vu de ce con­seil, si vous n’avez que quelques mil­liers de caté­gories et pro­duits, vous pour­riez vous dire que vous n’avez pas besoin de vous inquiéter de votre bud­get de crawl.

Ce serait une grave erreur.

Cer­taines recherch­es à facettes vont créer des liens explorables pour chaque com­bi­nai­son possible.

Sans par­ler des éventuels prob­lèmes de gon­fle­ment de l’index, cela veut dire que vous allez poten­tielle­ment génér­er des mil­lions d’URL à crawler par Google, vous allez vite devoir vous intéress­er au bud­get de crawl.

Vous pou­vez trou­ver un exem­ple sur le site de next.co.uk :

En inspec­tant le code HTML de la recherche à facette, vous ver­rez un lien :

Une fois que vous aurez suivi ce lien, vous pou­vez véri­fi­er le code HTML d’un autre résul­tat comme le bleu :

Vous voyez que la com­bi­nai­son de ces facettes crée une nou­velle URL à crawler.

Prenez main­tenant en compte les poten­tielles com­bi­naisons de tous les fil­tres disponibles. Vous allez vite voir pourquoi une nav­i­ga­tion à facettes peut pos­er des prob­lèmes à un moteur de recherche.

Dilution du PageRank

La recherche à facettes peut aus­si diluer le PageR­ank qui passe sur votre site.

C’est parce que le PageR­ank est divisé par le nom­bre total de liens sur la page. Le prob­lème inhérent avec la recherche à facette est que cela crée un grand nom­bre de liens internes.

Donc au lieu de pass­er le PageR­ank vers vos pro­duits ou caté­gories impor­tantes, cela va l’envoyer vers des liens au sein de vos fil­tres, ce qui dans la plu­part des cas ne va pas vous aider à amélior­er le traf­ic organique.

Lec­ture recom­mandée : Google PageR­ank is NOT Dead: Why It Still Matters

Il y a tou­jours des signes évi­dents de prob­lèmes liés à la recherche à facettes, voici quelques étapes à suiv­re pour voir si vos fil­tres font du mal à votre SEO.

1. Commencez par une recherche site :

Une excel­lente tac­tique pour véri­fi­er le gon­fle­ment d’index rapi­de­ment est d’utiliser l’opéra­teur de recherche site :. Si ce n’est pas for­cé­ment très pré­cis, c’est rapi­de et facile à faire.

C’est très sim­ple : ajouter “site :” devant votre nom de domaine, comme ci-dessous.

Notez le nom­bre de résul­tats que remonte Google. Est-ce que cela vous sem­ble plus élevé que le nom­bre d’URL que vous savez disponibles sur votre site ?

Si c’est le cas, c’est le pre­mier signe d’un prob­lème de gon­fle­ment de l’index.

2. Confirmez avec le rapport de couverture de la Google Search Console (GSC)

Le rap­port de cou­ver­ture de la GSC est un excel­lent moyen de repér­er les prob­lèmes de crawl et d’indexation rapidement.

Ren­dez-vous sim­ple­ment dans le rap­port “Couverture”dans GSC et sélec­tion­nez “valides” sur le graphique pour avoir un nom­bre pré­cis des pages indexées par Google :

Si cela vous sem­ble élevé, ou que vous avez récem­ment mis en place une recherche à facette et que ça a crevé le pla­fond, cela tend vers un prob­lème de gon­fle­ment d’index comme dit au-dessus.

Mais com­ment savoir si c’est à cause des filtres ?

Un bon sitemap va vous aider à diag­nos­ti­quer le prob­lème. Si vous l’avez chargée dans la GSC, le tableau sous le graphique va divis­er les URL en :

  • Indexée, non soumise dans le sitemap
  • Soumise et indexée

Cela veut dire que nous pou­vons regarder les pages “Indexées, non soumis­es dans le sitemap” pour voir quelles sont les pages indexées par Google que vous ne voulons pas :

Cet exem­ple est un site de paris qui vous per­met de fil­tr­er par lieux et tournois. Nous voyons que Google indexe des URL non souhaitées.

Une autre méth­ode pour décou­vrir des prob­lèmes poten­tiels est de fil­tr­er par URL “Exclues” :

Analyser les URL “Explorées, actuelle­ment non indexées” peut vous don­ner des infor­ma­tions sur les pages que Google a décou­vertes, mais a décidé de ne pas les indexer.

Google ne va pas index­er tout ce qu’il explore. Si les pages ne sont pas de bonne qual­ité comme la plu­part des pages de facettes, il peut décider de ne pas les indexer.

Dans cet exem­ple, nous savons qu’il y a plus de 1000 pages que Google a décou­vertes qu’il pour­rait index­er dans le futur. Nous voyons aus­si les URL issues de Facettes en cli­quant sur le rapport.

Ce qu’il y a au-dessus est un exem­ple rel­a­tive­ment stan­dard de prob­lèmes issus de la recherche à facette mis en avant par la GSC. Au fil du temps, ces prob­lèmes peu­vent devenir des cen­taines de mil­liers d’URL décou­vertes, mais non indexées (ce qui va mon­tr­er les poten­tiels prob­lèmes de crawl) :

Ou encore des cen­taines de mil­liers d’URL indexées alors qu’elles ne devraient pas l’être :

3. Obtenir plus de données avec un audit de site

Utilis­er la recherche et la GSC est un très bon moyen pour obtenir des don­nées rapi­des sur un prob­lème, mais aucun ne vous mon­tr­era toutes les URL indexables/indexées, ce qui va ren­dre dif­fi­cile de voir les cor­réla­tions et l’échelle du problème.

Un out­il d’audit de site comme celui de Ahrefs peut vous aider à remédi­er à ce prob­lème en vous don­nant des infor­ma­tions détail­lées sur les URL décou­vertes en explo­rant le site.

L’exemple ci-dessous est celui d’un site avec des prob­lèmes de recherche à facette qui provo­quent un gâchis de bud­get de crawl, vous pou­vez les repér­er en quelques clics.

Pour com­mencer, ren­dez-vous dans le rap­port index­a­bil­ité dans la barre de gauche.

Ensuite, jetez un œil à la “dis­tri­b­u­tion d’indexabilité” pour voir si quelque chose vous sem­ble étrange.

À par­tir d’un crawl par­tiel, l’Audit de site a trou­vé 39 URL non index­able pour chaque URL index­able. Comme ce n’est qu’un crawl par­tiel, on peut s’attendre à ce que ce ratio entre index­able et non index­able va sans doute s’aggraver.

Ce que l’on voit au-dessus est un ter­ri­ble gâchis de bud­get de crawl, c’est aus­si un excel­lent exem­ple de piège à crawler : où des prob­lèmes tech­niques vont créer un nom­bre qua­si infi­ni d’URL inutiles que les bots vont explorer.

Si votre recherche à facette provoque un gon­fle­ment de l’index (index bloat), le graphique que vous allez voir sera dif­férent. Plutôt qu’un grand nom­bre d’URL non-index­able, vous ver­rez un grand nom­bre d’URL index­ables comme sur ce que vous voyez en dessous.

Pour con­firmer que c’est un prob­lème lié à la recherche à facettes, sélec­tion­nez la por­tion non index­able du graphique et analy­sez la liste. Vous ver­rez un tableau de toutes les pages non index­ables explorées.

C’est ici que vous allez devoir trou­ver les points communs.

Qu’est-ce qui fait que les crawlers con­sid­èrent que ces pages ne sont pas indexables ?

Si la grande majorité des URL qui remon­tent dans le tableau sont issues des fil­tres, vous faites face à un prob­lème de recherche à facette.

Main­tenant que vous savez com­ment trou­ver les prob­lèmes de recherche à facettes, voici com­ment les régler.

1. Corrigez l’indexation avec une balise canonique

Si vous ren­con­trez des prob­lèmes d’indexation, mais pas de grave prob­lème de bud­get de crawl (et n’avez pas un site immense), la meilleure solu­tion est sans doute d’utiliser la balise canon­ique. Cela ren­force les sig­naux de lien pour les pages similaires/dupliquées vers l’URL que vous définis­sez comme canonique.

L’intérêt ?

Si vous avez des liens vers une page à facette, qui sont canon­isées vers la page sans facette, les sig­naux de ces liens ne sont pas per­dus. Les moteurs de recherche vont les ren­voy­er vers la page de caté­gorie, ce qui va les aider à bien se positionner.

Voici un exem­ple de com­ment faire…

Imag­i­nons que ce soit l’URL de votre page de catégorie :

https://exemple.com/lave-linge/samsung/

Votre URL à facette fonc­tionne avec des paramètres, donc lorsque quelqu’un applique des fil­tres, l’URL ressem­ble à ceci :

https://exemple.com/lave-linge/samsung/?drumsize=16kg&color=silver&energyrating=A

Sur l’URL à facette au-dessus, vous pou­vez sim­ple­ment ajouter une balise canon­ique pour point­er vers la page caté­gorie, elle ressem­blerait à ça :

<link rel="canonical" href="https://exemple.com/lave-linge/samsung/" />

Ou de cette manière dans vos head­ers HTTP :

Link : <https://exemple.com/lave-linge/samsung/>; rel="canonical"

Si cela sem­ble sim­ple et facile à faire pour un si gros prob­lème SEO, comme tou­jours, il y a des prob­lèmes poten­tiels. Le prin­ci­pal : que Google ignore votre balise canonique.

Tout sim­ple­ment parce que les balis­es canon­iques ne sont que des sug­ges­tions pour moteurs de recherche, pas des ordres. Si Google, pour une rai­son ou pour une autre, vient à penser que vous avez fait une erreur avec cette balise, il pour­rait décider de l’ignorer.

Les raisons les plus fréquentes pour lesquelles Google peut décider d’ig­nor­er votre balise canon­ique sont :

  • Les pages ne sont pas dupliquées. Si vos pages à facettes changent de manière sig­ni­fica­tive lorsque vous appliquez un fil­tre, Google va cer­taine­ment penser que ce n’est pas du con­tenu dupliqué. Par exem­ple, si votre con­tenu, titres et head­er change, Google peut s’y perdre.
  • Vous faites des liens internes vers les pages à facettes. Si vous avez beau­coup de liens internes qui pointent vers une page à facette qui a une page canonique,Google peut ignor­er votre balise.

Si vous ne voyez pas le nom­bre d’URL valides dans votre rap­port de cou­ver­ture après avoir mis en place des balis­es canon­iques, passez à l’étape 2.

2. Utilisez le rapport de paramètre URL de la Search Console

Si la canon­i­sa­tion ne règle pas les prob­lèmes d’indexation, le rap­port de paramètres d’URL dans la GSC est sans doute votre meilleure chance d’optimiser le crawl. Cela vous per­met de dire à Google com­ment gér­er les paramètres d’URL pour une meilleure exploration.

Le point négatif de cette méth­ode est qu’elle ne fonc­tionne que si votre recherche à facettes utilise des paramètres d’URL (si ce n’est pas le cas, passez à l’étape 3).

L’utilisation du rap­port de paramètre d’URL est rel­a­tive­ment sim­ple : ajoutez les paramètres, dites à Google com­ment cela affecte le con­tenu de la page et s’il existe des excep­tions à la règle de ce qu’il devrait explorer.

Note.
Si vous empêchez déjà le crawl via robots.txt, cela ne fera aucune différence

3. Fix crawling with robots.txt

Si vous faites face à un prob­lème de bud­get de crawl et que vous n’avez pas besoin de con­solid­er les sig­naux, vous allez devoir utilis­er robots.txt pour empêch­er Google d’explorer les URL à facette.

Pour blo­quer le crawl d’URL avec robots.txt, ajouter une règle dis­al­low comme ci-dessous :

User-agent : *

Disallow: *size=*

Dans l’exemple ci-dessus, nous avons util­isé deux jok­er (*) autour des paramètres. Si votre nav­i­ga­tion à facettes ne fonc­tionne pas en ajoutant des direc­to­ries, votre règle devrait ressem­bler à ça :

User-agent : *

Disallow: */size/*

Il y a deux cas où le robots.txt ne va pas bien fonctionner :

  • Vous n’avez pas de règle dis­cern­able dans le change­ment d’URL pour les dis­al­low. Peut-être que chaque pas va avoir des paramètres uniques.
  • Vous voulez autoris­er cer­tains pat­terns d’URL à être indexés et en blo­quer d’autres. Par exem­ple, vous voulez peut-être que le réper­toire /couleur/ puisse être crawlée pour la caté­gorie T‑shirt (ça a un intérêt dans la recherche), mais voulez le dés­ac­tiv­er pour la caté­gorie sous-vête­ments. Si vous pour­riez con­tourn­er cela en mélangeant des règles “Allow” et “Dis­al­low” dans le robots.txt, cela peut vite devenir com­pliqué à gér­er sur des sites à grande échelle.

Vous devez aus­si savoir que blo­quer le crawl ne va pas néces­saire­ment empêch­er Google d’indexer les URL blo­quées. En règle générale, Google va retir­er les URL blo­quées de l’index, mais seule­ment si elles n’ont pas de back­links et/ou beau­coup de liens internes qui y pointent. En d’autres ter­mes, tant que rien d’autre ne sig­nale à Google que ces URL ont de la valeur.

4. Retirez les liens internes vers les URL à facettes ou les passer en Nofollow

Si blo­quer le crawl­ing n’élimine pas com­plète­ment les prob­lèmes d’indexation issus de la recherche à facettes, met­tre les liens internes vers ces URL en nofol­low pour­rait régler le problème.

Il y a générale­ment deux sources à ces liens :

  1. Les liens de recherche à facettes. Par exem­ple, les liens au sein de votre nav­i­ga­tion à facettes.
  2. D’autres liens sur votre site. Par exem­ple des arti­cles de blog.

Pour les liens de recherche à facettes, appli­quer un blan­ket nofol­low est rel­a­tive­ment sim­ple quand on con­naît les bases du code. Mais ce n’est peut-être pas la meilleure idée si vous avez des balis­es canon­i­cal sur les URL à facette et/ou des URL à facettes que vous voulez index­er. Si Google finit par ne pas explor­er ces liens parce qu’ils sont en nofol­low, cela peut provo­quer des prob­lèmes d’indexation.

L’alternative est de choisir une à une les facettes à met­tre en nofol­low. C’est un peu plus dif­fi­cile à met­tre en place d’un point de vue tech­nique, mais peut val­oir la peine si vous cherchez à vis­er des requêtes longue-traîne via la recherche à facettes (je vais dévelop­per plus bas).

Le prin­ci­pal prob­lème de cette approche est qu’elle est moins utile depuis que Google a com­mencé à con­sid­ér­er le rel=’nofollow’ comme une indi­ca­tion, ce n’est pas une direc­tive comme robots.txt.

Cela dit, Google va se servir du nofol­low interne pour déter­min­er que l’URL avec l’attribut href en ques­tion n’est pas très impor­tante et qu’elle n’est donc pas prioritaire.

John Mueller l’a con­fir­mé :

[…] Nous allons con­tin­uer à nous servir de ces liens nofol­low comme un sig­nal pour nous dire que :
  • Ces pages ne sont pas si intéressantes
  • Google n’a pas besoin de les explorer
  • Elles n’ont pas besoin d’être util­isées pour le posi­tion­nement ou l’indexation
John Mueller
John Mueller, Search Advo­cate Google
Note.
Cette approche ne cor­rige pas le prob­lème de dilu­tion du PageR­ank. Le PageR­ank va tou­jours être dis­tribué à tra­vers tous les liens de la page, même ceux avec l’attribut nofol­low. Si vou voulez cor­riger cela, il va fal­loir véri­ta­ble­ment met­tre en place une canon­i­sa­tion propre 

Pour les liens qui se trou­vent ailleurs sur votre site, votre meilleure chance reste de les retirer.

Vous pou­vez trou­ver les liens internes qui pointent vers des URLS issus de facettes en util­isant l’Explo­rateur de site de Ahrefs :

  1. Entrez l’URL en question
  2. Ren­dez-vous dans le rap­port Back­links internes
  3. Fil­trez les liens dofol­low

Vous pou­vez ensuite sim­ple­ment chercher les liens internes “fol­low” sur votre site pour les retirer.

5. Corrigez définitivement l’indexation avec la balise noindex

Si vous avez tou­jours des prob­lèmes d’indexation après avoir suivi les étapes ci-dessus, votre dernière chance est la balise noin­dex.

L’intérêt de la balise noin­dex est que c’est une manière sûre d’empêcher l’indexation des pages issues des facettes. Le prob­lème est que cela ne va pas ren­forcer les sig­naux de rank­ing et, au fil du temps, Google pour­rait arrêter d’explorer les liens internes sur une page noin­dex, ce qui veut dire ne pas faire pass­er de sig­nal de ranking.

Mais cela reste une bonne méth­ode pour retir­er les URL de facettes de l’index de Google si rien d’autre ne fonctionne.

Pour met­tre cela en place, ajoutez sim­ple­ment soit une balise de meta robots dans le <head> d’une URL Facette :

<meta name="robots" content="noindex">

Our le X‑Robots head­er dans le head­er HTTP de votre URL facette :

X-Robots-Tag: noindex

Ensuite, vous devez retirer/ajuster tous les blocages de crawl pour l’URL dans le robots.txt ou l’outil de paramètres d’URL. SI vous ne le faites pas, Google ne ver­ra jamais la direc­tive noin­dex, donc la page restera indexée.

Lec­ture recom­mandée : Robots Meta Tag & X‑Ro­bots-Tag: Every­thing You Need to Know

À la lec­ture des par­ties précé­dentes, vous avez dû vous ren­dre compte que cor­riger tous les prob­lèmes poten­tiels liés à la recherche à facette n’est pas facile.

Toute approche pour cor­riger l’indexation ou l’exploration peut présen­ter de mau­vais côtés ou des complications.

Mais il existe une meilleure méthode.

Imag­i­nons que vous met­tiez en place une nou­velle recherche à facettes ou que vous en créez une pour la pre­mière fois. Dans ce cas-là, pour pou­vez cir­con­venir à tous les prob­lèmes cités plus haut tout en soignant votre UX.

Voici com­ment y parvenir. 

1. Utilisez AJAX et évitez les liens internes

Tout d’abord, con­stru­isez votre recherche à facettes avec AJAX et n’ajoutez pas de liens internes <a href=…>.

En faisant cela, vous allez amélior­er l’expérience util­isa­teur car la page ne va pas se recharg­er à chaque nou­veau fil­tre et Google ne ver­ra pas de lien interne vers des pages à facette, ce qui veut dire :

  • Qu’il ne va pas les explorer
  • Elles ne seront donc pas indexées
  • Ce qui évite la poten­tielle dilu­tion de PageRank

Voici un exemple.

Nous avons inté­gré une recherche à facette dans le plu­g­in Word­Press WP Grid Builder sur une ressource que j’ai créée appelée la SEO Tool­belt.

Ça ressem­ble à ça :

Lorsque vous faites clic droit et inspecter sur n’importe laque­lle des cas­es pour appli­quer un fil­tre, vous ver­rez qu’elles ne con­ti­en­nent pas de lien<a href=…>, ce qui va empêch­er Google d’explorer des URL supplémentaires.

Ain­si, j’ai évité d’avoir à ne serait-ce que penser à la perte de bud­get de crawl à cause de la nav­i­ga­tion à facettes.

2. Assurez-vous que les URL puissent être partagées

Ensuite, il faut s’assurer que lorsqu’un util­isa­teur clique sur un fil­tre, l’URL change.

Je recom­mande cette méth­ode car nous avons con­crète­ment changé le con­tenu de la page et, dans l’idéal, si un util­isa­teur la met en favori, fait un lien vers la page ou partage l’URL avec un ami, cela va sélec­tion­ner les fil­tres et les appli­quer directe­ment lorsque le lien/favori/partage sera cliqué.

Il y a deux méth­odes pour le faire :

  • Paramètre d’URL (?)
  • Hash­es d’URL (#)

La meilleure solu­tion est le hash­es d’URL, Google a ten­dance à ignor­er tout ce qui se trou­ve der­rière le hash dans une URL.

WP Grid Builder utilise des paramètres, donc après avoir appliqué les fil­tres, l’URL change ainsi :

https://seotoolbelt.co/tools/auditing/?_tool_type=browser-extension

Si vous accédez à cette URL, vous ver­rez des grilles d’outils fil­trés qui cor­re­spon­dent aux cas­es cochées.

Dans cet exem­ple, comme j’utilise des paramètres d’URL, je dois aus­si ajouter une balise canon­ique à la ver­sion de l’URL sans les paramètres, celle-ci :

https://seotoolbelt.co/tools/auditing/

Comme ces ver­sions paramétrées des URL ne reçoivent pas de lien interne et qu’il y a peu de chance qu’elles reçoivent des back­links (ce qui serait le seul moyen pour Google de les trou­ver), nous avons peu de chance qu’elles posent problème.

3. Produisez des crawl path alternatifs pour les pages importantes

Dans cer­tains cas, une ver­sion fil­trée d’une page peut être intéres­sante pour la recherche organique.

Par exem­ple, il y a des fil­tres pour “Fire­fox” et “Chrome” sur ma page pour l’extension de nav­i­ga­teur SEO, ces deux pages ont du poten­tiel de recherche.

Il faut donc s’assurer que les URL créées soient index­ables. Le meilleur moyen d’y par­venir est de met­tre en place des chemins d’exploration (crawl paths) vers ces pages. J’ai fait cela en ajoutant des liens de sous-nav­i­ga­tion à des ver­sions index­ables de ces pages fil­trées en haut de page.

Ces “sous-fil­trages” sont générés en se bas­ant sur les mêmes attrib­uts que la ver­sion à facette, mais je dois les génér­er consciemment.

Cela a per­mis plusieurs choses :

  • J’ai empêché le gâchis de bud­get de crawl, puisque je ne fais pas de lien interne vers les pages filtrées
  • Les pages fil­trées restent partage­ables, ce qui est une bonne chose en UX
  • Si une page fil­trée a du poten­tiel de recherche, je peux manuelle­ment per­me­t­tre à la page d’être indexée.

Comme vous pou­vez le voir, cela va grande­ment vous sim­pli­fi­er la vie en ter­mes de SEO et n’a pas de désavantages.

Jusqu’ici, je n’ai fait que présen­ter la recherche à facettes que comme quelque chose qui implique des com­pli­ca­tions SEO. Mais elle peut aus­si être util­isée pour attir­er plus de traf­ic via une stratégie de mots-clés longue traîne.

Je ne peux qu’insister sur les incroy­ables béné­fices que cela peut attir­er. Les don­nées Ahrefs mon­trent que 99,84 % des mots-clés reçoivent moins de 1000 recherch­es par mois, et représen­tent 29,33% de la total­ité de requêtes :

​​

Les URL facettes sont idéales pour attir­er du traf­ic longue traîne, car elles pro­posent des ver­sions plus spé­ci­fiques des pages qui visent des requêtes plus larges.

Com­mençons par les étapes qui vont vous per­me­t­tre de repér­er les oppor­tu­nités d’attirer plus de traf­ic longue-traîne. Ensuite, nous ver­rons com­ment implé­menter des actions concrètes.

1. Identifier les variations longue-traîne de mots-clés 

Pour com­mencer, vous allez devoir iden­ti­fi­er les oppor­tu­nités de mots-clés grâce à l’Explorateur de mots-clés Ahrefs. C’est extrême­ment simple.

Entrez le nom d’une caté­gorie que vous avez déjà sur votre titre comme “jeans taille haute”

Allez dans le rap­port “Match­ing Terms” (ter­mes correspondants)

Utilisez la side­bar et changez l’onglet sur “Par­ent Top­ic” (sujet parent)

En faisant cela, l’outil va regrouper tous les mots-clés avec un SERP sim­i­laire ensem­ble. Vous pou­vez ensuite analyser la liste pour choisir les pages facettées poten­tielles qu’il vaudrait le coup de faire index­er. En voici quelques-unes que j’ai repérées depuis la cap­ture d’écran ci-dessus :

  • high rise boot­cut jeans (1 900 recherches)
  • high rise skin­ny jeans (1 800 recherches)
  • high rise wide leg jeans (1 300 recherches)
  • ultra high rise jeans (970 recherches)
  • high waist­ed boyfriend jeans (700 recherches)
  • high rise super skin­ny jeans (380 recherches)
  • high waist­ed white jeans (360 recherches)

2. Rendez ces pages indexables

Vous devez ensuite ren­dre les pages qui cor­re­spon­dent à ces fil­tres à la fois explorables et index­ables par Google.

Ma méth­ode va dépen­dre de votre type de recherche à facette.

Recherche à facettes avec liens internes

Si vous avez inté­gré une recherche à facettes qui n’est pas con­fig­urée comme il le faudrait et qui a des liens internes vers chaque facette, vous avez besoin de vous assur­er que pour chaque URL :

  • La balise canon­ique est en self-reference
  • La balise noin­dex est retirée (si applicable)
  • Toutes les règles dis­al­low applic­a­bles ont été retirées du robots.txt (ou que vous avez mis des règles allow)
  • Tous les attrib­uts nofol­low ont été retirés des liens internes (si applicable)

Ce qu’il faut pré­cisé­ment faire dépend de la manière dont l’ensemble est con­fig­uré, mais ce qui est impor­tant est que les moteurs de recherche puis­sent explor­er et index­er ces pages.

Recherche à facettes AJAX avec des liens internes

Vous allez avoir à créer des pages de sous-caté­gorie pour avoir une nav­i­ga­tion à facette idéale comme men­tion­né dans la par­tie précédente.

C’est néces­saire parce que la recherche à facettes ne génère pas de liens internes, vous ne pou­vez donc pas l’utiliser pour créer ces pages à votre place.

La plu­part des plate­formes de e‑commerce ren­dent pos­si­ble la créa­tion de sous-caté­gories, mais dans l’idéal il vous faut d’autres fonc­tion­nal­ités sur lesquelles baser les sous-caté­gories de pro­duit selon les fil­tres de la caté­gorie par­ente. C’est prin­ci­pale­ment pour éviter d’avoir à opti­miser chaque sous-caté­gorie manuelle­ment. Ain­si, vous aurez l’avantage de génér­er rapi­de­ment des pages, à la manière d’une recherche à facettes, tout en évi­tant les com­pli­ca­tions SEO.

Par exem­ple, si vous créez une caté­gorie “jeans taille haute slim”, nous allons vouloir hérit­er du list­ing de pro­duits de “jeans taille haute”, mais qui ne mon­treront que les pro­duits qui ont aus­si l’attribut “slim” d’appliqué.

3. Optimisez les URL pour les recherches

C’est rel­a­tive­ment évi­dent, mais il faut pass­er par les fon­da­men­taux de l’optimisation SEO, comme :

  • Avoir des URL sim­ples et lis­i­ble, dans l’idéal, votre URL serait : /jeans/taille-haute/slim/, et non /jeans/taille-haute/?fit_variant=slim
  • Des balis­es title, meta descrip­tion et de head­er optimisées
  • Du con­tenu rédac­tion­nel unique
  • L’ajout des URL aux sitemaps XML

Les prin­ci­pales com­pli­ca­tions sont dans les con­fig­u­ra­tions où vous retirez une page facettée hors des con­trôles d’in­dex­a­tion et d’exploration par défaut.

C’est tout sim­ple­ment parce que, tech­nique­ment, les pages facettées sont dynamiques par essence et donc dif­férentes de la créa­tion d’une nou­velle sous-catégorie.

Des fonc­tion­nal­ités per­son­nal­isées sont néces­saires pour paramétr­er cor­recte­ment ces opti­mi­sa­tions on-page de pre­mière importance.

Conclusion

J’espère que vous avez bien com­pris les risques que peu­vent représen­ter la recherche à facettes pour le SEO, mais aus­si les belles oppor­tu­nités qu’elle peut représen­ter pour les requêtes longue-traîne.

Vous avez des ques­tions sur la recherche à facette ? Je suis sur Twit­ter.