Recherche à facette : Définition, exemples et meilleures pratiques SEO

Sam Underwood
Sam Underwood est un consultant indépendant qui aide les entreprises de e-commerce à faire croître leurs revenus organiques via le SEO on-page, SEO technique et des stratégies de contenu.
Statistiques de l'article
  • Backlinks 2
Données de Explorateur de contenu

Montre combien de site différents font un lien vers ce contenu. En règle générale, plus vous avez de sites qui vous donnent un backlink, plus haut vous êtes positionné dans Google.

Montre le trafic mensuel estimé pour cet article selon les données Ahrefs. Le trafic organique réel (issu de Google Analytics) est généralement 3 à 5 fois plus élevé.

Le nombre de fois que cet article a été partagé sur Twitter.

    Si vous avez tra­vail­lé sur n’importe quel type de site qui a besoin de gér­er un grand nom­bre d’éléments comme des annonces ou des listes, vous avez cer­taine­ment eu à faire avec la recherche à facette.

    La recherche à facettes est une méth­ode d’UX large­ment util­isée pour aider les util­isa­teurs à trou­ver rapi­de­ment ce qu’ils cherchent. Le côté négatif est que cela implique beau­coup de com­pli­ca­tions SEO poten­tielles qu’il va fal­loir gérer.

    Vous allez appren­dre dans ce guide :

    La recherche à facettes (ou nav­i­ga­tion à facette) est un type de nav­i­ga­tion sou­vent trou­vé dans les pages d’archives ou de caté­gories avec de nom­breux élé­ments. Son objec­tif est d’aider les util­isa­teurs à trou­ver rapi­de­ment ce qu’ils recherchent grâce à plusieurs fil­tres selon les attrib­uts des éléments.

    La plu­part des gens par­lent de recherche à facettes tout sim­ple­ment avec le terme “fil­tres”.

    Vous trou­verez le plus sou­vent ce type de nav­i­ga­tion sur des pages caté­gorie de :

    • Sites e‑commerce comme AO.com.
    • Sites d’annonce d’emploi comme Indeed.
    • Sites de voyage/réservation comme Google Flights ou Airbnb.

    Mais on peut aus­si en trou­ver sur d’autres sites de grande ampleur.

    La recherche à facettes fonc­tionne via le fil­tre des élé­ments d’une page de caté­gorie selon les attrib­uts, comme dit plus haut, ce seront sou­vent des listes de :

    • Pro­duits
    • Hotels/vols
    • Emplois

    Les attrib­uts peu­vent vari­er de site en site, mais les plus fréquents sont :

    • Prix
    • Couleur
    • Mar­que
    • Poids
    • Temps de trajet
    • Salaire
    • Quan­tité
    • Temps de livraison

    Une fois que les admin­is­tra­teurs du site ont don­né les attrib­uts adéquats aux élé­ments, le site va les pro­pos­er aux util­isa­teurs dans une liste :

    Ce qui arrive lorsqu’un util­isa­teur sélec­tionne un fil­tre va vari­er, mais en règle générale ce sera l’une de ces qua­tre choses :

    1. La liste va se met­tre à jour instan­ta­né­ment selon la sélec­tion sans recharg­er la page (via du JavaScript)
    2. La page recharge est la liste se met à jour (pas besoin de JavaScript)
    3. Lorsque l’utilisateur clique, rien ne se passe tant qu’il ne cliquent pas aus­si sur “Appli­quer”, ce qui va met­tre à jour la liste (encore une fois, avec du JavaScript).
    4. Lorsque l’utilisateur clique sur appli­quer les fil­tres, une nou­velle page se charge.

    Les deux pre­mières options ont une UX sim­i­laire, mais dif­férente de la troisième.

    L’UX choisie va dépen­dre de si votre util­isa­teur va avoir ten­dance à sélec­tion­ner plus d’un fil­tre. S’il a plutôt ten­dance à appli­quer plusieurs fil­tres, il est logique de ne les appli­quer que lorsqu’il a fini de les sélec­tion­ner et a cliqué sur le bou­ton pour valider.

    Une fois que les fil­tres sont appliqués, l’URL peut éventuelle­ment se met­tre à jour pour refléter la sélec­tion. Ce qui arrive à l’URL à cette étape peut varier : 

    1. Ça ne change rien. La liste est mise à jour sans change­ment d’URL.
    2. Le site ajoute un paramètre à l’URL comme “?colour=blue&brand=samsung”.
    3. Le site ajoute un hash à l’URL pour iden­ti­fi­er la sélec­tion, par exem­ple #colour=blue
    4. Une nou­velle URL sta­tique est créée comme /jeans/bleu/ (l’utilisateur a ici choisi l’attribut “bleu”)

    Les types de prob­lèmes qu’il va fal­loir prévoir ou cor­riger avec la mise en place d’une recherche à facette impliquent :

    • La dupli­ca­tion de contenu
    • Le gon­fle­ment de l’index (index bloat)
    • Explo­ration (crawl­ing)

    Mal­heureuse­ment, la recherche à facettes peut poten­tielle­ment créer un nom­bre presque infi­ni de com­bi­naisons et d’URL index­ables. Si vous avez un prob­lème comme celui-ci, l’impact SEO risque d’être très important.

    Voici quelques exem­ples de la manière dont ces prob­lèmes arrivent et leur impact sur le SEO de votre site :

    Contenu dupliqué

    On par­le de con­tenu dupliqué lorsque du con­tenu sim­i­laire est acces­si­ble via plusieurs URL. Les fil­tres sont con­nus pour créer des mass­es de con­tenu dupliqué. Ceci est prin­ci­pale­ment dû aux pages fil­trées qui sont des copies très proches de la page originale.

    Si le con­tenu dupliqué n’est pas néces­saire­ment un mau­vais sig­nal de rank­ing, cela peut causer quelques problèmes :

    Voici par exem­ple le site de e‑commerce currys.co.uk. Nous com­mençons par leur page écran PC HP. C’est une maque­tte de e‑commerce rel­a­tive­ment stan­dard, avec un head­er, une liste et une recherche à facettes :

    Et, sous la liste de pro­duit, du con­tenu au sujet des écrans HP :

    Main­tenant, appliquons le fil­tre “écran 4k”.

    Vous ver­rez que la liste de pro­duit se met à jour, le H1 change et l’URL passe de :

    /hp-computing/pc-monitors/pc-monitors/354_3057_30059_16_xx/xx-criteria.html

    À :

    /hp-4k-monitors/pc-monitors/pc-monitors/354_3057_30059_16_ba00012894-bv00311096/xx-criteria.html

    Mais si vous scrollez jusqu’en bas de la page, le même bloc de con­tenu est tou­jours là, sous la liste de produits.

    Ce n’est qu’un exem­ple de dupli­ca­tion sur le site. Met­tez ça à l’échelle de tous les fil­tres disponibles, et vous allez rapi­de­ment avoir des mil­lions de pages dupliquées que Google doit essay­er de rassem­bler en une seule page canonique.

    Gonflement d’index (Index bloat)

    Le gon­fle­ment d’index est lorsque les moteurs de recherche index­ent des pages de votre site qui n’ont aucune valeur de recherche.

    Ne per­me­t­tre à Google d’indexer que des pages de qual­ité est très impor­tant, des pages indexées de basse qual­ité vont avoir un impact négatif glob­al sur votre site, comme John Mueller l’explique dans cette vidéo :

    https://www.youtube.com/watch?v=B1UrnctsiZU&t=605s

    La recherche à facettes peut poten­tielle­ment créer des mil­lions d’URL index­ables qui ne con­ti­en­nent aucun con­tenu unique. Cela peut aus­si créer des vari­antes de pages qui n’apportent aucune valeur ajoutée aux util­isa­teurs ou aux moteurs de recherche.

    Voici un exemple : 

    AO.com a une page de caté­gorie dédiée aux lave-linges non-encastrables

    Un util­isa­teur peut vis­iter cette page et décider s’il veut fil­tr­er par :

    • Mar­que : Samsung
    • Capac­ité : Grande
    • Couleur : métallique
    • Fonc­tion­nal­ités : lavage rapide
    • Classe énergie : A

    Grâce aux fil­tres, le site mon­tre les machines qui répon­dent pré­cisé­ment aux besoins de l’utilisateur.

    Mais est-ce qu’un util­isa­teur va un jour faire une recherche aus­si pré­cise sur Google ?

    Bien évidem­ment que non.

    Nous le savons parce que nous avons une esti­ma­tion de recherche men­su­elle estimée de seule­ment 90 pour “lave-linge non encas­tra­ble” au Roy­aume-Uni, il y a donc très peu (aucune ?) chances que quelqu’un fasse une recherche plus spé­ci­fique comme “grand lave-linge sam­sung non encas­tra­ble avec fonc­tion lavage rapi­de et classe énergie A” 

    Avoir des pages indexées qui ne cor­re­spon­dent pas à une demande et recherche et qui sont de basse qual­ité peut poten­tielle­ment pouss­er un algo­rithme à avoir un impact négatif sur votre site

    Gâchis de budget de crawl

    Google ne peut dédi­er qu’un mon­tant fini de ressources pour explor­er les pages de votre site. C’est ce qu’on appelle le bud­get de crawl.

    Gér­er son bud­get de crawl n’est pas quelque chose que Google va con­sid­ér­er comme pri­or­i­taire à moins que vous ayez un énorme site (+1M pages uniques) ou grand (10k+ pages uniques) avec du con­tenu qui change rapidement.

    Au vu de ce con­seil, si vous n’avez que quelques mil­liers de caté­gories et pro­duits, vous pour­riez vous dire que vous n’avez pas besoin de vous inquiéter de votre bud­get de crawl.

    Ce serait une grave erreur.

    Cer­taines recherch­es à facettes vont créer des liens explorables pour chaque com­bi­nai­son possible.

    Sans par­ler des éventuels prob­lèmes de gon­fle­ment de l’index, cela veut dire que vous allez poten­tielle­ment génér­er des mil­lions d’URL à crawler par Google, vous allez vite devoir vous intéress­er au bud­get de crawl.

    Vous pou­vez trou­ver un exem­ple sur le site de next.co.uk :

    En inspec­tant le code HTML de la recherche à facette, vous ver­rez un lien :

    Une fois que vous aurez suivi ce lien, vous pou­vez véri­fi­er le code HTML d’un autre résul­tat comme le bleu :

    Vous voyez que la com­bi­nai­son de ces facettes crée une nou­velle URL à crawler.

    Prenez main­tenant en compte les poten­tielles com­bi­naisons de tous les fil­tres disponibles. Vous allez vite voir pourquoi une nav­i­ga­tion à facettes peut pos­er des prob­lèmes à un moteur de recherche.

    Dilution du PageRank

    La recherche à facettes peut aus­si diluer le PageR­ank qui passe sur votre site.

    C’est parce que le PageR­ank est divisé par le nom­bre total de liens sur la page. Le prob­lème inhérent avec la recherche à facette est que cela crée un grand nom­bre de liens internes.

    Donc au lieu de pass­er le PageR­ank vers vos pro­duits ou caté­gories impor­tantes, cela va l’envoyer vers des liens au sein de vos fil­tres, ce qui dans la plu­part des cas ne va pas vous aider à amélior­er le traf­ic organique.

    Lec­ture recom­mandée : Google PageR­ank is NOT Dead: Why It Still Matters

    Il y a tou­jours des signes évi­dents de prob­lèmes liés à la recherche à facettes, voici quelques étapes à suiv­re pour voir si vos fil­tres font du mal à votre SEO.

    1. Commencez par une recherche site :

    Une excel­lente tac­tique pour véri­fi­er le gon­fle­ment d’index rapi­de­ment est d’utiliser l’opéra­teur de recherche site :. Si ce n’est pas for­cé­ment très pré­cis, c’est rapi­de et facile à faire.

    C’est très sim­ple : ajouter “site :” devant votre nom de domaine, comme ci-dessous.

    Notez le nom­bre de résul­tats que remonte Google. Est-ce que cela vous sem­ble plus élevé que le nom­bre d’URL que vous savez disponibles sur votre site ?

    Si c’est le cas, c’est le pre­mier signe d’un prob­lème de gon­fle­ment de l’index.

    2. Confirmez avec le rapport de couverture de la Google Search Console (GSC)

    Le rap­port de cou­ver­ture de la GSC est un excel­lent moyen de repér­er les prob­lèmes de crawl et d’indexation rapidement.

    Ren­dez-vous sim­ple­ment dans le rap­port “Couverture”dans GSC et sélec­tion­nez “valides” sur le graphique pour avoir un nom­bre pré­cis des pages indexées par Google :

    Si cela vous sem­ble élevé, ou que vous avez récem­ment mis en place une recherche à facette et que ça a crevé le pla­fond, cela tend vers un prob­lème de gon­fle­ment d’index comme dit au-dessus.

    Mais com­ment savoir si c’est à cause des filtres ?

    Un bon sitemap va vous aider à diag­nos­ti­quer le prob­lème. Si vous l’avez chargée dans la GSC, le tableau sous le graphique va divis­er les URL en :

    • Indexée, non soumise dans le sitemap
    • Soumise et indexée

    Cela veut dire que nous pou­vons regarder les pages “Indexées, non soumis­es dans le sitemap” pour voir quelles sont les pages indexées par Google que vous ne voulons pas :

    Cet exem­ple est un site de paris qui vous per­met de fil­tr­er par lieux et tournois. Nous voyons que Google indexe des URL non souhaitées.

    Une autre méth­ode pour décou­vrir des prob­lèmes poten­tiels est de fil­tr­er par URL “Exclues” :

    Analyser les URL “Explorées, actuelle­ment non indexées” peut vous don­ner des infor­ma­tions sur les pages que Google a décou­vertes, mais a décidé de ne pas les indexer.

    Google ne va pas index­er tout ce qu’il explore. Si les pages ne sont pas de bonne qual­ité comme la plu­part des pages de facettes, il peut décider de ne pas les indexer.

    Dans cet exem­ple, nous savons qu’il y a plus de 1000 pages que Google a décou­vertes qu’il pour­rait index­er dans le futur. Nous voyons aus­si les URL issues de Facettes en cli­quant sur le rapport.

    Ce qu’il y a au-dessus est un exem­ple rel­a­tive­ment stan­dard de prob­lèmes issus de la recherche à facette mis en avant par la GSC. Au fil du temps, ces prob­lèmes peu­vent devenir des cen­taines de mil­liers d’URL décou­vertes, mais non indexées (ce qui va mon­tr­er les poten­tiels prob­lèmes de crawl) :

    Ou encore des cen­taines de mil­liers d’URL indexées alors qu’elles ne devraient pas l’être :

    3. Obtenir plus de données avec un audit de site

    Utilis­er la recherche et la GSC est un très bon moyen pour obtenir des don­nées rapi­des sur un prob­lème, mais aucun ne vous mon­tr­era toutes les URL indexables/indexées, ce qui va ren­dre dif­fi­cile de voir les cor­réla­tions et l’échelle du problème.

    Un out­il d’audit de site comme celui de Ahrefs peut vous aider à remédi­er à ce prob­lème en vous don­nant des infor­ma­tions détail­lées sur les URL décou­vertes en explo­rant le site.

    L’exemple ci-dessous est celui d’un site avec des prob­lèmes de recherche à facette qui provo­quent un gâchis de bud­get de crawl, vous pou­vez les repér­er en quelques clics.

    Pour com­mencer, ren­dez-vous dans le rap­port index­a­bil­ité dans la barre de gauche.

    Ensuite, jetez un œil à la “dis­tri­b­u­tion d’indexabilité” pour voir si quelque chose vous sem­ble étrange.

    À par­tir d’un crawl par­tiel, l’Audit de site a trou­vé 39 URL non index­able pour chaque URL index­able. Comme ce n’est qu’un crawl par­tiel, on peut s’attendre à ce que ce ratio entre index­able et non index­able va sans doute s’aggraver.

    Ce que l’on voit au-dessus est un ter­ri­ble gâchis de bud­get de crawl, c’est aus­si un excel­lent exem­ple de piège à crawler : où des prob­lèmes tech­niques vont créer un nom­bre qua­si infi­ni d’URL inutiles que les bots vont explorer.

    Si votre recherche à facette provoque un gon­fle­ment de l’index (index bloat), le graphique que vous allez voir sera dif­férent. Plutôt qu’un grand nom­bre d’URL non-index­able, vous ver­rez un grand nom­bre d’URL index­ables comme sur ce que vous voyez en dessous.

    Pour con­firmer que c’est un prob­lème lié à la recherche à facettes, sélec­tion­nez la por­tion non index­able du graphique et analy­sez la liste. Vous ver­rez un tableau de toutes les pages non index­ables explorées.

    C’est ici que vous allez devoir trou­ver les points communs.

    Qu’est-ce qui fait que les crawlers con­sid­èrent que ces pages ne sont pas indexables ?

    Si la grande majorité des URL qui remon­tent dans le tableau sont issues des fil­tres, vous faites face à un prob­lème de recherche à facette.

    Main­tenant que vous savez com­ment trou­ver les prob­lèmes de recherche à facettes, voici com­ment les régler.

    1. Corrigez l’indexation avec une balise canonique

    Si vous ren­con­trez des prob­lèmes d’indexation, mais pas de grave prob­lème de bud­get de crawl (et n’avez pas un site immense), la meilleure solu­tion est sans doute d’utiliser la balise canon­ique. Cela ren­force les sig­naux de lien pour les pages similaires/dupliquées vers l’URL que vous définis­sez comme canonique.

    L’intérêt ?

    Si vous avez des liens vers une page à facette, qui sont canon­isées vers la page sans facette, les sig­naux de ces liens ne sont pas per­dus. Les moteurs de recherche vont les ren­voy­er vers la page de caté­gorie, ce qui va les aider à bien se positionner.

    Voici un exem­ple de com­ment faire…

    Imag­i­nons que ce soit l’URL de votre page de catégorie :

    https://exemple.com/lave-linge/samsung/

    Votre URL à facette fonc­tionne avec des paramètres, donc lorsque quelqu’un applique des fil­tres, l’URL ressem­ble à ceci :

    https://exemple.com/lave-linge/samsung/?drumsize=16kg&color=silver&energyrating=A

    Sur l’URL à facette au-dessus, vous pou­vez sim­ple­ment ajouter une balise canon­ique pour point­er vers la page caté­gorie, elle ressem­blerait à ça :

    <link rel="canonical" href="https://exemple.com/lave-linge/samsung/" />

    Ou de cette manière dans vos head­ers HTTP :

    Link : <https://exemple.com/lave-linge/samsung/>; rel="canonical"

    Si cela sem­ble sim­ple et facile à faire pour un si gros prob­lème SEO, comme tou­jours, il y a des prob­lèmes poten­tiels. Le prin­ci­pal : que Google ignore votre balise canonique.

    Tout sim­ple­ment parce que les balis­es canon­iques ne sont que des sug­ges­tions pour moteurs de recherche, pas des ordres. Si Google, pour une rai­son ou pour une autre, vient à penser que vous avez fait une erreur avec cette balise, il pour­rait décider de l’ignorer.

    Les raisons les plus fréquentes pour lesquelles Google peut décider d’ig­nor­er votre balise canon­ique sont :

    • Les pages ne sont pas dupliquées. Si vos pages à facettes changent de manière sig­ni­fica­tive lorsque vous appliquez un fil­tre, Google va cer­taine­ment penser que ce n’est pas du con­tenu dupliqué. Par exem­ple, si votre con­tenu, titres et head­er change, Google peut s’y perdre.
    • Vous faites des liens internes vers les pages à facettes. Si vous avez beau­coup de liens internes qui pointent vers une page à facette qui a une page canonique,Google peut ignor­er votre balise.

    Si vous ne voyez pas le nom­bre d’URL valides dans votre rap­port de cou­ver­ture après avoir mis en place des balis­es canon­iques, passez à l’étape 2.

    2. Utilisez le rapport de paramètre URL de la Search Console

    Si la canon­i­sa­tion ne règle pas les prob­lèmes d’indexation, le rap­port de paramètres d’URL dans la GSC est sans doute votre meilleure chance d’optimiser le crawl. Cela vous per­met de dire à Google com­ment gér­er les paramètres d’URL pour une meilleure exploration.

    Le point négatif de cette méth­ode est qu’elle ne fonc­tionne que si votre recherche à facettes utilise des paramètres d’URL (si ce n’est pas le cas, passez à l’étape 3).

    L’utilisation du rap­port de paramètre d’URL est rel­a­tive­ment sim­ple : ajoutez les paramètres, dites à Google com­ment cela affecte le con­tenu de la page et s’il existe des excep­tions à la règle de ce qu’il devrait explorer.

    Note.
    Si vous empêchez déjà le crawl via robots.txt, cela ne fera aucune différence

    3. Fix crawling with robots.txt

    Si vous faites face à un prob­lème de bud­get de crawl et que vous n’avez pas besoin de con­solid­er les sig­naux, vous allez devoir utilis­er robots.txt pour empêch­er Google d’explorer les URL à facette.

    Pour blo­quer le crawl d’URL avec robots.txt, ajouter une règle dis­al­low comme ci-dessous :

    User-agent : *

    Disallow: *size=*

    Dans l’exemple ci-dessus, nous avons util­isé deux jok­er (*) autour des paramètres. Si votre nav­i­ga­tion à facettes ne fonc­tionne pas en ajoutant des direc­to­ries, votre règle devrait ressem­bler à ça :

    User-agent : *

    Disallow: */size/*

    Il y a deux cas où le robots.txt ne va pas bien fonctionner :

    • Vous n’avez pas de règle dis­cern­able dans le change­ment d’URL pour les dis­al­low. Peut-être que chaque pas va avoir des paramètres uniques.
    • Vous voulez autoris­er cer­tains pat­terns d’URL à être indexés et en blo­quer d’autres. Par exem­ple, vous voulez peut-être que le réper­toire /couleur/ puisse être crawlée pour la caté­gorie T‑shirt (ça a un intérêt dans la recherche), mais voulez le dés­ac­tiv­er pour la caté­gorie sous-vête­ments. Si vous pour­riez con­tourn­er cela en mélangeant des règles “Allow” et “Dis­al­low” dans le robots.txt, cela peut vite devenir com­pliqué à gér­er sur des sites à grande échelle.

    Vous devez aus­si savoir que blo­quer le crawl ne va pas néces­saire­ment empêch­er Google d’indexer les URL blo­quées. En règle générale, Google va retir­er les URL blo­quées de l’index, mais seule­ment si elles n’ont pas de back­links et/ou beau­coup de liens internes qui y pointent. En d’autres ter­mes, tant que rien d’autre ne sig­nale à Google que ces URL ont de la valeur.

    4. Retirez les liens internes vers les URL à facettes ou les passer en Nofollow

    Si blo­quer le crawl­ing n’élimine pas com­plète­ment les prob­lèmes d’indexation issus de la recherche à facettes, met­tre les liens internes vers ces URL en nofol­low pour­rait régler le problème.

    Il y a générale­ment deux sources à ces liens :

    1. Les liens de recherche à facettes. Par exem­ple, les liens au sein de votre nav­i­ga­tion à facettes.
    2. D’autres liens sur votre site. Par exem­ple des arti­cles de blog.

    Pour les liens de recherche à facettes, appli­quer un blan­ket nofol­low est rel­a­tive­ment sim­ple quand on con­naît les bases du code. Mais ce n’est peut-être pas la meilleure idée si vous avez des balis­es canon­i­cal sur les URL à facette et/ou des URL à facettes que vous voulez index­er. Si Google finit par ne pas explor­er ces liens parce qu’ils sont en nofol­low, cela peut provo­quer des prob­lèmes d’indexation.

    L’alternative est de choisir une à une les facettes à met­tre en nofol­low. C’est un peu plus dif­fi­cile à met­tre en place d’un point de vue tech­nique, mais peut val­oir la peine si vous cherchez à vis­er des requêtes longue-traîne via la recherche à facettes (je vais dévelop­per plus bas).

    Le prin­ci­pal prob­lème de cette approche est qu’elle est moins utile depuis que Google a com­mencé à con­sid­ér­er le rel=’nofollow’ comme une indi­ca­tion, ce n’est pas une direc­tive comme robots.txt.

    Cela dit, Google va se servir du nofol­low interne pour déter­min­er que l’URL avec l’attribut href en ques­tion n’est pas très impor­tante et qu’elle n’est donc pas prioritaire.

    John Mueller l’a con­fir­mé :

    […] Nous allons con­tin­uer à nous servir de ces liens nofol­low comme un sig­nal pour nous dire que :
    • Ces pages ne sont pas si intéressantes
    • Google n’a pas besoin de les explorer
    • Elles n’ont pas besoin d’être util­isées pour le posi­tion­nement ou l’indexation
    John Mueller
    John Mueller, Search Advo­cate Google
    Note.
    Cette approche ne cor­rige pas le prob­lème de dilu­tion du PageR­ank. Le PageR­ank va tou­jours être dis­tribué à tra­vers tous les liens de la page, même ceux avec l’attribut nofol­low. Si vou voulez cor­riger cela, il va fal­loir véri­ta­ble­ment met­tre en place une canon­i­sa­tion propre 

    Pour les liens qui se trou­vent ailleurs sur votre site, votre meilleure chance reste de les retirer.

    Vous pou­vez trou­ver les liens internes qui pointent vers des URLS issus de facettes en util­isant l’Explo­rateur de site de Ahrefs :

    1. Entrez l’URL en question
    2. Ren­dez-vous dans le rap­port Back­links internes
    3. Fil­trez les liens dofol­low

    Vous pou­vez ensuite sim­ple­ment chercher les liens internes “fol­low” sur votre site pour les retirer.

    5. Corrigez définitivement l’indexation avec la balise noindex

    Si vous avez tou­jours des prob­lèmes d’indexation après avoir suivi les étapes ci-dessus, votre dernière chance est la balise noin­dex.

    L’intérêt de la balise noin­dex est que c’est une manière sûre d’empêcher l’indexation des pages issues des facettes. Le prob­lème est que cela ne va pas ren­forcer les sig­naux de rank­ing et, au fil du temps, Google pour­rait arrêter d’explorer les liens internes sur une page noin­dex, ce qui veut dire ne pas faire pass­er de sig­nal de ranking.

    Mais cela reste une bonne méth­ode pour retir­er les URL de facettes de l’index de Google si rien d’autre ne fonctionne.

    Pour met­tre cela en place, ajoutez sim­ple­ment soit une balise de meta robots dans le <head> d’une URL Facette :

    <meta name="robots" content="noindex">

    Our le X‑Robots head­er dans le head­er HTTP de votre URL facette :

    X-Robots-Tag: noindex

    Ensuite, vous devez retirer/ajuster tous les blocages de crawl pour l’URL dans le robots.txt ou l’outil de paramètres d’URL. SI vous ne le faites pas, Google ne ver­ra jamais la direc­tive noin­dex, donc la page restera indexée.

    Lec­ture recom­mandée : Robots Meta Tag & X‑Ro­bots-Tag: Every­thing You Need to Know

    À la lec­ture des par­ties précé­dentes, vous avez dû vous ren­dre compte que cor­riger tous les prob­lèmes poten­tiels liés à la recherche à facette n’est pas facile.

    Toute approche pour cor­riger l’indexation ou l’exploration peut présen­ter de mau­vais côtés ou des complications.

    Mais il existe une meilleure méthode.

    Imag­i­nons que vous met­tiez en place une nou­velle recherche à facettes ou que vous en créez une pour la pre­mière fois. Dans ce cas-là, pour pou­vez cir­con­venir à tous les prob­lèmes cités plus haut tout en soignant votre UX.

    Voici com­ment y parvenir. 

    1. Utilisez AJAX et évitez les liens internes

    Tout d’abord, con­stru­isez votre recherche à facettes avec AJAX et n’ajoutez pas de liens internes <a href=…>.

    En faisant cela, vous allez amélior­er l’expérience util­isa­teur car la page ne va pas se recharg­er à chaque nou­veau fil­tre et Google ne ver­ra pas de lien interne vers des pages à facette, ce qui veut dire :

    • Qu’il ne va pas les explorer
    • Elles ne seront donc pas indexées
    • Ce qui évite la poten­tielle dilu­tion de PageRank

    Voici un exemple.

    Nous avons inté­gré une recherche à facette dans le plu­g­in Word­Press WP Grid Builder sur une ressource que j’ai créée appelée la SEO Tool­belt.

    Ça ressem­ble à ça :

    Lorsque vous faites clic droit et inspecter sur n’importe laque­lle des cas­es pour appli­quer un fil­tre, vous ver­rez qu’elles ne con­ti­en­nent pas de lien<a href=…>, ce qui va empêch­er Google d’explorer des URL supplémentaires.

    Ain­si, j’ai évité d’avoir à ne serait-ce que penser à la perte de bud­get de crawl à cause de la nav­i­ga­tion à facettes.

    2. Assurez-vous que les URL puissent être partagées

    Ensuite, il faut s’assurer que lorsqu’un util­isa­teur clique sur un fil­tre, l’URL change.

    Je recom­mande cette méth­ode car nous avons con­crète­ment changé le con­tenu de la page et, dans l’idéal, si un util­isa­teur la met en favori, fait un lien vers la page ou partage l’URL avec un ami, cela va sélec­tion­ner les fil­tres et les appli­quer directe­ment lorsque le lien/favori/partage sera cliqué.

    Il y a deux méth­odes pour le faire :

    • Paramètre d’URL (?)
    • Hash­es d’URL (#)

    La meilleure solu­tion est le hash­es d’URL, Google a ten­dance à ignor­er tout ce qui se trou­ve der­rière le hash dans une URL.

    WP Grid Builder utilise des paramètres, donc après avoir appliqué les fil­tres, l’URL change ainsi :

    https://seotoolbelt.co/tools/auditing/?_tool_type=browser-extension

    Si vous accédez à cette URL, vous ver­rez des grilles d’outils fil­trés qui cor­re­spon­dent aux cas­es cochées.

    Dans cet exem­ple, comme j’utilise des paramètres d’URL, je dois aus­si ajouter une balise canon­ique à la ver­sion de l’URL sans les paramètres, celle-ci :

    https://seotoolbelt.co/tools/auditing/

    Comme ces ver­sions paramétrées des URL ne reçoivent pas de lien interne et qu’il y a peu de chance qu’elles reçoivent des back­links (ce qui serait le seul moyen pour Google de les trou­ver), nous avons peu de chance qu’elles posent problème.

    3. Produisez des crawl path alternatifs pour les pages importantes

    Dans cer­tains cas, une ver­sion fil­trée d’une page peut être intéres­sante pour la recherche organique.

    Par exem­ple, il y a des fil­tres pour “Fire­fox” et “Chrome” sur ma page pour l’extension de nav­i­ga­teur SEO, ces deux pages ont du poten­tiel de recherche.

    Il faut donc s’assurer que les URL créées soient index­ables. Le meilleur moyen d’y par­venir est de met­tre en place des chemins d’exploration (crawl paths) vers ces pages. J’ai fait cela en ajoutant des liens de sous-nav­i­ga­tion à des ver­sions index­ables de ces pages fil­trées en haut de page.

    Ces “sous-fil­trages” sont générés en se bas­ant sur les mêmes attrib­uts que la ver­sion à facette, mais je dois les génér­er consciemment.

    Cela a per­mis plusieurs choses :

    • J’ai empêché le gâchis de bud­get de crawl, puisque je ne fais pas de lien interne vers les pages filtrées
    • Les pages fil­trées restent partage­ables, ce qui est une bonne chose en UX
    • Si une page fil­trée a du poten­tiel de recherche, je peux manuelle­ment per­me­t­tre à la page d’être indexée.

    Comme vous pou­vez le voir, cela va grande­ment vous sim­pli­fi­er la vie en ter­mes de SEO et n’a pas de désavantages.

    Jusqu’ici, je n’ai fait que présen­ter la recherche à facettes que comme quelque chose qui implique des com­pli­ca­tions SEO. Mais elle peut aus­si être util­isée pour attir­er plus de traf­ic via une stratégie de mots-clés longue traîne.

    Je ne peux qu’insister sur les incroy­ables béné­fices que cela peut attir­er. Les don­nées Ahrefs mon­trent que 99,84 % des mots-clés reçoivent moins de 1000 recherch­es par mois, et représen­tent 29,33% de la total­ité de requêtes :

    ​​

    Les URL facettes sont idéales pour attir­er du traf­ic longue traîne, car elles pro­posent des ver­sions plus spé­ci­fiques des pages qui visent des requêtes plus larges.

    Com­mençons par les étapes qui vont vous per­me­t­tre de repér­er les oppor­tu­nités d’attirer plus de traf­ic longue-traîne. Ensuite, nous ver­rons com­ment implé­menter des actions concrètes.

    1. Identifier les variations longue-traîne de mots-clés 

    Pour com­mencer, vous allez devoir iden­ti­fi­er les oppor­tu­nités de mots-clés grâce à l’Explorateur de mots-clés Ahrefs. C’est extrême­ment simple.

    Entrez le nom d’une caté­gorie que vous avez déjà sur votre titre comme “jeans taille haute”

    Allez dans le rap­port “Match­ing Terms” (ter­mes correspondants)

    Utilisez la side­bar et changez l’onglet sur “Par­ent Top­ic” (sujet parent)

    En faisant cela, l’outil va regrouper tous les mots-clés avec un SERP sim­i­laire ensem­ble. Vous pou­vez ensuite analyser la liste pour choisir les pages facettées poten­tielles qu’il vaudrait le coup de faire index­er. En voici quelques-unes que j’ai repérées depuis la cap­ture d’écran ci-dessus :

    • high rise boot­cut jeans (1 900 recherches)
    • high rise skin­ny jeans (1 800 recherches)
    • high rise wide leg jeans (1 300 recherches)
    • ultra high rise jeans (970 recherches)
    • high waist­ed boyfriend jeans (700 recherches)
    • high rise super skin­ny jeans (380 recherches)
    • high waist­ed white jeans (360 recherches)

    2. Rendez ces pages indexables

    Vous devez ensuite ren­dre les pages qui cor­re­spon­dent à ces fil­tres à la fois explorables et index­ables par Google.

    Ma méth­ode va dépen­dre de votre type de recherche à facette.

    Recherche à facettes avec liens internes

    Si vous avez inté­gré une recherche à facettes qui n’est pas con­fig­urée comme il le faudrait et qui a des liens internes vers chaque facette, vous avez besoin de vous assur­er que pour chaque URL :

    • La balise canon­ique est en self-reference
    • La balise noin­dex est retirée (si applicable)
    • Toutes les règles dis­al­low applic­a­bles ont été retirées du robots.txt (ou que vous avez mis des règles allow)
    • Tous les attrib­uts nofol­low ont été retirés des liens internes (si applicable)

    Ce qu’il faut pré­cisé­ment faire dépend de la manière dont l’ensemble est con­fig­uré, mais ce qui est impor­tant est que les moteurs de recherche puis­sent explor­er et index­er ces pages.

    Recherche à facettes AJAX avec des liens internes

    Vous allez avoir à créer des pages de sous-caté­gorie pour avoir une nav­i­ga­tion à facette idéale comme men­tion­né dans la par­tie précédente.

    C’est néces­saire parce que la recherche à facettes ne génère pas de liens internes, vous ne pou­vez donc pas l’utiliser pour créer ces pages à votre place.

    La plu­part des plate­formes de e‑commerce ren­dent pos­si­ble la créa­tion de sous-caté­gories, mais dans l’idéal il vous faut d’autres fonc­tion­nal­ités sur lesquelles baser les sous-caté­gories de pro­duit selon les fil­tres de la caté­gorie par­ente. C’est prin­ci­pale­ment pour éviter d’avoir à opti­miser chaque sous-caté­gorie manuelle­ment. Ain­si, vous aurez l’avantage de génér­er rapi­de­ment des pages, à la manière d’une recherche à facettes, tout en évi­tant les com­pli­ca­tions SEO.

    Par exem­ple, si vous créez une caté­gorie “jeans taille haute slim”, nous allons vouloir hérit­er du list­ing de pro­duits de “jeans taille haute”, mais qui ne mon­treront que les pro­duits qui ont aus­si l’attribut “slim” d’appliqué.

    3. Optimisez les URL pour les recherches

    C’est rel­a­tive­ment évi­dent, mais il faut pass­er par les fon­da­men­taux de l’optimisation SEO, comme :

    • Avoir des URL sim­ples et lis­i­ble, dans l’idéal, votre URL serait : /jeans/taille-haute/slim/, et non /jeans/taille-haute/?fit_variant=slim
    • Des balis­es title, meta descrip­tion et de head­er optimisées
    • Du con­tenu rédac­tion­nel unique
    • L’ajout des URL aux sitemaps XML

    Les prin­ci­pales com­pli­ca­tions sont dans les con­fig­u­ra­tions où vous retirez une page facettée hors des con­trôles d’in­dex­a­tion et d’exploration par défaut.

    C’est tout sim­ple­ment parce que, tech­nique­ment, les pages facettées sont dynamiques par essence et donc dif­férentes de la créa­tion d’une nou­velle sous-catégorie.

    Des fonc­tion­nal­ités per­son­nal­isées sont néces­saires pour paramétr­er cor­recte­ment ces opti­mi­sa­tions on-page de pre­mière importance.

    Conclusion

    J’espère que vous avez bien com­pris les risques que peu­vent représen­ter la recherche à facettes pour le SEO, mais aus­si les belles oppor­tu­nités qu’elle peut représen­ter pour les requêtes longue-traîne.

    Vous avez des ques­tions sur la recherche à facette ? Je suis sur Twit­ter.

    • Backlinks 2
    Données de Explorateur de contenu