Comment soumettre votre site à Google en 2021

Avatar
Responsable des contenus @ Ahrefs (ce qui veut dire en gros, que je dois m’assurer que chaque article publié est ÉPIQUE).
    Si vous voulez que des util­isa­teurs de moteurs de recherche trou­vent votre site, il faut qu’il soit indexé.

    Com­ment soumet­tre son site Inter­net à Google en 2021 ? Est-ce que c’est seule­ment nécessaire ?

    Dans ce guide, nous allons voir ensemble :

    Il y a deux moyens de soumet­tre son site à Google. Vous pou­vez soit lui fournir un sitemap à jour dans la Google Search Con­sole ou soumet­tre l’URL du sitemap via les ser­vices de “ping” de Google. Les deux options sont gra­tu­ites et très rapides.

    Trouver votre sitemap

    Les deux méth­odes néces­si­tent l’URL de votre sitemap. Elle dépend de la manière dont vous avez créé votre site.

    Si vous utilisez Word­Press, installez un plu­g­in de SEO gra­tu­it comme Yoast, Rank Math,ou The SEO Frame­work. Ils créent tous les sitemaps pour vous, à cette URL :

    votre.com/sitemap_index.xml

    Si vous utilisez Wix, Square­space ou Shopi­fy, votre sitemap sera à :

    votresite.com/sitemap.xml .

    Si vous utilisez une autre plate­forme ou CMS, il y a de grandes chances qu’ils créent aus­si une sitemap pour vous. Les URL les plus prob­a­bles sont :

    votresite.com/sitemap.xml

    votresite.com/sitemap_index.xml

    votresite.com/sitemap1.xml

    Si vous ne le trou­vez pas, véri­fiez si son emplace­ment est inscrit dans votresite.com/robots.txt.

    Si vous n’utilisez pas de plate­forme ou de CMS, vous allez avoir besoin de créer votre sitemap manuelle­ment. Mais prenez tout de même le temps de véri­fi­er les URL indiquées plus haut, il est pos­si­ble que vous en ayez déjà une.

    Soumettre votre sitemap

    Vous avez deux options

    Option 1 : soumettre votre sitemap dans la Google Search Console

    1. Con­nectez-vous à la Google Search Console
    2. Sélec­tion­nez la bonne propriété
    3. Cliquez sur “sitemaps” dans le menu de gauche
    4. Collez l’URL de votre sitemap
    5. Cliquez sur “Envoy­er”

    C’est sans doute la meilleure méth­ode, car la Google Search Con­sole va vous alert­er si elle détecte des erreurs dans votre sitemap dans le futur. Cela va aus­si vous per­me­t­tre d’avoir des indi­ca­tions sur la san­té de votre site, dont les raisons pour lesquelles cer­taines pages pour­raient ne pas être indexées.

    Option 2 : Soumettre votre sitemap en “pingant” Google

    Google dis­pose d’un ser­vice de “ping” via lequel vous pou­vez deman­der un nou­veau crawl de votre sitemap. Il vous suf­fit de copier/coller ceci dans votre nav­i­ga­teur, en rem­plaçant la fin par l’URL de votre sitemap :

    http://www.google.com/ping?sitemap=<url_complete_de_votre_sitemap>

    Par exem­ple, si l’URL de votre sitemap est votresite.com/sitemap.xml, entrez dans la barre d’adresse :

    http://www.google.com/ping?sitemap=https://votresite.com/sitemap.xml

    Vous devriez ensuite voir une page “Noti­fi­ca­tion de récep­tion de sitemap”.

    Google explique que vous ne devriez faire cela qu’avec une nou­velle sitemap ou récem­ment mise à jour. Ne soumet­tez ou pingez pas plusieurs fois des sitemaps qui n’ont pas changé.

    Il n’est nor­male­ment pas néces­saire de fournir indi­vidu­elle­ment chaque nou­velle page à Google. Tant que les nou­velles URL sont dans un sitemap que vous avez déjà soumis, ils finiront par être trou­vés. Mais il y a deux méth­odes pour éventuelle­ment accélér­er le processus.

    Option 1 : pinger Google

    Assurez-vous que les nou­velles pages sont bien dans votre sitemap puis suiv­ez les instruc­tions de la par­tie précé­dente pour pinger Google. Il va revéri­fi­er votre sitemap. Ce n’est pas réelle­ment néces­saire si vous utilisez Word­Press avec Yoast, Rank math ou The SEO Frame­work, car ils pin­gent tous Google automa­tique­ment.

    Option 2 : Utiliser l’outil d’inspection d’URL de Google

    Il est pos­si­ble de deman­der l’ajout d’URL à Google si elles ne sont pas dans votre sitemap (même si elles devraient s’y trou­ver nor­male­ment). Vous pou­vez utilis­er l’outil d’inspection d’URL dans la Google Search Console.

    1. Con­nectez-vous à la Google Search Console
    2. Sélec­tion­nez la bonne propriété
    3. Cliquez sur le menu à gauche “Inspec­tion d’URL”
    4. Collez l’URL de la nou­velle page
    5. Appuyez sur Entrée
    6. Cliquez sur “deman­der l’indexation”

    S’il n’y a qu’une ou deux nou­velles pages, cela ne risque pas de pos­er de prob­lème. Cer­taines per­son­nes esti­ment que c’est une manière d’accélérer l’indexation. Si vous avez beau­coup de nou­velles pages à soumet­tre, n’utilisez pas cette méth­ode. Vous y passerez la journée, préférez l’option une.

    Plus ou moins.

    Google va finir par trou­ver et index­er tout seul les pages qui sont utiles, même si vous ne les lui soumet­tez pas. Mais il y a plusieurs avan­tages à l’aider.

    Avant de vous expli­quer pourquoi, nous devons peut-être par­ler de la manière dont Google trou­ve et indexe du contenu.

    Comment Google trouve et indexe votre contenu

    Pour y par­venir, il y a qua­tre grandes étapes

    Note.
    Tout cela est sim­pli­fié à l’extrême, Google est une machine très complexe 

    Étape 1 : Découverte

    La décou­verte est la phase où Google apprend que votre site existe. Il trou­ve la plu­part des sites et pages via les sitemaps ou les back­links (liens entrants) sur les pages connues.

    Étape 2 : Crawl

    Le crawl­ing c’est quand un pro­gramme infor­ma­tique (spi­der) appelé Google­bot va vis­iter et télécharg­er vos pages.

    Étape 3 : Traitement

    C’est le moment où les infor­ma­tions clés vont être extraites des pages préal­able­ment crawlées (explorées) et pré­parées pour l’indexation

    Étape 4 : Indexation

    On par­le d’indexation lorsque les infor­ma­tions traitées des pages explorées sont ajoutées à l’immense base de don­nées que l’on appelle le search index. C’est ni plus ni moins une librairie numérique de tril­lions de pages web que Google peut poten­tielle­ment ressor­tir comme résul­tat de recherche.

    Lec­ture recom­mandée (en anglais) : How Do Search Engines Work and Why Should You Care?

    Pourquoi soumettre son site à Google est important

    Les qua­tre étapes ci-dessus arrivent tou­jours dans le même ordre, c’est un proces­sus. En soumet­tant votre site à Google, vous allez peut-être en accélér­er la pre­mière étape : la découverte.

    Comme tout proces­sus, plus tôt vous com­mencez, plus tôt vous atteignez votre objec­tif, ici l’indexation.

    Il y a cela dit d’autres raisons pour lesquelles soumet­tre sa sitemap est important.

    1. Cela indique à Google quelles sont les pages importantes

    Les sitemaps ne con­ti­en­nent générale­ment pas toutes les pages de votre site. Il ne s’y trou­vera que celles qui sont impor­tantes, seront exclues celles qui ne le sont pas ou les pages dupliquées. Cela per­met d’éviter d’in­dex­er une mau­vaise ver­sion d’une page à cause d’un prob­lème de con­tenu dupliqué.

    2. Cela prévient Google qu’il y a de nouvelles pages

    La plu­part des CMS vont d’eux-mêmes ajouter les nou­velles pages aux sitemaps et pinger Google. Cela per­met d’éviter d’avoir à soumet­tre chaque nou­velle page “à la main”.

    3. Cela prévient Google de l’existence des pages orphelines

    Les pages orphe­lines sont celles qui n’ont pas de liens internes issus des autres pages de votre site. Google ne peut pas les trou­ver de lui-même, à moins qu’elles dis­posent de back­links. Soumet­tre votre sitemap va en par­tie régler le prob­lème : les pages orphe­lines sont générale­ment inclus­es dans les sitemaps, en tout cas celles générées par les CMS.

    Google déclare que le crawl peut pren­dre entre quelques jours et quelques semaines (sou­venez-vous que le crawl est indis­pens­able à l’indexation).

    De mon expéri­ence, à moins d’avoir un très gros site, cela prend rarement plus d’une semaine ou deux.

    Mais pas d’inquiétude si ça met un peu plus de temps, c’est tout à fait normal.

    Google n’indexera pas tou­jours toutes les URL que vous allez lui soumet­tre. Même si les raisons pour cela peu­vent être très nom­breuses, voici les plus fréquentes :

    1. Vous avez bloqué le crawling

    Robots.txt est un fichi­er texte qui dit à Google quelles URL il peut explor­er ou non.

    Par exem­ple, ce fichi­er robots.txt empêche Google d’explorer les pages de tout le site :

    User-agent: Googlebot

    Disallow: /

    Il peut arriv­er que Google décide d’indexer des URL même s’il ne peut pas les explor­er, mais c’est très rare. Blo­quer le crawl va égale­ment empêch­er Google d’obtenir beau­coup d’informations sur la page en ques­tion; donc même s’il l’indexait, peu de chance qu’elle soit posi­tion­née dans un résul­tat de recherche.

    C’est l’une des raisons pour lesquelles nous con­seil­lons de soumet­tre son site dans la Google Search Con­sole : elle vous dira si des pages ont été exclues du crawl dans le rap­port Cou­ver­ture.

    Voici com­ment y accéder : 

    1. Con­nectez-vous à la Google Search Console
    2. Choi­sis­sez la bonne propriété
    3. Cliquez sur “Cou­ver­ture” dans le menu de gauche

    Ici, sélec­tion­nez l’onglet “Exclues” et cherchez ces trois problèmes :

    2. Vous avez classé des pages importantes en noindex

    Si vous avez un meta robots tag ou un x‑ro­bot-head­er sur votre page avec un attrib­ut “noin­dex”, Google ne va pas l’indexer.

    Si Google a déjà crawlé votre site, vous pou­vez véri­fi­er si cer­taines pages ont été exclues à cause du noin­dex dans le rap­port Cou­ver­ture. Activez les onglets “Erreur” et “Exclues” et cherchez ces deux erreurs :

    • URL envoyée désignée comme “noin­dex”
    • Exclue par la balise “noin­dex”

    Si Google n’a pas encore exploré votre site, ou que vous voulez véri­fi­er qu’il n’y a pas une balise “noin­dex” qui pour­rait se gliss­er dans votre site dans le futur, vous pou­vez vous inscrire au Ahrefs Web­mas­ter Tools (AWT). Ensuite, réalisez un crawl gra­tu­it via l’Audit de site. Cela va véri­fi­er une cen­taine d’éléments de SEO poten­tielle­ment prob­lé­ma­tiques, dont les pages en noindex.

    3. Vous avez des pages à faible valeur

    Il y a peu de chance que Google indexe des pages qui ne présen­tent pas réelle­ment de valeur aux yeux de ses util­isa­teurs. Dans un tweet de 2018, John Mueller sug­gère que votre site et son con­tenu soient “génial et inspi­rant” pour être indexé.

    Nous n’indexons jamais toutes les URL con­nues, c’est plutôt nor­mal. Con­cen­trez-vous sur ren­dre votre site génial et inspi­rant, les choses devraient nor­male­ment s’améliorer ensuite.

    Si vous avez véri­fié que le prob­lème d’indexation ne vient pas d’un prob­lème tech­nique, deman­dez-vous si cette page a réelle­ment un intérêt. Si la réponse est non, c’est sans doute la rai­son pour laque­lle elle n’est pas indexée.

    Si vous avez le sen­ti­ment que la page a une faible valeur et que vous craignez que ce soit le cas d’autres pages de votre site, faites un audit gra­tu­it de votre site en util­isant l’Audit de site des Ahrefs Web­mas­ter Tools. L’outil va véri­fi­er deux paramètres sou­vent asso­ciés aux pages à faible valeur :

    1. Des pages avec peu de texte
    2. Des pages de con­tenu dupliqué ou très sim­i­laire à une autre

    Vous pou­vez voir le nom­bre d’URL avec peu de con­tenu texte dans le rap­port “Tous les prob­lèmes

    Même si du con­tenu n’a pas for­cé­ment à être long pour avoir de la valeur, des pages avec un très faible nom­bre de mots n’ont sou­vent pas d’intérêt pour les util­isa­teurs de moteurs de recherche. Cela vaut alors le coup de les repren­dre et de les enrichir si c’est possible.

    Vous pou­vez égale­ment voir les pages de con­tenu dupliqué ou qua­si dupliqué dans le rap­port de Con­tenu dupliqué :

    Voici un bon exem­ple de deux pages à faible valeur qui sont presque similaires :

    Ce sont des caté­gories vides d’un site de e‑commerce. Comme aucune d’entre elles ne présente de pro­duit, elles ne sont pas utiles aux util­isa­teurs. Elles devraient être sup­primées ou améliorées.

    Lec­ture recom­mandée (en anglais) : 10 Ways to Get Google to Index Your Site

    Conclusion

    Même si votre site est indexé par Google, cela ne veut pas for­cé­ment dire que vous allez être en pre­mière page Google pour vos mots-clés ciblés. Être indexé veut dire que vous par­ticipez au cham­pi­onnat, pas que vous allez finir sur le podium.

    C’est ici qu’intervient le SEO. Le SEO a pour principe d’optimiser votre site pour aug­menter la part de traf­ic issue des moteurs de recherch­es. Dans ce cas : Google.

    Si vous voulez en appren­dre plus sur le SEO, con­sul­tez notre guide du débu­tant en SEO

    Si vous voulez soumet­tre votre site à d’autres moteurs de recherche, lisez notre guide com­plet pour soumet­tre son site aux moteurs de recherche.

    Vous avez des ques­tions ? Rejoignez-moi sur Twit­ter.