Comment soumettre son site Internet à Google en 2021 ? Est-ce que c’est seulement nécessaire ?
Dans ce guide, nous allons voir ensemble :
- Comment soumettre son site à Google
- Comment soumettre ses URL à Google
- A‑t-on besoin de soumettre son site à Google et pourquoi ?
- Combien de temps met Google à indexer un site ?
- Pourquoi Google n’indexe pas votre site
Il y a deux moyens de soumettre son site à Google. Vous pouvez soit lui fournir un sitemap à jour dans la Google Search Console ou soumettre l’URL du sitemap via les services de “ping” de Google. Les deux options sont gratuites et très rapides.
Trouver votre sitemap
Les deux méthodes nécessitent l’URL de votre sitemap. Elle dépend de la manière dont vous avez créé votre site.
Si vous utilisez WordPress, installez un plugin de SEO gratuit comme Yoast, Rank Math,ou The SEO Framework. Ils créent tous les sitemaps pour vous, à cette URL :
votre.com/sitemap_index.xml
Si vous utilisez Wix, Squarespace ou Shopify, votre sitemap sera à :
votresite.com/sitemap.xml
.
Si vous utilisez une autre plateforme ou CMS, il y a de grandes chances qu’ils créent aussi une sitemap pour vous. Les URL les plus probables sont :
votresite.com/sitemap.xml
votresite.com/sitemap_index.xml
votresite.com/sitemap1.xml
Si vous ne le trouvez pas, vérifiez si son emplacement est inscrit dans votresite.com/robots.txt.
Si vous n’utilisez pas de plateforme ou de CMS, vous allez avoir besoin de créer votre sitemap manuellement. Mais prenez tout de même le temps de vérifier les URL indiquées plus haut, il est possible que vous en ayez déjà une.
Soumettre votre sitemap
Vous avez deux options
Option 1 : soumettre votre sitemap dans la Google Search Console
- Connectez-vous à la Google Search Console
- Sélectionnez la bonne propriété
- Cliquez sur “sitemaps” dans le menu de gauche
- Collez l’URL de votre sitemap
- Cliquez sur “Envoyer”
C’est sans doute la meilleure méthode, car la Google Search Console va vous alerter si elle détecte des erreurs dans votre sitemap dans le futur. Cela va aussi vous permettre d’avoir des indications sur la santé de votre site, dont les raisons pour lesquelles certaines pages pourraient ne pas être indexées.
Option 2 : Soumettre votre sitemap en “pingant” Google
Google dispose d’un service de “ping” via lequel vous pouvez demander un nouveau crawl de votre sitemap. Il vous suffit de copier/coller ceci dans votre navigateur, en remplaçant la fin par l’URL de votre sitemap :
http://www.google.com/ping?sitemap=<url_complete_de_votre_sitemap>
Par exemple, si l’URL de votre sitemap est votresite.com/sitemap.xml, entrez dans la barre d’adresse :
http://www.google.com/ping?sitemap=https://votresite.com/sitemap.xml
Vous devriez ensuite voir une page “Notification de réception de sitemap”.
Google explique que vous ne devriez faire cela qu’avec une nouvelle sitemap ou récemment mise à jour. Ne soumettez ou pingez pas plusieurs fois des sitemaps qui n’ont pas changé.
Il n’est normalement pas nécessaire de fournir individuellement chaque nouvelle page à Google. Tant que les nouvelles URL sont dans un sitemap que vous avez déjà soumis, ils finiront par être trouvés. Mais il y a deux méthodes pour éventuellement accélérer le processus.
Option 1 : pinger Google
Assurez-vous que les nouvelles pages sont bien dans votre sitemap puis suivez les instructions de la partie précédente pour pinger Google. Il va revérifier votre sitemap. Ce n’est pas réellement nécessaire si vous utilisez WordPress avec Yoast, Rank math ou The SEO Framework, car ils pingent tous Google automatiquement.
Option 2 : Utiliser l’outil d’inspection d’URL de Google
Il est possible de demander l’ajout d’URL à Google si elles ne sont pas dans votre sitemap (même si elles devraient s’y trouver normalement). Vous pouvez utiliser l’outil d’inspection d’URL dans la Google Search Console.
- Connectez-vous à la Google Search Console
- Sélectionnez la bonne propriété
- Cliquez sur le menu à gauche “Inspection d’URL”
- Collez l’URL de la nouvelle page
- Appuyez sur Entrée
- Cliquez sur “demander l’indexation”
S’il n’y a qu’une ou deux nouvelles pages, cela ne risque pas de poser de problème. Certaines personnes estiment que c’est une manière d’accélérer l’indexation. Si vous avez beaucoup de nouvelles pages à soumettre, n’utilisez pas cette méthode. Vous y passerez la journée, préférez l’option une.
Plus ou moins.
Google va finir par trouver et indexer tout seul les pages qui sont utiles, même si vous ne les lui soumettez pas. Mais il y a plusieurs avantages à l’aider.
Avant de vous expliquer pourquoi, nous devons peut-être parler de la manière dont Google trouve et indexe du contenu.
Comment Google trouve et indexe votre contenu
Pour y parvenir, il y a quatre grandes étapes
Étape 1 : Découverte
La découverte est la phase où Google apprend que votre site existe. Il trouve la plupart des sites et pages via les sitemaps ou les backlinks (liens entrants) sur les pages connues.
Étape 2 : Crawl
Le crawling c’est quand un programme informatique (spider) appelé Googlebot va visiter et télécharger vos pages.
Étape 3 : Traitement
C’est le moment où les informations clés vont être extraites des pages préalablement crawlées (explorées) et préparées pour l’indexation
Étape 4 : Indexation
On parle d’indexation lorsque les informations traitées des pages explorées sont ajoutées à l’immense base de données que l’on appelle le search index. C’est ni plus ni moins une librairie numérique de trillions de pages web que Google peut potentiellement ressortir comme résultat de recherche.
Lecture recommandée (en anglais) : How Do Search Engines Work and Why Should You Care?
Pourquoi soumettre son site à Google est important
Les quatre étapes ci-dessus arrivent toujours dans le même ordre, c’est un processus. En soumettant votre site à Google, vous allez peut-être en accélérer la première étape : la découverte.
Comme tout processus, plus tôt vous commencez, plus tôt vous atteignez votre objectif, ici l’indexation.
Il y a cela dit d’autres raisons pour lesquelles soumettre sa sitemap est important.
1. Cela indique à Google quelles sont les pages importantes
Les sitemaps ne contiennent généralement pas toutes les pages de votre site. Il ne s’y trouvera que celles qui sont importantes, seront exclues celles qui ne le sont pas ou les pages dupliquées. Cela permet d’éviter d’indexer une mauvaise version d’une page à cause d’un problème de contenu dupliqué.
2. Cela prévient Google qu’il y a de nouvelles pages
La plupart des CMS vont d’eux-mêmes ajouter les nouvelles pages aux sitemaps et pinger Google. Cela permet d’éviter d’avoir à soumettre chaque nouvelle page “à la main”.
3. Cela prévient Google de l’existence des pages orphelines
Les pages orphelines sont celles qui n’ont pas de liens internes issus des autres pages de votre site. Google ne peut pas les trouver de lui-même, à moins qu’elles disposent de backlinks. Soumettre votre sitemap va en partie régler le problème : les pages orphelines sont généralement incluses dans les sitemaps, en tout cas celles générées par les CMS.
Google déclare que le crawl peut prendre entre quelques jours et quelques semaines (souvenez-vous que le crawl est indispensable à l’indexation).
De mon expérience, à moins d’avoir un très gros site, cela prend rarement plus d’une semaine ou deux.
Mais pas d’inquiétude si ça met un peu plus de temps, c’est tout à fait normal.
Google n’indexera pas toujours toutes les URL que vous allez lui soumettre. Même si les raisons pour cela peuvent être très nombreuses, voici les plus fréquentes :
1. Vous avez bloqué le crawling
Robots.txt est un fichier texte qui dit à Google quelles URL il peut explorer ou non.
Par exemple, ce fichier robots.txt empêche Google d’explorer les pages de tout le site :
User-agent: Googlebot
Disallow: /
Il peut arriver que Google décide d’indexer des URL même s’il ne peut pas les explorer, mais c’est très rare. Bloquer le crawl va également empêcher Google d’obtenir beaucoup d’informations sur la page en question; donc même s’il l’indexait, peu de chance qu’elle soit positionnée dans un résultat de recherche.
C’est l’une des raisons pour lesquelles nous conseillons de soumettre son site dans la Google Search Console : elle vous dira si des pages ont été exclues du crawl dans le rapport Couverture.
Voici comment y accéder :
- Connectez-vous à la Google Search Console
- Choisissez la bonne propriété
- Cliquez sur “Couverture” dans le menu de gauche
Ici, sélectionnez l’onglet “Exclues” et cherchez ces trois problèmes :
- Bloquée par le fichier robots.txt
- URL envoyée bloquée par le fichier robots.txt
- Indexée malgré le blocage par le fichier robots.txt
2. Vous avez classé des pages importantes en noindex
Si vous avez un meta robots tag ou un x‑robot-header sur votre page avec un attribut “noindex”, Google ne va pas l’indexer.
Si Google a déjà crawlé votre site, vous pouvez vérifier si certaines pages ont été exclues à cause du noindex dans le rapport Couverture. Activez les onglets “Erreur” et “Exclues” et cherchez ces deux erreurs :
- URL envoyée désignée comme “noindex”
- Exclue par la balise “noindex”
Si Google n’a pas encore exploré votre site, ou que vous voulez vérifier qu’il n’y a pas une balise “noindex” qui pourrait se glisser dans votre site dans le futur, vous pouvez vous inscrire au Ahrefs Webmaster Tools (AWT). Ensuite, réalisez un crawl gratuit via l’Audit de site. Cela va vérifier une centaine d’éléments de SEO potentiellement problématiques, dont les pages en noindex.
3. Vous avez des pages à faible valeur
Il y a peu de chance que Google indexe des pages qui ne présentent pas réellement de valeur aux yeux de ses utilisateurs. Dans un tweet de 2018, John Mueller suggère que votre site et son contenu soient “génial et inspirant” pour être indexé.
We never index all known URLs, that’s pretty normal. I’d focus on making the site awesome and inspiring, then things usually work out better.
— 🍌 John 🍌 (@JohnMu) January 3, 2018
Nous n’indexons jamais toutes les URL connues, c’est plutôt normal. Concentrez-vous sur rendre votre site génial et inspirant, les choses devraient normalement s’améliorer ensuite.
Si vous avez vérifié que le problème d’indexation ne vient pas d’un problème technique, demandez-vous si cette page a réellement un intérêt. Si la réponse est non, c’est sans doute la raison pour laquelle elle n’est pas indexée.
Si vous avez le sentiment que la page a une faible valeur et que vous craignez que ce soit le cas d’autres pages de votre site, faites un audit gratuit de votre site en utilisant l’Audit de site des Ahrefs Webmaster Tools. L’outil va vérifier deux paramètres souvent associés aux pages à faible valeur :
- Des pages avec peu de texte
- Des pages de contenu dupliqué ou très similaire à une autre
Vous pouvez voir le nombre d’URL avec peu de contenu texte dans le rapport “Tous les problèmes”
Même si du contenu n’a pas forcément à être long pour avoir de la valeur, des pages avec un très faible nombre de mots n’ont souvent pas d’intérêt pour les utilisateurs de moteurs de recherche. Cela vaut alors le coup de les reprendre et de les enrichir si c’est possible.
Vous pouvez également voir les pages de contenu dupliqué ou quasi dupliqué dans le rapport de Contenu dupliqué :
Voici un bon exemple de deux pages à faible valeur qui sont presque similaires :
Ce sont des catégories vides d’un site de e‑commerce. Comme aucune d’entre elles ne présente de produit, elles ne sont pas utiles aux utilisateurs. Elles devraient être supprimées ou améliorées.
Lecture recommandée (en anglais) : 10 Ways to Get Google to Index Your Site
Conclusion
Même si votre site est indexé par Google, cela ne veut pas forcément dire que vous allez être en première page Google pour vos mots-clés ciblés. Être indexé veut dire que vous participez au championnat, pas que vous allez finir sur le podium.
C’est ici qu’intervient le SEO. Le SEO a pour principe d’optimiser votre site pour augmenter la part de trafic issue des moteurs de recherches. Dans ce cas : Google.
Si vous voulez en apprendre plus sur le SEO, consultez notre guide du débutant en SEO
Si vous voulez soumettre votre site à d’autres moteurs de recherche, lisez notre guide complet pour soumettre son site aux moteurs de recherche.
Vous avez des questions ? Rejoignez-moi sur Twitter.