On a analysé 1 885 pages ajoutant des données structurées Schema. Les citations IA n’ont presque pas bougé.

On a lancé cette étude en analysant 6 millions d’URL, et on a constaté que les données structurées Schema sont beaucoup plus courantes sur les pages citées par l’IA que sur celles qui ne le sont pas.

Infographie montrant l’importance du balisage Schema sur les pages web afin d’améliorer leur compréhension, leur citation et leur visibilité dans les réponses des assistants IA génératifs
Les pages citées par l’IA sont presque trois fois plus susceptibles d’avoir du JSON-LD que les pages non citées.

Les pages citées par l’IA étaient presque trois fois plus susceptibles de contenir du JSON-LD que les pages non citées.

C’est un écart important, le genre de stat qui circule sur LinkedIn et dans les slides de conférence comme preuve que les données structurées sont un levier de visibilité IA.

Mais on n’était pas satisfaits de ces données, car il pouvait très facilement s’agir d’une corrélation et non d’une causalité.

Les données structurées Schema se trouvent généralement sur des sites mieux entretenus et plus sophistiqués techniquement, et ces mêmes sites publient du contenu plus solide, construisent davantage d’autorité, obtiennent plus de liens, et font tout ce qui permet d’être cité.

Les données structurées pourraient faire un vrai travail, mais elles pourraient aussi simplement profiter de la dynamique de tous les autres signaux.

On ne pouvait donc pas répondre à la vraie question des professionnels du SEO : si j’ajoute des données structurées à ma page, serais-je davantage cité par l’IA ?

Pour le savoir, on a mené une deuxième étude conçue pour isoler l’effet de l’ajout de données structurées.

Voici ce qu’on a trouvé.

On a suivi 1 885 pages web ayant ajouté du JSON-LD Schema entre août 2025 et mars 2026, on les a comparées à 4 000 pages de contrôle, et on a mesuré les changements de citations sur Google AI Overviews, AI Mode et ChatGPT.

L’ajout de données structurées n’a produit aucune hausse significative des citations sur aucune plateforme.

Source IAEffet sur les citationsConclusion
Google AIO-4,6 %Baisse faible mais statistiquement significative par rapport au groupe de contrôle apparié (les deux groupes étaient en baisse, mais les pages traitées ont légèrement chuté plus vite)
Google AI Mode+2,4 %Résultat statistiquement indifférenciable de zéro
ChatGPT+2,2 %Résultat statistiquement indifférenciable de zéro

Ces pourcentages sont issus de notre analyse la plus fiable (un test de différence de différences appariée).

Dans ce test, les pages traitées pour AI Mode et ChatGPT ont légèrement mieux performé que les pages de contrôle en moyenne, mais les différences sont suffisamment faibles pour pouvoir n’être que du bruit aléatoire sur des milliers d’URL.

Les AI Overviews ont affiché une baisse de 4,6 %, faible mais statistiquement significative par rapport aux pages de contrôle appariées.

Mais ce n’est pas tout à fait l’histoire complète. On va y revenir dans la prochaine section.

Globalement, on ne peut pas dire si les données structurées ont eu un tout petit effet positif ou aucun effet du tout.

Les citations AI Overviews sur les pages qui ont été mises à jour avec un balisage schéma ont baissé de 4,6 % par rapport aux pages de contrôle (donc sans balisage schéma), et le résultat est « statistiquement significatif » (la probabilité d’observer un tel écart par pur hasard est d’environ 1 sur 2 500).

Mais avant que quiconque interprète cela comme « ajouter des données structurées nuit à vos citations AI Overviews », deux éléments sont à garder à l’esprit.

  1. La taille absolue est faible. On parle d’une perte moyenne d’environ 12 citations par jour par page, dans un échantillon où la plupart des pages en obtenaient des centaines.
  2. Les pages traitées (avec un balisage) et les pages de contrôle (sans) appariées étaient déjà sur une trajectoire descendante marquée avant l’ajout des données structurées, le genre de déclin auquel on s’attendrait des AI Overviews se retirant de ces types de contenus spécifiques pour des raisons sans rapport avec les données structurées (par exemple une mise à jour Google changeant ce qui est mis en avant, le contenu devenant obsolète, ou Google n’ayant pas recrawlé la page récemment).
Infographie illustrant l’évolution des citations dans les AI Overviews de Google après l’ajout d’un balisage Schema sur les pages web et son impact potentiel sur la visibilité IA
Évolution des citations AI Overviews, pages traitées vs contrôle.
Note.
Comment lire ce graphique : les deux courbes sont ancrées à 1,0 à la semaine −1 (la semaine précédant l’ajout des données structurées), elles partent donc toujours du même point par construction. Avant le traitement, les deux groupes déclinent ensemble. Après le traitement, les pages traitées se situent légèrement en dessous des contrôles appariés (c’est l’écart de −4,6 %).

Cela dit, si l’ajout de données structurées n’avait aucun effet sur les citations dans un sens ou dans l’autre, on s’attendrait à ce que les pages traitées et les contrôles appariées déclinent ensemble au même rythme (ce qu’on observe globalement pour AI Mode et ChatGPT).

Le fait que les pages traitées aient légèrement plus baissé suggère que les données structurées ont eu un petit effet négatif, mais cela pourrait aussi refléter d’autres facteurs.

On ne peut pas déterminer lequel à partir de ces seules données.

En utilisant Brand Radar, Xibeijia a extrait quelques millions d’URL citées dans les AI Overviews.

Elle a ensuite récupéré l’historique HTML depuis notre base de données de crawl, indiqué si chaque URL contenait <script type="application/ld+json">, et repéré la date à laquelle la présence de données structurées est passée de « False » à « True ».

Cela lui a permis d’identifier 1 885 pages ayant introduit du JSON-LD entre août 2025 et mars 2026.

Pour analyser l’ensemble de ces données, elle a utilisé Agent A, notre nouvel agent marketing IA.

Méthodologie de l’étude.

Pour chaque page, Xibeijia connaissait 2 dates clés :

  • Le dernier jour où notre crawler a vérifié la page sans y trouver de JSON-LD
  • Le premier jour où notre crawler a détecté du JSON-LD sur la page

Le jour où une page a ajouté du JSON-LD est sa date de traitement.

Note.
« Traitement » est le terme standard désignant le moment où un changement est appliqué à quelque chose qu’on mesure.

Xibeijia a mesuré combien de fois chaque page était citée par Google AIO, Google AI Mode et ChatGPT dans les 30 jours précédant et suivant la date de traitement.

La partie délicate de toute étude de ce type, c’est de dépasser l’effet “bruit” des données.

Les citations sur l’ensemble de la recherche IA bougeaient durant cette période : les AI Overviews se contractaient, AI Mode explosait.

Si Xibeijia s’était contentée d’une simple comparaison avant/après, elle aurait mesuré la tendance de la plateforme, pas l’effet des données structurées.

Pour chaque URL traitée, elle a donc sélectionné 3 URL de contrôle (provenant de domaines différents, avec des niveaux de citations similaires sur la période de référence) qui n’avaient jamais ajouté de JSON-LD.

Comparer 2 groupes de pages qui étaient citées au même rythme avant, où la seule différence principale était que l’un des groupes avait ajouté des données structurées, a permis d’isoler plus facilement ce que les données structurées ont réellement fait.

On a examiné les données de quatre façons différentes pour s’assurer que toute conclusion résiste à l’examen.

Dans chaque test, on posait une version légèrement différente de la question : « les données structurées ont-elles eu un effet ? »

On ne croit vraiment à un résultat que lorsque plusieurs méthodes concordent, et c’est le cas ici.

Test 1 : Comparaison des changements moyens de citations entre les pages traitées et les pages de contrôle (test t à deux échantillons).

Infographie présentant les variations de citations observées par Ahrefs après trois tests réalisés pour vérifier l’impact du balisage Schema sur la visibilité dans les résultats IA et les AI Overviews
Test 1 : comparaison des changements moyens de citations.
Note.
Comment lire ces graphiques : chaque barre montre combien de pages ont connu un changement de citations après le traitement. À droite de zéro = gain, à gauche = perte. Pages traitées en couleur, contrôles en gris. Pour les AI Overviews, quelques valeurs aberrantes (certaines perdant 400 citations par jour, d’autres en gagnant 200) ont tiré la moyenne des pages traitées vers le bas. En les retirant, les groupes traités et de contrôle paraissent à peu près identiques.

Test 2 : Analyse en différence de différences (DiD) pour éliminer les tendances à l’échelle de la plateforme. C’est le test auquel on fait le plus confiance, et c’est la source des résultats présentés dans cet article.

Infographie présentant une analyse en différence de différences (DiD) utilisée pour neutraliser les variations globales de ChatGPT, AI Overviews et Google AI Mode, méthode considérée comme la plus fiable pour valider les résultats de l’étude sur la visibilité IA
Test 2 : analyse en différence de différences (DiD).
Note.
Comment lire ce graphique : chaque point montre l’effet des données structurées après élimination des tendances de plateforme. La barre autour d’un point indique la marge d’erreur. Si elle croise zéro, le résultat pourrait n’être que du bruit. En regardant uniquement la croissance brute avant/après pour AI Mode, on obtenait +43 %, mais cette analyse a révélé que les URL de contrôle avaient presque autant progressé, ce qui signifie qu’AI Mode explosait pour tout le monde. En retirant cela, les +43 % se réduisent aux +2,4 % présentés ici.

Test 3 : Représentation semaine par semaine des citations pour vérifier si les pages traitées et de contrôle ne divergeaient pas déjà avant l’ajout des données structurées (étude d’événement).

Représentation semaine par semaine des citations pour vérifier si les pages traitées et de contrôle ne divergeaient pas déjà avant l'ajout des données structurées (étude d'événement).
Test 3 : étude d’événement semaine par semaine.
Note.
Comment lire ce graphique : les deux courbes sont ancrées à 1,0 à la semaine −1, elles partent donc du même point par construction. C’est la forme qui compte. Les pages traitées et de contrôle ont évolué de façon similaire avant la semaine 0 et ont progressé ensemble après, ce qui indique un boom général d’AI Mode plutôt qu’un effet des données structurées.

Test 4 : Nouvelle exécution de la différence de différences (DiD) avec une fenêtre symétrique excluant la période de recrawl, pour s’assurer que le résultat n’était pas sensible à la façon dont on définissait « avant » et « après ».

Analyse DiD avec fenêtre symétrique pour tester la robustesse des résultats
Test 4 : DiD avec fenêtre symétrique.
Note.
Comment lire ce graphique : chaque plateforme affiche deux estimations côte à côte, une pour chaque définition d’« avant » et d’« après ». Les barres autour du point indiquent la marge d’erreur. Les deux estimations se situent à peu près au même endroit pour chaque plateforme, donc le résultat tient quelle que soit la définition de « avant » et « après ».

Les quatre tests ont raconté la même histoire : pas de croissance des citations sur AI Mode, pas de croissance sur ChatGPT, et un léger déclin sur AI Overviews qui est réel mais suffisamment faible pour qu’on ne puisse pas l’attribuer clairement aux données structurées.

Le résultat le plus cohérent, c’est que pas grand-chose n’a changé : les données structurées n’ont eu aucun effet positif ou négatif clairement établi.

A nuancer

Où est ce que les données structurées pourraient encore avoir de l’importance : Les pages pas encore citées par l’IA

Il y a un point important à connaître sur ces données : On a étudié des pages déjà largement citées par l’IA.

Chaque page du jeu de données comptait plus de 100 citations AI Overviews en février 2025, avant tout ajout de données structurées.

Ces pages faisaient déjà partie du périmètre de considération, crawlées et mises en avant par les LLMs.

Si une page est déjà reprise, nos données suggèrent que l’ajout de données structurées ne va pas la propulser plus haut.

Mais pour les pages qui ne sont pas du tout vues par les systèmes IA, les données structurées Schema pourraient encore jouer un rôle pour les aider à être crawlées, analysées ou indexées en premier lieu.

Notre étude ne peut pas répondre directement à cette question, mais une expérience récente de searchVIU aborde une question connexe.

Ils ont testé si 5 LLMs (ChatGPT, Claude, Perplexity, Gemini et Google AI Mode) utilisaient réellement les données structurées lors de la récupération d’une page en temps réel.

Spoiler : aucun ne l’a fait. Lors de la récupération directe, chaque système n’extrayait que le contenu HTML visible. Le JSON-LD, les Microdata cachées et les RDFa cachées étaient tous ignorés.

Quelques autres points à signaler, et des questions qui méritent d’être testées :

  • Les pages qui ajoutent du JSON-LD changent souvent d’autres choses en même temps (liens, contenu, corrections techniques). On ne peut pas totalement séparer les données structurées de ces modifications concomitantes.
  • On a regroupé tous les types de données structurées. Article, FAQ, Product, HowTo, Organization. Il est possible que certains types aident davantage que d’autres. Cela mériterait d’être approfondi.
  • On a mesuré 30 jours après le traitement. Si le JSON-LD a un effet à combustion lente, une fenêtre de 60 ou 90 jours pourrait révéler plus de croissance.
  • On a étudié le JSON-LD, le format de données structurées le plus répandu. D’autres formats existent (Microdata et RDFa), mais on ne les a pas encore testés.
  • On n’a regardé que les données structurées dans le HTML de la page, pas celles injectées via JavaScript. Les crawlers IA semblent traiter les deux différemment. ¹
  • Le léger déclin sur AI Overviews est réel mais inexpliqué. Les pages traitées ont baissé d’environ 4,6 % de plus que les contrôles appariées, et on ne sait pas pourquoi. Une étude de suivi pourrait examiner si des types de données structurées spécifiques ou des types de contenu spécifiques expliquent cet écart.

Vous voulez savoir si les données structurées fonctionnent spécifiquement pour votre site ? Faites une version réduite de cette étude vous-même. Brand Radar peut vous aider pour suivre l’évolution des citations IA :

Note.
Pour la traduction de cet article, j’ai choisi de filtrer les résultats sur ChatGPT, l’IA la plus utilisée en France. Si vous souhaitez regarder les citations des AIO, vous pouvez simplement changer dans les réglages des filtres.
  • Choisissez 5 à 10 pages test sur lesquelles vous prévoyez d’ajouter du JSON-LD. Idéalement des pages qui obtiennent déjà quelques citations IA, pour avoir une référence de départ (les pages avec zéro citation rendent difficile la distinction entre « les données structurées n’ont rien fait » et « la page n’allait de toute façon pas être citée »). Vous pouvez vérifier dans le rapport Pages citées.
Capture d’écran du rapport « Pages citées » dans Brand Radar d’Ahrefs affichant les pages les plus citées par les assistants IA et moteurs de recherche génératifs
Rapport Pages citées dans Brand Radar.
  • Choisissez 5 à 10 pages de contrôle avec des niveaux de citations similaires auxquelles vous n’allez pas ajouter de données structurées. C’est ce qui permet de distinguer « les données structurées ont fait quelque chose » de « ChatGPT a évolué pour tout le monde ce mois-là ».
  • Enregistrez les citations de référence pour les deux groupes sur AI Overview, AI Mode et ChatGPT dans Brand Radar. Appliquez simplement des filtres URL pour isoler ces chiffres de citations.
Filtres URL dans Brand Radar.
  • Ajoutez les données structurées à vos pages test et notez la date. Ne changez rien d’autre sur ces pages pendant la période de test.
  • Comparez les deux groupes après 30 jours (ou plus si possible). La question est : « les pages traitées ont-elles progressé davantage que les pages de contrôle ? »

Si les deux groupes ont évolué de façon similaire, c’est davantage lié à la tendance de la plateforme qu’aux données structurées.

Mais si les pages traitées ont surpassé les pages de contrôle, c’est un signe que les données structurées ont un impact positif sur les citations.

Si vous faites ce test sur vos propres pages et obtenez un résultat différent du nôtre, tenez nous au jus.

Pour les pages déjà citées par l’IA, l’ajout de JSON-LD Schema n’a pas augmenter le nombre de citations sur Google AI Mode ni sur ChatGPT, et n’a montré qu’un léger déclin sur les AI Overviews qu’on ne peut pas clairement attribuer aux données structurées.

Alors pourquoi 53 % des pages citées par l’IA utilisent-elles des données structurées ?

Parce que les sites qui ajoutent des données structurées ont aussi tendance à investir dans le SEO technique, publier du contenu de référence, créer des liens, maintenir leurs pages à jour et bien se positionner dans les résultats organiques.

Les systèmes IA récupèrent plus volontiers ce type de contenu, donc les pages citées sur-indexent sur tous ces signaux à la fois. Retirez les données structurées et il est très probable que le reste des signaux continue à porter la page jusqu’à la citation.

Si vous faites déjà bien tout le reste du travail SEO, le JSON-LD ne sera pas le facteur décisif.

Il existe bien sûr encore de nombreuses bonnes raisons d’utiliser le JSON-LD Schema (rich results, assistants vocaux, graphes de connaissances, reconnaissance d’entités en aval).

Mais si la seule raison pour laquelle vous l’ajoutez est d’obtenir plus de citations IA sur des pages déjà visibles, nos données ne soutiennent pas ce pari.