On a lancé cette étude en analysant 6 millions d’URL, et on a constaté que les données structurées Schema sont beaucoup plus courantes sur les pages citées par l’IA que sur celles qui ne le sont pas.

Les pages citées par l’IA étaient presque trois fois plus susceptibles de contenir du JSON-LD que les pages non citées.
C’est un écart important, le genre de stat qui circule sur LinkedIn et dans les slides de conférence comme preuve que les données structurées sont un levier de visibilité IA.
Mais on n’était pas satisfaits de ces données, car il pouvait très facilement s’agir d’une corrélation et non d’une causalité.
Les données structurées Schema se trouvent généralement sur des sites mieux entretenus et plus sophistiqués techniquement, et ces mêmes sites publient du contenu plus solide, construisent davantage d’autorité, obtiennent plus de liens, et font tout ce qui permet d’être cité.
Les données structurées pourraient faire un vrai travail, mais elles pourraient aussi simplement profiter de la dynamique de tous les autres signaux.
On ne pouvait donc pas répondre à la vraie question des professionnels du SEO : si j’ajoute des données structurées à ma page, serais-je davantage cité par l’IA ?
Pour le savoir, on a mené une deuxième étude conçue pour isoler l’effet de l’ajout de données structurées.
Voici ce qu’on a trouvé.
On a suivi 1 885 pages web ayant ajouté du JSON-LD Schema entre août 2025 et mars 2026, on les a comparées à 4 000 pages de contrôle, et on a mesuré les changements de citations sur Google AI Overviews, AI Mode et ChatGPT.
L’ajout de données structurées n’a produit aucune hausse significative des citations sur aucune plateforme.
| Source IA | Effet sur les citations | Conclusion |
|---|---|---|
| Google AIO | -4,6 % | Baisse faible mais statistiquement significative par rapport au groupe de contrôle apparié (les deux groupes étaient en baisse, mais les pages traitées ont légèrement chuté plus vite) |
| Google AI Mode | +2,4 % | Résultat statistiquement indifférenciable de zéro |
| ChatGPT | +2,2 % | Résultat statistiquement indifférenciable de zéro |
Ces pourcentages sont issus de notre analyse la plus fiable (un test de différence de différences appariée).
Dans ce test, les pages traitées pour AI Mode et ChatGPT ont légèrement mieux performé que les pages de contrôle en moyenne, mais les différences sont suffisamment faibles pour pouvoir n’être que du bruit aléatoire sur des milliers d’URL.
Les AI Overviews ont affiché une baisse de 4,6 %, faible mais statistiquement significative par rapport aux pages de contrôle appariées.
Mais ce n’est pas tout à fait l’histoire complète. On va y revenir dans la prochaine section.
Globalement, on ne peut pas dire si les données structurées ont eu un tout petit effet positif ou aucun effet du tout.
Les citations AI Overviews sur les pages qui ont été mises à jour avec un balisage schéma ont baissé de 4,6 % par rapport aux pages de contrôle (donc sans balisage schéma), et le résultat est « statistiquement significatif » (la probabilité d’observer un tel écart par pur hasard est d’environ 1 sur 2 500).
Mais avant que quiconque interprète cela comme « ajouter des données structurées nuit à vos citations AI Overviews », deux éléments sont à garder à l’esprit.
- La taille absolue est faible. On parle d’une perte moyenne d’environ 12 citations par jour par page, dans un échantillon où la plupart des pages en obtenaient des centaines.
- Les pages traitées (avec un balisage) et les pages de contrôle (sans) appariées étaient déjà sur une trajectoire descendante marquée avant l’ajout des données structurées, le genre de déclin auquel on s’attendrait des AI Overviews se retirant de ces types de contenus spécifiques pour des raisons sans rapport avec les données structurées (par exemple une mise à jour Google changeant ce qui est mis en avant, le contenu devenant obsolète, ou Google n’ayant pas recrawlé la page récemment).

Cela dit, si l’ajout de données structurées n’avait aucun effet sur les citations dans un sens ou dans l’autre, on s’attendrait à ce que les pages traitées et les contrôles appariées déclinent ensemble au même rythme (ce qu’on observe globalement pour AI Mode et ChatGPT).
Le fait que les pages traitées aient légèrement plus baissé suggère que les données structurées ont eu un petit effet négatif, mais cela pourrait aussi refléter d’autres facteurs.
On ne peut pas déterminer lequel à partir de ces seules données.
En utilisant Brand Radar, Xibeijia a extrait quelques millions d’URL citées dans les AI Overviews.
Elle a ensuite récupéré l’historique HTML depuis notre base de données de crawl, indiqué si chaque URL contenait <script type="application/ld+json">, et repéré la date à laquelle la présence de données structurées est passée de « False » à « True ».
Cela lui a permis d’identifier 1 885 pages ayant introduit du JSON-LD entre août 2025 et mars 2026.
Pour analyser l’ensemble de ces données, elle a utilisé Agent A, notre nouvel agent marketing IA.

Pour chaque page, Xibeijia connaissait 2 dates clés :
- Le dernier jour où notre crawler a vérifié la page sans y trouver de JSON-LD
- Le premier jour où notre crawler a détecté du JSON-LD sur la page
Le jour où une page a ajouté du JSON-LD est sa date de traitement.
Xibeijia a mesuré combien de fois chaque page était citée par Google AIO, Google AI Mode et ChatGPT dans les 30 jours précédant et suivant la date de traitement.
La partie délicate de toute étude de ce type, c’est de dépasser l’effet “bruit” des données.
Les citations sur l’ensemble de la recherche IA bougeaient durant cette période : les AI Overviews se contractaient, AI Mode explosait.
Si Xibeijia s’était contentée d’une simple comparaison avant/après, elle aurait mesuré la tendance de la plateforme, pas l’effet des données structurées.
Pour chaque URL traitée, elle a donc sélectionné 3 URL de contrôle (provenant de domaines différents, avec des niveaux de citations similaires sur la période de référence) qui n’avaient jamais ajouté de JSON-LD.
Comparer 2 groupes de pages qui étaient citées au même rythme avant, où la seule différence principale était que l’un des groupes avait ajouté des données structurées, a permis d’isoler plus facilement ce que les données structurées ont réellement fait.
On a examiné les données de quatre façons différentes pour s’assurer que toute conclusion résiste à l’examen.
Dans chaque test, on posait une version légèrement différente de la question : « les données structurées ont-elles eu un effet ? »
On ne croit vraiment à un résultat que lorsque plusieurs méthodes concordent, et c’est le cas ici.
Test 1 : Comparaison des changements moyens de citations entre les pages traitées et les pages de contrôle (test t à deux échantillons).

Test 2 : Analyse en différence de différences (DiD) pour éliminer les tendances à l’échelle de la plateforme. C’est le test auquel on fait le plus confiance, et c’est la source des résultats présentés dans cet article.

Test 3 : Représentation semaine par semaine des citations pour vérifier si les pages traitées et de contrôle ne divergeaient pas déjà avant l’ajout des données structurées (étude d’événement).

Test 4 : Nouvelle exécution de la différence de différences (DiD) avec une fenêtre symétrique excluant la période de recrawl, pour s’assurer que le résultat n’était pas sensible à la façon dont on définissait « avant » et « après ».

Les quatre tests ont raconté la même histoire : pas de croissance des citations sur AI Mode, pas de croissance sur ChatGPT, et un léger déclin sur AI Overviews qui est réel mais suffisamment faible pour qu’on ne puisse pas l’attribuer clairement aux données structurées.
Le résultat le plus cohérent, c’est que pas grand-chose n’a changé : les données structurées n’ont eu aucun effet positif ou négatif clairement établi.
Où est ce que les données structurées pourraient encore avoir de l’importance : Les pages pas encore citées par l’IA
Il y a un point important à connaître sur ces données : On a étudié des pages déjà largement citées par l’IA.
Chaque page du jeu de données comptait plus de 100 citations AI Overviews en février 2025, avant tout ajout de données structurées.
Ces pages faisaient déjà partie du périmètre de considération, crawlées et mises en avant par les LLMs.
Si une page est déjà reprise, nos données suggèrent que l’ajout de données structurées ne va pas la propulser plus haut.
Mais pour les pages qui ne sont pas du tout vues par les systèmes IA, les données structurées Schema pourraient encore jouer un rôle pour les aider à être crawlées, analysées ou indexées en premier lieu.
Notre étude ne peut pas répondre directement à cette question, mais une expérience récente de searchVIU aborde une question connexe.
Ils ont testé si 5 LLMs (ChatGPT, Claude, Perplexity, Gemini et Google AI Mode) utilisaient réellement les données structurées lors de la récupération d’une page en temps réel.
Spoiler : aucun ne l’a fait. Lors de la récupération directe, chaque système n’extrayait que le contenu HTML visible. Le JSON-LD, les Microdata cachées et les RDFa cachées étaient tous ignorés.
Quelques autres points à signaler, et des questions qui méritent d’être testées :
- Les pages qui ajoutent du JSON-LD changent souvent d’autres choses en même temps (liens, contenu, corrections techniques). On ne peut pas totalement séparer les données structurées de ces modifications concomitantes.
- On a regroupé tous les types de données structurées. Article, FAQ, Product, HowTo, Organization. Il est possible que certains types aident davantage que d’autres. Cela mériterait d’être approfondi.
- On a mesuré 30 jours après le traitement. Si le JSON-LD a un effet à combustion lente, une fenêtre de 60 ou 90 jours pourrait révéler plus de croissance.
- On a étudié le JSON-LD, le format de données structurées le plus répandu. D’autres formats existent (Microdata et RDFa), mais on ne les a pas encore testés.
- On n’a regardé que les données structurées dans le HTML de la page, pas celles injectées via JavaScript. Les crawlers IA semblent traiter les deux différemment. ¹
- Le léger déclin sur AI Overviews est réel mais inexpliqué. Les pages traitées ont baissé d’environ 4,6 % de plus que les contrôles appariées, et on ne sait pas pourquoi. Une étude de suivi pourrait examiner si des types de données structurées spécifiques ou des types de contenu spécifiques expliquent cet écart.
Vous voulez savoir si les données structurées fonctionnent spécifiquement pour votre site ? Faites une version réduite de cette étude vous-même. Brand Radar peut vous aider pour suivre l’évolution des citations IA :
- Choisissez 5 à 10 pages test sur lesquelles vous prévoyez d’ajouter du JSON-LD. Idéalement des pages qui obtiennent déjà quelques citations IA, pour avoir une référence de départ (les pages avec zéro citation rendent difficile la distinction entre « les données structurées n’ont rien fait » et « la page n’allait de toute façon pas être citée »). Vous pouvez vérifier dans le rapport Pages citées.

- Choisissez 5 à 10 pages de contrôle avec des niveaux de citations similaires auxquelles vous n’allez pas ajouter de données structurées. C’est ce qui permet de distinguer « les données structurées ont fait quelque chose » de « ChatGPT a évolué pour tout le monde ce mois-là ».
- Enregistrez les citations de référence pour les deux groupes sur AI Overview, AI Mode et ChatGPT dans Brand Radar. Appliquez simplement des filtres URL pour isoler ces chiffres de citations.

- Ajoutez les données structurées à vos pages test et notez la date. Ne changez rien d’autre sur ces pages pendant la période de test.
- Comparez les deux groupes après 30 jours (ou plus si possible). La question est : « les pages traitées ont-elles progressé davantage que les pages de contrôle ? »
Si les deux groupes ont évolué de façon similaire, c’est davantage lié à la tendance de la plateforme qu’aux données structurées.
Mais si les pages traitées ont surpassé les pages de contrôle, c’est un signe que les données structurées ont un impact positif sur les citations.
Si vous faites ce test sur vos propres pages et obtenez un résultat différent du nôtre, tenez nous au jus.
Pour les pages déjà citées par l’IA, l’ajout de JSON-LD Schema n’a pas augmenter le nombre de citations sur Google AI Mode ni sur ChatGPT, et n’a montré qu’un léger déclin sur les AI Overviews qu’on ne peut pas clairement attribuer aux données structurées.
Alors pourquoi 53 % des pages citées par l’IA utilisent-elles des données structurées ?
Parce que les sites qui ajoutent des données structurées ont aussi tendance à investir dans le SEO technique, publier du contenu de référence, créer des liens, maintenir leurs pages à jour et bien se positionner dans les résultats organiques.
Les systèmes IA récupèrent plus volontiers ce type de contenu, donc les pages citées sur-indexent sur tous ces signaux à la fois. Retirez les données structurées et il est très probable que le reste des signaux continue à porter la page jusqu’à la citation.
Si vous faites déjà bien tout le reste du travail SEO, le JSON-LD ne sera pas le facteur décisif.
Il existe bien sûr encore de nombreuses bonnes raisons d’utiliser le JSON-LD Schema (rich results, assistants vocaux, graphes de connaissances, reconnaissance d’entités en aval).
Mais si la seule raison pour laquelle vous l’ajoutez est d’obtenir plus de citations IA sur des pages déjà visibles, nos données ne soutiennent pas ce pari.