Méthodologie Brand Radar : comment Ahrefs collecte et modélise les données de visibilité IA

Juliette Begue
Responsable marketing d’Ahrefs France, Juliette aide les marques à maîtriser les fonctionnalités d'Ahrefs et à utiliser le SEO pour démultiplier leur visibilité et leurs leads.

Brand Radar vous per­met de suiv­re et d’explorer la vis­i­bil­ité des mar­ques dans l’IA et la recherche. Com­ment les don­nées sont col­lec­tées, mod­élisées et mis­es à jour ? On vous explique.

Voici com­ment nous recueil­lons les données :

  1. Nous inter­ro­geons des plate­formes IA comme Chat­G­PT, Per­plex­i­ty, Gem­i­ni, Copi­lot et les AI Overviews de Google avec des mil­lions de ques­tions réelles.
  2. Nous enreg­istrons ensuite toutes leurs répons­es afin que vous puissiez les analyser et voir où votre mar­que apparaît.
  3. Nous col­lec­tons les mots-clés et les SERP issus de la base de don­nées d’Ahrefs, qui con­tient plus de 100 mil­liards de mots-clés.
  4. Nous extrayons égale­ment les ques­tions “Peo­ple Also Ask” de Google pour refléter la manière dont les util­isa­teurs posent leurs ques­tions naturellement.
  5. Nous exé­cu­tons ces ques­tions dans les dif­férentes plate­formes IA.
  6. Enfin, nous stock­ons toutes les répons­es, ce qui vous per­met de rechercher dans le texte et les liens pour iden­ti­fi­er les men­tions et cita­tions de votre mar­que (ou de tout autre terme).

Les ensem­bles de ques­tions sont mis à jour et testés chaque mois dans les chat­bots, avec une fenêtre d’analyse de 90 jours.

Les métriques comme la Part de voix (Share of Voice) et les Impres­sions Estimées mod­élisent le niveau de vis­i­bil­ité d’une mar­que sur les sujets pop­u­laires, basé sur l’intérêt de recherche réel. Elles mon­trent une vis­i­bil­ité poten­tielle, non une portée réelle.

Brand Radar aide les entre­pris­es à com­pren­dre com­ment leur mar­que appa­raît dans l’IA et la recherche. Il cal­cule la Part de Voix (Share of Voice) en fonc­tion de la fréquence à laque­lle les mar­ques sont men­tion­nées ou citées dans les répons­es de Chat­G­PT, Per­plex­i­ty, Gem­i­ni, Microsoft Copi­lot et les AI Overviews et AI Mode de Google.

1. Data collection

Brand Radar mod­élise le com­porte­ment réel des util­isa­teurs, sans génér­er de prompts artificiels.

Les requêtes provi­en­nent du cor­pus “Peo­ple Also Ask” de Google et de la base de don­nées Ahrefs de 110 mil­liards de mots-clés (28,7 mil­liards suiv­is). Elles représen­tent la demande de recherche réelle et les for­mu­la­tions naturelles.

Chaque requête est exé­cutée dans les inter­faces IA com­pat­i­bles. Nous stock­ons les répons­es brutes. Les util­isa­teurs peu­vent chercher dans ce cor­pus pour iden­ti­fi­er les cita­tions (URLs liées) et les men­tions (cor­re­spon­dances textuelles) de n’importe quel terme.

Vol­ume men­su­el approx­i­matif des requêtes :

  • Chat­G­PT : 10,6 millions
  • Per­plex­i­ty : 13,1 millions
  • Gem­i­ni : 7,2 millions
  • Copi­lot : 13,3 millions
  • AI Overviews : 134 millions
  • AI Mode : 13,5 millions

Tous les prompts passent par les inter­faces web publiques et gra­tu­ites de Chat­G­PT, Gem­i­ni, Per­plex­i­ty, Copi­lot et autres plate­formes sup­port­ées, afin de refléter l’expérience util­isa­teur réelle.

Le paramé­trage des langues reflète la pro­por­tion de requêtes par pays et par langue dans notre base de mots-clés, assur­ant une représen­ta­tion équili­brée des marchés.

2. Data modeling

Comme les prompts IA sont pra­tique­ment infi­nis, Brand Radar se con­cen­tre sur les sujets à forte demande qui reflè­tent l’intérêt de recherche. Les métriques sont des indi­ca­teurs direc­tion­nels, non des vol­umes de traf­ic exacts. Elles doivent être com­pris­es comme des sig­naux de vis­i­bil­ité mod­élisée, et non comme des métriques de performance.

Les Impres­sions Estimées pondèrent les men­tions par le vol­ume de recherche Google pour mod­élis­er l’exposition potentielle.

Cadence de mise à jour selon la plateforme :

  • Chat­G­PT, Per­plex­i­ty, Gem­i­ni et Copi­lot sont mis à jour men­su­elle­ment, avec une fenêtre d’analyse sta­ble de 90 jours.
  • Google AI Overviews et AI Mode se met­tent à jour en con­tinu, en suiv­ant les cycles de mise à jour de la base de mots-clés.

Le report­ing “Toutes les plate­formes” com­bine les don­nées des deux groupes.

3. Transparence and limites

Un biais sur la couverture

La cou­ver­ture est plus forte en anglais. Les marchés non anglo­phones sont représen­tés proportionnellement.

Une cou­ver­ture plus forte sur les prompts courts et populaires

L’utilisation des chat­bots est très per­son­nal­isée et le nom­bre de requêtes IA pos­si­bles est virtuelle­ment infi­ni. Nous pri­or­isons les ques­tions les plus pop­u­laires et à forte demande issues de notre base de 110 mil­liards de mots-clés et du cor­pus Peo­ple Also Ask. Cela garan­tit une bonne cou­ver­ture des types de ques­tions les plus sus­cep­ti­bles d’apparaître dans les résul­tats IA, même si des prompts très longs ou ultra-niche peu­vent ne pas être inclus.

Anom­alies et hal­lu­ci­na­tions des LLMs

Les LLMs génèrent par­fois des liens hal­lu­cinés ou mal­for­més. Nous ne fil­trons pas ces liens, car ils reflè­tent la réal­ité du com­porte­ment des modèles.

Mis­es à jour des données

La fréquence de mise à jour par plate­forme est décrite dans la sec­tion Mod­éli­sa­tion des données.

4. Comment exploiter les données

Brand Radar est idéal pour :

  • Bench­mark­er la vis­i­bil­ité de mar­que et la Part de Voix
  • Com­par­er la cou­ver­ture des con­cur­rents à tra­vers les plate­formes IA
  • Iden­ti­fi­er les mod­èles de co-cita­tions et les lacunes de visibilité

Ce n’est pas un out­il de mesure d’audience ou d’analyse de traf­ic. Voyez-le comme un audit de vis­i­bil­ité médi­a­tique : il mon­tre ce qui appa­raît dans l’IA et la recherche, pas qui l’a vu.

Avec Brand Radar, vous pou­vez faire de l’IA un vrai moteur de ventes

5. Base de données

Brand Radar s’appuie sur l’infrastructure de don­nées d’Ahrefs : 28,7 mil­liards de mots-clés fil­trés par­mi 110 mil­liards découverts.

Cette base garan­tit que Brand Radar com­bine des don­nées de recherche véri­fiées avec une vis­i­bil­ité IA mod­élisée de manière trans­par­ente. Cette méthodolo­gie est fidèle à l’engagement d’Ahrefs pour l’exactitude et le com­porte­ment réel des utilisateurs.