LLMO : 10 moyens d’être mentionné par ChatGPT et les autres IA

L’optimisation pour les LLMs (LLMO) con­siste à amélior­er la vis­i­bil­ité de votre mar­que dans les répons­es générées par les LLM. Et le sujet devient de plus en plus ten­dance.  Vous n’avez pas encore planché sur le sujet ? Vous pou­vez encore être en avance, pas d’inquiétude.

tendance-recherche-llmo-optimisation-llm-seo-ia-graphique-gsc-ahrefs

Comme l’a dit Bernard Huang, pen­dant sa prise de parole lors de l’Ahrefs Evolve, “LLMs are the first real­is­tic search alter­na­tive to Google.” :
« Les LLMs sont la pre­mière alter­na­tive crédi­ble à Google pour la recherche. »

Les pro­jec­tions de marché vont dans le même sens :

Vous pou­vez vous plain­dre que les chat­bots IA réduisent votre part de traf­ic ou s’ap­pro­prient votre pro­priété intel­lectuelle. Ce ne serait pas faux.
Mais dans tous les cas, très bien­tôt, vous ne pour­rez plus les ignorer.

Comme aux débuts du SEO, je pense qu’on s’apprête à entr­er dans une sorte de Far West, où les mar­ques vont tout faire pour s’imposer dans les LLM, par tous les moyens.
Et pour équili­br­er, je m’attends aus­si à voir cer­tains acteurs légitimes, arrivés tôt, rafler la mise.

meme-llmo-bon-brute-truand-humour-seo

Apprenez à inté­gr­er les con­ver­sa­tions IA juste à temps pour la ruée vers l’or du LLMO grâce à ce guide SEO x IA.

Comprendre rapidement le LLMO

L’optimisation pour les LLM (Chat­G­PT, Per­plex­i­ty, Claude, Mis­tral AI…) con­siste à pré­par­er l’« univers » de votre mar­que (votre posi­tion­nement, vos pro­duits, vos équipes et les infor­ma­tions qui l’entourent) pour obtenir des men­tions dans un LLM.

Je par­le de men­tions textuelles, de liens, et même de l’intégration native de votre con­tenu de mar­que (par exem­ple des cita­tions, des sta­tis­tiques, des vidéos ou des visuels).

Note.

Petit lexique du LLMO

LLMO (Large Lan­guage Mod­el Optimization)
Ensem­ble des pra­tiques visant à influ­encer la vis­i­bil­ité, les men­tions et les recom­man­da­tions d’une mar­que dans les répons­es des LLM.

LLM (Large Lan­guage Model)
Mod­èle d’IA entraîné sur de vastes vol­umes de don­nées textuelles pour com­pren­dre le lan­gage et génér­er des répons­es (ex. Chat­G­PT, Gemini).

GEO / AEO / AISO (ter­mes proches, sou­vent interchangeables)
Opti­mi­sa­tion des con­tenus pour appa­raître dans les répons­es générées par l’IA, plutôt que dans une liste clas­sique de résultats.

  • GEO (Gen­er­a­tive Engine Opti­miza­tion) : focal­isé sur les moteurs génératifs.
  • AEO (Answer Engine Opti­miza­tion) : cen­tré sur les répons­es directes aux questions.
  • AISO (AI Search Opti­miza­tion) : terme générique englobant les deux.

Men­tions
Références à une mar­que, un pro­duit ou une entité dans une réponse générée par un LLM, avec ou sans lien.

Cita­tions
Men­tions accom­pa­g­nées d’une source iden­ti­fi­able (site, mar­que, URL), util­isées par le LLM pour appuy­er ou jus­ti­fi­er une réponse.

Part de voix IA (AI Share of Voice)
Part rel­a­tive de vis­i­bil­ité d’une mar­que dans les répons­es des LLM, com­parée à celle de ses con­cur­rents sur un ensem­ble de requêtes.

Exemple pour comprendre le LLMO

On va voir un exem­ple concret.

Quand j’ai demandé à Per­plex­i­ty « Qu’est ce qu’un assis­tant de rédac­tion IA », la réponse du chat­bot sour­cait explicite­ment Ahrefs avec 4 liens au-dessus de la ligne de flottaison.

c-est-quoi-llmo-techniques-seo-ia-exemple-comment-etre)-cite

Atten­tion à ne pas con­fon­dre LLM et AI Overviews, même si c’est effec­tive­ment lié.

Voyez le LLMO comme un nou­veau type de SEO. Les mar­ques cherchent active­ment à opti­miser leur vis­i­bil­ité dans les LLM, comme elles le font déjà dans les moteurs de recherche.
En réal­ité, le mar­ket­ing LLM pour­rait devenir une dis­ci­pline à part entière. Har­vard Busi­ness Review va même jusqu’à dire que les SEOs seront bien­tôt appelés des LLMOs.

Les LLM comme Chat­G­PT ne se con­tentent pas de fournir des infor­ma­tions sur les mar­ques, ils les recom­man­dent.

Comme un con­seiller de vente ou un per­son­al shop­per, ils influ­en­cent même les util­isa­teurs à sor­tir leur carte bancaire.

Si les gens utilisent les chat­bot IA pour obtenir des répons­es et acheter, votre mar­que doit apparaître.

Mais c’est loin d’être la seule rai­son pour laque­lle vous devez suiv­re cette tendance.
Voici les avan­tages clés à inve­stir dans le LLMO :

  • Vous péren­nisez la vis­i­bil­ité de votre marque.
    Les LLM ne vont pas dis­paraître. Ils devi­en­nent un nou­veau canal majeur pour dévelop­per la notoriété.
  • Vous béné­fi­ciez d’un avan­tage de pre­mier entrant (si vous agis­sez vite).
  • Vous occu­pez davan­tage d’espace en liens et en cita­tions, ce qui laisse moins de place à vos concurrents.
  • Vous vous inté­grez à des con­ver­sa­tions clients per­ti­nentes et personnalisées.
  • Vous aug­mentez vos chances que votre mar­que soit recom­mandée dans des con­ver­sa­tions à forte inten­tion d’achat.
  • Vous générez du traf­ic de recom­man­da­tion depuis les chat­bots vers votre site.
  • Vous améliorez votre vis­i­bil­ité dans la recherche par ricochet.
  • Le traf­ic venant des LLM ont un meilleur taux de con­ver­sion que les moteurs de recherche.

Le LLMO et le SEO sont étroitement liés

Les LLM RAG : c’est quoi?

La plu­part des chat­bots qui s’appuient sur des LLM sont des LLM RAG, pour « retrieval aug­ment­ed gen­er­a­tion », qui récupèrent des infor­ma­tions en direct sur inter­net en temps réel (par exem­ple Gemini).

Les LLM qui récupèrent des infor­ma­tions en direct peu­vent citer leurs sources avec des liens et envoy­er du traf­ic de recom­man­da­tion vers votre site, ce qui améliore votre vis­i­bil­ité organique.

Des rap­ports récents mon­trent que Per­plex­i­ty envoie même du traf­ic vers des pub­li­ca­tions qui essaient de le bloquer.

Comment suivre le trafic provenant des chatbots IA facilement ?

Trou­ver la part de votre traf­ic qui provient des LLM comme Chat­G­PT est sim­ple et gratuit :

  1. Utilis­er Ahrefs Web­an­a­lyt­ics, l’alternative gra­tu­ite à Google Analytics
  2. Dans la vue d’ensemble, scrollez jusqu’aux sources de trafic
  3. Cliquez sur “Recherch­es basées sur l’IA”

ahrefs-web-analytics-alternative-google-analytics-geo

Pas besoin de regex, juste de 2 clics.

[ahrefs-web-ana­lyt­ics-alter­na­tive-google-ana­lyt­ics-geo]

Les LLM peu­vent amélior­er votre traf­ic et votre SEO.
Mais, inverse­ment, votre SEO a aus­si le poten­tiel d’améliorer la vis­i­bil­ité de votre mar­que dans les LLM.

La mise en avant d’un con­tenu dans l’entraînement des LLM est influ­encée par sa per­ti­nence et sa découvrabilité. 
Olaf Kopp, Co-Founder, Aufge­sang GmbH

LLMO vs SEO : tableau comparatif

Le SEO vous place dans une liste. Le LLMO vous place dans une conversation.

Deux jeux de règles, deux façons de gag­n­er et une belle zone en com­mun au milieu.

réus­sir une dou­ble strat’

Dimen­sionSEO (recherche “clas­sique”)LLMO (LLMs / moteurs génératifs)
Objec­tifÊtre classé et obtenir des clics depuis la SERP.Être men­tion­né / cité / recom­mandé dans une réponse IA, avec ou sans clic.
Sur­face de visibilitéRésul­tats organiques, fea­tured snip­pets, PAA, images, etc.Répons­es générées (Chat­G­PT, Per­plex­i­ty, Gem­i­ni…), AI Overviews, cita­tions intégrées.
Unité de “rank­ing”Une page se posi­tionne sur une requête.Une entité (marque/personne/produit) s’impose dans un con­texte.
Ce qui “compte” le plusPer­ti­nence requête ↔ con­tenu, qual­ité on-page, autorité, sig­naux techniques.Crédi­bil­ité (sources, stats, preuves)

Représen­ta­tion (exac­ti­tude de la marque)

Disponi­bil­ité (être trouvable/citable quand l’IA cherche)

For­mats qui performentPages opti­misées (guides, caté­gories, land­ing pages, FAQ).Con­tenus “cita­bles” : déf­i­ni­tions nettes, don­nées pro­prié­taires, com­para­t­ifs, FAQs, pris­es de posi­tion sourcées.
Off-pageBack­links, ancres, men­tions, PR, E‑E-A‑T indirect.Men­tions + co-cita­tions + PR + UGC (forums) : tout ce qui ren­force l’association mar­que ↔ sujet.
Tech­niqueCrawl, index­a­tion, perf, struc­ture interne, canon­i­cal, etc.HTML acces­si­ble, pages sta­bles, info facile à extraire ; “aidons l’IA à lire vite et bien”.
Mesure (KPI)
  • Posi­tions / visibilité
  • Traf­ic organique
  • CTR, con­ver­sions
  • Men­tions & cita­tions IA
  • Part de voix IA vs concurrents
  • Traf­ic de recom­man­da­tion depuis les chatbots
Volatil­itéÉlevée, mais avec des pat­terns con­nus (updates, con­cur­rence, intent).Très élevée : répons­es non déter­min­istes + sources vari­ables + prompts infinis.
Hori­zon d’impactSou­vent pro­gres­sif, cumu­latif (mois).Mix : quick wins pos­si­bles, mais le vrai gain vient d’un tra­vail “mar­que + sources + cohérence”.
Con­clu­sion pratiqueLe meilleur move : garder votre SEO solide et ajouter une couche LLMO.

On ne rem­place pas, on empile.

L’optimisation LLM est un domaine très récent et nos recherch­es sont encore en cours.
Cela dit, j’ai iden­ti­fié plusieurs straté­gies et de tech­niques qui, selon les études disponibles, ont le poten­tiel d’augmenter la vis­i­bil­ité de votre mar­que dans les LLM.
Les voici, sans ordre particulier :

Les LLM inter­prè­tent le sens en analysant la prox­im­ité entre les mots et les expressions.

J’ai vulgarisé le process d’interprétation des LLM :

  1. Les LLM pren­nent les mots présents dans les don­nées d’entraînement et les trans­for­ment en tokens. Ces tokens peu­vent représen­ter des mots, mais aus­si des frag­ments de mots, des espaces ou de la ponctuation.
  2. Ils traduisent ensuite ces tokens en embed­dings, c’est-à-dire des représen­ta­tions numériques.
  3. Puis, ils posi­tion­nent ces embed­dings dans un « espace » sémantique.
  4. Enfin, ils cal­cu­lent l’angle de « sim­i­lar­ité cos­i­nus » entre les embed­dings dans cet espace afin d’évaluer leur prox­im­ité ou leur dis­tance séman­tique, et ain­si com­pren­dre leur relation.

Je vous ai perdu ?
Atten­dez, ne partez pas encore, je vous explique avec un exem­ple et des images :

LLMO et clusters thématiques : l’exemple des animaux

Imag­inez le fonc­tion­nement interne d’un LLM comme une carte de clus­ters / cocons. Les sujets thé­ma­tique­ment proches, comme « chien » et « chat », sont regroupés, tan­dis que ceux qui ne le sont pas, comme « chien » et « skate­board », sont plus éloignés.

representation-visuelle-carte-cluster-cocons-fonctionnement-llm-chatgpt

Note.
Qui avait la référence entre le chien et le skate? Otto the Skate­board­ing Dog.

LLMO et relations presses : l’exemple des chaises ergonomiques

Lorsque vous deman­dez à Claude quelles chais­es sont adap­tées pour amélior­er la pos­ture, il recom­mande les mar­ques Her­man Miller, Steel­case Ges­ture et Humanscale.

C’est parce que ces entités de mar­que présen­tent la prox­im­ité mesurable la plus forte avec le sujet « amélio­ra­tion de la posture ».

exemple-fonctionnement-llm-claude-optimisation-geo-seo

Pour être men­tion­né dans des recom­man­da­tions de pro­duits LLM sim­i­laires, à forte valeur com­mer­ciale, vous devez créer des asso­ci­a­tions solides entre votre mar­que et les sujets asso­ciés.

> Inve­stir dans les rela­tions press­es peut vous y aider.

Rien que l’année dernière, Her­man Miller a obtenu 273 pages de men­tions presse liées au terme « ergonomique » dans des médias comme Yahoo, CBS, CNET, The Inde­pen­dent et Tech Radar.

A screenshot from Ahrefs Content Explorer showing brand mentions in content for the words "Herman Miller Ergonomic". Highlighting 273 pages worth of mentions

Une par­tie de cette notoriété thé­ma­tique a été générée de manière organique, par exem­ple via des avis :

Screenshot highlighting a review of herman miller vs steelcase from Yahoo

Une autre provient des ini­tia­tives PR pro­pres à Her­man Miller, comme des com­mu­niqués de presse…

Screenshot highlighting a mention in PR Newswire from a Herman Miller press release

… ain­si que de cam­pagnes de PR ori­en­tées produit…

Screenshot of a headline from Luxury Daily reading "Herman miller creates special-edition gaming chairs in new collaboration" highlighting the fact that Herman Miller invests in product-led pr collaborations

Cer­taines men­tions sont issues de pro­grammes d’affiliation payants…

Screenshot of a headline from Yahoo reading "Feeling back pain? Try one of the 7 top-rated ergonomic office chairs" with text highlighted reading"Rolling Stone may receive an affiliate"

Et d’autres de parte­nar­i­ats sponsorisés…

Screenshot of a headline from CBS reading "Why is the Herman Miller so famous?" with text highlighted reading "Sponsored: Advertising".

On réca­pit­ule les 7 leviers de la stratégie LLMO de Her­man Miller pour être cité en pre­mier par Claude :

  1. Génér­er beau­coup retombées dans des grands médias
  2. Inciter les util­isa­teurs à laiss­er des avis
  3. Écrire des com­mu­niqués de presse régulièrement
  4. Com­mu­ni­quer sur les nou­veautés pro­duit via des con­tenus pour les médias
  5. Lancer des cam­pagnes d’affiliation
  6. Men­er des parte­nar­i­ats rémunérés dans leur secteur

Toutes ces approches sont des straté­gies légitimes pour ren­forcer la per­ti­nence thé­ma­tique et amélior­er vos chances de vis­i­bil­ité dans les LLM.

Si vous investis­sez dans une cam­pagne RP pilotée par sujets, assurez-vous de suiv­re votre part de voix, vos men­tions web et vos liens pour les thé­ma­tiques clés qui vous impor­tent, par exem­ple « ergonomie ».

trouver-sa-part-de-voix-avec-ahrefs-brand-radar-optimisation-llm

Cela vous aidera à iden­ti­fi­er pré­cisé­ment les actions RP les plus effi­caces pour aug­menter la vis­i­bil­ité de votre marque.

Vous pou­vez suiv­re la pro­gres­sion de vos indi­ca­teurs liés aux IA grâce à Brand Radar :

  • men­tions web
  • traf­ic issu des mentions
  • votre part de marché
  • Si vous appa­rais­sez dans les AI overviews

On va y revenir un peu plus bas.

trouver-informations-ai-overviews-llms-sur-ahrefs-brand-radar-explications

En par­al­lèle, con­tin­uez à tester les LLM avec des ques­tions liées à vos thé­ma­tiques pri­or­i­taires et notez toute nou­velle asso­ci­a­tion de sujets.

Si vos con­cur­rents sont déjà cités par l’IA sur des requêtes per­ti­nentes où vous n’apparaissez pas, vous devrez analyser leurs men­tions et réalis­er une analyse con­cur­ren­tielle des écarts.

Vous pour­rez ain­si com­pren­dre leur vis­i­bil­ité, définir des KPI con­crets à attein­dre (par exem­ple le nom­bre de men­tions pour le sujet X) et com­par­er vos per­for­mances aux leurs.

Je vous explique com­ment trou­ver ses écarts de con­tenu dans les IA ici.

J’en ai par­lé plus tôt, cer­tains chat­bots peu­vent se con­necter aux résul­tats web et les citer. Ce proces­sus est appelé RAG, pour « retrieval aug­ment­ed generation ».

Récem­ment, un groupe de chercheurs en IA a mené une étude por­tant sur 10 000 requêtes réelles issues des moteurs de recherche (sur Bing et Google), afin d’identifier les tech­niques les plus sus­cep­ti­bles d’augmenter la vis­i­bil­ité dans des chat­bots RAG comme Per­plex­i­ty ou BingChat.

Pour chaque requête, ils ont sélec­tion­né aléa­toire­ment un site web à opti­miser, puis testé :

  • dif­férents types de contenus : 
    • cita­tions,
    • ter­mes techniques
    • sta­tis­tiques…
  • dif­férentes caractéristiques : 
    • flu­id­ité,
    • com­préhen­sion
    • ton d’autorité…

Voici leurs résultats :

tableau-etude-llmo-analyse-requetes-llm-contenus-avec-citations-statistiques-sources-priviliegies

Les sites qui inclu­ent des cita­tions, des sta­tis­tiques et des sources étaient les plus fréquem­ment référencés par Chat­G­PT et les autres LLMs enrichis par la recherche. Ils ont enreg­istré une aug­men­ta­tion de 30 à 40 % du « Posi­tion adjust­ed word count », autrement dit de la vis­i­bil­ité, dans les répons­es des LLM.

Ces trois élé­ments ont un point com­mun essen­tiel. Ils ren­for­cent l’autorité et la crédi­bil­ité d’une mar­que. Ce sont aus­si des types de con­tenus qui ont ten­dance à génér­er des backlinks.

Les LLM appren­nent à par­tir d’un large éven­tail de sources en ligne. Si une cita­tion ou une sta­tis­tique est régulière­ment men­tion­née, un LLM va très prob­a­ble­ment la partager plus sou­vent dans ses réponses.

Alors, si vous voulez que le con­tenu de votre mar­que appa­raisse dans les LLM, com­plétez le avec avec

  • des cita­tions pertinentes
  • des sta­tis­tiques propriétaires
  • des sources fiables

ajouter-citations-statistiques-sources-dans-cpontneus-pour-etre-cite-par-chatgpt-exemple

Et gardez ce con­tenu court et syn­thé­tique. J’ai con­staté que la plu­part des LLM ne four­nissent générale­ment qu’une ou deux phras­es de cita­tions ou de statistiques.

Avant d’aller plus loin, il faut absol­u­ment que je salue 2 pro­fes­sion­nels du SEO excep­tion­nels ren­con­trés lors de notre événe­ment Ahrefs Evolve, qui ont inspiré cette recom­man­da­tion : Bernard Huang et Aley­da Solis.

On a déjà com­pris que les LLM se con­cen­trent sur les rela­tions entre les mots et les expres­sions pour prédire leurs réponses.

Pour s’aligner avec cette logique, vous devez dépass­er la sim­ple approche par mots-clés isolés et analyser votre mar­que à tra­vers le prisme de ses entités.

Analyser comment les LLM perçoivent votre marque

Vous pou­vez auditer les entités (per­son­nes, mar­ques, con­cepts, pro­duits…) asso­ciées à votre mar­que afin de mieux com­pren­dre com­ment les LLM la perçoivent.

Pen­dant Ahrefs Evolve, Bernard Huang, fon­da­teur de Clearscope, a présen­té une méth­ode effi­cace pour analyser vos entités sur les GSE (chat­G­PT, Mis­tral AI…).

Il a essen­tielle­ment repro­duit le proces­sus qu’utilise le LLM de Google pour com­pren­dre et class­er les contenus.

Pour com­mencer, il a établi que Google s’appuie sur « les 3 piliers du rank­ing » pour pri­oris­er les con­tenus : le texte prin­ci­pal (body), le texte d’ancrage et les don­nées d’interaction utilisateur.

3-piliers-pour-ranker-seo-priorisation-du-contenu-selon-google-body-ancres-interactions

Ensuite, à par­tir des don­nées issues du Google Leak, il a émis l’hypothèse que Google iden­ti­fie les entités de la manière suivante :

  • Analyse on-page : durant le proces­sus de classe­ment, Google utilise le traite­ment du lan­gage naturel (NLP) pour iden­ti­fi­er les thé­ma­tiques, ou « page embed­dings », présentes dans le con­tenu d’une page. Bernard estime que ces embed­dings aident Google à mieux com­pren­dre les entités.
  • Analyse au niveau du site : au cours de ce même proces­sus, Google col­lecte des don­nées sur le site. Là encore, Bernard pense que ces don­nées ali­mentent la com­préhen­sion des entités par Google. Ces don­nées incluent : 
    • Les embed­dings de site : les thé­ma­tiques recon­nues à l’échelle de l’ensemble du site.
    • Le score de focus du site : un indi­ca­teur du niveau de con­cen­tra­tion du site sur un sujet spécifique.
    • Le ray­on du site : une mesure de l’écart entre les thé­ma­tiques des pages indi­vidu­elles et les thé­ma­tiques glob­ales du site.

Pour repro­duire le mode d’analyse de Google, Bernard a util­isé l’API Nat­ur­al Lan­guage de Google afin d’identifier les page embed­dings, ou poten­tielles « entités au niveau de la page », présentes dans un arti­cle d’iPullRank.

Screenshot from Bernard Huang's Ahrefs talk showing analysis of iPullRank's Google Leak article, using Google's NLP API on right of screenshot. Analysis reveals page embedding topics like "Clicks, components, Cloud platform, connections, content, confidence etc."

Il s’est ensuite tourné vers Gem­i­ni et a posé la ques­tion : « Sur quels sujets iPull­Rank est-il perçu comme faisant autorité ? », afin de mieux com­pren­dre le focus d’entités au niveau du site et d’évaluer le degré d’alignement entre la mar­que et son contenu.

Screenshot from Bernard Huang's Ahrefs talk show a query in Gemini “What topics are iPullRank authoritative in?”. Answer includes technical seo, content strategy, and seo consulting

Enfin, il a analysé le texte d’ancrage pointant vers le site d’iPullRank, puisque les ancres indiquent la per­ti­nence thé­ma­tique et con­stituent l’un des trois piliers du ranking.

Ahrefs backlink analysis dashboard showing anchor text distribution for ipullrank.com with 1,652 total anchors. Detailed metrics including referring domains, DR scores, and dofollow percentages for top anchor texts including iPullRank and Mike King.

Si vous souhaitez que votre mar­que appa­raisse naturelle­ment dans des con­ver­sa­tions clients pilotées par l’IA, c’est exacte­ment cette méth­ode que vous devez appli­quer pour auditer et com­pren­dre vos pro­pres entités de marque.

Évaluer votre situation actuelle et définir votre objectif

Une fois que vous con­nais­sez vos entités de mar­que exis­tantes, vous pou­vez iden­ti­fi­er les écarts entre les sujets pour lesquels les LLM vous con­sid­èrent comme légitime et ceux sur lesquels vous souhaitez apparaître.

Il ne vous reste alors qu’à créer de nou­veaux con­tenus de mar­que pour ren­forcer ces associations.

Utiliser des outils de recherche d’entités de marque

Voici 3 out­ils que vous pou­vez utilis­er pour auditer vos entités de mar­que et amélior­er vos chances d’apparaître dans des con­ver­sa­tions LLM per­ti­nentes pour votre marque :

1. Google’s Nat­ur­al Lan­guage API

L’API Nat­ur­al Lan­guage de Google est un out­il payant qui vous mon­tre les entités présentes dans le con­tenu de votre marque.

D’autres chat­bots LLM utilisent des jeux de don­nées d’entraînement dif­férents de ceux de Google, mais il est raisonnable de sup­pos­er qu’ils iden­ti­fient des entités sim­i­laires, puisqu’ils reposent eux aus­si sur le traite­ment du lan­gage naturel.

Google's NLP API screenshot. Analysis reveals page embedding topics for iPullRank's article like "Clicks, components, Cloud platform, connections, content, confidence etc."

2. Inlinks’ Enti­ty Analyzer

L’Entity Ana­lyz­er d’Inlinks utilise égale­ment l’API de Google et vous offre quelques analy­ses gra­tu­ites pour com­pren­dre votre opti­mi­sa­tion des entités au niveau du site.

A screenshot of inLink's free entity identity checker for ahrefs, showing 16% of entities being detected: ahrefs, big data, seo, pps, pr, twitter, academy, youtube.

3. Ahrefs’ AI Con­tent Helper

Notre out­il AI Con­tent Helper vous indique les entités que vous ne cou­vrez pas encore au niveau d’une page et vous con­seille sur les actions à men­er pour amélior­er votre autorité thématique.

trouver-entites-pour-ranker-sur-llm-exemple-outil-ahrefs-ai-content-helper-ameliorer-autorite-thematique-analyse-contenu

Selon une étude de Seer Inter­ac­tive, avoir un bon classe­ment dans les moteurs de recherche aug­mente la prob­a­bil­ité qu’une mar­que soit citée dans des répons­es générées par l’IA (on par­le de cette étude à la sec­tion n°9.)

C’est exacte­ment ce que fait Brand Radar, entre autres (telle­ment plus de pos­si­bil­ités!)

Imag­inez si vous pouviez…

  • rechercher une thé­ma­tique de mar­que impor­tante et à forte valeur
  • décou­vrir com­bi­en de fois votre mar­que est men­tion­née en lien avec cette thé­ma­tique dans les IA
  • com­par­er les men­tions de votre mar­que et votre Part de Voix IA à celles de vos concurrents

exemple-indicateur-llmo-brand-radar-mentions-ai-citations-ia-ahrefs

Brand Radar rend ce work­flow concret.

En quelques sec­on­des, une sim­ple recherche vous per­met d’obtenir un rap­port com­plet sur la vis­i­bil­ité de votre mar­que afin de com­par­er vos per­for­mances dans les LLM.

Vous pou­vez ensuite vous inté­gr­er aux con­ver­sa­tions IA en :

  • Analysant et recy­clant les straté­gies des con­cur­rents ayant la plus forte vis­i­bil­ité dans les IA
  • Tes­tant l’impact de vos actions mar­ket­ing et PR sur la vis­i­bil­ité dans les IA
  • Ren­forçant les straté­gies les plus effi­caces identifiées
  • Iden­ti­fi­ant des sites tiers béné­fi­ciant d’une forte vis­i­bil­ité dans les Chat­bots IA et AI Overviews
  • Nouant les meilleurs parte­nar­i­ats iden­ti­fiés pour obtenir davan­tage de co-citations

Nous avons vu com­ment vous entour­er des bonnes entités et com­ment rechercher les entités per­ti­nentes. Il est main­tenant temps de par­ler du fait de devenir une entité de mar­que à part entière.
Au moment de la rédac­tion de cet arti­cle, les men­tions et recom­man­da­tions de mar­que dans les LLM dépen­dent forte­ment de votre présence sur Wikipedia, car Wikipedia représente une part sig­ni­fica­tive des don­nées d’entraînement des LLM.

À ce jour, tous les LLM sont entraînés à par­tir du con­tenu de Wikipedia, qui con­stitue presque tou­jours la plus grande source de don­nées dans leurs jeux d’entraînement.
Sele­na Deck­el­mann, Chief Prod­uct and Tech­nol­o­gy Offi­cer, Wiki­me­dia Foundation

Vous pou­vez revendi­quer la page Wikipedia de votre mar­que en respec­tant ces qua­tre principes clés :

  • Notoriété : votre mar­que doit être recon­nue comme une entité à part entière. Dévelop­per des men­tions dans des arti­cles de presse, des livres, des pub­li­ca­tions académiques et des inter­views peut vous y aider.
  • Véri­fi­a­bil­ité : vos affir­ma­tions doivent être étayées par des sources tierces fiables.
  • Neu­tral­ité de point de vue : les pages de votre mar­que doivent être rédigées dans un ton neu­tre et non biaisé.
  • Absence de con­flit d’intérêts : assurez-vous que la per­son­ne qui rédi­ge le con­tenu soit impar­tiale vis-à-vis de la mar­que, par exem­ple ni pro­prié­taire ni mar­ke­teur, et qu’elle priv­ilégie des infor­ma­tions factuelles plutôt que promotionnelles.
Astuce
Mul­ti­pliez les con­tri­bu­tions pour assur­er votre crédi­bil­ité en tant que con­tribu­teur avant de ten­ter de revendi­quer vos pages Wikipedia, afin d’avoir des chances de succès.

Une fois votre mar­que listée, il s’agit ensuite de pro­téger cette page con­tre les mod­i­fi­ca­tions biaisées ou inex­actes qui, si elles ne sont pas sur­veil­lées, pour­raient se retrou­ver dans les LLM et dans les con­ver­sa­tions clients.

Un effet sec­ondaire posi­tif du fait d’avoir des pages Wikipedia bien struc­turées est que vous avez davan­tage de chances d’apparaître indi­recte­ment dans le Knowl­edge Graph de Google.
Les Knowl­edge Graphs struc­turent les don­nées d’une manière plus facile à traiter pour les LLM. Wikipedia est donc un levi­er durable en matière d’optimisation LLM.

Si vous cherchez à amélior­er active­ment la présence de votre mar­que dans le Knowl­edge Graph, utilisez l’outil Google Knowl­edge Graph Search de Carl Hendy pour analyser votre vis­i­bil­ité actuelle et son évo­lu­tion. Il affiche des résul­tats pour des per­son­nes, des entre­pris­es, des pro­duits, des lieux et d’autres types d’entités.

Screenshot of a search for CNN in Carl Hendy's Google Knowledge Graph Search Tool showing 20 entity results, including Cable News Network Inc., CNN Türk, and CNN Brazil

Les vol­umes de recherche ne cor­re­spon­dent pas for­cé­ment à la quan­tité de prompts, mais vous pou­vez tout de même exploiter les don­nées de vol­ume pour iden­ti­fi­er des ques­tions de mar­que impor­tantes sus­cep­ti­bles d’apparaître dans les con­ver­sa­tions LLM.

Com­ment trou­ver les ques­tions de mar­que sur Ahrefs ?

Vous pou­vez trou­ver les ques­tions de mar­que en longue traîne dans l’outil Key­words Explor­er, dans le rap­port Ter­mes Correspondants.

  • Rechercher une thé­ma­tique pertinente
  • Ouvrir l’onglet « Questions »,
  • Activ­er le fil­tre « Marque »

Vous obtenez une liste de requêtes aux­quelles répon­dre dans votre contenu.

rechercher-question-avec-sa-marque-dans-prompts-chatgpt-sur-ahrefs

Surveillez les suggestions des LLM et des moteurs de recherche

Si votre mar­que est déjà bien établie, vous pou­vez même men­er une recherche de ques­tions directe­ment dans un chat­bot IA.

Cer­tains LLM intè­grent une fonc­tion­nal­ité de saisie semi-automa­tique dans leur barre de recherche. En tapant un prompt comme « Est ce que [nom de mar­que]… », vous pou­vez déclencher cette fonc­tion­nal­ité voire même en com­mençant avec le nom de votre mar­que pour voir les sujets actuellement.

suggestions-automatiques-chatgpt-inspiration-geo

Ces sug­ges­tions sont indépen­dantes de l’autocomplétion Google ou des ques­tions Peo­ple Also Ask.

suggestions-mots-clefs-google-tendances-marque

Ce type de recherche reste évidem­ment lim­ité, mais il peut vous fournir des idées sup­plé­men­taires sur les thé­ma­tiques que vous devez cou­vrir pour ren­forcer la vis­i­bil­ité de votre mar­que dans les LLM.

Vous ne pou­vez pas sim­ple­ment vous appuy­er sur le « fine-tun­ing » pour percer dans les LLM commerciaux
Le con­cept de « fine-tun­ing » con­siste à entraîn­er un LLM afin qu’il com­prenne mieux un con­cept ou une entité.
Mais il ne suf­fit pas de coller une grande quan­tité de doc­u­men­ta­tion de mar­que dans Copi­lot en espérant être men­tion­né et cité indéfiniment.
Le fine-tun­ing n’améliore pas la vis­i­bil­ité de mar­que dans les LLM publics comme Chat­G­PT ou Gem­i­ni. Il ne fonc­tionne que dans des envi­ron­nements fer­més et per­son­nal­isés, comme les CustomGPTs.

screenshot-kanerika-difference-entre-llm-fine-tuning-entrainer-chatgpt-possible

Tableau com­para­tif des LLM publics et privés par Kanerika

Cela per­met d’éviter que des répons­es biaisées soient dif­fusées publiquement.
Le fine-tun­ing peut être utile en interne, mais pour amélior­er la vis­i­bil­ité de votre mar­que, vous devez surtout vous con­cen­tr­er sur l’intégration de votre mar­que dans les don­nées d’entraînement des LLM publics.

Les entre­pris­es IA restent très dis­crètes sur les don­nées d’entraînement qu’elles utilisent pour affin­er les répons­es des LLM.

Les mécan­ismes internes des grands mod­èles de lan­gage au cœur des chat­bots restent une véri­ta­ble boîte noire.
Adam Rogers, Senior Tech Cor­re­spon­dent, Busi­ness Insider

Voici quelques-unes des sources qui ali­mentent les LLM. Il a fal­lu creuser en pro­fondeur pour les iden­ti­fi­er, et je pense n’avoir fait qu’effleurer le sujet.

LLM training data sources, including blogs, news articles, reddit, codebase repositories, wikipedia, academic papers public gov resources, books, and open access databases.

Les LLM sont essen­tielle­ment entraînés sur un cor­pus mas­sif de textes issus du web.

Par exem­ple, Chat­G­PT est entraîné sur 19 mil­liards de tokens de con­tenus web et sur 410 mil­liards de tokens provenant des pages du Com­mon Crawl.

A table titled "Datasets used to train GPT-3" listing datasets, their quantity in tokens, weight in the training mix, and epochs elapsed when training for 300 billion tokens. Datasets include Common Crawl (filtered), WebText2, Books1, Books2, and Wikipedia with corresponding data on the number of tokens and their representation in the training process.

Étude de recherche Ope­nAI Lan­guage Mod­els are Few-Shot Learners

Une autre source clé des don­nées d’entraînement des LLM est le con­tenu généré par les util­isa­teurs, et plus pré­cisé­ment Reddit.

« Notre con­tenu est par­ti­c­ulière­ment impor­tant pour l’intelligence arti­fi­cielle. Il con­stitue un socle fon­da­men­tal de l’entraînement de nom­breux grands mod­èles de lan­gage (LLM). »

Pour ren­forcer la vis­i­bil­ité et la crédi­bil­ité de votre mar­que, il est per­ti­nent de lancer et affin­er une bonne stratégie Reddit.

Si vous souhaitez aug­menter les men­tions de mar­que issues de con­tenus générés par les util­isa­teurs, tout en évi­tant les pénal­ités liées au par­a­site SEO, con­cen­trez-vous sur :

Ensuite, une fois ces actions mis­es en place, vous devez suiv­re votre pro­gres­sion sur Reddit.

Vous pou­vez le faire avec Ahrefs via Brand Radar dans l’onglet Red­dit tout en com­para­nt votre pro­gres­sion sur Red­dit avec vos concurrents :

screenshot-comment-suivre-progression-visibilite-marque-sur-reddit-avec-ahrefs

Gem­i­ni n’entraînerait théorique­ment pas ses mod­èles à par­tir des prompts ou des répons­es des utilisateurs…

Google Cloud's "Data you submit and receive" section explaining data handling for Gemini. It highlights that prompts submitted to Gemini are not used to train models unless explicitly shared for product improvements and details about code customization and validation of Gemini's output.

Cepen­dant, le fait de fournir un retour sur ses répons­es sem­ble l’aider à mieux com­pren­dre les marques.
Lors de son excel­lente con­férence à Brighton­SEO, Crys­tal Carter a présen­té l’exemple d’un site, Site of Sites, qui a fini par être recon­nu comme une mar­que par Gem­i­ni grâce à des actions telles que la nota­tion des répons­es et l’envoi de feedback.

A screenshot of a feedback dialog on Google Search, specifically showing a rating given for a response labeled "Bad response." The reason selected is "Not factually correct," with a note explaining that the URL provided by Gemini is incorrect and not part of the mentioned website.

Essayez vous aus­si de fournir des retours sur les répons­es générées. C’est par­ti­c­ulière­ment per­ti­nent pour les LLM basés sur la récupéra­tion d’informations en temps réel comme Gem­i­ni, Per­plex­i­ty et Copilot.
Cela pour­rait bien être votre porte d’entrée vers une meilleure vis­i­bil­ité de mar­que dans les LLM.

À l’origine, cette sec­tion por­tait sur l’utilisation du bal­is­age schema pour struc­tur­er votre con­tenu de manière à ce qu’un LLM puisse mieux l’analyser et le com­pren­dre. Cette approche s’appuyait sur les recherch­es que j’avais lues sur le sujet.

Depuis, j’ai décou­vert que ce n’était pas tout à fait exact. Les crawlers IA ne peu­vent pas accéder aux don­nées schema ni, plus large­ment, aux don­nées ren­dues côté client. À l’heure actuelle, ils ne peu­vent crawler que le HTML.

Je recon­nais m’être trompée et je m’excuse de vous avoir induit en erreur.

Voici un excel­lent post d’Elie Berre­by si vous souhaitez une analyse plus tech­nique sur la manière dont les LLM explorent les don­nées sur le web ouvert.

A clip-out of Elie Berreby’s post on AI’s inability to read structured data

Mais voici pourquoi vous devez absol­u­ment con­tin­uer à tra­vailler votre SEO lorsque vous cherchez à capter ces pré­cieuses men­tions dans les LLM.

En se con­cen­trant sur les secteurs de la finance et du SaaS, Seer Inter­ac­tive a soumis 10 000 requêtes à fort vol­ume de recherche et à forte inten­tion d’achat à l’API GPT-4o d’OpenAI. Ils ont ensuite mesuré la fréquence d’apparition des noms de mar­que dans les réponses.

Ils ont com­plété cette analyse avec des don­nées de SERP issues de Google et Bing.

De fortes cor­réla­tions, autour de 0,65, indiquent que les posi­tions organiques influ­en­cent bien les men­tions dans les LLM. À l’inverse, l’impact des back­links s’avère éton­nam­ment neutre.

LLM study from Seer Interactive showing the correlation between organic rankings and brand mentions in LLMs

Les cor­réla­tions liées aux mots-clés organiques devi­en­nent encore plus fortes lorsque l’équipe de Seer Inter­ac­tive exclut les forums, les réseaux soci­aux et les agré­ga­teurs, afin de se con­cen­tr­er sur des sites ori­en­tés solu­tion, plus sus­cep­ti­bles d’apparaître dans les répons­es des LLM.

LLM study from Seer Interactive showing the correlation between organic rankings and brand mentions in LLMs

La morale est sim­ple : ne sac­ri­fiez pas vos posi­tions organiques au prof­it de la vis­i­bil­ité dans les LLM.

Vos efforts SEO quo­ti­di­ens jouent un rôle majeur dans le développe­ment de la notoriété de votre mar­que auprès des IA.

Dans une étude récente inti­t­ulée Manip­u­lat­ing Large Lan­guage Mod­els to Increase Prod­uct Vis­i­bil­i­ty, des chercheurs de Har­vard ont mon­tré qu’il est tech­nique­ment pos­si­ble d’utiliser le « strate­gic text sequenc­ing » (STS) pour gag­n­er en vis­i­bil­ité dans les LLM.

Ini­tiale­ment conçu pour con­tourn­er les garde-fous de sécu­rité des mod­èles, ce procédé repose sur une opti­mi­sa­tion par essais et erreurs, visant à déclencher cer­tains sché­mas appris par le LLM afin d’influencer ses réponses.

Les résul­tats sont par­lants : dans env­i­ron 40 % des cas testés, l’ajout de séquences opti­misées améliore le classe­ment du pro­duit ciblé. D’autres travaux démon­trent égale­ment que des con­tenus soigneuse­ment conçus, inclu­ant des injec­tions de prompt ou des biais sub­tils, peu­vent manip­uler les recom­man­da­tions de mar­ques, allant jusqu’à faire dépass­er des pro­duits fac­tices à des acteurs établis.

Ces pra­tiques LLMO black hat ne sont plus théoriques. Des cas réels de dén­i­gre­ment et de sab­o­tage de mar­que via l’IA com­men­cent à émerg­er, exposant de nou­velles failles dans les sys­tèmes de recom­man­da­tion des LLM.

Si l’optimisation pour les LLM est dev­enue incon­tourn­able, une réal­ité s’impose : à l’image des débuts du SEO, des acteurs oppor­tunistes chercheront des rac­cour­cis pour capter la vis­i­bil­ité IA. Il devient donc tout aus­si cru­cial de penser stratégie défen­sive et pro­tec­tion de mar­que que performance.

  • Croire que le LLMO rem­place le SEO
    Mau­vais pari. Le SEO vous rend décou­vrable. Le LLMO vous rend citable. Si vous sac­ri­fiez vos posi­tions organiques, vous coupez une par­tie de l’alimentation.
  • Con­fon­dre LLM, AI Overviews et “recherche IA”
    Même écosys­tème, pas les mêmes règles. Opti­miser “comme pour Google” sans com­pren­dre le for­mat (con­ver­sa­tion, sources, RAG) = beau­coup d’efforts pour peu de mentions.
  • Raison­ner “mots-clés” au lieu de raison­ner “entités”
    Les LLM ne “rangent” pas votre mar­que dans un dossier “key­word”. Ils la situent dans une carte de con­cepts. Sans asso­ci­a­tions claires (mar­que ↔ sujet ↔ preuves), vous restez hors champ.
  • Faire du con­tenu flou, long et sans preuves
    Les répons­es IA adorent ce qui se cite facile­ment : déf­i­ni­tions nettes, points clés, stats, sources. Un pavé mar­ket­ing sans faits = zéro cita­tion, voire pire, une refor­mu­la­tion tiède.
  • Se noy­er dans les fea­tures au lieu d’être ultra clair
    Trop de pail­lettes = pas de posi­tion­nement. Si vous ne savez pas résumer votre valeur en 1–2 phras­es véri­fi­ables, l’IA ne saura pas non plus.
  • Miser sur le “fine-tun­ing” pour percer dans les LLM publics
    Coller votre doc dans un Copi­lot et espér­er domin­er Chat­G­PT n’est pas une stratégie. Le fine-tun­ing aide en envi­ron­nement fer­mé, pas pour la vis­i­bil­ité “grand public”.
  • Penser que le schema “suf­fit”
    Les crawlers IA ne lisent pas tou­jours ce que vous pensez (et pas for­cé­ment ce qui est ren­du côté client). Pri­or­ité : un HTML lis­i­ble, sta­ble, et des infos faciles à extraire.
  • Faire du black hat (STS, prompt injec­tions, manipulations)
    Oui, cer­tains “cheat codes” exis­tent. Non, ce n’est pas durable. Et surtout : vous vous exposez à un retour de flamme (répu­ta­tion, con­fi­ance, plateformes).
  • Spam­mer Red­dit / forums façon “par­a­site”
    L’UGC peut aider… mais pas le bruit. Si vous lais­sez une trace de spam, vous gag­nez peut-être une men­tion aujourd’hui et vous perdez votre crédi­bil­ité demain.
  • Ne pas mesur­er la vis­i­bil­ité IA (et pilot­er au feeling)
    Sans KPI (men­tions, cita­tions, part de voix IA, traf­ic de recom­man­da­tion), vous ne saurez jamais ce qui marche. Le LLMO est un ter­rain de test permanent.
  • Oubli­er la défense de marque
    Dés­in­for­ma­tion, sab­o­tage, pages tiers biaisées : ça arrive déjà. Wikipé­dia, pages de référence, cohérence des infos, mon­i­tor­ing… c’est du LLMO aussi.
  • Ignor­er l’expérience on-site après la mention
    Les men­tions finis­sent par envoy­er du traf­ic. Si vos pages citées ne guident pas vers vos pages clés (mail­lage, preuve, con­ver­sion), vous lais­sez l’or dans la rivière.

Tester, tester, tester

Avec le LLMO, rien n’est garan­ti. Les LLM restent en grande par­tie une boîte noire.

Nous ne savons pas pré­cisé­ment quelles don­nées ni quelles straté­gies sont util­isées pour entraîn­er les mod­èles ou déter­min­er l’inclusion des mar­ques. Mais nous sommes habitués, nous les pro­fes­sion­nels du SEO.

Nous tes­terons, rétro­con­cevrons et enquêterons jusqu’à comprendre.

Le par­cours d’achat a tou­jours été com­plexe et dif­fi­cile à mesur­er. Les inter­ac­tions avec les LLM le ren­dent dix fois plus compliqué.

Elles sont mul­ti­modales, rich­es en inten­tions, inter­ac­tives et non déter­min­istes. Elles vont génér­er encore davan­tage de recherch­es non linéaires.

Selon Aman­da King, il faut déjà env­i­ron 30 points de con­tact sur dif­férents canaux avant qu’une mar­que soit recon­nue comme une entité. Avec la recherche IA, ce chiffre ne fera qu’augmenter.

Aujourd’hui, ce qui se rap­proche le plus du LLMO est l’optimisation de l’expérience de recherche, ou SXO.

Réfléchir à l’expérience que vivront vos clients sous tous les angles de votre mar­que est désor­mais cru­cial, d’autant plus que vous avez de moins en moins de con­trôle sur la manière dont ils vous découvrent.

Lorsque, enfin, ces men­tions et cita­tions de mar­que dure­ment acquis­es com­menceront à affluer, vous devrez alors vous pencher sur l’expérience on-site. Cela inclut par exem­ple le fait de lier stratégique­ment les pages fréquem­ment citées par les LLM vers des pages clés afin de redis­tribuer cette valeur sur votre site.

En clair, le LLMO repose sur une con­struc­tion de mar­que réfléchie et cohérente dans le temps. Ce n’est pas un chantier sim­ple, mais il en vaut claire­ment la peine si ces prévi­sions se con­fir­ment et si les LLM finis­sent par dépass­er la recherche tra­di­tion­nelle dans les années à venir.

Et si vous débutez en stratégie LLMO, je ne peux que vous con­seillez de vous appuy­er sur le serveur Ahrefs MCP (une sorte de chat­bot Ahrefs, vous ver­rez) pour avoir des straté­gies GEO qui s’ap­puient sur de vraies données :