
按 Ryan Law
Ahrefs 内容营销总监
当你让 ChatGPT 推荐最适合健身时佩戴的头戴式耳机时,背后究竟发生了什么?
AI 搜索引擎如何生成答案并挑选产品推荐?它们与 Google 这类传统搜索引擎有什么不同(又有哪些重叠之处)?
更关键的是,你如何帮助你的网站、品牌和产品出现在结果里?
感谢 Gianluca Fiorelli 和 Mark Williams-Cook 审阅并为本章做出贡献。
AI 搜索引擎是一种问答系统,利用大语言模型(LLM)来查找信息并生成回复。
传统搜索引擎和 AI 搜索引擎之间存在一些关键差异(尽管随着传统搜索引擎加入更多 AI 功能,这些差异正在缩小):
下面是一个典型 AI 搜索界面的样子,与你在 ChatGPT、Claude 或 AI 模式中看到的类似:

要帮助你出现在这类答案中,你首先需要理解让 AI 搜索引擎运转的核心流程。
LLM 会在海量内容上进行训练,相当于
这些训练数据帮助 LLM 形成对世界的
您知道吗?
实际的训练过程比这里说明的更复杂。其中包括预训练阶段,用于去除 HTML、移除可识别个人身份的信息、排除屏蔽词,并将数据过滤到特定语言。还包括后训练阶段,用于训练语言模型更像一个乐于助人的聊天助手(而不只是下一个令牌的预测器)。想了解更多,请观看 Andrej Karpathy 的视频:Deep Dive into LLMs like ChatGPT。

这正是基于实体的 SEO 变得至关重要之处。如果你的品牌持续出现在知识图谱中,使用 Schema 标记进行恰当的结构化,并在全网高质量内容中与相关实体共同出现,你就在训练数据中构建了更强的

Gianluca Fiorelli, 战略与国际 SEO/AI 搜索顾问
关键在于,LLM 有许多
一个常见误解是,LLM 会像软件打补丁一样获得“知识更新”。事实上,每个模型只会在固定数据集上训练一次。当你看到新模型发布、知识截止日期更新,那是一个从零开始训练出来的全新模型,并不是对现有模型的更新。

Gianluca Fiorelli, 战略与国际 SEO/AI 搜索顾问
一个会产生幻觉、还会分享过时信息的搜索引擎,听起来并不怎么有用。因此,LLM 通过一种称为 grounding 的过程来克服其中一些限制。
LLM 可以通过两种方式验证并改进它们的回答:使用工具(如计算器或其他数据 API),或从外部来源检索更多信息。第二个过程在技术上称为检索增强生成(RAG)。
当用户输入一个问题时,LLM 会自问:“我是否已经知道答案,还是应该获取额外信息?”如果 LLM 能以很高的确定性预测下一个令牌(例如变化不大的问题,如“红细胞的作用是什么?”),它很可能会基于自身的基础知识作答。若确定性较低(对于更容易变化的问题,如“最划算的咖啡研磨机是哪款?”),它就会使用搜索工具,从互联网上的其他来源寻找相关信息。
LLM 会经过微调,以识别那些可能需要补充信息的查询类型,例如:
某些 LLM 模型也很可能触发额外的搜索(例如,

通过 RAG 寻找事实依据(通常称为
AI 搜索引擎会通过一种称为“查询扇出”(query fan-out)的过程来进行这种 grounding。
关键在于,查询扇出解释了为何传统 SEO 对 AI 可见性至关重要。
ChatGPT、Gemini 和 Perplexity 等 AI 助手会使用 Google、Bing、Brave 等搜索索引来获取最新信息。
搜索服务提供商之所以重要,是因为每家都有不同的排序算法、索引和覆盖范围:让你的品牌在 Google 搜索中提高曝光度,对提升你在 AI 模式下的可见度可能比在 ChatGPT 中更有帮助,因为 ChatGPT 更依赖 Bing。
| AI 搜索引擎 | 用于 Grounding 的搜索索引 |
|---|---|
当触发网页搜索时,LLM 会从其搜索索引中请求相关结果。搜索索引会返回一个结果列表,LLM 则通过评估网页标题、返回的页面摘要内容以及新鲜度(发布距今多久)等信息,选择最相关的页面进行抓取。
为什么 SEO 对 AI 搜索至关重要
这一点值得重复强调:Google 和 Bing 等传统搜索引擎,在帮助 AI 搜索引擎决定在答案中提及和引用哪些内容方面起着关键作用。
换句话说,在传统搜索中排名越靠前,你在 AI 搜索中的可见度就越高。
但 LLM 到底在“搜索”什么?
LLM 使用一种叫作查询扇出的流程。输入到 ChatGPT 和其他 AI 搜索引擎中的许多提示词都极其冗长、偏对话式,而且往往完全独一无二。直接用谷歌搜索这些原始提示词,并不总能返回有用内容。
因此,与其用用户的原始查询直接进行网页搜索……
"我正在为一家中型 B2B SaaS 公司规划一份为期 6 个月的内容策略,该公司向电商品牌销售一款分析产品。公司……"

……LLM 会使用最初的提示词生成一系列更短、相关的查询,以帮助检索相关信息。
这些“扇出查询”同样由大语言模型生成,因此具有非确定性:即便是同一次搜索,它们也可能经常变化。

Mark Williams-Cook, 创始人,AlsoAsked
这个过程对 SEO 从业者来说应该不陌生:这些相关查询与长尾关键词、子意图以及
事实上,ChatGPT、Gemini 和 Copilot 引用的链接中,只有12%会出现在 Google 针对原始用户提示词的前 10 条结果里。不过,这并不意味着传统排名不重要。AI 搜索引擎会通过生成多个搜索查询来检索内容——而这些扇出查询往往更接近传统、以关键词为导向的搜索,这时你已有的 SEO 工作就变得至关重要。

查询扇出让人更省心:你不必去猜用户会用什么对话式提示词。相反,应针对拆解后的查询进行优化,也就是 LLM 自然会生成的语义组件。这些和传统关键词分析非常相似:[主题] + [限定词]、对比类查询、定义类查询,以及

Gianluca Fiorelli, 战略与国际 SEO/AI 搜索顾问
当 LLM 从搜索索引中检索到相关页面后,它并不会通读全文。相反,页面会被切分成更小的文本“块(chunk)”,模型会优先处理(有时还会扩展)那些看起来与查询最相关的文本片段。
这些文本块通常每个包含几百到几千个词,只占大多数网页的一小部分。LLM 也受到严格的上下文窗口限制:它能处理的文本量有限,其中包括用户的提示词、所有检索到的文本块,以及它自己的回复。这意味着它必须非常有选择性地决定要检索并纳入哪些内容。
下面是一个例子:
| 整页内容 | “Grounding 是一种工作流程:模型会检索外部来源,提取相关事实,并使用这些摘录来减少幻觉、提升信息的新鲜度……随后它会扫描多个来源、对比信息并综合生成回答,而不是逐字照搬文本。这一步的综合有助于避免过度依赖任何单一来源。” |
| 摘录 | “解释助手如何通过网页搜索检索外部来源,并通过将回答锚定在检索到的事实上来减少幻觉。” |
| 扩展示例(第 1–2 行) | “Grounding 是一种工作流程:模型会检索外部来源,提取相关事实,并使用这些摘录来减少幻觉、提升信息的新鲜度。模型会在发起网页搜索前,评估某个查询是否需要最新或可验证的信息。” |
| 扩展示例(第 33–34 行) | “随后它会扫描多个来源、对比信息并综合生成回答,而不是逐字照搬文本。这一步的综合有助于避免过度依赖任何单一来源。” |
让 LLM 更容易理解你的内容
这点很重要:当 AI 搜索引擎从互联网上抓取你的内容时,它们只能看到部分摘录,而非整个页面。要最大化内容在 LLM 答案中被引用的概率,你的页面的相关性和价值必须让 LLM 很容易理解,即使没有访问整页内容的权限也是如此。
随后,AI 搜索引擎会将这些文本整合到其响应生成流程中。
原始网页内容会被 grounding 到模型的答案中:在上一步提取出的文本或数据片段会被加入模型的上下文,基本等同于在说:“这里有一些可能有用的网页上下文,现在请用这些信息来回答用户的问题。”
随后,模型会将其固有知识与检索到的内容结合起来生成答案,并分享给用户。回复通常会包含引用:可点击的 URL,链接到事实锚定过程中使用的来源。
AI 搜索引擎检索到的页面,并不都会在最终答案中获得引用。模型会基于多种因素来选择引用哪些来源:
这意味着,即使你的内容被检索到并被阅读,也无法保证会获得可见的引用;内容必须被认定与答案中的某一具体论断直接相关,才会被引用。
这就是 AI 搜索引擎工作原理的核心,但还有一层额外的复杂性:个性化。
ChatGPT 和其他 AI 搜索引擎可以为不同用户个性化定制结果,这意味着同一个提示词可能会为不同的人生成不同的结果。个性化可能会受到多种因素影响,包括:
这里有个类比,帮助你理解系统提示词:如果你在踢足球,

Mark Williams-Cook, 创始人,AlsoAsked

因此,与其纠结于某一次提示词的回复结果,不如在更长的时间维度内、覆盖更多提示词,持续跟踪你的品牌与网站的平均可见度表现。
每个 AI 搜索引擎(从 ChatGPT 到 Perplexity 再到 Google AI Mode)都略有不同,但核心流程基本一致。对 SEO 从业者和营销人员而言尤其重要的是,Google 和 Bing 等传统搜索引擎提供了 AI 搜索引擎运行所需的大量基础设施。要优化 AI 搜索,在很大程度上仍取决于传统 SEO 的最佳实践。

Ryan Law 是 Ahrefs 的内容营销总监。他拥有 13 年的从业经验,历任作家、内容策略师、团队负责人、营销总监、副总裁、首席营销官(CMO)以及机构创始人。他曾为包括 Google、Zapier、GoDaddy、Clearbit 和 Algolia 在内的数十家公司提供咨询,帮助其改善内容营销和 SEO 表现。此外,他还是一位小说家,同时创办了两门内容营销课程。
在开始学习 SEO 之前,您需要先了解搜索引擎的工作原理。
了解如何优化网站以获得 SEO 成功,并掌握 SEO 的四大核心要素。
SEO 的起点是了解您的目标客户在搜索什么。
学习如何创建能在搜索引擎中排名靠前的内容。
您可以在此处优化页面,以帮助搜索引擎理解它们。
链接是搜索引擎发现新页面并评判其“权重”的依据。若没有链接,想要在竞争激烈的关键词中取得高排名将非常困难。
确保网站不存在任何技术层面的失误,以免阻碍 Google 访问和解读网站内容,这一点至关重要。
了解如何提升您在本地搜索结果中的可见度,并从所在地区获得更多客户。
如今谈到 SEO,已经离不开生成式 AI。
了解 ChatGPT 等 AI 搜索引擎究竟如何生成答案,以及它们会选择提及哪些品牌和产品。