经过多年与客户的合作,尤其是作为一家英国机构的技术搜索引擎优化主管,我发现技术搜索引擎优化诊断几乎每天都会发生。因此,我知道了解每个问题是什么以及为什么它如此重要是多么重要,特别是对于新的 SEO 来说。
理解技术诊断中发现的问题可以让你全面分析一个站点,并提出一个全面的策略。
在本指南中,我将带领你一步一步地走过一个成功的技术诊断过程,但也解释每一个问题是什么,也许更重要的是,它应该在你的优先列表上。
无论是对你自己的网站进行改进,还是为你的第一个客户提供建议,本指南将帮助你在八个步骤中成功而自信地完成技术性 SEO 诊断。
但首先,让我们澄清一些基本问题。
技术搜索引擎优化是任何网站的核心基础。技术 SEO 诊断是网站维护的必要部分,可以分析网站的技术方面。
诊断将检查网站是否为各种搜索引擎(包括谷歌、必应、雅虎等)进行了适当的优化。
这包括确保不存在与爬虫和索引相关的问题,这些问题会阻止搜索引擎允许你的站点出现在搜索引擎结果页面(SERP)上。
诊断包括分析站点的所有元素,以确保没有遗漏任何可能阻碍优化过程的东西。在许多情况下,一些小的改变可以显著提高你的排名。
此外,诊断可以突出显示你的网站可能没有意识到的技术问题,比如 hflang 错误、权威标签的问题或混合内容问题。
推荐阅读: 技术 SEO 初学者指南
一般来说,我总是喜欢对一个新网站进行初步诊断ーー无论是我刚刚建立的网站,还是我第一次从客户那里看到的网站ーー然后每季度进行一次诊断。
我认为养成良好的诊断习惯是明智的,作为正在进行的网站维护的一部分。尤其是当你正在处理一个不断发布新内容的网站时。
当你注意到你的排名停滞不前或下降时,进行搜索引擎优化诊断也是一个好主意。
在完成技术诊断之前,你需要从客户那里得到什么?
即使客户来找我的目标不一定是“技术搜索引擎优化重点,”如链接建设或创建内容,重要的是要记住,任何技术问题可能会阻碍我们的工作成功向前推进。
评估网站的技术方面,就如何进行改进提供建议,并解释这些技术问题如何影响我们打算一起进行的工作,这些都是非常重要的。
也就是说,如果你打算对一个不属于你自己的网站进行技术诊断,至少你需要访问该网站的谷歌搜索控制台和谷歌分析账户。
在大多数情况下,技术SEO诊断并不容易。除非你拥有一个非常简单的商业网站,该网站是由专家SEO完美构建的,否则你很可能会遇到一些技术问题。
通常,尤其是在更复杂的网站上,例如具有大量页面的网站或多种语言的网站,诊断可能就像是一个不断发展的难题,可能需要几天甚至几周才能破解。
无论你是想诊断自己的小网站还是为新客户诊断的小网站,我都将带你完成八个步骤,这些步骤将帮助你识别和解决一些最常见的技术问题。
步骤1. 爬行你的网站
所有你需要开始在这里是设置一个项目 Ahrefs 的网站诊断,你甚至可以免费访问作为 Ahrefs 站长工具的一部分。
这个工具扫描你的网站,检查有多少网址,有多少是可索引的,有多少不是,有多少有问题。
从这里开始,诊断工具创建一个关于它发现的所有内容的深入报告,以帮助你识别和修复阻碍网站性能的任何问题。
当然,更高级的问题可能需要进一步的调查,涉及其他工具,如谷歌搜索控制台。但是我们的诊断工具在突出关键问题方面做得很好,特别是对于初学者 SEO。
首先,运行诊断与网站诊断,你将需要确保你的网站连接到你的 Ahrefs 帐户作为一个项目。最简单的方法是通过谷歌搜索控制台,虽然你可以通过添加一个 DNS 记录或 HTML 文件来验证你的所有权。
一旦验证了所有权,最好在运行第一次爬网之前检查网站诊断设置。如果你有一个较大的站点,最好在开始之前提高爬网速度。
有许多标准设置。对于一个小型的个人站点,这些设置可能是合适的。但是,诸如“极限”下爬行的最大页面数之类的设置可能需要针对更大的项目进行更改。
此外,如果你正在寻找深入的洞察核心页面指标(CWV) ,你可能希望在这里添加你的 GoogleAPI 密钥。
一旦满足了这些设置,你就可以在“网站诊断”选项卡下运行一个新的抓取。
最初,在进行诊断之后,你将被直接进入“概述”页面。这将为你提供该工具发现内容的顶级视图,包括数量可索引与非可索引的页面,顶级问题,和总体网站健康评分为100。
这将为你提供一个快速和易于理解的整体网站健康数值。
从这里,你可以进入“所有问题”标签。这将分解爬行器发现的所有问题,它们的优先级有多高,以及如何修复它们。
该报告以及其他工具可以帮助你开始识别可能阻碍你在 SERP 上的性能的问题。
步骤2. 发现爬网性和索引问题
如果你的网站有不能被搜索引擎抓取的页面,你的网站可能没有被正确地索引(如果有的话),如果你的网站没有出现在索引中,用户就无法找到它。
确保搜索机器人可以抓取你的网站并正确收集数据,这意味着搜索引擎可以准确地将你的网站放在SERP上,并且你可以为这些重要关键字进行排名。
在寻找爬虫问题时,有一些事情你需要考虑:
- 索引错误
- Robots.txt 错误
- 网站地图问题
- 优化爬行预算
确定索引问题
优先级: 高
如果你想出现在谷歌的任何地方,确保你的页面被索引是必要的。
检查站点是如何被索引的最简单的方法是到 Google Search Console 并检查 Coverage 报告。在这里,你可以准确地看到哪些页面被索引,哪些页面有警告,以及哪些页面被排除在外,以及为什么:
请注意,只有在没有任何问题的情况下对页面进行索引时,页面才会出现在搜索结果中。
如果你的页面没有被编入索引,那么可能会有许多问题导致这种情况。我们将看一看下面的顶部几个,但你也可以检查我们的其他指南,以获得更深入的演练。
检查robots.txt文件
优先级: 高
robots.txt文件可以说是你网站上最简单的文件。但这是人们经常犯的错误。虽然你可能会建议搜索引擎如何抓取你的网站,它很容易出错。
大多数搜索引擎,尤其是 Google,都喜欢遵守你在 robots.txt 文件中设置的规则。因此,如果你告诉搜索引擎不要爬行和/或索引某些网址,甚至不小心你的整个网站,这就会发生。
下面是 robots.txt 文件的样子,它告诉搜索引擎不要抓取任何页面:
通常,这些说明即使在站点上线,也将这些说明留在文件中,从而阻止了站点被爬行。这是一个罕见的简单修复程序,可作为SEO的灵丹妙药。
你还可以通过将URL键入Google搜索控制台搜索栏来检查单个页面是否可以访问和索引。如果尚未索引并且可以访问,则可以“请求索引”。
Google 搜索控制台的 Coverage 报告也可以让你知道你是否屏蔽了 robots.txt 中的某些页面,尽管它们被索引了:
机器人元标签
优先级: 高
Robot meta 标记是一个 HTML 片段,它告诉搜索引擎如何抓取或索引某个页面。它被放置在网页的 < head > 部分,看起来像这样:
<meta name="robots" content="noindex" />
这个Noindex是最常见的。正如你所猜测的,它告诉搜索引擎不要索引页面。我们还经常在整个网站的页面上看到以下机器人元标签:
<meta name="robots" content=”max-snippet:-1, max-image-preview:large, max-video-preview:-1" />
这告诉 Google 可以在 SERP 上免费使用你的任何内容。除非你添加 noindex 或 nonippet 指令,否则 WordPress 的 Yoast SEO 插件默认会添加这个。
如果页面上没有机器人元标签,搜索引擎会将其作为索引,follow,这意味着它们可以索引页面并抓取其上的所有链接。
但是Noindex实际上有很多用途:
- 对用户来说很少或没有价值的单薄页面
- 重复页面
- 管理员和感谢页面
- 内部搜索结果
- PPC 登陆页
- 关于即将到来的促销、竞赛或产品发布的页面
- 重复的内容(使用权威标签建议索引的最佳版本)
但是不恰当的使用恰好也是一个顶级的可索引性问题。意外地使用错误的属性可能会对 SERP 上的显示产生不利影响,因此请记住小心使用它。
检查站点地图
优先级: 高
XML 站点地图可以帮助 Google 浏览网站上的所有重要页面。考虑到爬虫不能停下来问路,一个站点地图确保谷歌有一套说明,当涉及到爬行和索引你的网站。
但是,就像爬虫程序可能会意外地通过 robots.txt 文件被阻塞一样,网页可能会被排除在站点地图之外,这意味着爬虫程序可能不会获得优先级。
此外,通过在你的站点地图中包含不应该存在的页面,比如破碎的页面,你可以混淆爬虫程序并影响你的爬行预算(下面将详细介绍)。
你可以在网站诊断 > 所有问题 > 其他中查看网站地图问题。
这里的主要内容是确保所有你想要索引的重要页面都在你的站点地图中,并避免包含任何其他内容。
推荐阅读:如何创建XML站点地图(并将其提交给Google)
检查抓取预算
优先级: 高(对于大型网站)
抓取预算是指搜索引擎可以抓取多少页面以及抓取的速度。
各种各样的事情影响爬行预算。其中包括网站上的资源数量,以及谷歌认为你的可索引页面的价值。
拥有一个大的抓取预算并不能保证你将排在搜索结果页面的顶部。但是,如果由于爬网预算问题而没有抓取所有关键页面,那么这些页面可能不会被索引。
如果你的网页很受欢迎,收到有机流量和链接,并且在网站内部链接良好,那么你的网页很可能会被扫描成你每日抓取预算的一部分。
新网页ーー以及那些没有内部或外部链接的网页,例如那些在较新网站上找到的网页ーー可能不会那么频繁地被搜索。
对于拥有数百万页面或经常更新的站点的大型站点,爬虫预算可能是一个问题。一般来说,如果你有大量的页面没有像你希望的那样频繁地被抓取或更新,那么你应该考虑加快抓取速度。
在 Google 搜索控制台中使用 Crawl Stats 报告可以让你深入了解你的站点是如何被抓取的,以及任何可能被 Googlebot 标记的问题。
你还需要查看任何标记的抓取状态,如下所示:
推荐阅读:什么是爬网预算,SEO应该为此担心吗?
步骤3. 检查页面上的技术元素
检查你的页面基础是很重要的。虽然许多 SEO 可能会告诉你,页面上的问题,如那些元描述并不是一个大问题,我个人认为这是良好的 SEO 管理的一部分。
甚至谷歌的 John Mueller 之前也说过在一个网页上有多个 H1标签不是问题。然而,让我们把搜索引擎优化看作一个积分系统。
如果你和一个竞争对手的网站并肩站在搜索结果页面上,那么即使是最基本的问题也可能成为决定谁排名最高的催化剂。因此,在我看来,即使是最基本的家务问题也应该得到解决。
因此,让我们看看以下内容:
- 页面标题和标题标签
- 元描述
- 权威标签
- Hreflang标签
- 结构化数据
页面标题和标题标签
优先级: 中等
标题标签比大多数人认为的更有价值。他们的工作是让谷歌和网站访问者知道一个网页是关于什么的ーー就像这样:
下面是原始的 HTML 格式:
<title>How to Craft the Perfect SEO Title Tag (Our 4-Step Process)</title>
近年来,标题标签在搜索引擎优化领域引发了很多争论。事实证明,如果谷歌不喜欢你的标题,它很可能会修改你的标题标签。
Google 重写 title 标签的最大原因之一就是它们太长了。这是网站诊断中突出强调的一个问题。
一般来说,最好确保所有页面都有 title 标签,标签的长度不超过60个字符。
推荐阅读:如何创建完美的SEO标题标签
元描述
优先级: 低
元描述是描述页面内容的 HTML 属性。它可以作为片段显示在搜索结果的 title 标签下,以提供进一步的上下文。
更多的访问者会点击你的网站在搜索结果,如果它有一个迷人的元描述。尽管谷歌只有37% 的时间提供元描述,但是确保你最重要的页面拥有优秀的元描述仍然很重要。
你可以查明是否有任何元描述丢失,以及它们是否太长或太短。
但是写元描述不仅仅是为了填补一个空白,而是为了吸引潜在的网站访问者。
推荐阅读: 如何写出完美的元描述
检查权威标签
优先级: 高
权威标签rel = “ canonical”)指定重复或接近重复页面的主版本。换句话说,如果在几个 URL 下有大约相同的可用内容,那么应该使用权威标签来指定哪个版本是主版本,并且应该建立索引。
权威标签是搜索引擎优化的重要组成部分,主要是因为谷歌不喜欢重复的内容。此外,不正确地使用权威标签(或根本不使用)会严重影响爬网预算。
如果爬行器正在浪费时间爬行重复的页面,这可能意味着错过了有价值的页面。
你可以在网站诊断中找到重复的内容问题: 网站诊断 > 报告 > 重复 > 问题。
推荐阅读:权威标签:初学者的简单指南
国际SEO:Hreflang标签
优先级: 高
尽管Hreflang似乎是另一个简单的HTML标签,但它可能是最复杂的SEO元素。
对于使用多种语言的站点,hflangtag 是必需的。如果同一页面有多个不同语言版本,或者面向世界不同地区,例如,美国有一个英文版本,法国有一个法文版本,那么就需要 hflangtag。
翻译一个网站既费时又费钱ーー因为你需要付出努力,并确保所有版本都显示在相关的搜索结果中。但是,通过迎合使用不同语言内容的不同用户,它确实提供了更好的用户体验。
另外,由于多语言页面集群共享彼此的排名信号,正确使用 hflang 标记可以作为排名因素产生直接影响。谷歌的 Gary Illyes 在这段视频中暗示了这一点。
你可以在本地化下的网站诊断中找到 hflangtag 问题: 网站诊断 > 所有问题 > 本地化
推荐阅读:Hreflang:初学者的简易指南
结构化数据
优先级: 高
结构化数据,通常称为模式标记,在 SEO 中有许多有价值的用途。
最重要的是,结构化数据用于帮助获得知识面板中的丰富结果或特性。这里有一个很好的例子: 当处理食谱时,每个结果都会有更多的细节,比如评分。
你还可以在知识面板中看到一个特性,显示什么是巧克力饼干(以及一些营养信息) :
因为结构化数据不仅可以帮助 Google 更好地理解你的网站,还可以帮助 Google 更好地理解诸如作者之类的详细信息,所以结构化数据不仅可以帮助语义搜索,还可以提高专业知识、权威性和可信度,也就是 E‑A-T。
现在,JSON-LD 是结构化数据的首选格式,所以尽可能保持这种格式。但是你也可以遇到 Microdata 和 RDFa。
作为技术诊断的一部分,你应该测试结构化数据。一个很好的工具是 Classy Schema 测试工具。
你也可以通过 Google 的富媒体结果测试来检查你的富媒体情况。
步骤4. 确定图像问题
在SEO方面,通常会忽略图像优化。但是,图像优化具有许多好处,其中包括:
- 提高的负载速度。
- 你可以从Google图像获得更多流量。
- 更具吸引力的用户体验。
- 提高可访问性。
图像问题可以在主要诊断报告中找到:网站诊断>报告>图像。
损坏的图片
优先级: 高
破碎的图像不能在你的网站上显示。一般来说,这会导致糟糕的用户体验,但也可能看起来垃圾,给访问者的印象是网站没有得到很好的维护和专业。
这对于那些通过网站赚钱的人来说是很大的问题,因为这会让网站看起来不那么值得信赖。
图像文件大小太大
优先级: 高
网站上的大图片会严重影响网站的速度和性能。理想情况下,你希望以尽可能小的尺寸和适当的格式(如 WebP)显示图像。
最好的选择是在上传图片到你的网站之前优化图片文件的大小。像 TinyJPG 这样的工具可以在图片添加到网站之前优化它们。
如果你想优化现有的图片,有一些工具可以使用,特别是对于更流行的内容管理系统(CMS) ,比如 WordPress。诸如 Imagify 或 WP-Optimize 这样的插件就是很好的例子。
HTTPS页面链接到HTTP图像
优先级: 中等
链接到 HTTP 图像的 HTTPS 页面会导致所谓的“混合内容问题”,这意味着页面是通过 HTTPS 安全加载的。但是它链接到的资源(如图像或视频)处于不安全的 HTTP 连接上。
混合内容是一个安全问题。对于那些通过显示广告赚钱的网站,它甚至可以阻止广告提供商在你的网站上投放广告。它也降低了你网站的用户体验。
默认情况下,某些浏览器限制不安全的资源请求。如果你的页面依赖于这些易受攻击的资源,那么如果这些资源被禁用,页面可能无法正常工作。
缺少 Alt 文本
优先级: 低
Alt 文本或替代文本描述网站上的图像。这是一个令人难以置信的重要组成部分的图像优化,因为它提高了你的网站访问世界各地数以百万计的人谁是视力障碍。
通常,那些有视力障碍的人使用屏幕阅读器,它可以将图像转换成音频。本质上,这是向站点访问者描述图像。适当优化的 ALT 文本允许屏幕阅读器告知视障网站用户他们正在看到的内容。
Alt 文本还可以作为图像链接的锚文本,帮助你在谷歌图片上排名,并提高主题相关性。
推荐阅读:SEO的ALT文本:如何优化图像
步骤5. 分析内部链接
当大多数人想到SEO的“链接”时,他们会考虑外部链接。如何构建它们,应该拥有多少,等等。
许多人没有意识到的是内部链接的纯粹重要性。实际上,内部链接就像果冻与外部链接的花生酱一样。你能没有另一个吗?当然。他们在一起总是更好吗?你打赌!
内部链接不仅可以帮助你的外部链接构建工作,而且还可以为搜索引擎和用户提供更好的网站体验。
使用内部链接对主题进行适当的散句,为你网站上的每个人都易于理解局部路线图。这有很多好处:
- 创建关键字的相关性
- 帮助确保所有内容都被抓取
- 使得访问者很容易找到相关的内容或产品
当然,当正确地完成时,所有这些都是有道理的。但是,当你第一次接触站点时,应该对内部链接进行诊断,因为事情可能不会像你想要的那样有序。
4xx 状态码
优先级: 高
进入网站诊断 > 内部页面 > 问题标签 > 4XX 页面。
在这里,你可以看到站点的所有损坏的内部页面。
这些都是有问题的,因为它们浪费了“链接权益”,给用户带来了负面体验。
以下是处理这些问题的一些选择:
- 返回同一地址的损坏页面(如果不小心删除)
- 将损坏的页面重定向到更合适的位置。 应该更新或删除所有引用该页面的内部链接
孤页面
优先级: 高
进入网站诊断 > 链接 > 问题标签 > 孤儿页面(没有内部链接)。
这里,我们突出显示没有内部链接指向它们的页面。
可索引页面不应该成为孤立页面的原因有两个:
内部链接不会通过 PageRank,因为没有。
它们不会被谷歌找到(除非你通过谷歌搜索控制台上传你的网站地图,或者有其他几个网站抓取页面的外部链接,否则它们不会被看到)。
如果你的网站有多个孤立的网页,过滤清单从高到低的有机流量。如果内部链接添加到孤立的页面仍然接收有机流量,他们肯定会获得更多的流量。
推荐阅读:SEO的内部链接:可操作的指南
步骤6. 检查外部链接
外部链接是页面中链接到另一个域的超链接。这意味着你所有的外部链接ーー从另一个外部链接到你网站的链接ーー都是别人的外部链接。
看到互联网的魔力是如何无形地交织在一起的吗
外部链接通常用于以引用的形式备份资源。例如,如果我正在写一篇博客文章,并讨论一项研究的指标,我将从外部链接到我在哪里找到的权威来源。
链接到可靠的来源,使你自己的网站更可信的访问者和搜索引擎。这是因为你证明了你的信息是由可靠的研究支持的。
这是John对外部链接的看法:
链接到其他网站是一个伟大的方式提供价值给你的用户。通常情况下,链接帮助用户找到更多,检查你的来源,并更好地了解你的内容是如何相关的问题,他们有。
一如既往,就像其他任何事情一样,外部链接可能会导致问题。这些可以在诊断报告中找到(类似于内部链接) : 网站诊断 > 所有问题 > 链接。
正如你可以从上面的图片中看到的,链接被分解成可索引的和不可索引的,你可以在两个类别中找到相同的问题。然而,每个问题有不同的预先确定的重要性水平ーー这取决于链接是否可索引。
页面有链接到损坏的页面
优先级: 高(如果可索引)
这个问题既可以引用内部链接,也可以引用外部链接,这意味着链接到的 URL 返回的是4XX 返回代码。这些链接损害了访问者的用户体验,并可能损害你的网站的可信度。
页面没有导出链接
优先级: 高(如果可索引)
同样,这个问题涉及到内部和外部链接,本质上意味着一个页面根本没有来自它的链接。这意味着页面是一个“死胡同”为你的网站访问者和搜索引擎。真扫兴。
但是具体到外部链接,如果你的页面没有外部链接,它会影响到上面讨论的所有外部链接的好处。
步骤7. 网站速度和性能
网站速度已经成为搜索引擎优化社区最近的一个热门话题,特别是在谷歌宣布移动速度确实是一个排名因素之后。
自2021年5月以来,被称为核心网络重要性(CWV)的速度指标已经被谷歌用来对网页进行排名。他们使用最大内容元素(LCP)来评估视觉负荷,累积布局移位(CLS)来测试视觉稳定性,第一次输入延迟(FID)来测量交互性。
谷歌的目标是提高用户体验,因为,让我们面对现实吧,没有人喜欢慢节奏的网站。在当今社会,对即时满足的需求鼓励网站访问者在完成他们打算做的事情之前离开。
虽然网站只有轻微的速度问题可能不会看到任何改善排名从速度优化,研究表明,非常缓慢的网站可能会看到有机流量的改善,点击率,和更多。
在 Ahrefs 诊断报告中,你可以找到关于站点速度的信息: 网站诊断 > 报告 > 性能 > 概述。
还有许多优秀的速度测试工具可用,包括来自 Google 的 PageSpeed Insights 和我个人最喜欢的 GTmetrix。
网站的速度优化非常缓慢,可能是一个复杂的过程。然而,对于初学者,最好使用其中一个可用的工具,如 WPRocket 或 NitroPack (都是付费的)来显著提高站点速度。
步骤8.确保你的网站移动端友好
在我们现在生活的这个世界上,比以往任何时候都更多的人在不断地使用移动设备。例如,根据 DatarePortal 长达300页的研究,移动购物目前占据了60% 的市场份额。
毫无疑问,在过去的几年里,谷歌一直在寻求转向移动优先的索引。
从技术角度来看,使用 Ahrefs 的移动爬虫对站点进行第二次诊断是一个很好的实践。作为标准,Ahrefs 的诊断工具使用桌面爬网来诊断你的站点; 然而,这可以很容易地在“项目设置”中的“爬网设置”下进行更改。
我们的比较功能将比较你的移动和桌面站点,并通知你有什么变化或如果有任何“新的”问题出现,一旦你爬行你的网站的第二次,例如,问题只存在于移动。
从这里,你可以选择任何“新建”、“添加”或“删除”数字,以确定对于每个问题有哪些更改。
推荐阅读:移动优先索引:你需要知道的
最后的想法
老实说,这只是抓住了表面,当它来执行技术搜索引擎优化诊断。上面的每一点都可以很容易地得到一篇关于它的完整的博客文章,以及其他更高级的问题,比如分页、日志文件分析和高级站点结构。
然而,对于那些希望了解如何开始,以便成功地完成技术搜索引擎优化诊断,这是一个伟大的地方开始。
无论何时执行技术 SEO 诊断,你总是有大量的修复。重要的是首先搞清楚你的优先顺序。幸运的是,Ahrefs 的网站诊断为每个问题提供了一个预定义的优先级评级。
不过,有一点要记住,不管这个问题是什么,它的重要性取决于你正在处理的网站或页面。例如,你想要排名的主页总是优先于你不想索引的页。
与往常一样,如果你有任何疑问,请随时在Twitter上ping我。